Termin „Small Data” kontrastuje z terminem „Big Data”, który odnosi się do kombinacji szalonych ilości ustrukturyzowanych, półstrukturalnych i nieustrukturyzowanych danych generowanych w każdej sekundzie. Big Data można również zdefiniować za pomocą trzech Vs danych: Volume, Velocity i Variety. Objętość odnosi się do ilości danych generowanych w każdej sekundzie; prędkość oznacza tempo, w jakim dane są odbierane i przetwarzane; a różnorodność odnosi się do różnych formatów danych.

Co to jest Big Data?

Big Data odnosi się do niezwykle dużych porcji zarówno ustrukturyzowanych, jak i nieustrukturyzowanych danych, które są zbyt złożone, aby człowiek mógł je zrozumieć. Kiedyś dane oznaczały dokumenty i papiery, z kilkoma zdjęciami lub filmami, ale teraz oznaczają znacznie więcej. Niemal niemożliwe jest oszacowanie ilości danych, które wytwarzamy każdego dnia. Uważa się, że prawie 2,5 kwintyliona bajtów danych tworzonych każdego dnia, dzięki rosnącej liczbie urządzeń cyfrowych i rozwojowi Internetu rzeczy. Ponadto portale społecznościowe generują z minuty na minutę duże ilości danych w postaci zdjęć, filmów i grafik. Big Data odnosi się do dużych ilości danych wytwarzanych w erze cyfrowej, które obejmują wszystkie dane internetowe generowane przez e-maile, strony internetowe, platformy streamingowe i portale społecznościowe. Big Data odnosi się nie tylko do ilości danych generowanych i przechowywanych elektronicznie, ale także do dużych zbiorów danych, które są zbyt złożone, aby można je było przetwarzać przy użyciu konwencjonalnych metod przetwarzania danych i które wymagałyby nowych technik algorytmicznych.

Co to są Małe dane?





Małe dane odnoszą się do danych wystarczająco małych, aby człowiek mógł je zrozumieć zarówno pod względem objętości, jak i formatu. Objętość danych oznacza ilość danych do przetworzenia. A jeśli chodzi o small data, objętość jest zaskakująco mniejsza, co może wiązać się z bardziej precyzyjnymi, kęsowymi metrykami. Termin small data kontrastuje z Big Data, który z kolei odnosi się do danych zbyt dużych i złożonych, aby można je było analizować i przetwarzać za pomocą tradycyjnych technik przetwarzania danych. Małe dane można zdefiniować jako niewielkie zbiory danych, które są wystarczająco zdolne do wpływania na decyzje w teraźniejszości. W przeciwieństwie do Big Data, tempo, w jakim małe dane docierają do przetwarzania jest stałe i kontrolowane, a akumulacja danych jest również stosunkowo powolna, co sprawia, że są one łatwe do przetworzenia i łatwo dostępne. A co najlepsze, małe dane są wszędzie i są łatwe do zrozumienia przez człowieka, co w rzeczywistości może przełożyć się na inteligencję biznesową.

Różnica między Big Data a Small Data

Znaczenie

– Big Data odnosi się do dużych porcji danych, które są zbyt obszerne i złożone, aby mogły być analizowane i przetwarzane przez tradycyjne techniki przetwarzania danych. Big Data to duże ilości danych produkowanych w erze cyfrowej, które obejmują wszystkie dane internetowe generowane przez e-maile, strony internetowe, platformy streamingowe i portale społecznościowe. Małe dane, przeciwnie, odnoszą się do danych wystarczająco małych, aby ludzie mogli je zrozumieć zarówno pod względem objętości, jak i formatu.

Tom



– Big Data to kombinacja szaleńczych ilości strukturalnych, półstrukturalnych i nieustrukturyzowanych danych generowanych w każdej sekundzie, które zalewają przedsiębiorstwo każdego dnia. Aplikacje internetowe, takie jak portale społecznościowe, analityka czasu rzeczywistego, platformy streamingowe czy strony e-commerce, mają do czynienia z dużą ilością danych, których objętość przekracza ograniczenia tradycyjnych systemów bazodanowych. Jeśli chodzi o małe dane, objętość jest zaskakująco mniejsza, co może wiązać się z bardziej precyzyjnymi, kęsowymi metrykami i co sprawia, że są one łatwo dostępne i łatwe do zrozumienia.

Velocity

– Velocity to tempo, w jakim dane docierają, są analizowane i przetwarzane w celu spełnienia określonych standardów. Ogromne ilości danych mogą być gromadzone w krótkim czasie, a przepływ danych jest masowy i ciągły. Najlepszym sposobem na określenie szybkości Big Data jest zbadanie szybkości danych wytwarzanych przez kliknięcia użytkowników w czasie rzeczywistym. Z kolei Small Data zajmuje się jednym rodzajem danych, więc akumulacja danych jest stosunkowo powolna, jeśli chodzi o Small Data, a przepływ danych jest stały i kontrolowany.



Rozmaitości

– Różnorodność Big Data odnosi się do różnych typów danych, w tym danych ustrukturyzowanych, półstrukturyzowanych, nieustrukturyzowanych oraz ich kombinacji. Dane mogą mieć postać dokumentów, e-maili, tekstów, plików audio i wideo, grafiki i innych. Big Data występuje w wielu formatach, od e-maili, przez tweety, po media społecznościowe i dane z czujników. Źródłem danych w tradycyjnych aplikacjach były głównie transakcje związane z finansami, podróżami, ubezpieczeniami, opieką zdrowotną, handlem detalicznym oraz przetwarzaniem danych przez rząd i sądownictwo. Rodzaje źródeł rozszerzyły się radykalnie, obejmując dane społeczne, dane maszynowe i dane transakcyjne.

Podsumowanie Big Data vs. Small Data

Big Data to połączenie szalonych ilości danych ustrukturyzowanych, półstrukturyzowanych i nieustrukturyzowanych, które są zbyt złożone, aby mogły być analizowane i przetwarzane przez tradycyjne techniki przetwarzania danych. Są to duże zbiory danych, których rozmiar przekracza możliwości typowych narzędzi programowych do przetwarzania, przechowywania i analizowania. Big Data różni się dość znacznie od tradycyjnego pojęcia small data pod względem objętości, szybkości, różnorodności i prawdziwości. Małe dane, przeciwnie, to dane na tyle małe, że można je wygodnie przechowywać na pojedynczej maszynie, zwłaszcza na lokalnych serwerach, lub na laptopie, i są łatwo dostępne.