Dane nie były już postrzegane jako statyczne lub nieświeże, których przydatność lub wartość kończyła się po osiągnięciu celu, dla którego zostały zebrane. Dane stały się raczej surowcem biznesowym, istotnym elementem, wykorzystywanym do tworzenia nowej formy wartości ekonomicznej. W rzeczywistości dane są skarbnicą innowacji i usług w dzisiejszym cyfrowym świecie, gotową udowodnić swoją wartość przy użyciu odpowiednich narzędzi. Postęp technologiczny i rozpowszechnienie Internetu dały początek całemu nowemu wszechświatowi nowych treści, nowych danych i nowych źródeł informacji wokół nas. W naukach takich jak astronomia i genomika powstał termin „Big Data”. Koncepcja ta przenosi się obecnie na wszystkie obszary funkcjonalne ludzkiego przedsięwzięcia. Niezależnie od tego, jak się ją definiuje, zjawisko Big Data jest coraz bardziej obecne i coraz ważniejsze. Big Data ma w sobie ogromny potencjał wartości i niezliczone możliwości kształtowania przyszłości. Data Science jest głównym środkiem do odkrycia i wykorzystania tego potencjału.

Co to jest Big Data?

Nie ma konkretnej definicji Big Data, niezależnie; zjawisko Big Data jest wszechobecne. Big Data to termin uniwersalny, który odnosi się do ilości informacji tak dużych, tak rozległych i tak złożonych, że nie można nimi zarządzać za pomocą konwencjonalnych narzędzi do przetwarzania danych. Ilość informacji nie mieści się już w pamięci, którą komputery wykorzystują do przetwarzania, więc inżynieria zaczęła pracować nad nowymi narzędziami, które mogłyby to wszystko analizować. W ten sposób powstały nowe technologie przetwarzania, takie jak MapReduce firmy Google czy Hadoop, który wyszedł z Yahoo. Podstawową ideą Big Data jest to, że wszystko, co robimy, pozostawia po sobie cyfrowy ślad, czyli dane, które można analizować, aby uzyskać użyteczne spostrzeżenia. Big Data charakteryzuje się czterema cechami V – objętością, różnorodnością, szybkością i prawdziwością. Na najbardziej podstawowym poziomie Big Data to zbiór danych, które mogą być analizowane w celach biznesowych.





Co to jest Data Science?

Big Data ma w sobie ogromny potencjał wartości, a Data Science jest głównym środkiem do odkrycia i wykorzystania tego potencjału. Data Science to interdyscyplinarna dziedzina, która zajmuje się wszystkimi rzeczami związanymi z danymi, zapewniając sposoby korzystania z Big Data. Możliwość gromadzenia danych w formie elektronicznej spowodowała powstanie nowej, ekscytującej dziedziny Data Science – połączenia dyscyplin informatyki i statystyki w celu analizowania szalenie ogromnych ilości danych, co prowadzi do odkrywania wiedzy. Ideą Data Science jest identyfikacja wzorców, odkrywanie zależności i nadawanie sensu surowym danym. Jest to dziedzina, która zajmuje się złożonym światem danych, jednocześnie używając mieszanki narzędzi i algorytmów, aby wydobyć z nich użyteczne informacje.

Różnica między Big Data a Data Science

Definicja

– Big Data odnosi się do dużych ilości danych, które są zbyt obszerne i złożone, aby można je było przechowywać i przetwarzać za pomocą tradycyjnych aplikacji do przetwarzania danych. Big Data obejmuje wszystkie rodzaje danych, które pomagają dostarczyć właściwe informacje, do właściwej osoby, we właściwej ilości, aby pomóc w podejmowaniu świadomych decyzji. Data Science to dziedzina, która obejmuje wszystko, co związane z danymi, w tym sposoby korzystania z Big Data. Data Science jest głównym środkiem do odkrycia i wykorzystania potencjału Big Data.



Koncepcja

– Big Data charakteryzuje się czterema V – volume, variety, velocity i veracity. Odzwierciedla wszystko, od objętości danych, przez złożoność typów i struktur danych, po szybkość tworzenia nowych danych. Big Data to dane lub informacje, które mogą być wykorzystane do analizy insightów, co skutkuje świadomymi decyzjami i strategicznymi posunięciami biznesowymi. Możliwość gromadzenia danych w formie elektronicznej spowodowała powstanie dziedziny Data Science, która łączy dyscypliny informatyki i statystyki w celu analizy szalenie ogromnych ilości danych, które mogą prowadzić do odkrycia wiedzy.



Cel

– Prawdziwa wartość Big Data nie leży w dużych ilościach danych, ale w tym, co możemy z nimi zrobić. To nie ilość danych robi różnicę, ale zdolność analityków do analizowania ogromnych i złożonych zbiorów danych, czego nie można było zrobić wcześniej. Celem jest pomoc przedsiębiorstwom w tworzeniu nowych możliwości wzrostu lub osiągnięcie znaczącej przewagi nad tradycyjnymi praktykami biznesowymi. Celem Data Science jest wykorzystanie możliwości, jakie stwarza Big Data przy użyciu nowych architektur danych, zasad, narzędzi i algorytmów.

Podsumowanie Big Data vs. Data Science

Big Data ma w sobie ogromny potencjał wartości, a Data Science jest głównym środkiem do odkrycia i wykorzystania tego potencjału. Big Data to dane lub informacje, które mogą być wykorzystane do analizy insightów. Ostatecznym celem pracy z Big Data jest wydobycie użytecznych informacji. Data Science wykorzystuje możliwości, jakie daje Big Data, stosując nowe metody wywodzące się ze statystyki, informatyki i sztucznej inteligencji. Zastosowanie praktyk Data Science do Big Data jest cenną strategią różnicowania, ale w niedalekiej przyszłości stanie się prawdopodobnie standardową podstawową kompetencją.