10 zasad i zakazów dotyczących Big Data

Dlaczego warto zaufać Techopedii
Przegląd najważniejszych treści

Big data to nowa i dopiero rozwijająca się domena dla większości firm. Aby działała, wymaga starannego dostrojenia i stosowania najlepszych praktyk.

Big data jest wykorzystywana i stosowana w wielu dziedzinach biznesu, ponieważ analityka danych, sztuczna inteligencja i uczenie maszynowe stają się częścią głównego nurtu. Analityka big data może wydobyć prawdziwą wartość z tego bogactwa danych, a dane te mogą być ustrukturyzowane, nieustrukturyzowane lub częściowo ustrukturyzowane.

Pojawienie się mediów społecznościowych dało wiele nowych możliwości gromadzenia danych o zachowaniach klientów. Oto kilka przykładów:

  • Dane Clickstream pochodzą z interakcji na stronie internetowej, takich jak kliknięcia myszą i przewijanie strony internetowej.
  • Społecznościowe serwisy biznesowe to internetowe społeczności klientów, którzy chętnie dzielą się informacjami na temat swoich zachowań zakupowych.
  • Czujniki dostarczają danych o fizycznych środowiskach klientów, takich jak temperatura, wilgotność i wzorce ruchu.

Spostrzeżenia uzyskane z analizy danych mogą pomóc organizacjom w procesie podejmowania decyzji. Jednak prawdziwe korzyści z big data można osiągnąć tylko wtedy, gdy są one zarządzane we właściwy sposób. Organizacje mogą uniknąć zagubienia się w przestrzeni big data, identyfikując punkt wyjścia z prostymi przypadkami użycia i wdrażając je w celu szybkiego sprawdzenia wyników.

Pierwszym krokiem przed rozpoczęciem jakiejkolwiek inicjatywy związanej z big data jest odpowiednie planowanie. Organizacja musi jasno znać cel projektu. Powinna również określić, jaką wartość chce wydobyć i jak wpłynie to na decyzje biznesowe. Na początek należy wybrać najbardziej obiecujący obszar.

W tym artykule omówimy niektóre z zaleceń i zakazów związanych z inicjatywami Big Data.

1. Poznaj cel i punkt wyjścia

Cel gromadzenia danych i określenie punktu wyjścia jest bardzo ważne dla powodzenia każdego projektu big data. Na początek celem powinno być zidentyfikowanie najbardziej obiecujących przypadków użycia dla firmy. Pomoże to organizacji zidentyfikować komponenty dla tych przypadków użycia.

Następnie należy przeprowadzić odpowiednie planowanie, aby zastosować techniki Bigdata do tych przypadków użycia i uzyskać cenny wgląd w rozwój firmy. Priorytet wykonania powinien zależeć od takich czynników jak:

  • Koszt wdrożenia.
  • Przewidywany wpływ na biznes.
  • Długość czasu wymaganego do uruchomienia.
  • Szybkość wdrożenia.

Organizacje powinny zawsze zaczynać od prostej i łatwej do wdrożenia aplikacji jako projektu pilotażowego. (Przeczytaj także: Dlaczego warto porzucić narzędzie do zarządzania projektami na rzecz systemu operacyjnego).

2. Prawidłowo oceniaj licencje na dane

Dane są paliwem dla wszelkich projektów Big Data i analitycznych. Dlatego bardzo ważne jest, aby chronić dane przed niewłaściwym wykorzystaniem. Przed udzieleniem dostępu do danych jakiemukolwiek dostawcy lub użytkownikowi zewnętrznemu należy wdrożyć odpowiednie warunki licencjonowania. Licencja na dane powinna jasno określać następujące podstawowe punkty. W umowie licencyjnej znajdzie się również wiele innych krytycznych parametrów.

  • Kto będzie korzystał z danych?
  • Jakie dane będą dostępne?
  • W jaki sposób dane będą wykorzystywane?

Jeśli wystąpi jakikolwiek błąd w licencjonowaniu, wynikająca z tego utrata danych i niewłaściwe użycie będą miały niezaprzeczalnie negatywny wpływ na biznes.

3. Zezwalaj na demokratyzację danych

Demokratyzację danych można zdefiniować jako ciągły proces, w którym każdy w organizacji ma dostęp do danych. Ludzie w organizacji powinni czuć się komfortowo, pracując z danymi i śmiało wyrażać swoje opinie.

Demokratyzacja danych pomaga organizacjom stać się bardziej zwinnymi i podejmować decyzje biznesowe oparte na danych. Można to osiągnąć poprzez ustanowienie odpowiedniego procesu. Po pierwsze, dane powinny być dostępne dla wszystkich warstw, niezależnie od struktury organizacyjnej. Po drugie, po walidacji danych należy ustanowić jedno źródło prawdy (zwane „złotym źródłem”). Po trzecie, każdy powinien mieć możliwość sprawdzenia danych i wniesienia swojego wkładu. Po czwarte, nowe pomysły mogą być testowane poprzez podejmowanie skalkulowanego ryzyka. Jeśli nowy pomysł zakończy się sukcesem, organizacje mogą iść naprzód, w przeciwnym razie można go uznać za wyciągniętą lekcję.

4. Buduj kulturę współpracy

W grze Big Data bardzo ważna jest wzajemna współpraca między różnymi działami i grupami w organizacji. Inicjatywa big data może odnieść sukces tylko wtedy, gdy zostanie zbudowana odpowiednia kultura organizacyjna na wszystkich poziomach, niezależnie od ich ról i obowiązków.

Kierownictwo organizacji powinno mieć jasną wizję przyszłości i musi zachęcać do nowych pomysłów. Wszyscy pracownicy i ich działy powinni mieć możliwość znajdowania okazji i budowania sprawdzonych koncepcji, aby je zweryfikować. Nie powinno być żadnej polityki obwiniania i zatrzymywania gry. Jest to zawsze proces uczenia się, który musi być akceptowany zarówno w przypadku sukcesu, jak i porażki.

5. Ocena infrastruktury big data

Część infrastrukturalna każdego projektu Big Data jest równie ważna. Ilość danych jest mierzona w petabajtach, które są przetwarzane w celu uzyskania wglądu. Z tego powodu zarówno infrastruktura przechowywania, jak i przetwarzania danych musi być odpowiednio oceniona.

Centra danych są wykorzystywane do celów przechowywania danych, więc muszą być oceniane pod kątem składników kosztów, zarządzania, tworzenia kopii zapasowych, niezawodności, bezpieczeństwa, skalowalności i wielu innych czynników. (Przeczytaj także: 6 kluczowych zagrożeń związanych z chmurą publiczną).

Podobnie, przetwarzanie dużych zbiorów danych i powiązana infrastruktura technologiczna muszą zostać dokładnie sprawdzone przed sfinalizowaniem transakcji. Usługi w chmurze są generalnie bardzo elastyczne pod względem wykorzystania i kosztów. Uznani dostawcy usług w chmurze to między innymi AWS, Azure i GCP, ale na rynku jest też wielu innych.

Centra danych są wykorzystywane do celów przechowywania danych, więc muszą być oceniane pod kątem składników kosztów, zarządzania, tworzenia kopii zapasowych, niezawodności, bezpieczeństwa, skalowalności i wielu innych czynników. (Przeczytaj także: 6 kluczowych zagrożeń związanych z chmurą publiczną).

6. Nie zgub się w morzu danych

Dobre zarządzanie danymi jest bardzo ważne dla powodzenia projektów big data. Przed wdrożeniem należy zaplanować odpowiednią strategię gromadzenia danych. Ogólnie rzecz biorąc, istnieje powszechna tendencja do gromadzenia wszystkich starszych danych biznesowych. Jednak wszystkie te dane mogą nie pasować do obecnych scenariuszy biznesowych. Dlatego ważne jest, aby najpierw zidentyfikować przypadki użycia biznesowego i określić, gdzie dane będą stosowane.

Gdy strategia danych jest dobrze zdefiniowana i bezpośrednio łączy się z docelową aplikacją biznesową, można zaplanować kolejny krok wdrożenia. Następnie nowe dane mogą zostać rozszerzone w celu poprawy modelu i jego wydajności.

7. Nie zapominaj o  oprogramowaniu open source

Przydatność rozważanej technologii powinna być oceniana na podstawie wielkości projektu i budżetu organizacyjnego. Wiele platform open source jest dostępnych za darmo do prowadzenia projektów pilotażowych. Małe i średnie organizacje mogą korzystać z rozwiązań open source, aby rozpocząć swoją przygodę z big data. Tak więc, organizacja powinna skupić się na wynikach i ROI.

Hadoop to platforma oprogramowania typu open source, która wykorzystuje HDFS (rozproszony system plików Hadoop) i MapReduce do analizy dużych zbiorów danych na klastrach sprzętu towarowego, czyli w rozproszonym środowisku obliczeniowym. (Przeczytaj: Jak mogę wykorzystać Hadoop do analizy dużych zbiorów danych?)

Ruch Big Data dojrzał do punktu, w którym Hadoop stał się de facto standardem przetwarzania dużych zbiorów danych. MapReduce to model programowania służący do dystrybucji danych i ich równoległego przetwarzania w klastrze komputerów przy użyciu prostych modeli programowania. Został on opracowany przez Google w celu wydajnego przetwarzania dużych ilości danych na dużych klastrach komputerów.

8. Nie zaczynaj bez odpowiedniego planowania

Bardzo niebezpiecznym trendem jest rozpoczynanie wszystkich projektów Big Data za jednym zamachem. Takie podejście prawdopodobnie doprowadzi tylko do częściowego sukcesu lub całkowitej porażki. Organizacje powinny odpowiednio planować przed rozpoczęciem inicjatyw związanych z big data, zamiast iść na całość lub podejmować skok wiary. Zawsze zaleca się rozpoczęcie od prostej, małej i mierzalnej aplikacji.

Gdy pilotaż zakończy się sukcesem, można go wdrożyć w aplikacjach na dużą skalę. Kluczowe jest poświęcenie czasu na opracowanie planu i staranny wybór projektu pilotażowego.

9. Nie zaniedbuj bezpieczeństwa

Bezpieczeństwo danych to kolejny ważny aspekt projektów big data. W każdym scenariuszu big data, petabajty danych są pobierane z różnych systemów źródłowych, a następnie przetwarzane. Przetworzone dane stanowią dane wejściowe do modelu analitycznego. Wynikiem analizy jest cenny wgląd w działalność firmy. Po udoskonaleniu surowych danych i wydobyciu z nich znaczących informacji, poufność, integralność i dostępność (CIA) tych informacji staje się krytyczna.

Gdy dane zawierają krytyczne informacje biznesowe, stają się cenne dla organizacji. Dlatego dane te muszą być zabezpieczone przed zagrożeniami zewnętrznymi. Bezpieczeństwo danych musi być zaplanowane jako część cyklu życia wdrożenia Big Data. (Przeczytaj także: Bezpieczeństwo w chmurze: 5 typowych zagrożeń cybernetycznych).

10. Nie skupiaj się na pojedynczych jednostkach biznesowych

W dzisiejszym złożonym scenariuszu biznesowym skupianie się na pojedynczej jednostce biznesowej nie pomoże. Organizacje powinny spojrzeć na biznes jako całość i myśleć w kategoriach globalnej perspektywy. Najlepszym podejściem powinno być podejmowanie małych kroków na raz i utrzymywanie globalnego spojrzenia. Koncentracja powinna być holistyczna pod względem jednostek biznesowych. Będzie to miało pozytywny wpływ i lepszy zwrot z inwestycji.

Podsumowanie

Nie ma konkretnej ścieżki sukcesu dla wdrożenia Big Data. Jest to jednak połączenie planowania, strategii, podejścia i różnych innych czynników, które prowadzą do sukcesu.

Każda organizacja ma konkretny cel do osiągnięcia, więc strategia powinna być odpowiednio zaplanowana, projekt pilotażowy musi być starannie wybrany, a uzyskane informacje muszą być odpowiednio chronione i traktowane.

Related Articles

Margaret Rouse
Technology Expert
Margaret Rouse
ekspertka ds. technologii

Margaret jest nagradzaną technical writerką, nauczycielką i wykładowczynią. Jest znana z tego, że potrafi w prostych słowach pzybliżyć złożone pojęcia techniczne słuchaczom ze świata biznesu. Od dwudziestu lat jej definicje pojęć z dziedziny IT są publikowane przez Que w encyklopedii terminów technologicznych, a także cytowane w artykułach ukazujących się w New York Times, w magazynie Time, USA Today, ZDNet, a także w magazynach PC i Discovery. Margaret dołączyła do zespołu Techopedii w roku 2011. Margaret lubi pomagać znaleźć wspólny język specjalistom ze świata biznesu i IT. W swojej pracy, jak sama mówi, buduje mosty między tymi dwiema domenami, w ten…