10 saker att göra och inte göra med Big Data

Varför oss?
Viktiga noteringar

Big data är ett nytt och framväxande område för de flesta företag. För att få det att fungera krävs noggrann finjustering och användning av bästa praxis.

Big data används och tillämpas inom flera olika affärsområden i takt med att dataanalys, artificiell intelligens och maskininlärning blir allt vanligare. Big data-analys kan utvinna det verkliga värdet ur denna mängd data, och dessa data kan vara strukturerade, ostrukturerade eller halvstrukturerade.

Framväxten av sociala medier har gett upphov till många nya möjligheter att samla in data om kundbeteenden. Här är några exempel:

  • Clickstream-data kommer från interaktioner på webbplatsen, t.ex. musklick och bläddring på webbsidan.
  • Sociala företagssajter är onlinegemenskaper med kunder som är villiga att dela information om sitt köpbeteende.
  • Sensorer tillhandahåller data om kundernas fysiska miljöer, t.ex. temperatur, luftfuktighet och trafikmönster.

Insikterna från dataanalyser kan hjälpa organisationer i deras beslutsprocess. Men den verkliga nyttan med big data uppnås bara om den hanteras på rätt sätt. Organisationer kan undvika att gå vilse i big data-världen genom att identifiera startpunkten med enkla användningsfall och implementera den för att snabbt kontrollera resultatet.

Det första steget innan man påbörjar ett big data-initiativ är ordentlig planering. En organisation måste tydligt veta syftet med projektet. De bör också identifiera vilket värde de vill utvinna och hur det kommer att påverka affärsbesluten. Det mest lovande området bör väljas till att börja med.

I den här artikeln kommer vi att utforska några av de saker som bör och inte bör göras i samband med big data-initiativ.

1. Känn till syftet och startpunkten

Syftet med datainsamlingen och att identifiera startpunkten är mycket viktigt för att lyckas med alla big data-projekt. Till att börja med bör målet vara att identifiera de mest lovande användningsfallen för verksamheten. Det kommer att hjälpa organisationen att identifiera komponenterna för dessa användningsfall.

Därefter bör en ordentlig planering göras för att tillämpa Bigdata-tekniker på dessa användningsfall och extrahera värdefull insikt för företagets tillväxt. Prioriteringen av utförandet bör bero på faktorer som:

  • Kostnad för genomförande.
  • Förväntad inverkan på verksamheten.
  • Tidsåtgång för lansering.
  • Implementeringens hastighet.

Organisationer bör alltid börja med en enkel applikation som är lätt att implementera som ett pilotprojekt. (Läs också: Varför du bör byta ut ditt projekthanteringsverktyg mot ett arbets-OS).

2. Utvärdera datalicenser på rätt sätt

Data är bränslet för alla big data- och analysprojekt. Därför är det mycket viktigt att skydda dina data från missbruk. Korrekta licensvillkor bör finnas på plats innan dataåtkomst beviljas till en leverantör eller tredjepartsanvändare. Datalicensen bör tydligt nämna följande grundläggande punkter. Det kommer också att finnas många andra kritiska parametrar i licensavtalet.

  • Vem kommer att använda uppgifterna?
  • Vilka data kommer att vara tillgängliga?
  • Hur kommer uppgifterna att användas?

Om licensieringen inte fungerar kommer dataförlust och felaktig användning att få negativa konsekvenser för verksamheten.

3. Tillåt demokratisering av data

Datademokratisering kan definieras som en kontinuerlig process där alla i en organisation har tillgång till data. Medarbetarna i en organisation bör känna sig bekväma med att arbeta med data och uttrycka sina åsikter på ett självsäkert sätt.

Datademokratisering hjälper organisationer att bli mer flexibla och fatta datainformerade affärsbeslut. Detta kan uppnås genom att etablera en lämplig process. För det första bör data vara tillgängliga för alla lager, oavsett organisationsstruktur. För det andra bör en enda sanningskälla (kallad “den gyllene källan”) fastställas efter validering av data. För det tredje bör alla ha rätt att kontrollera uppgifterna och ge sina synpunkter. För det fjärde kan de nya idéerna testas genom att man tar kalkylerade risker. Om den nya idén är framgångsrik kan organisationen gå vidare, annars kan den betraktas som en lärdom.

4. Bygg upp en samarbetskultur

I spelet om big data är ömsesidigt samarbete mellan olika avdelningar och grupper i en organisation mycket viktigt. Ett big data-initiativ kan bara bli framgångsrikt om man bygger upp en ordentlig organisationskultur på alla nivåer, oavsett roller och ansvarsområden.

Ledningen för en organisation bör ha en tydlig vision för framtiden och de måste uppmuntra nya idéer. Alla anställda och deras avdelningar bör tillåtas att hitta möjligheter och bygga koncept för att validera dem. Det bör inte finnas någon politik för att skylla ifrån sig och stoppa spelet. Det är alltid en inlärningsprocess, som måste accepteras lika mycket för både framgång och misslyckande.

5. Utvärdera infrastrukturen för big data

Infrastrukturdelen av alla big data-projekt är lika viktig. Datavolymen mäts i petabyte, som bearbetas för att utvinna insikter. Därför måste både lagrings- och bearbetningsinfrastrukturen utvärderas ordentligt.

Datacenter används för lagringsändamål och måste utvärderas med avseende på kostnadskomponenter, hantering, säkerhetskopiering, tillförlitlighet, säkerhet, skalbarhet och många andra faktorer.

På samma sätt måste behandlingen av big data och den relaterade tekniska infrastrukturen kontrolleras noggrant innan affären slutförs. Molntjänster är i allmänhet mycket flexibla när det gäller användning och kostnad. Etablerade molnleverantörer inkluderar tunga aktörer som AWS, Azure och GCP, men det finns också många fler på marknaden.

6. Gå inte vilse i havet av data

God datastyrning är mycket viktigt för att lyckas med big data-projekt. En lämplig strategi för datainsamling bör planeras före implementeringen. I allmänhet finns det en tendens att samla in alla äldre data i ett företag. Men all denna data kanske inte passar så bra för aktuella affärsscenarier. Därför är det viktigt att först identifiera verksamhetens användningsområden och bestämma var datan ska användas.

När datastrategin är väldefinierad och direkt kopplad till målaffärsapplikationen kan nästa steg i implementeringen planeras. Efter detta kan nya data läggas till för att förbättra modellen och dess effektivitet.

7. Glöm inte bort öppen källkod

Användbarheten av den teknik du överväger bör utvärderas baserat på projektets storlek och organisationens budget. Många open source-plattformar är tillgängliga gratis för att driva pilotprojekt. Små och medelstora organisationer kan utforska dessa open source-lösningar för att starta sin big data-resa. Organisationens fokus bör ligga på resultatet och ROI.

Hadoop är ett ramverk med öppen källkod som använder HDFS (Hadoop Distributed File System) och MapReduce för att analysera stora datamängder på kluster av råvara – det vill säga i en distribuerad datormiljö.

Big Data-rörelsen har mognat till den punkt där Hadoop har blivit de facto-standarden för bearbetning av big data. MapReduce är en programmeringsmodell för att distribuera data och bearbeta dem parallellt över ett kluster av datorer med hjälp av enkla programmeringsmodeller. Den utvecklades av Google för effektiv bearbetning av stora datamängder på stora datorkluster.

8. Börja inte utan ordentlig planering

Det är en mycket farlig trend att starta alla sina big data-projekt på en gång. Detta tillvägagångssätt kommer sannolikt bara att leda till delvis framgång eller totalt misslyckande. Organisationer bör planera ordentligt innan de startar sina big data-initiativ snarare än att gå all in eller ta ett språng av tro. Det är alltid rekommenderat att börja med en enkel, liten och mätbar applikation.

När pilotprojektet är framgångsrikt kan det implementeras i storskaliga applikationer. Det är viktigt att ta sig tid att utveckla en plan och att välja pilotprojekt med omsorg.

9. Försumma inte säkerheten

Datasäkerhet är en annan viktig aspekt av big data-projekt. I alla big data-scenarier hämtas petabytes av data från olika källsystem och bearbetas sedan. Den bearbetade datan är indata till analysmodellen. Resultatet av analysen är värdefulla insikter för verksamheten. När rådata har förfinats och meningsfull information har utvunnits ur rådata blir informationens konfidentialitet, integritet och tillgänglighet (CIA) av avgörande betydelse.

När data innehåller kritisk affärsinformation blir den värdefull för organisationen. Därför måste dessa data skyddas från externa hot. Datasäkerhet måste planeras som en del av livscykeln för implementering av big data.

10. Fokusera inte på isolerade affärsenheter

I dagens komplexa affärsscenario hjälper det inte att fokusera på en enskild affärsenhet. Organisationer bör ta ett helhetsgrepp om verksamheten och tänka i termer av ett globalt perspektiv. Det bästa tillvägagångssättet är att ta små steg i taget och behålla en global syn. Fokus bör vara holistiskt när det gäller affärsenheter. Det kommer att ge positiva effekter och bättre ROI.

Slutsats

Det finns ingen specifik framgångsväg för implementering av big data. Men det är en kombination av planering, strategi, tillvägagångssätt och olika andra faktorer som leder till framgång.

Varje organisation har ett specifikt mål att uppnå, så strategin bör planeras i enlighet med detta, pilotprojektet måste väljas med omsorg och den resulterande informationen måste skyddas och behandlas korrekt.

Relaterade termer

Relaterade nyheter

Kaushik Pal
Technology writer
Kaushik Pal
Teknikskribent

Kaushik är teknisk arkitekt och programvarukonsult och har över 23 års erfarenhet av analys, utveckling, arkitektur, design, testning och utbildning inom programvarubranschen. Han är intresserad av ny teknik och innovationsområden. Han fokuserar på webbarkitektur, webbteknik, Java/J2EE, öppen källkod, WebRTC, big data och semantisk teknik. Han har visat sin expertis inom kravanalys, arkitekturdesign och implementering, förberedelse av tekniska användningsfall och mjukvaruutveckling. Hans erfarenhet har spänt över olika områden som försäkring, bank, flygbolag, sjöfart, dokumenthantering och produktutveckling etc. Han har arbetat med en mängd olika tekniker, från stordator (IBM S/390), mellanklass (AS/400), webbteknik, öppen källkod och big data. Kaushik är främst involverad…