Ostrukturerad data

Varför oss?

I denna artikel utforskar vi ostrukturerad data, dess källor och användningsområden, samt hur företag kan analysera denna data för att förbättra kundrelationer och effektivisera hantering.

Vad är ostrukturerad data?

Ostrukturerad data är digital information som inte kan lagras effektivt i en relationsdatabas (RDMS) eftersom den inte använder förinställda datamodeller eller scheman.

Ostrukturerad data, som kan vara rå, lagras ofta i en datasjö. Källor för ostrukturerad data är till exempel sensorer och ställdon, e-post och textmeddelanden, Word-dokument, PowerPoint-presentationer, elektroniska patientjournaler (EHR), digitala bilder, ljudfiler och videor.

I kundcentrerade företag kan ostrukturerad data analyseras för att förbättra relationsmarknadsföring och hantering av kundrelationer (CRM).

Techopedia förklarar ostrukturerad data

Ostrukturerad data avser data som följer en form som är mindre ordnad än objekt som kalkylbladssidor, databastabeller eller andra linjära eller ordnade datauppsättningar. I själva verket är termen “datauppsättning” användbar eftersom den associeras med data som finns i snygga, tillgängliga matriser, utan extra innehåll, och som är länkade eller taggade i en specifik struktur.

Ostrukturerad Data Semi-Strukturerad Data Strukturerad Data
Karakteristisk Inga definierade datamodeller; svår att söka Löst kopplade datamodeller Klart definierade datamodeller; lätt att söka
Exempel Bildfil Callcenter-logg Kalkylblad
Lagring Datasjö (Data lake) Organiserat med metataggar Relationsdatabas

Andra exempel på ostrukturerade textdata är:

  • Word-dokument
  • PowerPoint-presentationer
  • Snabbmeddelanden
  • Samarbetsprogram
  • Dokument
  • Böcker
  • Inlägg på sociala medier
  • Journaler

Icke-textuella ostrukturerade data skapas i allmänhet i media, till exempel:

  • MP3-ljudfiler
  • JPEG-bilder
  • Flash-videofiler

Ostrukturerad data har vanligtvis ingen fördefinierad datamodell och det är inte säkert att den passar bra ihop med relationstabeller. Ostrukturerad data består vanligtvis av text. De kan dock innehålla siffror och datum samt fakta. Detta leder till tvetydigheter som är svåra att identifiera med hjälp av konventionella program.

Lagring av stora mängder ostrukturerad data som genereras inom ett företag kan, om den hanteras dåligt, leda till högre kostnader. Data i pappersdokument eller i elektroniskt format måste skannas för att ett sökprogram ska kunna analysera idéer, beroende på ord som används i vissa sammanhang. Detta är känt som företagssökning eller semantisk sökning.

Relaterade termer

Margaret Rouse
Technology Expert
Margaret Rouse
Teknikexpert

Margaret Rouse är en prisbelönt teknisk skribent och lärare som är känd för sin förmåga att förklara komplexa tekniska ämnen för en icke-teknisk affärspublik. Under de senaste tjugo åren har hennes förklaringar publicerats på TechTargets webbplatser och hon har citerats som en auktoritet i artiklar av New York Times, Time Magazine, USA Today, ZDNet, PC Magazine och Discovery Magazine.Margarets idé om en rolig dag är att hjälpa IT- och affärsproffs att lära sig tala varandras högt specialiserade språk. Om du har ett förslag på en ny definition eller hur man kan förbättra en teknisk förklaring, vänligen maila Margaret eller kontakta…