Tiedonlouhinta

Avoin toiminta

Tiedonlouhinta (Data Mining) tarkoittaa prosessia, jossa analysoidaan piilotettuja datan kuvioita eri näkökulmista, jotta tämä data voidaan muuttaa hyödylliseksi ja usein toiminnalliseksi tiedoksi. Data kerätään ja koostetaan yhteen paikkaan, kuten tietovarastoihin, ja tiedonlouhinta-algoritmit etsivät erilaisia kuvioita, joita yritykset voivat käyttää tekemään parempia päätöksiä

Toimivan liiketoiminnan kannalta on tärkeää pystyä tekemään tietoon perustuvia päätöksiä, jotka auttavat leikkaamaan kustannuksia, lisäämään tuloja tai palvelemaan asiakkaita paremmin.

Tiedonlouhintaa kutsutaan myös tiedon löytämiseksi tai tiedon löydön prosessiksi. Se on kriittinen liiketoimintatiedon alueella datavetoisten päätösten tekemiseksi.

Tiedonlouhinta – miten sitä tehdään?

Tiedonlouhinta on monitieteinen ala, jossa pyritään etsimään syy-seuraussuhteita eri muuttujien kesken. Se on erityisen arvokasta nykypäivänä, kun pyritään tutkimaan suuria tietomääriä eli niin sanottu big dataa.

Tiedonlouhinnan prosessiin kuuluvat seuraavat vaiheet:

  1. Datan poiminta, muuntaminen ja tallentaminen tietokantaan
  2. Datan säilyttäminen ja hallinta moniulotteisissa tietokannoissa
  3. Datan tarjoaminen analyytikoille erilaisten ohjelmistojen avulla
  4. Analysoitujen tietojen esittäminen helposti ymmärrettävissä muodoissa, kuten graafeina.

Tiedonlouhinnan ensimmäinen askel on kerätä liiketoiminnalle kriittistä tietoa esimerkiksi sen omistamista tietokannoista. Nykyään tietoa kerätään netissä monista eri lähteistä, jotka yhdessä muodostavat valtavia määriä järjestelmätöntä tietoa.

Yrityksen data voi olla joko transaktionaalista, operatiivista tai metatietoa. Transaktionaalinen data käsittelee päivittäisiä toimintoja, kuten myyntejä, varastoja ja kustannuksia. Nämä ovat sinänsä tärkeitä ja hyvin tuttuja tapoja kerätä tietoja liiketoiminnan kohteena olevista kuluttajista.

Operatiivinen data on yleensä ennusteita, kun taas metatieto keskittyy loogiseen tietokannan suunnitteluun. Tietoelementtien väliset kuviot ja niiden suhteet voivat usein tuottaa olennaista tietoa liiketoimintaprosessien parantamiseksi. Jos jokin liiketoiminnan osa ei toimi optimaalisella tavalla, sitä voidaan tiedonlouhinnan avulla parantaa huomattavasti.

Asiakaskeskeiset organisaatiot käsittelevät dataa tarjoamalla selkeitä kuvia myydyistä tuotteista, hinnoista, kilpailusta ja asiakkaista. Tässä kohdin tiedon oikeanlainen louhinta sekä sen analysoiminen saattaa antaa merkittävääkin kilpailuetua kohdemarkkinoilla.

Esimerkiksi vähittäiskaupan jättiläinen Walmart lähettää kaiken olennaisen tiedon tietovarastoon, jossa sillä on käytössä teratavujen edestä dataa. Tämä data on helposti saatavilla kaikille sen toimitusketjuun osallistuville toimijoille. Näin koko prosessia voidaan muuttaa tehokkaammaksi, kun asiakkaiden käyttäytymisestä saadaan tarkempaa dataa.

Yrityksen toimihenkilöt voivat tuottaa erilaisia kuvioita ostotottumuksista, kuten tärkeistä päivistä, eniten haetuista tuotteista ja muista vastaavanlaisista ilmiöistä. Juuri tähän tiedonlouhintatekniikat tarjoavat arvokkaita työkaluja.

Tiedonlouhinnan toinen vaihe on sopivan algoritmin valitseminen – mekanismi, joka tuottaa mallin datan louhimista varten. Algoritmin yleinen toimintaperiaate saattaa perustua trendien tunnistamiseen tai muuhun vastaavaan. Ajan saatossa algoritmeja voidaan myös kehittää entistä paremmiksi, kun niiden toiminnasta saada lisätietoja.

Tiedonlouhinnassa suosittuja algoritmeja ovat luokittelualgoritmit ja regressioalgoritmit, joita käytetään datan elementtien välisten suhteiden tunnistamiseen. Suuret tietokantasovellusten toimittajat, kuten Oracle ja SQL, sisällyttävät palveluihinsa tiedonlouhintaan liittyviä algoritmeja vastatakseen asiakkaiden vaatimuksiin.

Samankaltaiset termit

Margaret Rouse
Technology expert
Margaret Rouse
Teknologia-asiantuntija

Margaret Rouse on palkittu teknologiatoimittaja ja opettaja, joka tunnetaan hänen kyvyistään selittää vaikeitakin teknologisia konsepteja aiheesta vähemmän tietävälle finanssialan yleisölle. Viimeisen 20 vuoden ajan hänen selityksensä ovat ilmestyneet TechTargetin nettisivuille, minkä lisäksi häntä ovat siteeranneet asiantuntijana New York Times, Time Magazine, USA Today, ZDNet, PC Magazine ja Discovery Magazine. Margaretin mielestä mikään ei ole hauskempaa kuin opettaa IT-alan ja finanssialan ammattilaisille, kuinka toisen alan hyvin spesifillä kielellä puhutaan. Jos sinulla on ideoita selitettävistä termeistä tai parannuksista aikaisempiin selityksiin, lähetä sähköpostia Margaretille tai ota yhteyttä häneen LinkedInissä tai Twitterissä.