Koneoppiminen (ML)

Avoin toiminta

Koneoppiminen on ennen kaikkea tekoälyn (AI) toimintaa vahvistava ja mahdollistava teknologia. Tämä artikkeli kertoo tarkemmin minkä tyyppisestä teknologiasta on kyse.

Mitä koneoppiminen (ML) tarkoittaa?

Koneoppiminen (eng. Machine Learning) on tekoälyn (AI) alaluokka, joka rakentaa algoritmisia malleja datan kuvioiden ja erilaisten suhteellisuuksien tunnistamiseksi. Tässä yhteydessä sana ‘kone’ on synonyymi tietokoneohjelmalle ja sana ‘oppiminen’ kuvaa kuinka ML-algoritmit tarkentuvat sitä mukaa, kun ne saavat lisää tietoa.

Koneoppimisen käsite on itse asiassa jo melko vanha, sillä se on ensimmäisen kerran mainittu jo vuonna 1959. Mutta sen soveltaminen käytännössä esimerkiksi liiketoiminnassa ei ollut taloudellisesti mahdollista ennen Internetin tuloa. Lisäksi viimeaikaiset kehitysaskeleet big data-analytiikan ja pilviteknologian saralla ovat tehneet ML:stä käytännönläheisemmän ilmiön.

Tämä johtuu siitä, että ML-algoritmin kouluttaminen siihen, että se kykenee löytämään tiettyjä malleja ja kuvioita kaiken tiedon joukosta vaatii paljon laskentaresursseja ja pääsyä massadataan (Big Data).

Termejä tekoäly ja koneoppiminen käytetään joskus synonyymeinä, koska viime aikoihin asti useimmat tekoälyhankkeet ovat olleet hyvin kapeita. Lisäksi useimmat ML-mallit rakennettiin suorittamaan vain yhtä tehtävää kerralla, joten ne käyttivät ohjattua oppimista ja vaativat suuria, ennalta merkittyjä tietojoukkoja koulutukseen.

Nykyään robottiprosessiautomaation (RPA) avulla voidaan automatisoida tietojen esikäsittelyprosessia ja näin ollen nopeuttaa koneoppimisalgoritmien koulutusta huomattavasti.

Techopedia selittää koneoppimisen (ML)

Laadukkaat koneoppimismallit edellyttävät korkealaatuista koulutusdataa ja pääsyä suuriin tietojoukkoihin, joista voidaan poimia tiettyihin liiketoiminnan tavoitteisiin sopivimpia ominaisuuksia, ja näin paljastaa merkityksellisiä assosiaatioita. Koneoppiminen voi siis toimia ennen kaikkea liiketoimintaa tehostavana teknologiana.

Koneoppimismallit

Koneoppimismalli on yksinkertaisesti datalla ajetun ML-algoritmin tulos. Jos aikeissasi on kokeilla koneoppimismallin rakentamista itse, siihen liittyvät vaiheet ovat seuraavat:

  1. Kerää haluamasi harjoitustiedot.
  2. Sitten valmistele tiedot harjoittelua varten.
  3. Päätä, mitä oppimisalgoritmia haluat käyttää.
  4. Syötä oppimateriaalit algoritmille.
  5. Arvioi oppimisalgoritmin tulokset.
  6. Säädä tarvittaessa algoritmin muuttujia (hyperparametrejä), jotka ohjaavat koulutusprosessia tulosten parantamiseksi.

Tyypillisessä ML-algoritmin kehittämisessä valvotut koneoppimisalgoritmit vaativat tietojoukon, joka koostuu esimerkeistä, joissa jokainen esimerkki koostuu syötteestä ja lähdöstä. Näin ollen ML-algoritmin koulutuksen tyypillinen tavoite on päivittää ennustavan mallin parametrit sen varmistamiseksi, että mallin päätöspuut tuottavat johdonmukaisesti haluttuja tuloksia. Koneoppiminen ei ole vielä valmis, vaan tässä kohtaa kuvaan astelee mukaan entropia.

Entropia on matemaattinen kaava, jota käytetään häiriöiden ja satunnaisuuden kvantifiointiin suljetussa järjestelmässä. Koneoppimisprojekteissa tärkeä tavoite on varmistaa, että entropia pysyy mahdollisimman alhaisena, koska tämä mitta määrittää, kuinka mallin päätöspuut valitsevat datan jakamisen.

Koneoppimisen koulutus

Koneoppimismallien kouluttamiseen käytetään kolmea algoritmien päätyyppiä: ohjattu oppiminen, ohjaamaton oppiminen ja vahvistusoppiminen.

  • Ohjattu oppiminen tarkoittaa, että algoritmille annetaan määritelty koulutusdata (syöte) ja näytetään oikea vastaus (tulos). Tämän tyyppinen oppimisalgoritmi käyttää historiallisten tietojoukkojen tuloksia ennustaakseen lähtöarvoja uusille, saapuville tiedoille.
  • Ohjaamaton koneoppiminen on sitä, kun algoritmille annetaan koulutusdataa, jota ei ole määritelty. Sen sijaan, että sitä pyydettäisiin ennustamaan oikea tulos, tämän tyyppinen oppimisalgoritmi käyttää opetusdataa havaitakseen kuvioita, joita voidaan sitten soveltaa muihin tietoryhmiin, jotka käyttäytyvät samaan tapaan.
  • Joissakin tilanteissa voi olla tarpeen käyttää pientä määrää määriteltyä tietoa suuren määrittelemättömän datan määrän tukena harjoituksen aikana. Tällaista koulutusta kutsutaan usein puoliohjatuksi koneoppimiseksi.
  • Vahvistusoppiminen on sitä, että harjoitustietojen sijaan algoritmille annetaan palkkiosignaali ja se etsii tiedoista malleja, jotka antavat sille palkkion. Tämän tyyppisen oppimisalgoritmin syöte on usein johdettu oppimisalgoritmin vuorovaikutuksesta fyysisen tai digitaalisen ympäristön kanssa.

Mikä voi johtaa koneoppimisessa harhaan?

Suuri yleisö haluaa, että tekoäly – ja erityisesti koneoppimisalgoritmit – ovat läpinäkyviä ja selkokielellä selitettäviä. Mutta todellisuudessa koneoppimisen algoritminen läpinäkyvyys voi olla monimutkaisempaa kuin vain sen tiedon jakaminen, mitä algoritmia käytettiin tietyn ennusteen tekemiseen.

Monet ML:n uudet käyttäjät ovat olleet yllättyneitä huomatessaan, etteivät matemaattiset algoritmit olekaan salaisia. Itse asiassa useimmat nykyään käytetyt suositut algoritmit, joita koneoppiminen käyttää, ovat vapaasti kaikkien saatavilla. Kyse on harjoitustiedosta, jolla on oma arvo, ei itse käytetystä algoritmista.

On kuitenkin huomoitava, että koska ihminen valitsee oppimisalgoritmin kouluttamiseen käytetyt tiedot, tämä voi vahingossa aiheuttaa erilaista harhaa ja ennakkoluuloisuutta rakennettavassa ML-mallissa. Oppimisalgoritmien iteratiivisuus voi myös vaikeuttaa ML-insinöörien kykyä palata taaksepäin ja jäljittää tietyn ennusteen takana olevaa logiikkaa, jos siinä huomataan korjattavaa.

Siinä tapauksessa, kun datatieteilijä tai ML-insinööri pystyy selvittämään, miten tietty ennuste tehtiin, ML-mallia voidaan kutsua selitettävissä olevaksi tekoälyksi. Mutta kun ei ole mahdollista paljastaa, kuinka tietty ennuste tehtiin – joko siksi, että matematiikasta tulee liian monimutkaista tai harjoitusdata on jonkun omistamaa – ML-mallia voidaan kutsua black box AI:ksi.

Koneoppiminen ja MLOp:it

Koneoppiminen on ilmiö, johon liittyviä projekteja valvovat yleensä datatieteilijät ja koneoppimisinsinöörit. Datatieteilijän työhön kuuluu tyypillisesti hypoteesin luominen ja koodin kirjoittaminen, joka toivottavasti todistaa hypoteesin olevan totta. ML-insinöörin työ taas keskittyy koneoppimistoimintoihin (MLOps).

Koneoppimistoiminta on tapa hallita koneoppimismallin koko elinkaarta – mukaan lukien sen koulutusta, viritystä, jokapäiväistä käyttöä tuotantoympäristössä ja mahdollista eläkkeelle siirtymistä. Tästä syystä ML-insinööreillä on oltava työtiedot tietojen mallintamisesta, ominaisuussuunnittelusta ja ohjelmoinnista. Ja kaikki tämä sen lisäksi, että heillä on vahva matematiikan ja tilastotieteen tausta ja tuntemus.

Ihannetapauksessa datatieteilijät ja ML-insinöörit tekevät samassa organisaatiossa yhteistyötä päättäessään, minkä tyyppinen oppimisalgoritmi toimii parhaiten tietyn liiketoimintaongelman ratkaisemisessa. Joillakin aloilla ML-insinöörin työ kuitenkin rajoittuu siihen, mitä tietoja tulisi käyttää koulutukseen ja miten koneoppimismallin tulokset validoidaan, jotta koneoppiminen olisi optimaalisella tasolla.

Samankaltaiset termit

Margaret Rouse
Teknologia-asiantuntija

Margaret Rouse on palkittu teknologiatoimittaja ja opettaja, joka tunnetaan hänen kyvyistään selittää vaikeitakin teknologisia konsepteja aiheesta vähemmän tietävälle finanssialan yleisölle. Viimeisen 20 vuoden ajan hänen selityksensä ovat ilmestyneet TechTargetin nettisivuille, minkä lisäksi häntä ovat siteeranneet asiantuntijana New York Times, Time Magazine, USA Today, ZDNet, PC Magazine ja Discovery Magazine. Margaretin mielestä mikään ei ole hauskempaa kuin opettaa IT-alan ja finanssialan ammattilaisille, kuinka toisen alan hyvin spesifillä kielellä puhutaan. Jos sinulla on ideoita selitettävistä termeistä tai parannuksista aikaisempiin selityksiin, lähetä sähköpostia Margaretille tai ota yhteyttä häneen LinkedInissä tai Twitterissä.