Voivatko nestemäiset hermoverkot mullistaa tekoälyn maailmaa?

Tiivistelmä

Tekoälyn maailmassa nestemäiset hermoverkot erottuvat tärkeänä ja selkeänä tekijänä niiden ihmisaivojen kaltaisen, epälineaarisen ja luovan lähestymistavan ansiosta. Tämä on päinvastainen lähestymistapa, kuin mistä lineaariset hermoverkot tunnetaan. Nestemäiset hermoverkot tunnetaan erityisesti siitä, että ne selviytyvät erinomaisesti monimutkaisista haasteista, kuten sääennusteiden tarkasta määrittämisestä, osakemarkkinoiden analysoinnista ja puheentunnistuksen eri alueista, joita aiemmin hallitsivat ihmisasiantuntijat.

Edellä mainituista kyvyistään johtuen, nestemäiset hermoverkot ovat yksi tärkeimpiä ja mielenkiintoisimpia nousevia komponentteja tekoälyn, eli Artificial Intelligence (AI) alalla.

Kun koneen tai robotin on reagoitava ulkoisiin ärsykkeisiin tai tietoihin, tämä toiminto voi olla erittäin kuluttavaa erilaisten resurssien saralla, mikä taas voi aiheuttaa pullonkaulan, jos tekoälyä yritetään sovittaa liian pieneen tilaan.

VentureBeat on kuvannut, kuinka perinteinen hermoverkko saattaa tarvita 100 000 keinotekoista neuronia pitääkseen auton vakaana esimerkiksi tietynlaisen ajotestin aikana, kuten ajoneuvon ajamisessa tietyn tieosuuden läpi turvallisesti.

Mutta kun samaan tehtävään sovellettiin nestemäisiä hermoverkkoja, löydäkset olivat uskomattomia. MIT CSAILin nestemäisiä hermoverkkoja kehittävä tiimi pystyi suorittamaan saman tehtävän vain 19 neuronilla.

Nestemäiset hermoverkot – inspiraatio niiden takana

Nestemäiset hermoverkot ovat eräänlainen syväoppimista harjoittava arkkitehtuuri.

  1. Se on ennen kaikkea kehitetty auttamaan erilaisia tehtäviä suorittavia robotteja ratkaisemaan monimutkaisia haasteita, helpottamaan niiden oppimista ja tehtävänratkaisukykyä.
  2. Tämän teknologian tavoitteena on välttää riippuvuus pilvipalveluista tai rajoitetusta sisäisestä tallennustilasta.

MIT CSAILin johtaja Daniela Rus kertoi tutkimuksistaan seuraavaa VentureBeatille: “Nestemäisten hermoverkkojen inspiraationa oli ajatella olemassa olevia koneoppimisen lähestymistapoja ja pohtia, kuinka ne sopivat sellaisiin turvallisuuskriittisiin järjestelmiin, joita robotit ja reunalaitteet tarjoavat.”

Hän jatkoi: “Robotilla ei todellakaan voi ajaa suurta kielimallia, koska niissä ei ole paljoa laskentatilaa [tehoa] ja [tallennustilaa].”

Tutkimusryhmä käytti nestemäisten hermoverkkojen kehityksessä hyväksi myös pienten organismien biologisten hermosolujen tutkimuksesta saatavaa tietoa.

Mitä ovat keinotekoiset hermoverkot?

Käydään seuraavaksi läpi tässä artikkelissa tarvittavat peruskäsitteet, jotta voimme ymmärtää keinotekoisten ja nestemäisten hermoverkkojen erot.

  • Keinotekoinen hermoverkko on teknologia, joka toimii ihmisaivojen toimintaa vastaavalla tavalla.
  • Pääasiassa keinotekoinen hermoverkko simuloi jollain tavalla aivojen biologisten neuronien toimintaa ja rakentamista.
  • Neuraaliverkkoja rakennetaan monin eri tavoin, laskettuina malleina, joilla toteutetaan esimerkiksi erilaisia koneoppimisprojekteja.
  • Niissä tietokoneita voidaan kouluttaa “ajattelemaan” omalla tavallaan ja itsenäisesti (ChatGPT).

Sen perusteella, mitä tiedämme ihmisaivoista, sekä sen perusteella, miten voimme jo hyödyntää huipputeknologioita, voimme edistyä sen selvittämisessä, kuinka tietokone saadaan “toimimaan kuin aivot”. Tämä ei kuitenkaan tarkoita sitä, että insinöörit toistaisivat ihmisen kognitiivista käyttäytymistä. Ihmisen aivot ovat musta laatikko, jota emme vieläkään täysin ymmärrä.

Jossakin mielessä hermoverkot ovat outo hybridi “tekemisestä” ja “olemisesta”. Ne toimivat paljolti aivojen hermosolujen kerrosten tavoin. Mutta ero on siinä, että keinotekoiset hermoverkot toimivat silti valtavan harjoitusdatan perusteella, joten ne ovat lopulta vain puoliälykkäitä, ainakin omiin ihmisaivoihimme verrattuna.

Mitä ovat nestemäiset hermoverkot?

Nyt kun tiedämme mitä keinotekoiset hermoverkot ovat, joten verrataan tätä tietoa seuraavaksi siihen, mitä nestemäiset hermoverkot ovat. Nestemäisiä hermoverkkoja voidaan ajatella ihmisaivojen toisiinsa liittyvinä soluina, jotka yhdistyvät käsittelemään tietoa ja tuottamaan tulosta.

Ihmisen aivot ovat erittäin monimutkainen solujärjestelmä, joka suorittaa hyvin monimutkaisia laskelmia. Nestemäiset hermoverkot taas keskittyvät turvallisuuden kannalta kriittisiin sovelluksiin, kuten itseohjautuviin ajoneuvoihin ja robotteihin, jotka tarvitsevat jatkuvan datavirran syöttämistä niihin.

Daniela Rusin mukaan “Nestemäisillä hermoverkoilla menee yleensä hyvin, kun meillä on aikasarjadataa… tarvitset sekvenssin, jotta nestemäiset verkot toimivat hyvin.”

“Jos yrität soveltaa nestemäistä verkkoratkaisua johonkin staattiseen tietokantaan, kuten ImageNetiin, se ei kuitenkaan toimi niin hyvin”, hän huomautti.

Mikä on tekoäly?

Jotta voimme ratkaista artikkelin otsikon kysymyksen, meidän on myös ymmärrettävä mikä tekoäly on.

​Tekoäly, eli Artificial Intelligence (AI), joka tunnetaan myös nimellä koneäly, on tietojenkäsittelytieteen ala, joka keskittyy rakentamaan ja hallitsemaan teknologiaa, joka voi oppia tekemään päätöksiä ja suorittamaan toimia itsenäisesti ihmisen puolesta.

AI ei kuitenkaan ole yksittäinen teknologia. Sen sijaan se on kattotermi, jonka alle mahtuu kaikentyyppisiä ohjelmistoja tai laitteistoja, jotka tukevat koneoppimista, asiantuntijajärjestelmiä, generatiivista tekoälyä ja tietyntyyppistä robotiikkaa.

Nykypäivän tekoäly toimii pääasiassa perinteisillä CMOS-pohjaisilla laitteistoilla ja sisältää sekoituksen perinteisiä algoritmeja ja dataohjattuja koneoppimismalleja.

Kun tätä teknologiaa on sulautettu yhä enemmän arkikäyttöön, myös nestemäiset hermoverkot ovat keränneet enemmän kiinnostustat. Se on tutkimusalue, jolla pyritään jäljittelemään ihmisaivojen arkkitehtuuria suunnittelemalla erikoislaitteistoja ja algoritmeja, jotka on optimoitu alhaiseen virrankulutukseen ja reaaliaikaisuuteen.

Lue myös: Voiko kvanttilaskenta vaikuttaa tekoälysovelluksiin?

Ero tekoälyn ja koneoppimisen välillä

Machine Learning (ML) on tekoälyn osajoukko, joka keskittyy sellaisten mallien rakentamiseen, joiden avulla tietokoneet voivat oppia erityyppisestä datasta. Sen sijaan, että ML-mallit olisi nimenomaisesti ohjelmoitu suorittamaan jokin tehtävä, ne käyttävät tietoja ennusteiden tai päätösten tekemiseen.

Pohjimmiltaan kaikki tekoäly on tekoälyä, mutta kaikki tekoäly ei käytä toimiakseen ML-tekniikoita. Esimerkiksi sääntöpohjaiset asiantuntijajärjestelmät ja symbolinen tekoäly kuuluvat tekoälyn sateenvarjon alle, mutta niihin ei välttämättä sisälly tiedoista oppimista samalla tavalla kuin Machine Learningiin.

Nestemäiset hermoverkot – edut ja rajat

Tämä artikkelin alussa mainittu MIT:n Computer Science and Artificial Intelligence Laboratoryn (CSAIL) tutkimusryhmä on havainnut nestemäisiä hermoverkkoja kehittäessään erityisesti seuraavanlaisia etuja.

Eivät vaadi paljoa tilaa

Nestemäiset hermoverkot voisivat toimia huomattavasti pienemmällä määrällä neuroneja kuin perinteiset hermoverkot.

Kuten aiemmin tässä artikkelissa on kuvattu, perinteinen syväoppiva hermoverkko tarvitsee noin 100 000 neuronia pitääkseen itse ajavan auton kaistalla – nestemäinen hermoverkko taas tarvitsee tähän tehtävään vain 19 neuronia.

Syy-seuraus

Nestemäiset hermoverkot käsittelevät kausaalisuutta paremmin kuin perinteiset syväoppivat hermoverkot. Ne voivat näin ollen havaita selvän syiden ja seurausten välisen yhteyden, jonka kanssa klassiset syväoppivat hermoverkot kamppailevat.

Esimerkiksi klassiset syväoppivat hermoverkot voivat jatkuvasti tunnistaa syy-seuraussuhteita tapahtumien välillä eri asetuksissa tehokkaammin kuin klassinen hermoverkko.

Tiedon tulkittavuus

Tekoälyjärjestelmän tarjoamien tietojen tulkinta ja ymmärtäminen on yksi tekoälyn suurimmista haasteista. Klassisissa syväoppimismalleissa on usein matala, epäselvä tai väärä perusta datan tulkinnoille, mutta nestemäiset hermoverkot voivat tarjota datan lisäksi myös perusteita tietojen tulkintaan.

Miinuspuolet

Tästä huolimatta ei voida ajatella, että nestemäiset hermoverkot olisivat kattava ratkaisu kaikkeen.

Vaikka ne käsittelevät tehokkaasti jatkuvia datavirtoja, kuten äänivirtoja, lämpötilatietoja tai videovirtoja, ne kamppailevat staattisen tai kiinteän datan kanssa. On kuitenkin olemassa useita muita tekoälymalleja, jotka sopivat näihin tehtäviin paremmin.

Yhteenveto – Nestemäiset hermoverkot

Tekoälymaailmassa nestemäiset hermoverkot ovat joitain kaikkein mielenkiintoisimpia uusia malleja.

Ne toimivat rinnakkain klassisen syväoppivan hermoverkon kanssa, mutta nestemäiset hermoverkot näyttävät sopivan paremmin erittäin monimutkaisten tehtävien suorittamiseen, kuten autonomisiin ajoneuvoihin, lämpötilan tai ilmaston tulkitsemiseen tai osakemarkkinoiden analyyseihin. Klassinen syväoppiva neuroverkko taas toimii paremmin staattisen tai aikatiedon tulkitsemisessa ja käyttämisessä.

MIT:n Computer Science and Artificial Intelligence Laboratoryn (CSAIL) tutkijat ovat yrittäneet laajentaa nestemäisten hermoverkkojen ominaisuuksia useampiin erilaisiin käyttötapauksiin, mutta tämä tulee viemään aikaa.

Sekä nestemäisillä hermoverkoilla että klassisilla syväoppivilla hermoverkoilla on määritellyt roolinsa laajemmassa tekoälykuvassa, ja tämä on ehdottomasti tapaus, jossa kaksi eri mallia on enemmän kuin yksi.

Kaushik Pal

Kaushik on tekninen arkkitehti ja ohjelmistokonsultti, jolla on yli 23 vuoden kokemus ohjelmistoanalyysista, kehityksestä, arkkitehtuurista, suunnittelusta, testauksesta ja koulutusalalta. Hänellä on kiinnostus uusiin teknologioihin ja innovaatioalueisiin. Hän keskittyy web-arkkitehtuuriin, verkkoteknologioihin, Java/J2EE:hen, avoimen lähdekoodin ohjelmistoihin, WebRTC:hen, suuriin tietoihin ja semanttisiin teknologioihin. Hän on osoittanut asiantuntemuksensa vaatimusanalyysissä, arkkitehtuurin suunnittelussa ja toteutuksessa, teknisten käyttötapausten laatimisessa ja ohjelmistokehityksessä. Hänen kokemuksensa on kattanut eri toimialat, kuten vakuutus, pankki, lentoyhtiöt, merenkulku, asiakirjahallinta ja tuotekehitys, jne. Hän on työskennellyt laajan valikoiman teknologioiden parissa aina suurten tietokonejärjestelmien (IBM S/390), keskisuuren tason (AS/400), web-teknologioiden, avoimen lähdekoodin ja suurten tietojen alueille. Kaushik on pääasiassa mukana Java/J2EE/avoimen lähdekoodin/verkko/WebRTC/Hadoop- ja suurten tietojen…