Avoin toiminta

Google Bard on nyt Gemini – vaikutus tekoälymarkkinoille

Google ilmoitti eilen, että se nimeää Bard-chatbottinsa uudelleen ja julkaisee sen nimellä Google Gemini. Tämä on yhtiön tehokkain suuren kielimallin (LLM) tekoälybotti.

Tällä hetkellä Bardin käyttäjät voivat olla vuorovaikutuksessa Geminin kanssa verkossa tai Google Playn ja App Storen kautta yli 40 kielellä. Chatbotin perusversio käyttää Gemini Pro 1.0 -mallia.

”Missiomme Bardin kanssa on aina ollut tarjota sinulle suora pääsy tekoälymalleihimme, ja Gemini edustaa tehokkainta malliperhettä tällä saralla. Tämän heijastamiseksi Bard tullaan nyt yksinkertaisesti tuntemaan nimellä Gemini”, kertoi Googlen julkaisema blogiteksti.

Samaan aikaan Google ilmoitti julkaisevansa Gemini Advancedin, joka on päivitetty versio chatbotista. Se on saatavilla Google One Premium -paketilla, joka maksaa 20 dollaria kuukaudessa, ja siinä on pääsy Ultra 1.0:aan.

Tämä malli on suunniteltu suorittamaan paremmin erittäin monimutkaisia tehtäviä, kuten koodaamista, loogista päättelyä ja ohjeiden seuraamista, samalla kun se tukee pidempiä keskusteluja ja kyselyitä.

Google Gemini – Tärkeimmät pointit

  • Google Bard nimenmuutos tarkoittaa, että Google Bard -chatbotti tunnetaan tästä eteenpäin nimellä Gemini. Google julkaisee myös Gemini Ultran, joka on sen tähän mennessä tehokkain suuri kielimalli (LLM).
  • Google Gemini tukee yli 40 kieltä ja integroituu tiiviisti Googlen tuote-ekosysteemiin.
  • Gemini Advanced on osoittanut kykynsä menestyä koodaamisen ja päättelyn kaltaisissa tehtävissä ja tukee tekstin, äänen ja kuvan syöttöä.
  • Bard nimenmuutos Geminiksi asettaa Geminin Googlen tekoälytuotteiden kärkeen, jonka myötä kilpailu Googlen ja OpenAI-Microsoftin välillä kiristyy.

Mitä Bardin uudelleenbrändäys ja Gemini Advanced lanseeraus tarkoittavat tekoälymarkkinoille?

Se, että Google nimenmuutos muuttaa Bardin Google Geminiksi, on merkki Googlen pyrkimyksistä nostaa Geminin LLM-perhe yhtiön tärkeimpien tuotteiden joukkoon, sekä multimodaaliseksi tekoäly tuotteeksi. Äskettäin julkaistu Gemini tukee useita kommunikoinnin tapoja, mukaan lukien tekstiä, ääntä ja kuvia. Googlen Imagen 2 tekstistä kuvaksi -mallin ansiosta se voi myös luoda kuvia.

Yksi keskeisistä syistä tähän uudelleenbrändäykseen on se, että multimodaaliuden rinnalle on nousemassa kilpailun koveneminen LLM-markkinoilla. Olemme jo nähneet OpenAI:n ja Microsoftin kaltaisten palveluntarjoajien ottavan multimodaalisuutta mukaan tuotevalikoimaansa.

Esimerkiksi OpenAI lisäsi viime vuoden lopulla integraation tekstistä kuvaksi -malliin DALL-E 3:een, sekä mahdollisuuden tukea äänten käyttöä. Ja juuri viime viikolla Microsoft ilmoitti lisäävänsä mahdollisuuden luoda ja muokata kuvia, kun Copilot lanseeraa uuden mallin nimeltä Deucalion.

Esittelyssä Google Gemini Advanced

Ehkä se merkittävin häiritsevä vaikutus markkinoilla nyt on kuitenkin Googlen Gemini Advanced, joka tarjoaa pääsyn Googlen tehokkaaseen Ultra 1.0 -malliin, sekä myös 2 Tt:n tallennustilaa pilvessä.

Lisäksi organisaatio sanoo, että Premium-tilaajat voivat käyttää Geminiä Gmailin, Docsin, Slidesin ja Sheetsin kautta, ja näin käyttää kaikkien kyseisten sovellusten sisältämiä tietoja.

Kun tätä katsotaan tarkemmin, Gemini Advancedin pääsy tehokkaampaan multimodaaliseen tekoälymalliin ja syvä integraatio Googlen laajaan tuote-ekosysteemiin samassa hintapisteessä kuin ChatGPT Plus-versio tekee siitä paljon kilpailukykyisemmän tuotteen OpenAI:n ja Microsoftin ratkaisuihin verrattuna.

Tietenkin Microsoftilla on edelleen erittäin kilpailukykyinen tarjonta itsessään – ei vain GPT-4:ää käyttävän Bing Chatin myötä, vaan myös Copilotin kautta, joka integroituu Office 365 -sovelluksiin, kuten Word, PowerPoint, Excel, Teams ja Power. Samaan aikaan OpenAI:lla menee vielä aikaa julkaista kauan odotettu GPT-5.

Onko Gemini Advanced parempi kuin ChatGPT?

Tällä hetkellä käytettävissä olevien tietojen perusteella Google Gemini Advanced osoittaa vaikuttavaa suorituskykyä, joka voi jopa ylittää ChatGPT:n. Tarkemmin sanottuna sen GPT-4-version, ja vain tietyillä alueilla.

Merkittävimpänä mainintana Googlen tutkimuksen mukaan sen käyttämä Ultra 1.0 -malli on ensimmäinen LLM, joka päihittää ihmisasiantuntijat massiivisessa monitehtäväkielen ymmärtämisen (MMLU) vertailussa jopa 90 prosentilla. Vertailun vuoksi GPT-4:n pistemäärä samalla vertailulla oli 86,5%.

Googlen tutkimus kertoo myös, että Ultra kykenee saavuttamaan huippuluokan tuloksia 30:ssa 32:sta mitatusta vertailuarvosta, mukaan lukien suositut tekstin ja päättelyn vertailuarvot, kuvan ymmärtämisen vertailuarvot, sekä puheentunnistuksen ja puheen kääntämisen vertailuarvot.

Vaikka Gemini Ultra toimii samalla tasolla kuin GPT-4, se ei selvästi ylitä sitä.

Ethan Mollick, Pennsylvanian yliopiston Wharton Schoolin apulaisprofessori, joka on kokeillut mallia kuuden viikon ajan, huomautti blogikirjoituksessaan, että “Gemini Advanced on selvästi GPT-4-luokan malli”, mutta totesi myös, että se “ei päihitä ylivoimaisesti GPT-4:ää vertailuarvoissa.”

Erilaistumisen suhteen Mollick väitti, että “GPT-4 on paljon kehittyneempi koodin käyttämisessä ja suorittaa useita vaikeita sanallisia tehtäviä paremmin”, kun taas “Google Gemini on parempi selittämään ja tekemään hienoa työtä kuvien ja haun yhdistämisessä.”

Joka tapauksessa on selvää, että OpenAI:n ja Googlen mallien välinen kuilu on umpeutunut partakoneen terälle, minkä myötä oikeanlaisella tuote-ekosysteemillä on elinkelpoinen vaihtoehto haastaa monoliittisen OpenAI-Microsoft-kumppanuuden, jonka vuoksi Euroopan komissio käynnisti äskettäin tutkimuksen.

Yhteenveto

LLM-markkinat muuttuivat juuri paljon mielenkiintoisemmiksi. Bardin antaessa tilaa uudelle chatbot versiolle, Google Gemini ja Gemini Advancedille, jotka käyvät ChatGPT Plus:aa vastaan, kilpailu Googlen ja OpenAI-Microsoftin välillä kovenee reippaasti.

Mikä on Google Gemini?

Google Geminin väitetään olevan maailman suurin ja tehokkain tekoälymalli. Se tulee kolmessa eri versiossa: Ultra, Pro ja Nano. Ultra on kattavin ja monipuolisin, suunniteltu monimutkaisimpiin tehtäviin, kun taas Pro on yleismalli ja Nano kevytversio suoritettavaksi suoraan laitteella.

Googlen mukaan Gemini Ultra on ensimmäinen kielimalli, joka voittaa ihmisasiantuntijat MMLU-tehtävissä. Sen suorituskykyä osoittaa 90 %:n tulos 57 eri testissä, kattaen matematiikan, fysiikan, historian, lakitekstit ja lääketieteen, kun taas GPT4 saavutti vain 86,4 %.

Gemini (entinen Bard) tekoälybotti käyttää Gemini Pro -versiota englanninkielisenä yli 170 maassa. Nano-versio puolestaan on tarkoitettu saataville Pixel 8 Pro -puhelimiin, ja jokin versio Geministä on tulossa myös Google-hakuun, mainospalveluihin, Chromeen ja Duet AI -palveluun.

Jos joku yritys voi päihittää OpenAI:n markkinoiden hallitsevana toimijana, se on Google pelkästään sen kokeneen DeepMind-tiimin voiman ja Google-haun ja YouTuben kaltaisista tuotteista kerätyn runsaan omistusoikeudellisen datan ansiosta. Mutta on liian aikaista sanoa, että GPT-4 olisi vielä täysin syrjäytetty.

Samankaltaiset termit

Tim Keary
Teknologia-asiantuntija

Tammikuusta 2017 lähtien Tim Keary on toiminut itsenäisenä teknologia-kirjoittajana ja raportoijana, käsitellen yritysteknologiaa ja tietoturvaa.