Google Gemini AI vakava uhka ChatGPT:lle – tässä syy

Tiivistelmä

Erilaisten tekoälysovellusten pariin on nyt liittynyt myös maailman suurin hakukone: Google Gemini on joukko suuria kielimalleja (LLM), jotka sisältävät AlphaGo-vaikutteisia tekniikoita. Tämä tarkoittaa käytännössä Googlen strategista vastausta suureen suosioon vuonna 2023 nousseelle ChatGPT:lle. Gemini pyrkii haastamaan ChatGPT:n hallitsevan aseman nimenomaan generatiivisen tekoälyn alalla, koska sillä on multimodaalisia ominaisuuksia ja mahdollisuus käyttää Googlen laajoja haku- eli harjoitustietoja useista eri palveluista. Tämä askel korostaa Googlen sitoutumista tekoälyinnovaatioiden kehittämiseen ja sen kilpailuaseman vakiinnuttamiseen nopeasti kasvavilla generatiivisilla tekoälymarkkinoilla, joiden arvon ennustetaan nousevan 1,3 triljoonaan dollariin vuoteen 2032 mennessä.

Google Gemini aikoo haastaa supersuositun ChatGPT:n! Keneltäkään ei varmaan jäänyt huomiotta, kuinka ChatGPT:n julkaisu marraskuussa 2022 ravisteli Googlea sen perustuksia myöten. Suosittu chatbot uhkasi jättimäisen hakukoneyhtiön liiketoimintaa niin suurella volyymilla, että se joutui julistamaan itselleen melkein hätätilan ja alkoi sen myötä investoida generatiivisen tekoälyn kehittämiseen omassa tallissaan.

Googlen kehitystyö tekoälyn saralla onkin jo ennen Google Geminiä tuottanut tulosta. Google Bardi tuotiin ensin markkinoille haastamaan ChatGPT erityyppisten sisältöjen, kuten kuvan ja tekstin tuottamisessa. Ja nyt yhtiö on lanseerannut myös Google Geminin.

Google Gemini lanseerattiin keskiviikkona 6. joulukuuta 2023, ja aloitimme sen kehityksen seuraamisen vain kuukausi lanseerauksen jälkeen. Miedän näkemyksemme mukaan on olemassa suuri mahdollisuus, että Google saa vielä haltuunsa kovasti kilpaillun AI-kruunun ChatGPT:ltä.

Mikä on Google Gemini?

Google Gemini on joukko suuria kielimalleja (LLM), jotka hyödyntävät AlphaGo:sta otettuja koulutustekniikoita, mukaan lukien vahvistusoppiminen ja erityislaatuinen hakutoiminto, joka voi jatkossa poistaa ChatGPT:n sen asemasta planeetan hallitsevimpana generatiivisena tekoälyratkaisuna.

Tämä Googlen vastaus ChatGPT:lle tulee vain kuukausia sen jälkeen, kun Google yhdisti Brain- ja DeepMind AI -laboratorionsa luodakseen uuden tutkimusryhmän nimeltä Google DeepMind. Tämän työryhmän tavoitteena on jatkokehittää sekä Bardin ja sen seuraavan sukupolven PaLM 2 LLM:ää eteenpäin.

Tutkijat odottavat, että generatiivisten tekoälymarkkinoiden arvo nousee arviolta 1,3 triljoonaan dollariin vuoteen 2032 mennessä, joten on selvää, että Google investoi tähän alaan isolla kädellä säilyttääkseen asemansa johtavana tekoälykehittäjänä.

Mikä on Large Language Model (LLM)?

LLM:ään perustuvat työkalut koulutetaan valtavilla tietomäärillä, ja ne käyttävät itseohjattua oppimista, jonka avulla ne ennustavat seuraavan lauseen edellistä lausetta ympäröivän kontekstin perusteella. Prosessi toistetaan yhä uudelleen, kunnes malli saavuttaa hyväksyttävän tarkkuustason.

Kun LLM on koulutettu, sitä voidaan hienosäätää monenlaisia NLP-tehtäviä varten, mukaan lukien:

  • Keskustelevien chatbottien, kuten ChatGPT:n, rakentaminen.
  • Tekstin luominen tuotekuvauksiin, blogikirjoituksiin ja artikkeleihin.
  • Vastaukset usein kysyttyihin kysymyksiin (FAQ) ja ohjaa asiakkaiden tiedustelut sopivimmalle ihmiselle.
  • Analysoi asiakkaiden palautetta sähköpostista, sosiaalisen median viesteistä ja tuotearvosteluista.
  • Liiketoiminnan sisällön kääntäminen eri kielille.
  • Suurten tekstidatamäärien luokittelu ja jaottelu tehokkaampaan käsittelyyn ja analysointiin.

Mikä on ChatGPT?

ChatGPT (Chat Generative Pre-trained Transformer) on sarja suosittuja generatiivisia AI-chatbotteja, jotka on kehittänyt, ja joita ylläpitää OpenAI -niminen yritys. Suuret kielimallit (LLM), jotka tukevat aiemmin luotuja chatbot-malleja, olivat yksimuotoisia ja pystyivät käsittelemään ja luomaan ainoastaan tekstisisältöä. Tämän “alkuperäisen” chatbotin uusimmat versiot ovat multimodaalisia, eli ne voivat tunnistaa ja luoda kuvia, osallistua keskusteluihin ja etsiä keskusteluun lisää sisältöä Internetistä reaaliajassa saman keskustelullisen käyttöliittymän (CUI) kautta.

OpenAI julkaisi aluksi ilmaisen version ChatGPT:stä, mutta toi markkinoille myös kaupallistetun version vuonna 2023.

  1. Se veloitusmalli perustuu kehittäjiltä perittävään pääsymaksuun chatbotin sovellusohjelmoinnin rajapintoihin (API)
  2. Lisäksi se tarjoaa kahdenlaisia maksullisia tilauksia.
  3. OpenAI on myös julkaissut Assistants API -nimisen vedä ja pudota -työkalun, joka antaa kehittäjille mahdollisuuden käyttää vaihtelevaa koodausasiantuntemusta.
  4. Tämä LCNC-kehittäjätyökalu antaa sellaisille käyttäjille, joilla on hyvin vähän koodauskokemusta, mahdollisuuden luoda mukautettuja chatbotteja, jotka voidaan jakaa tai myydä OpenAI:n GPT-kaupan kautta.

ChatGPT:llä on tällä hetkellä yli kaksi miljoonaa kehittäjää ja yli 100 miljoonaa viikoittaista aktiivista käyttäjää. Sitä käyttää vähintään 92% Fortune 500 -yrityksistä, mikä kertoo siitä, että Google Gemini taistelee hyvin varteenotettavaa kilpailijaa vastaan.

Auttaakseen varmistamaan tekoälyn (AI) vastuullisen käytön, ChatGPT:n tekoälyinsinöörit ja automaattiset valvontajärjestelmät valvovat jatkuvasti käyttäjien kehotteita ja mallien tuloksia. Käyttäjien tietosuojan turvaamiseksi OpenAI ei käytä ChatGPT-keskusteluja mallikoulutukseen ilman käyttäjien lupaa.

Lue myös: Voivatko nestemäiset hermoverkot mullistaa tekoälyn maailmaa?

Kaikki mitä toistaiseksi tiedämme Google Geministä?

Toukokuussa Googlen ja Alphabetin toimitusjohtaja Sundar Pichai julkaisi blogikirjoituksen, jossa on hän tarjoaa korkeatasoisen katsauksen hakukonejätin LLM:ään seuraavien kommenttien myötä:

“Google Gemini luotiin alusta alkaen multimodaaliksi, erittäin tehokkaaksi työkalujen ja sovellusliittymien integroinnissa, ja se on suunniteltu mahdollistamaan tulevaisuuden innovaatiot, kuten muisti ja suunnittelu.”

Pichai totesi myös, että “vaikka vielä on hyvin aikaista, näemme jo vaikuttavia multimodaalisia ominaisuuksia, joita ei ole nähty aikaisemmissa malleissa.

“Kun Google Gemini on hienosäädetty ja turvallisuustestattu tarkasti, se tulee saatavaksi eri kokoisena ja eri ominaisuuksilla, aivan kuten PaLM 2.”

Google DeepMindin toimitusjohtajan Demis Hassabiksen Wired-haastattelussa todettiin, että Google Gemini “yhdistää joitain AlphaGo-tyyppisten järjestelmien vahvuuksia suurten kielimallien hämmästyttäviin ominaisuuksiin.”

Viekö Google Gemini kruunun ChatGPT:ltä?

Yksi suurimmista keskusteluista Google Geminin julkaisun ympärillä on se, onko sen kielimallilla kaikki se, mitä tarvitaan ChatGPT:n voittamiseen. ChatGPT nimittäin saavutti vuonna 2023 yli 100 miljoonaa aktiivista käyttäjää joka kuukausi.

Alun perin Google käytti Geminin kykyä luoda tekstiä ja kuvia erottaakseen sen GPT4:stä, mutta 25. syyskuuta 2023 OpenAI ilmoitti, että käyttäjät voivat tehdä tekstikehotteiden lisäksi myös puhe- ja kuvakyselyitä ChatGPT:llä.

Nyt kun OpenAI kokeilee multimodaalista mallilähestymistapaa ja on yhdistänyt ChatGPT:n Internetiin, ehkä suurin ero näiden kahden välillä on Googlen laaja valikoima sen omaa koulutusdataa, jota Gemini voi käyttää. Google Gemini voi käsitellä tietoja, jotka on kerätty palveluista, kuten Googlen hausta, YouTubesta, Google-kirjoista ja Google Scholarista.

Näiden omistusoikeudellisten tietojen käyttö Gemini-mallien koulutuksessa voi johtaa selkeään etulyöntiasemaan niiden oivallusten ja päätelmien kehittyneisyydessä, jotka se voi saada kaikista näistä valtavista tietojoukosta. Tämä pätee erityisesti silloin, jos varhaiset raportit pitävät paikkansa, joiden mukaan Gemini on koulutettu käyttämään kaksi kertaa niin monta merkkiä kuin ChatGPT4.

Lisäksi Google DeepMind- ja Brain-tiimien välistä kumppanuutta ei voida aliarvioida tänä vuonna, sillä OpenAI kohtaa alan kilpailussa maailmanluokan tekoälytutkijoita, mukaan lukien Googlen perustaja Sergey Brin ja DeepMind vanhempi tekoälytiedemies ja koneoppimisen asiantuntija Paul Barham.

Kyseessä on siis erittäin kokenut tiimi, jolla on syvä ymmärrys siitä, kuinka soveltaa eri teknologioita, kuten vahvistusoppimista, luodakseen tekoälyohjelmia, jotka voivat kerätä tietoa ja parantaa ongelmanratkaisukykyään ajan myötä itsenäisesti ja entistä tehokkaammin.

Yhteenveto – Google Gemini vs. ChatGPT

Google Geminin yhdistelmä multimodaalisia kykyjä, vahvistusoppimisen käyttöä, sen tekstin ja kuvan luontiominaisuudet sekä Googlen omistamat tietolähteet ovat kaikki ainesosia, joita Gemini tarvitsee päihittääkseen ChatGPT-4:n.

Harjoitteludata on avaintekijä, sillä LLM:n asekilpailun voittava organisaatio päätetään suurelta osin sen perusteella, kuka kouluttaa heidän mallejaan suurimmalla ja rikkaimmalla tietojoukolla.

Tästä huolimatta, samalla kun OpenAI:n kerrotaan työskentelevän uuden seuraavan sukupolven multimodaalisen Gobi-nimisen LLM:n parissa, emme voi vielä kirjata pois tätä generatiivista tekoälyjättiä. Nyt kysymys kuuluu, kuka toteuttaa jatkossa multimodaalista tekoälyä paremmin?

Tim Keary

Tammikuusta 2017 lähtien Tim Keary on toiminut itsenäisenä teknologia-kirjoittajana ja raportoijana, käsitellen yritysteknologiaa ja tietoturvaa.