Nylig kunngjorde Google at de omprofilerer chatboten Bard og lanserer Gemini Ultra, den kraftigste store språkmodellen (LLM).
Nå kan brukerne samhandle med Gemini online eller via Google Play og App Store på over 40 språk. Basisversjonen av chatboten bruker Gemini Pro 1.0-modellen.
“Vårt mål med Bard har alltid vært å gi deg direkte tilgang til våre AI-modeller, og Gemini representerer vår mest kompetente modellfamilie. For å gjenspeile dette vil Bard nå ganske enkelt bli kjent som Gemini”, heter det i Googles blogginnlegg.
Samtidig kunngjorde Google lanseringen av Gemini Advanced, en oppgradert versjon av chatboten som er tilgjengelig via et Google One Premium-abonnement (20 USD per måned), som har tilgang til Ultra 1.0.
Modellen er utviklet for å yte bedre på svært komplekse oppgaver som koding, logisk resonnering og å følge instruksjoner, samtidig som den støtter lengre samtaler.
Nøkkelpunkter
Hva betyr omprofileringen av Bard og lanseringen av Gemini Advanced for AI-markedet?
Omprofileringen av Bard til Gemini er et tydelig forsøk fra Googles side på å posisjonere Gemini-familien av LLM-er som sitt flaggskip innen multimodale AI-produkter. Den nylig lanserte Gemini støtter en rekke inndata, inkludert tekst, tale og bilder. Takket være Googles Imagen 2-tekst-til-bilde-modell kan den også generere bilder.
En av hovedårsakene til dette er at multimodalitet er i ferd med å bli en konkurransemessig nødvendighet i LLM-kappløpet. Når alt kommer til alt, har vi allerede sett leverandører som OpenAI og Microsoft innlemme multimodalitet i produktporteføljene sine.
OpenAI la for eksempel til en integrasjon med tekst-til-bilde-modellen DALL-E 3 og muligheten til å støtte stemmestyring på slutten av fjoråret, og så sent som i går kunngjorde Microsoft at de legger til muligheten til å opprette og redigere bilder med Copilot, og lanserte en ny modell kalt Deucalion.
Introduksjonen av Gemini Advanced
Men det kanskje mest betydningsfulle innspillet i markedet nå er Gemini Advanced, som ikke bare gir tilgang til Googles kraftige Ultra 1.0-modell, men som også gir tilgang til 2 TB lagringsplass i skyen.
I tillegg sier organisasjonen at Premium-abonnenter kan bruke Gemini via Gmail, Docs, Slides og Sheets og få tilgang til data som er inkludert i disse appene.
Når man tar dette i betraktning, gjør Gemini Advanceds tilgang til en kraftigere multimodal AI-modell og dyp integrasjon med Googles produktøkosystem til samme pris som Plus-versjonen av ChatGPT dette til et mye mer konkurransedyktig produkt i forhold til løsninger fra OpenAI og Microsoft.
Microsoft har selvsagt fortsatt et svært konkurransedyktig tilbud – ikke bare med Bing Chat som bruker GPT-4, men også med Copilot som integreres med Office 365-apper som Word, PowerPoint, Excel, Teams og Power. På samme måte har OpenAI fortsatt tid til å lansere den etterlengtede GPT-5.
Er Gemini Advanced bedre enn ChatGPT?
Basert på den informasjonen vi har tilgjengelig, viser Gemini Advanced imponerende ytelse og overgår til og med ChatGPT, nærmere bestemt GPT-4-versjonen, på visse områder.
Ifølge Googles research er Ultra 1.0-modellen den første LLM-modellen som utkonkurrerer menneskelige eksperter på MMLU-testen (massive multitask language understanding) med en score på 90%. Til sammenligning oppnådde GPT-4 en poengsum på 86,5% på den samme testen.
Googles research rapporterer også at Ultra oppnår toppresultater i 30 av 32 målte benchmarks, inkludert populære tekst- og resonneringsbenchmarks, bildeforståelsesbenchmarks, talegjenkjenning og taleoversettelsesbenchmarks.
Når det er sagt, presterer Gemini Ultra på samme nivå som GPT-4, men uten å overgå den.
Ethan Mollick, førsteamanuensis ved Wharton School ved University of Pennsylvania, som har eksperimentert med modellen i seks uker, bemerket i et blogginnlegg at “Gemini Advanced er helt klart en GPT-4-klassemodell”, men bemerket også at den “ikke åpenbart blåser bort GPT-4 i referansene.”
Når det gjelder differensiering, hevdet Mollick at “GPT-4 er mye mer sofistikert når det gjelder bruk av kode og utfører en rekke vanskelige verbale oppgaver bedre”, mens “Gemini er bedre på forklaringer og gjør en god jobb med å integrere bilder og søk.”
Uansett er det tydelig at avstanden mellom OpenAI og Googles modeller har blitt mindre, og at det nå finnes et levedyktig alternativ med det rette produktøkosystemet som kan utfordre det monolittiske OpenAI-Microsoft-samarbeidet, som nylig utløste en henvendelse fra EU-kommisjonen.
Konkludert
LLM-markedet har nettopp blitt mye mer interessant. Nå som Bard må vike plassen for Gemini og Gemini Advanced tar opp kampen med ChatGPT Plus, øker konkurransen mellom Google og OpenAI-Microsoft.
Hvis det er noe selskap som kan vippe OpenAI av pinnen som den dominerende leverandøren i markedet, er det Google, bare i kraft av sitt erfarne DeepMind-team og den store mengden proprietære data som er samlet inn fra produkter som Google Search og YouTube.
Men det er for tidlig å si at GPT-4 er detronisert ennå.