Google Gemini (Gemini AI)

Wat is Google Gemini?

Google Gemini, of Gemini AI, is een geïntegreerde suite van Large Language Models (LLM’s) die momenteel wordt ontwikkeld door Google AI. Volgens Google CEO Sundar Pichai zijn de basismodellen van Gemini vanaf het begin ontworpen om multimodaal te zijn.

Dit betekent dat gebruikers tekst, afbeeldingen, code en audio-inhoud kunnen verwerken en genereren via één gebruikersinterface (UI).

Gemini bevindt zich momenteel in de bètatestfase bij een selecte groep ontwikkelaars van enkele bedrijven. Naar verwachting zal Gemini eind 2023 PaLM 2 vervangen, de LLM die op dit moment Google Bard aanstuurt.

Google Gemini functies

Zoubin Ghahramani, de vicepresident van Google DeepMind, zei dat Gemini beschikbaar zal zijn in dezelfde vier formaten als PaLM 2: Gecko, Otter, Bison en Unicorn.

  • Gecko wordt naar verwachting lichtgewicht en ideaal voor gebruik op mobiele apparaten.
  • Otter is ontworpen om krachtiger te zijn dan Gecko en wordt verwacht geschikt te zijn voor een breed scala aan unimodale taken.
  • Bison is groter en veelzijdiger dan Otter. Het wordt waarschijnlijk geschikt voor een beperkt aantal multimodale taken en wordt verwacht te concurreren met Chat GPT-4 om marktaandeel.
  • Unicorn is ontworpen als de grootste, krachtigste en meest veelzijdige versie van Gemini. Verwacht wordt dat het geschikt is voor een breed scala aan multimodale taken en veel verder gaat dan Chat GPT of een van zijn concurrenten.

Hoe Gemini AI werkt

Gemini maakt waarschijnlijk gebruik van de Google Pathways-architectuur. In dit type AI-architectuur wordt een reeks modulaire machine learning (ML)-modellen aanvankelijk geleerd hoe ze een specifieke taak moeten uitvoeren. Eenmaal getraind worden de modules verbonden tot een netwerk.

De netwerkmodules kunnen onafhankelijk van elkaar werken of samenwerken om verschillende soorten outputs te genereren. Aan de achterkant zetten encoders verschillende soorten gegevens om in een gemeenschappelijke taal en decoders genereren uitvoer in verschillende modaliteiten op basis van de gecodeerde invoer en de taak.

Verwacht wordt dat Google Duet AI zal gebruiken als front-end voor Gemini. Deze gebruiksvriendelijke interface verbergt de complexiteit van de Gemini-architectuur en maakt het mogelijk voor mensen met verschillende vaardigheidsniveaus om Gemini-modellen te gebruiken voor generatieve AI.

Hoe Gemini AI wordt getraind

Gemini LLM modellen zijn naar verluidt getraind met een combinatie van de volgende technieken:

  • Supervised learning: Gemini AI-modules werden getraind om outputs voor nieuwe gegevens te voorspellen door patronen te gebruiken die waren geleerd van gelabelde trainingsgegevens.
  • Non-supervised learning: Gemini AI modules werden getraind om autonoom patronen, structuren of relaties te ontdekken in data zonder de noodzaak van gelabelde voorbeelden.
  • Reinforcement learning: De Gemini AI-modules verbeterden hun beslissingsstrategieën iteratief door middel van een trial-and-error-proces dat de modules leerde om beloningen te maximaliseren en straffen te minimaliseren.

Sommige industrie-experts hebben gespeculeerd dat Google zwaar vertrouwde op ‘reinforcement learning’ met menselijke feedback (RLHF) om Gemini modules te trainen op Cloud TPU v5e chips. Volgens Google hebben TPU’s vijf keer meer rekenkracht dan de chips die werden gebruikt om Chat GPT te trainen.

Tot nu toe heeft Google nog geen specifieke informatie vrijgegeven over de datasets waarop Gemini AI is getraind. Het is echter waarschijnlijk dat Google-technici het LangChain-framework hebben gebruikt en data hebben hergebruikt die ze onlangs hebben gebruikt om PaLM 2 te trainen.

Deze gegevens waren afkomstig uit verschillende bronnen, waaronder boeken en artikelen, codeopslagplaatsen, websites, video- en podcastscripts, berichten op social media en interne gegevens van Google.

Lancering Google Gemini

De releasedatum en uiteindelijke mogelijkheden van Gemini AI zijn nog onbekend. Wat wel bevestigd is, is dat Google een beperkt aantal ontwikkelaars bij een klein aantal bedrijven vroegtijdige toegang heeft gegeven tot Gemini.

Dit suggereert dat Gemini eind 2023 klaar zou kunnen zijn voor release en integratie in Google Cloud Vertex AI-services. Als alles goed gaat, zal Gemini AI ook worden geïntegreerd in alle Google clouddiensten voor bedrijven en consumenten die gebruik maken van kunstmatige intelligentie (AI), waaronder Google Search, Google Translate en Google Assistant.

Zodra Gemini AI wordt vrijgegeven, zal de schaalbaarheid – samen met de flexibele tool- en API-integratiemogelijkheden (Application Programming Interface) – het geschikt maken voor gebruik in een breed scala aan realtime desktop- en mobiele applicaties.

Hoe Google Gemini AI aan zijn naam komt

Sommige media hebben gemeld dat Gemini staat voor “Generalized Multimodal Intelligence Network Interface”, maar die informatie kon niet worden bevestigd.

Volgens Google Bard is het waarschijnlijk dat de ontwikkelaars van Google de geïntegreerde LLM-suite hebben vernoemd naar het sterrenbeeld Tweelingen en de oude Griekse mythe van Castor en Pollux, die als inspiratie diende voor het sterrenbeeld.

Gerelateerde begrippen

Margaret Rouse

Margaret Rouse is een bekroond technisch schrijver en docent die bekend staat om haar vermogen om complexe technische onderwerpen uit te leggen aan een niet-technisch, zakelijk publiek. In de afgelopen twintig jaar is haar uitleg verschenen op vele websites en is ze als autoriteit aangehaald in artikelen van de New York Times, Time Magazine, USA Today, ZDNet, PC Magazine en Discovery Magazine. Margaret geniet ervan om IT- en business professionals te helpen om elkaars zeer gespecialiseerde talen te begrijpen. Als je een suggestie hebt voor een nieuwe definitie of hoe je een technische uitleg kunt verbeteren, stuur Margaret dan een…