Google DeepMind’s prestaties en doorbraken in AI-onderzoek

Betrouwbaarheid
IN HET KORT

De staat van dienst van DeepMind op het gebied van innovatie in projecten zoals AlphaFold, AlphaGo, WaveNet en Google Bard laat zien dat de grenzen van geautomatiseerde besluitvorming nog lang niet zijn bereikt.

Er zijn maar weinig laboratoria voor kunstmatige intelligentie (AI) die zoveel baandoorbrekende ontdekkingen hebben gedaan als de Britse startup DeepMind. Het lab, dat in 2010 werd opgericht door Demis Hassabis, Shane Legg en Mustafa Suleyman, heeft consequent aan de top gestaan van AI-ontwikkeling op het gebied van deep learning, unsupervised learning, reinforcement learning en neurowetenschappen.

Nadat het bedrijf in 2014 voor 500 miljoen dollar werd overgenomen door Google, heeft het ook een belangrijke rol gespeeld in de ontwikkeling van diensten als Google Search, YouTube en Gmail. In 2023 fuseerde DeepMind met Google Research tot Google Deepmind.

Hoewel het tot 2021 heeft geduurd voordat DeepMind voor het eerst winst maakte, heeft het jarenlang een cruciale rol gespeeld bij het tot leven brengen van spraakmakende projecten, zoals AlphaFold, AlphaGo en WaveNet, en bij het ontdekken van nieuwe manieren om AI te gebruiken om menselijke besluitvorming te verbeteren.

DeepMind’s top 5 AI-doorbraken

Sinds de oprichting meer dan tien jaar geleden heeft DeepMind bijgedragen aan een aanzienlijk aantal innovaties in AI-onderzoek. Hieronder staan enkele van de belangrijkste.

1. AlphaFold

Een van de grootste doorbraken van DeepMind in de afgelopen tien jaar was een AI-programma genaamd AlphaFold, dat op 22 juli 2021 werd gelanceerd. AlphaFold gebruikt AI om de aminozuursequentie van eiwitten te verwerken en voorspelt de vorm van eiwitten door een 3D-model te genereren.

Vóór de lancering van AlphaFold kenden wetenschappers slechts de 3D-structuren van 17% van de eiwitten in het lichaam. Nu, na de lancering van AlphaFold, hebben wetenschappers toegang tot meer dan 200 miljoen eiwitvoorspellingen en kan 98,5% van de 3D-structuren voor menselijke eiwitten worden voorspeld.

AlphaFold heeft geholpen om meer inzicht te krijgen in de structuur van menselijke eiwitten, die traditioneel ondoorzichtig was gebleven als een van de grootste problemen in de biologie. Vóór AlphaFold moesten wetenschappers zelfstandig experimenteren om de onderliggende structuur van een eiwit te ontdekken.

Vandaag de dag gebruiken meer dan 1,2 miljoen onderzoekers in 190 landen de AlphaFold Protein Structure database en hebben ze de oplossing gebruikt om een vaccin tegen malaria te helpen ontwikkelen en nieuwe behandelingen voor leverkanker te ontdekken.

Door AI te gebruiken om het in kaart brengen van eiwitten te automatiseren, heeft DeepMind niet alleen wetenschappers geholpen om eiwitstructuren te bekijken, maar heeft het ook actief bijgedragen aan het versnellen van biologisch onderzoek en het ontdekken van toekomstige medicijnen.

2. AlphaGo

Een ander onderzoeksproject dat internationaal veel aandacht heeft gekregen is AlphaGo. AlphaGo is een AI-gestuurd programma dat gebruikmaakt van machine learning en diepe neurale netwerken om het bordspel Go te spelen. AlphaGo analyseert eerdere spellen en bordconfiguraties om de volgende zet te voorspellen bij het spelen van Go.

In tegenstelling tot andere AI-spelende Go-programma’s, die zoekbomen gebruikten om alle mogelijke zetten en posities te testen, kreeg AlphaGo een beschrijving van het Go-bord als invoer en werd vervolgens getraind om duizenden keren tegen zichzelf te spelen om zijn beslissingsvermogen te verbeteren.

Deze aanpak was zo succesvol dat het programma niet alleen drievoudig Europees Go-kampioen Fan Hui versloeg in oktober 2015, maar in maart 2016 ook Lee Sedol, een 18-voudig wereldkampioen Go, versloeg. AlphaGo behaalde ook een 9-dan professionele ranking, de hoogste certificering van het spel.

AlphaGo liet zien hoe AI kan worden toegepast om een complex besluitvormingsproces te ontleden, gemeenschappelijke patronen te leren en de meest effectieve reactie of uitkomst te voorspellen.

3. WaveNet

WaveNet, uitgebracht in 2016, is een andere ontwikkeling die DeepMind heeft voortgebracht. Het is een generatief model voor ruwe audio dat is getraind op een grote hoeveelheid spraakvoorbeelden en is in staat om natuurlijk klinkende spraak te genereren op basis van tekst- of audio-invoer.

In plaats van het knippen en hercompileren van spraakopnames zoals andere tekst-naar-spraaksystemen, gebruikte WaveNet in plaats daarvan een neuraal netwerk dat was getraind op afbeeldingen, video’s en geluiden om de structuur van menselijke taal te leren en na te bootsen.

Dit betekende dat het waveforms vanaf nul kon samenstellen en spraak kon genereren die het geluid van een menselijke stem nabootst. Nu wordt WaveNext gebruikt in een reeks populaire toepassingen, waaronder Google Assistant, Google Search en Google Translate.

De belangrijkste prestatie van DeepMind met WaveNext was dat de organisatie erin slaagde een oplossing te bouwen die computergegenereerde spraak natuurlijker en minder robotachtig liet klinken dan traditionele tekst-naar-spraak oplossingen.

4. Google Bard

In het tijdperk van generatieve AI is een van de belangrijkste bijdragen van DeepMind het werk aan de Google Bard chatbot, die in maart 2023 werd uitgebracht in samenwerking met Google AI.

Bard is gebouwd op het Pathways Language Model 2 (PaLM), een taalmodel dat is getraind op openbaar beschikbare gegevens, waaronder webpagina’s, broncode en andere data, en stelt gebruikers in staat om zoekopdrachten en antwoorden in natuurlijke taal te verwerken.

De release van Bard kwam slechts enkele maanden nadat OpenAI zich had gevestigd als marktleider op het gebied van Large Language Model (LLM) met de release van ChatGPT in november 2022 en was van cruciaal belang om concurrerend te blijven in de AI-wapenwedloop.

In dit stadium is het belangrijkste verschil tussen Bard en ChatGPT dat Bard op verzoek op internet kan zoeken en antwoorden kan genereren, terwijl ChatGPT afhankelijk is van trainingsgegevens van vóór 2021.

Het is de moeite waard om op te merken dat Bard een moeilijke start had en Google 100 miljard dollar aan marktwaarde verloor nadat het tijdens een demo ten onrechte beweerde dat de James Webb ruimtetelescoop de eerste foto’s van een planeet buiten het zonnestelsel had gemaakt. Sindsdien is het echter een belangrijke concurrent van OpenAI geworden, met 142,6 miljoen bezoekers in mei.

5. RT-2

Slechts enkele maanden na de samenwerking met Google AI om Bard uit te brengen, bracht DeepMind in juli 2023 RT-2 uit, het eerste vision-language action (VLA) robotica-transformatormodel. RT-2 verwerkt tekst en afbeeldingen van het internet en gebruikt deze om robotacties uit te voeren.

RT-2 kan worden gebruikt om robotica-apparatuur te besturen en robots te leren basistaken uit te voeren, zoals het identificeren van een stuk afval en het weggooien ervan. Het kan ook reageren op gebruikerscommando’s met redeneringen in de vorm van objectcategorieën of beschrijvingen op hoog niveau.

Het kan ook semantisch redeneren, zoals bepalen of een voorwerp kan worden gebruikt als geïmproviseerde hamer (bijvoorbeeld een steen) en welk soort drankje het beste is voor een vermoeid persoon (een energiedrankje).

Als VLA-model is RT-2 innovatief in de zin dat het gebruikers een nieuwe manier van interactie met robots biedt door ze te leren hoe ze bepaalde taken moeten uitvoeren en bepaalde acties moeten uitvoeren. Dit opent een hele reeks nieuwe gebruiksmogelijkheden voor AI in de robotica.

Conclusie

DeepMind heeft al jaren een reputatie als een van de beste AI-laboratoria ter wereld. Met de resultaten van spraakmakende projecten als AlphaFold, AlphaGo, WaveNet, Google Bard en RT-2 zal DeepMind de komende jaren een belangrijke speler blijven in het AI-onderzoek.

Als we iets kunnen leren van het onderzoek van DeepMind, dan is het wel dat AI kan worden gebruikt om bijna elk denkbaar probleem op te lossen, hoe complex het scenario of de vereiste ook is.

Gerelateerde begrippen

Gerelateerde artikelen

Techopedia
Redactie
Techopedia
Redactie

Bij Techopedia willen we inzicht en inspiratie bieden aan IT-professionals, besluitvormers op het gebied van technologie en iedereen die zich met trots een geek noemt. Van het definiëren van complex tech jargon in ons woordenboek, tot het verkennen van de laatste trends in onze artikelen of het bieden van een diepgaande dekking van een onderwerp in onze tutorials, ons doel is om u te helpen technologie beter te begrijpen - en, hopelijk, betere beslissingen te nemen als gevolg daarvan.