Nur wenige Labore für künstliche Intelligenz (KI) haben so viele bahnbrechende Entdeckungen gemacht wie das im Vereinigten Königreich ansässige Startup DeepMind. Das 2010 von Demis Hassabis, Shane Legg und Mustafa Suleyman gegründete Labor steht seither an der Spitze der KI-Entwicklung in den Bereichen Deep Learning, unüberwachtes Lernen, Reinforcement Learning und Neurowissenschaften.
Nach der Übernahme durch Google für 500 Millionen Dollar im Jahr 2014 spielte das Unternehmen auch eine wichtige Rolle bei der Entwicklung von Diensten wie Google Search, YouTube und Gmail. Im Jahr 2023 fusionierte DeepMind mit Google Research und gründete Google Deepmind.
Auch wenn es bis 2021 dauerte, bis DeepMind zum ersten Mal Gewinne erzielte, spielte das Unternehmen jahrelang eine entscheidende Rolle bei der Entwicklung hochkarätiger Projekte wie AlphaFold, AlphaGo und WaveNet sowie bei der Entdeckung neuer Wege zur Verbesserung der menschlichen Entscheidungsfindung durch KI.
Die 5 wichtigsten KI-Durchbrüche von DeepMind
Seit seiner Gründung vor über einem Jahrzehnt hat DeepMind zu einer beträchtlichen Anzahl von Innovationen in der KI-Forschung beigetragen. Einige der wichtigsten sind im Folgenden aufgeführt.
1. AlphaFold
Einer der größten Durchbrüche von DeepMind in den letzten zehn Jahren war ein KI-Programm namens AlphaFold, das am 22. Juli 2021 eingeführt wurde. AlphaFold verwendet KI, um die Aminosäuresequenz von Proteinen zu verarbeiten und die Form von Proteinen durch die Erstellung eines 3D-Modells vorherzusagen.
Vor der Veröffentlichung von AlphaFold kannten Wissenschaftler nur die 3D-Strukturen von 17 % der Proteine im Körper. Nach der Einführung von AlphaFold haben Wissenschaftler nun Zugang zu über 200 Millionen Proteinvorhersagen, und 98,5 % der 3D-Strukturen für menschliche Proteine können vorhergesagt werden.
AlphaFold hat im Wesentlichen dazu beigetragen, die Struktur menschlicher Proteine besser zu verstehen, die bisher als eines der größten Probleme der Biologie undurchsichtig geblieben war. Vor AlphaFold mussten Wissenschaftler eigenständig experimentieren, um die zugrunde liegende Struktur eines Proteins zu entdecken.
Heute nutzen mehr als 1,2 Millionen Forscher in 190 Ländern die AlphaFold-Proteinstrukturdatenbank und haben mit Hilfe dieser Lösung einen Impfstoff gegen Malaria entwickelt und neue Behandlungsmethoden für Leberkrebs entdeckt.
Durch den Einsatz von KI zur Automatisierung des Protein-Mappings hat DeepMind nicht nur Wissenschaftlern geholfen, Proteinstrukturen zu betrachten, sondern auch aktiv dazu beigetragen, die biologische Forschung und die Entdeckung künftiger Medikamente zu beschleunigen.
2. AlphaGo
Ein weiteres Forschungsprojekt, das international auf großes Interesse gestoßen ist, ist AlphaGo. AlphaGo ist ein KI-gesteuertes Programm, das maschinelles Lernen und tiefe neuronale Netze nutzt, um das Brettspiel Go zu spielen. AlphaGo analysiert vergangene Spiele und Brettkonfigurationen, um den nächsten Zug beim Go-Spiel vorherzusagen.
Im Gegensatz zu anderen KI-Go-Programmen, die Suchbäume verwenden, um alle möglichen Züge und Positionen zu testen, erhielt AlphaGo eine Beschreibung des Go-Bretts als Eingabe und wurde dann trainiert, tausende Male gegen sich selbst zu spielen, um seine Entscheidungsfähigkeit zu verbessern.
Dieser Ansatz war so erfolgreich, dass das Programm im Oktober 2015 nicht nur den dreimaligen Go-Europameister Fan Hui besiegen konnte, sondern im März 2016 auch den 18-maligen Go-Weltmeister Lee Sedol. AlphaGo erreichte auch einen 9-Dan-Profi-Rang, die höchste Zertifizierung des Spiels.
AlphaGo hat gezeigt, wie KI eingesetzt werden kann, um einen komplexen Entscheidungsprozess zu analysieren, gemeinsame Muster zu lernen und die effektivste Reaktion oder das beste Ergebnis vorherzusagen.
3. WaveNet
WaveNet, das 2016 veröffentlicht wurde, ist eine weitere Kernentwicklung von DeepMind. Es handelt sich um ein generatives Modell für Rohaudio, das auf einer großen Menge von Sprachproben trainiert wird und in der Lage ist, natürlich klingende Sprache auf der Grundlage von Text- oder Audioeingaben zu erzeugen.
Anstatt Sprachaufnahmen wie andere Text-to-Speech-Systeme zu schneiden und neu zu kompilieren, verwendet WaveNet stattdessen ein auf Bildern, Videos und Tönen trainiertes neuronales Faltungsnetzwerk, um die Struktur der menschlichen Sprache zu erlernen und zu emulieren.
Das bedeutet, dass es Wellenformen von Grund auf neu komponieren und Sprache erzeugen kann, die den Klang einer menschlichen Stimme nachahmt. Heute wird WaveNext in einer Reihe von beliebten Anwendungen eingesetzt, darunter Google Assistant, Google Search und Google Translate.
Die wichtigste Errungenschaft von DeepMind mit WaveNext war, dass es dem Unternehmen gelang, eine Lösung zu entwickeln, die computergenerierte Sprache natürlicher und weniger roboterhaft klingen lässt als herkömmliche Text-to-Speech-Lösungen.
4. Google Bard
In der Ära der generativen KI war einer der wichtigsten Beiträge von Deepmind die Arbeit an dem Chatbot Google Bard, der im März 2023 in Zusammenarbeit mit Google AI veröffentlicht wurde.
Bard basiert auf dem Pathways Language Model 2 (PaLM), einem Sprachmodell, das auf öffentlich zugänglichen Daten, einschließlich Webseiten, Quellcode und anderen Daten, trainiert wurde, und ermöglicht es den Nutzern, natürlichsprachliche Anfragen und Antworten in natürlicher Sprache zu verarbeiten.
Die Veröffentlichung von Bard erfolgte nur wenige Monate, nachdem sich OpenAI mit der Veröffentlichung von ChatGPT im November 2022 als Branchenführer im Bereich Large Language Model (LLM) etabliert hatte, und war entscheidend, um im KI-Wettrüsten wettbewerbsfähig zu bleiben.
Zum jetzigen Zeitpunkt besteht das Hauptunterscheidungsmerkmal zwischen Bard und ChatGPT darin, dass Bard das Internet bei Bedarf durchsuchen und Antworten generieren kann, während ChatGPT auf Trainingsdaten aus der Zeit vor 2021 angewiesen ist.
Es ist erwähnenswert, dass Bard einen schweren Start hatte und Google 100 Milliarden Dollar an Marktwert verlor, nachdem es fälschlicherweise behauptet hatte, dass das James Webb Weltraumteleskop während einer Demo die ersten Bilder eines Planeten außerhalb des Sonnensystems aufgenommen hatte. Seitdem hat es sich jedoch zu einem wichtigen Konkurrenten von OpenAI entwickelt und erreichte im Mai 142,6 Millionen Besucher.
5. RT-2
Nur wenige Monate nach der Zusammenarbeit mit Google AI bei der Veröffentlichung von Bard brachte DeepMind im Juli 2023 RT-2 auf den Markt, das erste Vision-Language-Action (VLA)-Robotik-Transformer-Modell. RT-2 verarbeitet Text und Bilder aus dem Internet und nutzt sie zur Ausgabe von Roboteraktionen.
RT-2 kann zur Steuerung von Robotikgeräten eingesetzt werden und Robotern grundlegende Aufgaben beibringen, z. B. das Erkennen und Wegwerfen von Müll. Es ist auch in der Lage, auf Benutzerbefehle mit Schlussfolgerungen in Form von Objektkategorien oder Beschreibungen auf hoher Ebene zu reagieren.
Es ist auch in der Lage, semantische Schlussfolgerungen zu ziehen, wie z. B. zu erkennen, ob ein Objekt als improvisierter Hammer verwendet werden kann (z. B. ein Stein) und welche Art von Getränk für eine müde Person am besten geeignet ist (ein Energydrink).
Als VLA-Modell ist RT-2 insofern innovativ, als er den Nutzern eine neue Art der Interaktion mit Robotern ermöglicht, indem er ihnen beibringt, wie sie bestimmte Aufgaben erfüllen und bestimmte Aktionen ausführen können. Dies eröffnet eine ganze Reihe neuer Anwendungsmöglichkeiten für KI in der Robotik.
Die Quintessenz
DeepMind genießt seit Jahren den Ruf als eines der besten KI-Labore der Welt. Mit seiner Erfolgsbilanz bei der Verwirklichung der hochkarätigen Projekte AlphaFold, AlphaGo, WaveNet, Google Bard und RT-2 wird DeepMind auch in den kommenden Jahren eine wichtige Rolle in der KI-Forschung spielen.
Wenn es etwas gibt, das man aus der DeepMind-Forschung lernen kann, dann ist es, dass KI zur Lösung fast jedes erdenklichen Problems eingesetzt werden kann, egal wie komplex das Szenario oder die Anforderung ist.