Die unglaubliche Geschichte der DeepMind-KI, die DNA-Krankheiten entschlüsselt

DAS WICHTIGSTE IM ÜBERBLICK

Der Artikel befasst sich mit AlphaMissense AI, einem bahnbrechenden Tool von DeepMind, das die Pathogenität genetischer Mutationen vorhersagt und dabei hilft, den Ursprung von Krankheiten aufzudecken. Dieser Fortschritt ist für die Verbesserung der Gendiagnostik und -behandlung von entscheidender Bedeutung. AlphaMissense, das auf AlphaFold basiert, übertrifft menschliche Experten bei der Variantenklassifizierung und kommt Forschern und Medizinern weltweit zugute.

Im Bereich der Biologie dient unsere DNA als umfassendes Codebuch, das wesentliche Anweisungen für das Funktionieren und die Entwicklung des Körpers enthält.

Im Folgenden wird untersucht, wie ein KI-Ableger von Googles DeepMind 89 % von 71 Millionen potenziellen Fehlern in der DNA klassifiziert hat ein krasser Gegensatz zu den 0,1 %, die von menschlichen Experten ermittelt wurden.

Das System wird inzwischen von Hunderttausenden von Forschern in 190 Ländern eingesetzt. Doch zunächst geht es um die Vorgeschichte.

Wie Protein kodiert und erzeugt wird

Ein wichtiges Kapitel des DNA-Codebuchs betrifft die Bildung von Proteinen, die lebenswichtige Aufgaben wie den Transport von Sauerstoff, die Erleichterung von Verdauung und die Aufrechterhaltung der strukturellen Integrität des Körpers erfüllen. Dieses Kapitel besteht aus etwa 20.000 bis 25.000 Codewörtern.

Im Laufe der Zeit können einige dieser Codewörter beschädigt werden, was zu schweren Anomalien wie Typ-2-Diabetes, Krebs, Mukoviszidose und anderen Erkrankungen führt.

Diese fehlerhaften Codes, die als Missense-Mutationen bezeichnet werden, stellen Genmutationen dar winzige Pannen, die, wenn sie in unseren Genen vorhanden sind, die Funktion der zugehörigen Proteine verändern können.

Das ist so, als ob ein einziger Buchstabe in einem Wort umgedreht wird und möglicherweise die gesamte Bedeutung eines Satzes verändert.

Obwohl jeder von uns etwa 9.000 dieser fehlerhaften Codes in seiner DNA trägt, sind nicht alle von ihnen schädlich.

Genauso wie nicht jeder Tippfehler in einem Artikel dessen Kernaussage grundlegend beeinflusst, sind viele genetische Mutationen gutartig und haben kaum Auswirkungen auf unsere Gesundheit.

Während die in unserem Körper eingebauten Mechanismen fleißig an der Korrektur dieser Mutationen arbeiten, wie die sorgfältige Rechtschreibprüfung eines Redakteurs, können nicht alle genetischen Fehler von der Zellmaschinerie unseres Körpers repariert werden.

Entschlüsselung der genetischen Sprache

Diese genetische Sprache zu verstehen und die Auswirkungen der beschädigten Codes oder Fehler zu begreifen, ist ein zentrales Anliegen in der biologischen Forschung.

Dieses Unterfangen ist der Schlüssel zur Erschließung fortschrittlicher Diagnosemethoden und zur Entwicklung von Therapien für genetische Krankheiten.

Die Entdeckung von schädlichen oder pathogenen Fehlern bietet uns die Möglichkeit, auf unsere Gesundheit und unser Wohlbefinden Einfluss zu nehmen und sicherzustellen, dass das genetische Codebuch so fehlerfrei und kraftvoll wie möglich bleibt.

Obwohl Biologen seit langem bestrebt sind, die Auswirkungen von Missense-Mutationen zu entschlüsseln, bleibt es aufgrund der begrenzten experimentellen Datenlage weitgehend rätselhaft.

Die Frage, welche der Millionen möglichen genetischen Fehler zu einer Krankheit führen könnten, ist nach wie vor ungeklärt.

So wurden beispielsweise von den mehr als 4 Millionen beobachteten Missense-Varianten beim Menschen nur 2 % von Experten als pathogen oder gutartig eingestuft, was etwa 0,1 % aller 71 Millionen potenziellen Missense-Varianten entspricht.

AlphaFold: Neue Möglichkeiten für die biologische Forschung

Im Jahr 2018 gelang DeepMind, der Tochtergesellschaft von Google, eine bahnbrechende Leistung in der biologischen Forschung.

Sie stellte AlphaFold vor, ein System der künstlichen Intelligenz (KI), das in der Lage ist, die 3D-Struktur eines Proteins allein anhand seiner Aminosäuresequenz genau vorherzusagen.

Damit wird das seit langem bestehende Proteinfaltungsproblem angegangen, eine Herausforderung, die Biologen seit über 50 Jahren vor ein Rätsel stellt.

Proteine sind die grundlegenden Bestandteile des Lebens, weil sie jeden biologischen Prozess steuern. Das Verständnis der Struktur eines Proteins bietet tiefe Einblicke in die genetische Sprache und die Evolution.

AlphaFold wurde an rund 170.000 Proteinen aus der Proteindatenbank trainiert und konnte so Proteinstrukturen entschlüsseln.

Durch den Vergleich von Sequenzen in der Datenbank konnte es die Nähe von Aminosäuren in gefalteten Strukturen ableiten und so fundierte Vermutungen über unbekannte Strukturen anstellen.

Diese bahnbrechende Technologie, die nach einigen Wochen maschinellen Lernens mit einer Rechenleistung von 100 bis 200 GPUs erreicht wurde, hat den Bereich der biologischen Forschung verändert.

Eine von AlphaFold erstellte Datenbank mit Proteinstrukturen wird von Millionen von Forschern in 190 Ländern für verschiedene Aufgaben genutzt, z. B. für das Verständnis von Krankheiten oder die Beschleunigung der Arzneimittelentdeckung.

AlphaMissense: Revolutionäre Erkennung von genetischen Fehlern

In Erweiterung des AlphaFold-Modells haben DeepMind-Forscher dieses Modell kürzlich mit der Fähigkeit ausgestattet, die Pathogenität von Missense-Varianten vorherzusagen.

Zu diesem Zweck wurde AlphaFold auf Kennzeichnungen abgestimmt, die Varianten in menschlichen und eng verwandten Primatenpopulationen unterscheiden.

Häufig beobachtete Varianten werden als gutartig eingestuft, während nicht beobachtete Varianten als pathogen klassifiziert werden.

Dieses neu entwickelte Modell, das als AlphaMissense bekannt ist, bietet einen kontinuierlichen Score, mit dem Nutzer einen Schwellenwert für die Variantenklassifizierung entsprechend ihren spezifischen Genauigkeitsanforderungen wählen können.

Die Forscher wiesen in ihrer in der Zeitschrift Science veröffentlichten Arbeit nach, dass AlphaMissense 89 % aller 71 Millionen potenziellen Missense-Varianten als wahrscheinlich pathogen oder gutartig einstufte, verglichen mit den 0,1 %, die von menschlichen Experten identifiziert worden waren.

Die Feinabstimmung des vortrainierten AlphaFold reduziert zudem den Bedarf an umfangreichen Trainingsdaten, Rechenzeit und Energieverbrauch.

AlphaMissense-Katalog: Unterstützung der genetischen Forschung

DeepMind hat einen auf den Prognosen des AlphaMissense-Modells basierenden Katalog erstellt und ihn der Öffentlichkeit zugänglich gemacht.

Dieser Katalog kann zwar keine direkten Diagnosen stellen, dient aber als wertvolle Ressource für Forscher und Mediziner.

Um festzustellen, ob eine bestimmte Missense-Variante für eine Krankheit verantwortlich sein könnte, steht den Forschern nun eine Tabelle mit dem voraussichtlichen Pathogenitätswert zur Verfügung.

AlphaMissense könnte Forschern dabei helfen, den Prozess der Zuordnung von genetischen Mutationen zu Krankheiten zu rationalisieren, indem unwahrscheinliche Optionen schnell ausgeschlossen werden. Außerdem könnte es unser Verständnis für übersehene Aspekte unseres genetischen Codes verbessern.

Dieser offene Katalog kann dazu beitragen, Licht in bisher rätselhafte Zustände zu bringen und den Weg zu genaueren Diagnosen und Behandlungen zu weisen.

Die Forscher von DeepMind betonen jedoch, dass die Vorhersagen nicht isoliert verwendet werden sollten, sondern eher als Leitfaden für die reale Wissenschaft dienen.

DeepMind hat bei der Veröffentlichung seines trainierten Modells einen vorsichtigen Ansatz gewählt, um einen möglichen Missbrauch dieser Technologie zu verhindern.

Anstatt das Modell zum sofortigen Download und zur Nutzung zur Verfügung zu stellen, haben sie alle wesentlichen Informationen, einschließlich des Computercodes, zugänglich gemacht, damit andere ihre Arbeit nachahmen können.

Fazit 

In dem Bestreben, unseren genetischen Code zu verstehen und die Geheimnisse genetischer Krankheiten zu lüften, bietet die AlphaMissense-KI von DeepMind ein innovatives Werkzeug.

Die Klassifizierung von 89 % aller 71 Millionen potenziellen Missense-Varianten, im Vergleich zu den 0,1 %, die bisher erreicht wurden, ist unglaublich ein Beweis dafür, wie viel wertvolle Arbeit künstliche Intelligenz leisten kann.

Dank der Vorhersage der Pathogenität von Missense-Varianten ermöglichen diese Instrumente Forschern und Medizinern, den genetischen Ursprung komplexer Syndrome zu ermitteln.

Der öffentlich zugängliche AlphaMissense-Katalog ist zwar kein eigenständiges Diagnosetool, stellt aber eine wertvolle Ressource für die genetische Forschung dar und hat das Potenzial, die Verknüpfung von Genmutationen mit Krankheiten zu beschleunigen.

Der vorsichtige Ansatz von DeepMind stellt sicher, dass diese transformative Technologie verantwortungsvoll genutzt wird, indem sie einen offenen Zugang zu wichtigen Informationen gewährt und gleichzeitig vor möglichem Missbrauch schützt.

Verwandte Begriffe

Dr. Tehseen Zia

Dr. Tehseen Zia hat einen Doktortitel und mehr als 10 Jahre Forschungserfahrung auf dem Gebiet der Künstlichen Intelligenz (KI) nach seiner Promotion. Er ist Assistenzprofessor und leitet die KI-Forschung an der Comsats University Islamabad und ist Mitbegründer des National Center of Artificial Intelligence Pakistan. In der Vergangenheit hat er als Forschungsberater für das von der Europäischen Union finanzierte KI-Projekt Dream4cars gearbeitet.