La IA de DeepMind que desentraña las enfermedades del ADN

Fiabilidad
Resumen

El artículo analiza AlphaMissense AI, una herramienta innovadora de DeepMind que predice la patogenicidad de las mutaciones genéticas y ayuda a descubrir el origen de las enfermedades. Este avance es crucial para mejorar los diagnósticos y tratamientos genéticos, mientras que AlphaMissense, basada en AlphaFold, supera a los expertos humanos en la clasificación de variantes, lo que beneficia a investigadores y profesionales médicos de todo el mundo.

En el ámbito de la biología, nuestro ADN es un completo libro de códigos que contiene instrucciones esenciales para el funcionamiento y desarrollo de nuestro cuerpo.

Vamos a analizar cómo una rama de inteligencia artificial (IA) de la empresa DeepMind de Google ha clasificado el 89 % de los 71 millones de posibles “errores” en el ADN, en claro contraste con el mero 0,1 % identificado por expertos humanos.

En la actualidad, cientos de miles de investigadores de 190 países la utilizan.

Pero antes de llegar a eso, tenemos que preparar el terreno.

¿Cómo se codifican y crean las proteínas?

Un capítulo importante del libro de códigos del ADN se refiere a la creación de proteínas, que desempeñan funciones vitales, como transportar el oxígeno necesario para la vida, facilitar la digestión y mantener la integridad estructural del organismo. Este capítulo se compone de unas 20.000 a 25.000 palabras clave.

Con el tiempo, algunas de estas palabras clave pueden corromperse, dando lugar a anomalías graves como la diabetes de tipo 2, el cáncer, la fibrosis quística, etc.

Estos códigos defectuosos, denominados mutaciones sin sentido, representan mutaciones genéticas, pequeños fallos que, cuando están presentes en nuestros genes, pueden alterar la función de las proteínas asociadas. Es como si se invirtiera una sola letra de una palabra, lo que podría cambiar todo el significado de una frase.

Sin embargo, aunque cada uno de nosotros tiene alrededor de 9.000 de estos códigos corruptos en su ADN, no todos son dañinos. Del mismo modo que no todas las erratas de un artículo cambian fundamentalmente su mensaje central, muchas mutaciones genéticas son benignas y ejercen poca influencia en nuestra salud.

Aunque los mecanismos de corrección incorporados a nuestro organismo trabajan diligentemente para corregir estas mutaciones, como el minucioso corrector ortográfico de un editor, no todos los errores genéticos pueden ser reparados por la maquinaria celular de nuestro cuerpo.

Descifrar el lenguaje genético

Entender este lenguaje genético y comprender el impacto de los «códigos corruptos» o missenses son búsquedas fundamentales en el campo de la investigación biológica. Este empeño es la clave para desentrañar métodos avanzados de diagnóstico y allanar el camino para el desarrollo de tratamientos de enfermedades genéticas.

La detección de missenses perjudiciales o patógenos nos brinda la oportunidad de dar forma a la narrativa de nuestra salud y bienestar, garantizando que nuestro libro de códigos genéticos permanezca tan libre de errores y vibrante como sea posible.

Aunque los biólogos llevan mucho tiempo esforzándose por desvelar el impacto de las mutaciones missense, sigue siendo un gran misterio cuál de los millones de errores genéticos posibles podría dar lugar a una enfermedad, debido a los limitados datos experimentales disponibles.

Por ejemplo, de los más de 4 millones de variantes missense observadas en humanos, sólo el 2% han sido identificadas como patógenas o benignas por los expertos, lo que supone aproximadamente el 0,1% de los 71 millones de posibles variantes missense.

AlphaFold: Transformando el panorama de la investigación biológica

En 2018, DeepMind, una filial de Google, logró una hazaña innovadora en la investigación biológica al presentar AlphaFold, un sistema de inteligencia artificial (IA) capaz de predecir con precisión la estructura 3D de una proteína únicamente a partir de su secuencia de aminoácidos.

Con ello se aborda el viejo «problema del plegamiento de las proteínas», un reto que ha dejado perplejos a los biólogos durante más de 50 años. Las proteínas son los componentes fundamentales de la vida y rigen todos los procesos biológicos. Comprender la estructura de una proteína ofrece profundos conocimientos sobre el lenguaje genético y la evolución.

El entrenamiento de AlphaFold en unas 170.000 proteínas del banco de datos de proteínas le permitió descifrar estructuras proteicas. Al comparar las secuencias del banco de datos, dedujo la proximidad de los aminoácidos en las estructuras plegadas, haciendo conjeturas sobre estructuras desconocidas.

Esta IA revolucionaria, conseguida tras unas semanas de aprendizaje automático utilizando una potencia de cálculo equivalente a entre 100 y 200 GPU, transformó el campo de la investigación biológica. La base de datos de estructuras proteicas creada por AlphaFold está siendo utilizada por millones de investigadores de 190 países para tareas tan variadas como comprender enfermedades o acelerar el descubrimiento de fármacos.

AlphaMissense: Transformación de la detección de errores genéticos

Ampliando el modelo AlphaFold, los investigadores de DeepMind han dotado recientemente a este modelo de la capacidad de predecir la patogenicidad de las variantes missense. Para lograr este objetivo, AlphaFold se afina en las etiquetas que distinguen las variantes observadas en poblaciones humanas y de primates estrechamente emparentados. Las variantes comúnmente observadas se clasifican como benignas, mientras que las no observadas se clasifican como patógenas.

Este modelo de nuevo desarrollo, denominado AlphaMissense, ofrece una puntuación continua, lo que permite a los usuarios elegir un umbral para la clasificación de variantes en función de sus requisitos específicos de precisión.

En el artículo publicado en Science, los investigadores demostraron que AlphaMissense clasificaba el 89% de los 71 millones de posibles variantes missense como probablemente patógenas o benignas, frente al 0,1% que habían identificado los expertos humanos.

El perfeccionamiento de AlphaFold previamente entrenado también reduce la necesidad de grandes cantidades de datos de entrenamiento, el tiempo de cálculo y el consumo de energía.

Catálogo AlphaMissense: Potenciando la investigación genética

DeepMind ha creado un catálogo basado en las predicciones generadas por el modelo AlphaMissense y lo ha puesto a disposición del público. Aunque este catálogo no puede diagnosticar directamente enfermedades, constituye un valioso recurso para investigadores y profesionales de la medicina.

Los investigadores que deseen determinar si una variante missense específica puede ser responsable de una enfermedad pueden ahora consultar la tabla y encontrar su puntuación de patogenicidad prevista.

AlphaMissense podría ayudar a los investigadores a agilizar el proceso de relacionar mutaciones genéticas con enfermedades, eliminando rápidamente opciones poco probables. También podría mejorar nuestra comprensión de aspectos de nuestro código genético que se pasan por alto.

Este catálogo abierto puede ser decisivo para arrojar luz sobre enfermedades hasta ahora misteriosas y guiar el camino hacia diagnósticos y tratamientos más precisos. Los investigadores de DeepMind subrayan, sin embargo, que las predicciones no deben utilizarse de forma aislada, sino como guía para la investigación en el mundo real.

DeepMind ha adoptado un enfoque cauteloso con respecto a la publicación de su modelo entrenado para evitar un posible uso indebido de esta tecnología. En lugar de hacer que el modelo esté disponible para su descarga y uso inmediatos, han hecho accesible toda la información esencial, incluido el código informático, lo que permite a otros replicar su trabajo.

Lo esencial

En la búsqueda de la comprensión de nuestro código genético y desentrañar los misterios de las enfermedades genéticas, AlphaMissense AI by DeepMind ofrece una herramienta innovadora.

Clasificar el 89% de los 71 millones de posibles variantes missense, en comparación con el 0,1% al que hemos llegado hasta ahora, es increíble: un testimonio de lo valioso que puede ser el trabajo de la inteligencia artificial.

Al predecir la patogenicidad de las variantes de sentido erróneo, estas herramientas permiten a los investigadores y profesionales médicos identificar los orígenes genéticos de síndromes complejos.

Aunque no se trata de una herramienta de diagnóstico en sí misma, el catálogo AlphaMissense disponible públicamente es un recurso valioso para orientar la investigación genética y tiene el potencial de acelerar la vinculación de las mutaciones genéticas con las enfermedades.

El enfoque prudente de DeepMind garantiza que esta tecnología transformadora se utilice de forma responsable, permitiendo el acceso abierto a información esencial y protegiendo al mismo tiempo contra posibles usos indebidos.

Temas relacionados

Artículos relacionados

Dr. Tehseen Zia
Tenured Associate Professor
Dr. Tehseen Zia
Profesor titular asociado, Universidad COMSATS de Islamabad (CUI)

El Dr. Tehseen Zia tiene un doctorado y más de 10 años de experiencia investigadora postdoctoral en Inteligencia Artificial (IA). Es profesor titular asociado y dirige la investigación sobre IA en la Universidad Comsats de Islamabad, y coinvestigador principal en el Centro Nacional de Inteligencia Artificial de Pakistán. En el pasado, trabajó como consultor de investigación en el proyecto Dream4cars, financiado por la Unión Europea.