Fiabilidad

Logros y avances de Google DeepMind en la investigación de la IA

Resumen

El historial de innovación de DeepMind en proyectos como AlphaFold, AlphaGo, WaveNet y Google Bard demuestra que el cielo es el límite para la toma de decisiones automatizada.

Pocos laboratorios de inteligencia artificial (IA) han realizado tantos descubrimientos revolucionarios como la empresa británica DeepMind. El laboratorio, fundado por Demis Hassabis, Shane Legg y Mustafa Suleyman en 2010, ha estado siempre a la vanguardia del desarrollo de la IA en el ámbito del deep learning, el aprendizaje no supervisado, el aprendizaje por refuerzo y la neurociencia.

Tras ser adquirida por Google por 500 millones de dólares en 2014, la empresa también ha desempeñado un papel clave en el desarrollo de servicios como Google Search, YouTube y Gmail. En 2023, DeepMind se fusionó con Google Research para formar Google Deepmind.

Aunque DeepMind tardó hasta 2021 en obtener beneficios por primera vez, durante años ha desempeñado un papel fundamental en el desarrollo de proyectos de gran repercusión, como AlphaFold, AlphaGo y WaveNet, y en el descubrimiento de nuevas formas de utilizar la IA para mejorar la toma de decisiones humanas.

Los 5 mayores avances de DeepMind en IA

Desde su creación hace más de una década, DeepMind ha contribuido a un gran número de innovaciones en la investigación de la IA. A continuación se desglosan algunas de las más significativas:

1. AlphaFold

Uno de los mayores avances de DeepMind en la última década fue un programa de IA llamado AlphaFold, que se lanzó el 22 de julio de 2021. AlphaFold utiliza IA para procesar la secuencia de aminoácidos de las proteínas y predice la forma de las proteínas generando un modelo 3D.

Antes del lanzamiento de AlphaFold, los científicos sólo conocían las estructuras tridimensionales del 17% de las proteínas del organismo. Ahora, tras el lanzamiento de AlphaFold, los científicos tienen acceso a más de 200 millones de predicciones de proteínas, y se puede predecir el 98,5% de las estructuras 3D de las proteínas humanas.

Fundamentalmente, AlphaFold ha contribuido a aumentar la visibilidad de la estructura de las proteínas humanas, que tradicionalmente había permanecido opaca como uno de los mayores problemas de la biología. Antes de AlphaFold, los científicos tenían que experimentar de forma independiente para descubrir la estructura subyacente de una proteína.

En la actualidad, más de 1,2 millones de investigadores de 190 países utilizan la base de datos de estructuras de proteínas AlphaFold y han empleado la solución para ayudar a desarrollar una vacuna contra la malaria y descubrir nuevos tratamientos contra el cáncer de hígado.

Al utilizar la IA para automatizar el mapeo de proteínas, DeepMind no solo ha ayudado a los científicos a ver las estructuras de las proteínas, sino que ha contribuido activamente a acelerar la investigación biológica y el futuro descubrimiento de fármacos.

2. AlphaGo

Otro proyecto de investigación que suscitó un gran interés internacional es AlphaGo. AlphaGo es un programa impulsado por IA que utiliza aprendizaje automático y redes neuronales profundas para jugar al juego de mesa Go. AlphaGo analiza partidas anteriores y configuraciones del tablero para predecir el siguiente movimiento a realizar cuando juega al Go.

A diferencia de otros programas de Go, que utilizaban árboles de búsqueda para probar todas las jugadas y posiciones posibles, a AlphaGo se le dio una descripción del tablero de Go como entrada y luego se le entrenó para jugar contra sí mismo miles de veces para mejorar su capacidad de toma de decisiones.

Este enfoque tuvo tanto éxito que el programa no solo consiguió derrotar al tricampeón europeo de Go Fan Hui en octubre de 2015, sino que en marzo de 2016 venció a Lee Sedol, 18 veces campeón del mundo de Go. AlphaGo también logró una clasificación profesional de 9-dan, la certificación más alta del juego.

En términos más generales, AlphaGo demostró un marco sobre cómo la IA podría aplicarse para diseccionar un proceso complejo de toma de decisiones, aprendiendo patrones comunes y prediciendo la respuesta o el resultado más eficaz.

3. WaveNet

WaveNet, lanzado en 2016, es otra de las principales creaciones de DeepMind. Se trata de un modelo generativo para audio sin procesar que se entrena con un gran volumen de muestras de voz y tiene la capacidad de generar voz con sonido natural a partir de texto o entrada de audio.

En lugar de cortar y recopilar grabaciones de voz como otros sistemas de conversión de texto en voz, WaveNet utiliza una red neuronal convolucional entrenada en imágenes, vídeos y sonidos para aprender y emular la estructura del lenguaje humano.

Así podía componer formas de onda desde cero y generar un habla que imitara el sonido de la voz humana. Ahora, WaveNext se utiliza en una serie de aplicaciones populares, como Google Assistant, Google Search y Google Translate.

El principal logro de DeepMind con WaveNext fue que la organización logró construir una solución que hizo que el habla generada por computadora sonara más natural y menos robótica que las soluciones tradicionales de texto a voz.

4. Google Bard

En la era de la IA generativa, una de las contribuciones más importantes de Deepmind ha sido su trabajo en el chatbot Google Bard, que se lanzó en colaboración con Google AI en marzo de 2023.

Bard se basa en el Pathways Language Model 2 (PaLM), un modelo de lenguaje entrenado con datos disponibles públicamente, como páginas web, código fuente y otros datos, y permite procesar las consultas y respuestas en lenguaje natural de los usuarios.

El lanzamiento de Bard se produjo apenas unos meses después de que OpenAI se hubiera consolidado como líder del sector de los modelos de lenguaje de gran tamaño (LLM) con el lanzamiento de ChatGPT en noviembre de 2022 y era fundamental para seguir siendo competitivos en la carrera armamentística de la IA.

En este momento, la principal diferencia entre Bard y ChatGPT es que el primero puede buscar en Internet bajo demanda y generar respuestas, mientras que ChatGPT se basa en datos de entrenamiento anteriores a 2021.

Cabe señalar que, aunque Bard tuvo un comienzo difícil, Google perdió 100.000 millones de dólares de valor de mercado tras afirmar incorrectamente que el telescopio espacial James Webb tomó las primeras imágenes de un planeta fuera del sistema solar durante una demostración. Desde entonces, sin embargo, se ha convertido en un competidor clave contra OpenAI, alcanzando 142,6 millones de visitantes en mayo.

5. RT-2

Apenas unos meses después de trabajar con Google AI para lanzar Bard, DeepMind procedió a lanzar RT-2 en julio de 2023, el primer modelo de transformador robótico de acción de visión-lenguaje (VLA). RT-2 procesa texto e imágenes tomados de Internet y los utiliza para generar acciones robóticas.

RT-2 puede utilizarse para controlar equipos robóticos, enseñando a los robots a realizar tareas básicas, como identificar un trozo de basura y tirarlo. También es capaz de responder a las órdenes del usuario con razonamientos en forma de categorías de objetos o descripciones de alto nivel.

También tiene capacidad para realizar razonamientos semánticos, como identificar si un objeto podría utilizarse como martillo improvisado (por ejemplo, una roca) y qué tipo de bebida sería mejor para una persona cansada (una bebida energética).

Como modelo de VLA, RT-2 es innovador en el sentido de que proporciona a los usuarios una nueva forma de interactuar con los robots, enseñándoles a realizar determinadas tareas y ejecutar determinadas acciones de salida. Esto abre toda una nueva gama de casos de uso de la IA en robótica.

En resumen

Durante años, DeepMind ha mantenido su reputación como uno de los mejores laboratorios de IA del mundo. Con su historial de proyectos de alto nivel como AlphaFold, AlphaGo, WaveNet, Google Bard y RT-2, DeepMind seguirá siendo un actor clave en la investigación de la IA en los próximos años.

Si hay algo que aprender de la investigación de DeepMind es que la IA puede utilizarse para resolver casi cualquier problema que se nos ocurra, por complejo que sea el escenario o el requisito.

Temas relacionados

Tim Keary
Editor

Desde enero de 2017, Tim Keary ha sido un escritor y reportero de tecnología independiente que cubre tecnología empresarial y ciberseguridad.