¿Qué significa AlphaGo?
AlphaGo es una IA estrecha, un programa informático desarrollado por Google DeepMind para jugar al Go, un juego de mesa de estrategia chino para dos jugadores similar al ajedrez.
AlphaGo es el primer programa de IA que fue capaz de derrotar a un jugador humano profesional, el jugador 2-dan Fan Hui en octubre de 2015, en un tablero de tamaño completo sin desventajas.
Después venció a uno de los jugadores humanos mejor clasificados del mundo, Lee Sedol, 9-dan, en marzo de 2016, ganando cuatro partidas de cinco.
Definición de AlphaGo
El proyecto AlphaGo se inició en 2014 como banco de pruebas para comprobar hasta qué punto el algoritmo de red neuronal de Google DeepMind que utiliza el aprendizaje profundo podía competir en Go.
El algoritmo de AlphaGo es una combinación de técnicas de búsqueda en árbol y aprendizaje automático y se refuerza con un amplio entrenamiento tanto con humanos como con otros jugadores informáticos.
Utiliza la búsqueda en árbol Monte Carlo y se guía por una red de políticas y valores, implementada mediante tecnologías de redes neuronales profundas.
La red de políticas se entrena y ayuda a la IA a predecir la siguiente jugada con más probabilidades de ganar, mientras que la red de valores se entrena para reducir el árbol de búsqueda y determinar el valor de esas posiciones, estimando los ganadores en cada posición en lugar de buscar hasta el final de la partida.
AlphaGo se alimentó primero con jugadas históricas de partidas de jugadores humanos, utilizando una base de datos de unos 30 millones de jugadas, lo que le permitió imitar las jugadas humanas. Una vez que la IA alcanzó un cierto grado de competencia, se la entrenó aún más haciéndola jugar contra instancias de sí misma, utilizando el aprendizaje por refuerzo para mejorar y aprender más.
En octubre de 2015, una versión de computación distribuida de AlphaGo jugó y derrotó a Fan Hui, campeón europeo de Go 2-dan, siendo la primera vez que un programa informático vencía a un jugador profesional de Go. Fan Hui ayudó entonces como consultor del equipo de DeepMind meses después de su derrota.
En marzo de 2016, AlphaGo se enfrentó a Lee Sedol, uno de los jugadores mejor clasificados del mundo, que había alcanzado el nivel máximo de 9-dan.
Ganó cuatro partidas frente a una de Lee, lo que supuso un gran avance en la investigación de la IA, ya que significó que el algoritmo de aprendizaje profundo y redes neuronales utilizado por DeepMind se puede utilizar para cualquier otro propósito, ya que en realidad no se programó para jugar al Go, sino que se le enseñó a jugar al Go. Esto abre todo un mundo nuevo para la investigación en IA.