Recientemente, la inteligencia artificial (IA) ha realizado notables avances en el procesamiento del lenguaje natural (PLN). Esto se debe principalmente a su capacidad para entrenar modelos a gran escala utilizando datos textuales. En sí, durante el último año, la IA ha dado grandes pasos evolutivos que han sorprendido al mundo entero pero detrás de todo esto hay varios elementos que vale la pena conocer.
Con el desarrollo de estos modelos lingüísticos, la IA se vuelve competente en tareas como análisis de sentimientos, traducción automática, generación de textos y resumen.
Sin embargo, a pesar de estos avances, la IA sigue luchando con sus capacidades cognitivas cuando se trata de abordar tareas de razonamiento de varios pasos, como problemas matemáticos de palabras y razonamiento simbólico y de sentido común.
Este artículo presenta el último avance conocido como razonamiento de cadena de pensamiento (CoT), una técnica basada en prompts (instrucciones) que permite a los modelos de IA mostrar capacidades cognitivas.
¿Qué es un prompt?
El prompt es una instrucción para que el modelo genere una respuesta. Es similar a pedirle a alguien que escriba un ensayo sobre un tema específico. Al igual que los escritores humanos, los modelos de IA emplean instrucciones como base para escribir ensayos o generar respuestas.
Podemos plantear a modelos lingüísticos como ChatGPT preguntas sencillas como “¿Quién es el rey del Reino Unido?” o problemas complejos con descripciones detalladas de las tareas. Incluso una petición como “Cuéntame un chiste” puede considerarse una pregunta abierta.
¿Cómo funciona la ingeniería de prompts?
La ingeniería de prompts se ocupa de crear y diseñar instrucciones que permitan a los modelos de IA realizar tareas específicas. Durante este proceso, es crucial elegir cuidadosamente los datos y el formato de la instrucción para garantizar que el modelo pueda aprovecharlos eficazmente para ejecutar la tarea.
Por ejemplo, si queremos determinar el sentimiento de la crítica de la película “No la veas”, podemos añadir la instrucción “Es” a la frase, convirtiéndola en “No la veas. Es ____”. En este caso, anticiparíamos una mayor probabilidad de que el modelo lingüístico genere “malísima” en lugar de “genial”.
El objetivo de la ingeniería de prompts de IA es generar prompts de alta calidad que permitan al modelo de IA hacer predicciones precisas.
Aprendizaje basado en instrucciones
Los prompts también pueden utilizarse para enseñar a un modelo de IA a producir los resultados deseados. La técnica, conocida como aprendizaje basado en prompts, consiste en proporcionar al modelo consultas y respuestas correctas antes de pedirle que responda a otras consultas.
Por ejemplo, podemos plantear al modelo algunas preguntas numéricas y sus respuestas, pidiéndole que resuelva otras preguntas:
Q: En la cafetería había 23 manzanas. Si usaron 20 para hacer el almuerzo y compraron 6 más, ¿cuántas manzanas tienen? A: 9Q: En una clase hay 15 alumnos. Si se incorporan 7 alumnos más a la clase, ¿cuántos alumnos hay en total? A: ______ |
Sin embargo, se ha observado que las instrucciones simples, que consisten únicamente en una pregunta y su respuesta, a menudo conducen a resultados incorrectos en tareas cognitivas como problemas matemáticos de palabras, razonamiento simbólico y razonamiento de sentido común.
Para hacer frente a estos retos, el razonamiento en cadena es una nueva y prometedora técnica diseñada específicamente para permitir a los modelos de IA abordar con éxito estas tareas cognitivas.
Cadena de pensamiento
En el razonamiento estándar, el modelo aprende de ejemplos de pregunta-respuesta y luego predice respuestas para nuevas preguntas. Por otro lado, la cadena de pensamiento se ocupa de instruir al modelo para que divida los problemas complejos en pasos más pequeños y proporcione tanto los pasos de razonamiento intermedios como la solución final.
La cadena de pensamiento se inspira en el razonamiento aritmético, en el que el razonamiento en lenguaje natural se utiliza para construir un argumento que conduce a la respuesta final.
Esto ayuda al modelo a abordar problemas de varios pasos con mayor eficacia, ya que le permite descomponer los problemas complicados en pasos más pequeños y cómodos que pueden resolverse fácilmente.
Además, como la cadena de pensamiento se basa en el lenguaje, puede aplicarse a cualquier tarea que una persona pueda resolver utilizando el lenguaje. A continuación se muestra un ejemplo de una pregunta estándar frente a una pregunta de cadena de pensamiento.
Ejemplo de consulta estándar | Ejemplo de un prompt de cadena de pensamiento | |
Pregunta | Imagina que estás planeando un viaje por carretera con tus amigos. Quieres calcular el coste total del combustible para el viaje. La distancia entre el punto de partida y el de destino es de 800 km y el consumo medio de tu coche es de 50 km por litro. El precio actual del combustible es de 3,50 $ por galón. Calcule el coste total estimado del combustible para el viaje. | Imagina que estás planeando un viaje por carretera con tus amigos. Quieres calcular el coste total del combustible para el viaje. La distancia entre el punto de partida y el de destino es de 800 km y el consumo medio de tu coche es de 50 km por litro. El precio actual del combustible es de 3,50 $ por galón. Calcule el coste total estimado del combustible para el viaje y explique sus cálculos paso a paso. |
Respuesta | 59,50 dólares. |
|
Beneficios de la técnica de la cadena de pensamiento
La cadena de pensamiento -o Chain-of-thought en inglés- ofrece varias ventajas cuando se trata de mejorar las capacidades cognitivas de los modelos de IA:
- Descomposición de problemas: La cadena de pensamiento permite a los modelos de IA descomponer los problemas complicados en pasos intermedios fáciles de manejar, lo que les lleva a resolver problemas complejos de razonamiento de varios pasos.
- La cadena de pensamiento permite a los modelos de IA resolver problemas complejos de razonamiento de varios pasos.
- Interpretabilidad del modelo: al permitir que el modelo de IA genere pasos de razonamiento intermedios con soluciones, una cadena de pensamiento nos proporciona una forma de interpretar el comportamiento del modelo; cómo ha llegado el modelo a una solución concreta. Esto nos permite identificar y depurar posibles errores en la ruta de razonamiento.
- La cadena de pensamiento.
- Aplicabilidad general: El razonamiento en cadena de pensamiento ha demostrado ser útil en varias tareas, incluyendo problemas matemáticos de palabras, razonamiento de sentido común y manipulación simbólica. En esencia, puede aplicarse potencialmente a cualquier tarea que los seres humanos puedan resolver utilizando el lenguaje, lo que lo convierte en un enfoque versátil.
- Razonamiento en cadena.
- Fácil integración: El razonamiento de la cadena de pensamiento podría integrarse fácilmente en los modelos de IA existentes basados en el lenguaje. No requiere recursos informáticos adicionales para volver a entrenar o afinar los modelos. Todo lo que necesita son algunos ejemplos de cadena de pensamiento que indiquen al modelo cómo descomponer los problemas.
Se ha demostrado que el uso de la cadena de pensamiento mejora eficazmente las capacidades cognitivas de los modelos de IA en las áreas que se mencionan a continuación.
Razonamiento aritmético es una capacidad cognitiva que implica la habilidad para resolver problemas matemáticos de palabras realizando cálculos de múltiples pasos. Esta capacidad ayuda a los estudiantes a desarrollar las estrategias de resolución de problemas necesarias para resolver problemas matemáticos. Los investigadores han demostrado que la cadena de pensamiento ayuda a los modelos de IA a aprender esta capacidad cognitiva.
El razonamiento lógico es una habilidad cognitiva crucial que se ocupa de responder a preguntas relacionadas con escenarios cotidianos extrayendo inferencias a partir de conocimientos generales. Los científicos han establecido que la cadena de pensamiento permite a los modelos de IA incorporar esta habilidad, permitiéndoles comprender situaciones comunes.
El razonamiento simbólico es una habilidad cognitiva fundamental que implica manipular y evaluar expresiones simbólicas. Los investigadores han informado de que la cadena de pensamiento dota a los modelos de IA de esta capacidad, lo que les permite realizar un razonamiento simbólico eficaz en diversos dominios.
En resumen sobre la cadena de pensamiento
La cadena de pensamiento es un enfoque prometedor para mejorar las capacidades cognitivas de los modelos de IA, especialmente en áreas como el razonamiento aritmético, el razonamiento de sentido común y el razonamiento simbólico.
A diferencia de las instrucciones simples, la cadena de pensamiento ordena al modelo que descomponga los problemas complejos en pasos más pequeños para producir razonamientos intermedios junto con la solución final.
La cadena de pensamiento no sólo resuelve tareas cognitivas, sino que también proporciona información sobre el funcionamiento interno del modelo. Además, puede desplegarse fácilmente en diversas tareas sin necesidad de recursos informáticos adicionales.
Si seguimos explorando y perfeccionando el razonamiento en cadena, podremos capacitar a los modelos de IA para que demuestren con eficacia sus capacidades cognitivas mejoradas. Además si estos avancen se unen a otros como blockchain o la computación cuántica, podemos estar en el inicio de un panoráma que hoy ni se puede imaginar.