Thomas Carlyle, filósofo británico del siglo XIX, creía que la capacidad humana de utilizar herramientas desempeñaba un papel crucial en la formación del desarrollo humano.
Expresó esta idea como «El hombre es un animal que utiliza herramientas. Sin herramientas, no es nada; con herramientas, lo es todo».
A medida que nos adentramos en la era de la inteligencia artificial, la filosofía de Carlyle surge como un remedio potencial para abordar ciertas limitaciones notables inherentes a los grandes modelos lingüísticos (LLM).
Las limitaciones de los grandes modelos lingüísticos (LLM)
Aunque los LLM como ChatGPT y Google Bard han logrado avances impresionantes en áreas como el diálogo natural, el razonamiento matemático y la síntesis de programas, su principal limitación reside en su capacidad fija para absorber y almacenar información.
Esta falta de flexibilidad dificulta su capacidad para adaptarse a contextos cambiantes, y el confinado contexto operativo añade retos a la hora de mantenerse al día en un mundo que cambia constantemente. En consecuencia, los LLM necesitan reciclarse periódicamente para actualizar sus conocimientos y mejorar su capacidad de razonamiento.
¿Podemos enseñar a los LLM a utilizar herramientas? Si es así, eso les abriría las puertas a bases de conocimientos amplias y en evolución, que les permitirían abordar intrincadas tareas computacionales.
Demostrando el acceso a las tecnologías de búsqueda y a las bases de datos, podemos potenciar que los LLM se comprometan con un espacio de conocimiento considerablemente más amplio y dinámico.
Asimismo, al permitir el acceso a herramientas computacionales, los LLM demuestran su capacidad para manejar intrincadas tareas computacionales. Como resultado, los principales proveedores de LLM están incorporando plugins que permiten a los LLM aprovechar sin problemas herramientas externas a través de API.
Capacidad creativa más allá del uso de herramientas
A medida que los LLM muestran una impresionante capacidad para emplear herramientas, resulta crucial reconocer el aspecto fundamental de la filosofía de Carlyle que va más allá del mero uso de herramientas.
Subraya nuestra capacidad distintiva para utilizar herramientas y crear ingeniosamente otras nuevas para abordar los retos emergentes.
Esta capacidad creativa, que implica el empleo de las herramientas existentes para forjar otras nuevas, se erige como la auténtica fuerza motriz del desarrollo humano.
Más allá del ámbito de las herramientas físicas, también mostramos una inclinación natural a construir herramientas mentales o estrategias cognitivas para desenvolvernos en las tareas repetitivas de nuestra vida cotidiana.
Considera la analogía de aprender a conducir un coche: al principio, realizamos las tareas a conciencia, pero con el dominio, la conducción se convierte en una segunda naturaleza, que requiere un esfuerzo cognitivo mínimo.
La teoría del proceso dual y las capacidades LLM
La teoría de la mente de doble proceso ofrece una visión de cómo funcionan nuestras mentes, dividiendo las capacidades cognitivas humanas en dos sistemas: Sistema 1 y Sistema 2.
El Sistema 1, parecido a un conjunto de procesos repetitivos, facilita el pensamiento rápido, automático e intuitivo, responsable de los juicios rápidos y la heurística.
Por otra parte, el Sistema 2 encarna un enfoque más deliberado y analítico. Participa en el razonamiento, el pensamiento crítico y los procesos cognitivos intrincados cuando se enfrenta a problemas o decisiones complejas, mostrando un razonamiento lógico y un mayor control cognitivo.
Curiosamente, el Sistema 2 del marco del proceso dual resuena con las capacidades evolutivas de los LLM para realizar razonamientos y pensamientos críticos.
Sin embargo, al igual que nuestros procesos cognitivos, los LLM (similares al Sistema 2) necesitan desarrollar mecanismos para producir respuestas repetitivas automatizadas similares al Sistema 1.
Los LLM como creadores de herramientas (LATM)
En el esfuerzo continuo por dotar a los LLM de la capacidad de crear nuevas herramientas, investigadores de la UC Berkeley y Microsoft se embarcan en este viaje con el desarrollo de un marco que denominan «LLM como Creadores de Herramientas (LATM)» que permite a los LLM generar sus propias herramientas reutilizables para abordar nuevas tareas.
LATM emplea un sistema de dos fases para permitir a los LLM crear y utilizar eficazmente herramientas específicas para cada tarea, proporcionando un enfoque integral de su funcionalidad.
En la primera fase, conocida como creación de herramientas, un LLM asume el papel de «constructor de herramientas». Aprovechando sus capacidades de procesamiento del lenguaje natural, elabora funciones Python a medida para resolver problemas concretos.
Esta habilidad única mejora la capacidad de resolución de problemas de los LLM, introduciendo una nueva dimensión de capacidad.
Posteriormente, en la fase de aplicación de herramientas, otro LLM, denominado «usuario de herramientas», aplica estas herramientas personalizadas para atender nuevas solicitudes y gestionar tareas complejas.
Estas herramientas preconstruidas permiten a los LLM navegar eficientemente por diversos dominios problemáticos sin incurrir en una sobrecarga computacional innecesaria.
Un aspecto interesante es que las herramientas creadas pueden reutilizarse para tareas repetitivas dentro de un flujo de trabajo o adaptarse para nuevas tareas según sea necesario. Esta adaptabilidad contribuye a la construcción de LLM escalables y rentables, capaces de gestionar tareas complejas.
En su estudio empírico, el equipo de investigación aplicó el LATM para resolver intrincados problemas de razonamiento, incluidas tareas desafiantes como las de Big-Bench. Los experimentos demostraron que el LATM alcanzaba niveles de rendimiento comparables a los de modelos que consumen muchos recursos, como el GPT-4, al tiempo que reducía significativamente los costes de cálculo.
Retos y direcciones futuras
Este esfuerzo presenta una vía prometedora para mejorar las capacidades avanzadas de resolución de problemas de los LLM, otorgándoles la capacidad de construir herramientas adaptadas a tareas específicas de forma autónoma.
Sin embargo, marca un paso fundacional en la capacitación de los modelos lingüísticos para innovar e idear nuevas herramientas que respondan a los retos emergentes.
Además, en lugar de limitarse a un único lenguaje de programación y funcionalidades básicas, los LLM deberían ser adaptables a múltiples lenguajes, cada uno con capacidades únicas adecuadas para abordar diversos retos y automatizar tareas repetitivas más sofisticadas, como la conducción.
Una perspectiva cautivadora para la investigación futura consiste en permitir que el fabricante de herramientas perfeccione y actualice las herramientas existentes para tratar nuevos casos problemáticos, reflejando el proceso iterativo que se observa en el desarrollo de software.
Esta adaptabilidad puede acelerar potencialmente la evolución del ecosistema de la IA, presentando un sinfín de oportunidades. Estas capacidades empoderan colectivamente a los LLM, fomentando una sensación de autosuficiencia en sus capacidades de resolución de problemas.
Lo esencial
Inspirado en la filosofía de las herramientas de Carlyle, LATM ofrece un enfoque similar al humano para mejorar a los LLM. El LATM permite a los LLM elaborar y utilizar eficazmente herramientas específicas para cada tarea, demostrando adaptabilidad y rentabilidad.
A medida que los LLM evolucionan, la teoría del proceso dual guía su transición entre el razonamiento analítico y las respuestas automatizadas. El sistema bifásico del LATM demuestra su éxito en la resolución de problemas complejos, compitiendo con modelos que consumen muchos recursos y reduciendo significativamente los costes.
De cara al futuro, los retos incluyen ampliar la adaptabilidad del LLM a múltiples lenguajes y perfeccionar las herramientas de forma iterativa.
Esta adaptabilidad impulsa la evolución del ecosistema de la IA, ofreciendo posibilidades apasionantes. Estos avances capacitan a los LLM, inculcándoles una sensación de autosuficiencia en sus capacidades de resolución de problemas.