Anthropic, la startup de inteligencia artificial fundada por antiguos investigadores de OpenAI, ha lanzado una importante actualización de su principal asistente conversacional de IA, Claude.
Claude 2.1 viene repleto de mejoras significativas que lo consolidan como uno de los sistemas de IA más sofisticados y éticamente alineados disponibles en la actualidad.
La actualización se basa en las capacidades básicas del modelo inicial Claude 2.0, presentado en 2023. Desde entonces, millones de personas han utilizado Claude para diversas aplicaciones, como la traducción de trabajos académicos, la redacción de planes de negocio y el análisis de complejos contratos legales.
Escuchando los comentarios de los usuarios, Anthropic ha centrado Claude 2.1 en potenciar áreas clave como la honestidad, la comprensión y la interoperabilidad.
El resultado es un asistente de IA que puede comprender más contexto, hacer recomendaciones más inteligentes e integrarse de forma segura en los flujos de trabajo existentes de los usuarios.
Ventana de contexto masiva de 200.000 tokens
Uno de los cambios más notables de Claude 2.1 es la ventana de contexto ampliada a 200.000 tokens (PDF), que permite a Claude procesar unas 150.000 palabras de texto a la vez. Esto supone el doble del límite anterior de 100.000 tokens de Claude 2.0.
La ventana de contexto significativamente mayor permite a los usuarios alimentar a Claude con documentos enteros, como extensas bases de código, informes financieros, trabajos de investigación, novelas y mucho más.
Claude puede resumir rápidamente, extraer ideas, responder a preguntas concretas y generar otros resultados de alto nivel para grandes volúmenes de texto.
Procesar 200.000 tokens es un logro técnico sin precedentes y sitúa a Claude en la vanguardia de las capacidades de procesamiento del lenguaje natural. Anthropic afirma que Claude es el primer sistema de IA que alcanza esta longitud de contexto líder en el sector.
Doble reducción de declaraciones falsas
Además de la ventana de contexto ampliada, Anthropic se centró en mejorar significativamente la honestidad y precisión de Claude 2.1. Según las pruebas internas, Claude 2.1 ha mostrado una reducción del doble de declaraciones falsas en comparación con Claude 2.0.
Esta espectacular mejora de la veracidad en diversos temas permite a las empresas utilizar Claude para aplicaciones de alto riesgo que requieren resultados fiables. El aumento de la honestidad también hace que Claude sea más seguro para las conversaciones de dominio abierto.
LEER MÁS:
Como parte de su metodología de pruebas, Anthropic evaluó a Claude 2.1 con un amplio conjunto de preguntas objetivas complejas diseñadas para comprobar la honestidad de los sistemas de IA. Las preguntas abarcaban temas que iban desde la geografía y la historia hasta la cultura pop y la actualidad.
Utilizando una rigurosa métrica de puntuación, el equipo de Anthropic evaluó si Claude 2.1 hacía afirmaciones demostrablemente incorrectas o admitía adecuadamente la incertidumbre cuando carecía de conocimientos suficientes.
En general, el nuevo modelo optó por la humildad en lugar de proporcionar información falsa en una proporción sustancialmente mayor.
La comprensión y el resumen de documentos largos y complejos también experimentaron notables mejoras, y Claude 2.1 demostró una disminución del 30% de respuestas incorrectas en comparación con su predecesor.
En el caso de los resúmenes y las conclusiones extraídas de fuentes extensas, el índice de imprecisiones se redujo entre 3 y 4 veces en las pruebas comparativas internas.
API de uso de herramientas para integraciones personalizadas
Anthropic también ha introducido el uso de herramientas, una API que permite a los desarrolladores conectar Claude 2.1 a aplicaciones de terceros, bases de datos internas y lógica personalizada. Esta función pretende que Claude sea más versátil en diversos casos de uso empresarial.
Con el uso de herramientas, Claude 2.1 puede orquestar funciones personalizadas definidas por el desarrollador, buscar en bases de conocimiento privadas, consultar conjuntos de datos internos, aprovechar API externas, realizar cálculos y mucho más basándose en instrucciones del usuario.
Por ejemplo, los desarrolladores pueden construir interfaces de lenguaje natural sobre Claude para
- Traducir solicitudes en llamadas a API estructuradas
- Recuperar información de bases de datos mediante consultas SQL
- Invocar microservicios específicos de la empresa mediante llamadas a la API y mucho más.
Consola de desarrollador y banco de trabajo mejorados
En el aspecto técnico, Anthropic también ha mejorado su Consola basada en la nube, desde la que los desarrolladores pueden acceder a Claude 2.1 a través de la API.
El objetivo de la Consola mejorada es que a los usuarios les resulte más fácil y rápido optimizar los avisos e integrar Claude en las aplicaciones.
Los aspectos más destacados son:
- Banco de trabajo para probar e iterar rápidamente los avisos
- Posibilidad de guardar revisiones de avisos y hacer un seguimiento del historial
- Sistema de avisos que permite personalizar el tono y la personalidad de Claude
- Generación de fragmentos de código para utilizar fácilmente los avisos en los SDK.
Según Anthropic, estas actualizaciones para desarrolladores acelerarán el despliegue en el mundo real de asistentes de IA como Claude en diversos sectores.
La versión Claude 2.1 para humanos ya está activa e interactuando con los usuarios en claude.ai. Tanto la versión gratuita como la de pago se han actualizado para utilizar el último modelo.
Los usuarios de Claude Pro de pago pueden aprovechar el contexto completo de 200.000 tokens, mientras que la versión gratuita tiene una longitud máxima de contexto menor.
Rápido impulso de clientes e inversores
El lanzamiento de Claude 2.1 se produce tras el enorme interés de clientes e inversores por Anthropic, impulsado por la combinación única de potencia, seguridad y transparencia de Claude. Este interés ha impulsado la valoración de Anthropic a más de 4.000 millones de dólares.
Los hitos recientes incluyen:
- El uso de Claude por millones de usuarios en todo el mundo
- Asociaciones de alto perfil con Nvidia, AWS, Microsoft, NVIDIA
- Más de 1.000 millones de dólares comprometidos por inversores como Amazon, Google y Sapphire Ventures
- Según se informa, está recaudando otra ronda de 750 millones de dólares, ahora con una valoración de 15.000 millones de dólares.
El resultado final
Según Dario Amodei, director general de Anthropic, la mera publicación de artículos de investigación no basta para avanzar realmente en la seguridad de la IA.
Como argumentó en una entrevista en el New York Times, Anthropic cree que debe competir comercialmente para tener un impacto significativo en el sector.
Lanzando públicamente asistentes de IA avanzados y éticamente alineados como Claude, Anthropic pretende influir en los competidores y elevar sistemáticamente el listón de las normas de seguridad en los productos de consumo de IA. La empresa espera que su liderazgo en transparencia y seguridad haga avanzar a todo el sector.
Con su continuo progreso en el desarrollo de sistemas de IA profundamente útiles pero éticamente alineados, el futuro de Anthropic parece brillante. Claude 2.1 es sólo el último ejemplo de cómo Anthropic cumple su misión de establecer el listón más alto de seguridad en inteligencia artificial.