Falcon 180B “asesino de llamas” demuestra liderazgo ante la IA

Fiabilidad
Resumen

"Llama Killer", Falcon 180B ha demostrado que la brecha entre la IA de código abierto y la de código cerrado se está cerrando rápidamente. Aunque no está al nivel de GPT-4, su competitividad frente a PaLM2 y GPT-3.5 demuestra que es una fuerza a tener en cuenta.

Esta semana, el Instituto de Innovación Tecnológica (TII) de los Emiratos Árabes Unidos (EAU) ha presentado el mayor modelo lingüístico de código abierto (LLM) hasta la fecha, Falcon 180B. Cuenta con 180.000 millones de parámetros y se ha entrenado con 3,5 billones de tokens.

Falcon 180B utiliza el conjunto de datos RefinedWeb de TII, que utiliza datos extraídos de documentos públicos de investigación de rastreo web, textos jurídicos, noticias, literatura y conversaciones en redes sociales.

Gracias a estos datos, el modelo puede rendir bien al realizar tareas como pruebas de razonamiento, codificación, competencia y conocimientos.

¿Qué es el Falcon 180B? Un nuevo aspirante a la corona de la IA

El lanzamiento de Falcon 180B se produce pocos meses después de que Meta lanzara el modelo preentrenado Llama 2 en julio y de que TII lanzara Falcon 40B en mayo de 2023. En el momento de su lanzamiento, Llama-2 admitía 180.000 millones de parámetros y estaba entrenado con 2 billones de tokens, lo que lo convertía en el mayor LLM de código abierto en el momento de su lanzamiento.

Sin embargo, el nuevo LLM de TII es 2,5 veces mayor que Llama 2 y se entrena utilizando 4 veces más potencia de cálculo. También supera a Llama 2 en tareas de comprensión lingüística multitarea (MMLU). Por eso algunos llaman a Falcon 180B el asesino de Llama.

Estas ventajas de rendimiento hacen de Falcon 180B el mayor LLM de código abierto del mercado, y la razón por la que actualmente ocupa el primer puesto en la clasificación de LLM abiertos de Hugging Face.

Falcon 180B también ha mostrado un rendimiento prometedor frente a los LLM propietarios, y Hugging Face sugiere que puede rivalizar con PaLM 2 de Google, el modelo de lenguaje utilizado para Bard, y destaca que supera con creces a GPT-3.5.

Dicho esto, cabe señalar que el tamaño del modelo requiere al menos 320 GB de memoria para funcionar, lo que puede suponer una inversión costosa.

En cualquier caso, aunque Falcon 180B no está al nivel de GPT-4, ha demostrado que la brecha entre la IA de código abierto y la de código cerrado se está cerrando rápidamente.

A medida que esa brecha siga cerrándose, las plataformas de código abierto estarán situadas para hacerse con una cuota de mercado mucho mayor, sobre todo si las organizaciones prefieren la privacidad que ofrecen los LLM de código abierto.

La ventaja de la privacidad de la IA de código abierto frente a los modelos propietarios

Los modelos de IA de código abierto como Falcon 180B ofrecen una clara ventaja sobre los modelos patentados en lo que respecta a la privacidad de los datos.

Con un modelo de IA de código abierto, una organización puede entrenar un modelo preentrenado en sus propios servidores sin enviar datos al modelo centralizado de un proveedor externo.

Este no es el caso de la mayoría de las soluciones de IA patentadas. Por ejemplo, OpenAI, Google y Anthropic recopilan datos de las conversaciones de los usuarios con sus chatbots. Esto no ocurre con los LLM de código abierto.

Sin embargo, es importante tener en cuenta que OpenAI ha intentado abordar estos problemas de privacidad con el lanzamiento de ChatGPT Enterprise, que no recopila datos de las solicitudes de los usuarios, por lo que es probable que otros proveedores propietarios intenten restringir el intercambio de datos en el futuro.

Democratización e IA de código abierto

A este nivel de rendimiento, las soluciones de IA de código abierto como Falcon 180B tienen el potencial de democratizar el acceso a la IA para que las empresas puedan experimentar con esta tecnología como parte de aplicaciones e integraciones con total transparencia en lugar de utilizar productos que se han construido con un enfoque opaco de caja negra.

Con los modelos de IA de código abierto, una comunidad de investigadores puede trabajar conjuntamente e iterar sobre el código y los casos de uso para impulsar el desarrollo de la tecnología en su conjunto sin verse limitada por los guardianes de la propiedad.

“Estamos comprometidos con la democratización del acceso a la IA avanzada, ya que nuestra privacidad y el impacto potencial de la IA en la humanidad no deberían estar controlados por unos pocos”, declaró el Secretario General del Consejo de Investigación de Tecnología Avanzada de los EAU, S.E. Faisal Al Bannai, en el comunicado de prensa del anuncio.

“Aunque puede que no tengamos todas las respuestas, nuestra determinación sigue siendo inquebrantable: colaborar y contribuir a la comunidad de código abierto, garantizando que los beneficios de la IA sean compartidos por todos.”

Además, el lanzamiento de Falcon 180B ayudará a desafiar el monopolio de Silicon Valley de empresas como Google, Meta, OpenAI y Anthropic, que han estado dominando la innovación en IA. También ayuda a consolidar a Oriente Medio como una región clave a seguir para el desarrollo de estas tecnologías en el futuro.

Uso aceptable

Uno de los elementos más interesantes del comunicado es que Falcon 180B tiene una política de uso aceptable más permisiva que otros competidores como OpenAI y Anthrophic.

Por ejemplo, la política de Falcon 180B se desglosa en cuatro líneas (parafraseadas): no utilizarlo para infringir normativas locales o internacionales, perjudicar o explotar a terceros, difundir información falsa o difamar a otros.

En cambio, la política de uso de OpenAI presenta una lista de 14 usos no permitidos de sus modelos y otros requisitos.

Entre los usos no permitidos se incluyen no sólo las actividades ilegales y el acoso, sino, en términos más generales, “las actividades que entrañen un riesgo de perjuicio económico”, los contenidos para adultos, las campañas políticas, el asesoramiento jurídico o financiero no cualificado, la toma de decisiones gubernamentales de alto riesgo o la facilitación de instrucciones sobre cómo tratar problemas de salud.

La política de uso aceptable de Anthropic también establece un gran número de usos y casos de uso prohibidos.

Como resultado, Falcon 180B tiene menos barandillas que estos modelos propietarios, lo que abre la puerta a más casos de uso pero podría abrir la puerta a otros retos en torno a la gestión de contenidos controvertidos y desinformación.

Un mercado muy competitivo

Por encima de todo, el lanzamiento de Falcon 180B pone de relieve que la IA está evolucionando más rápido de lo que nadie puede prever. Las organizaciones no pueden permitirse asumir que un proveedor dominará el mercado para siempre.

Aunque OpenAI ha disfrutado de una ventaja inicial tras lanzar ChatGPT el año pasado, otros competidores no dejan de usurpar esa posición con más parámetros y prestaciones.

Una vez que los competidores propietarios y de código abierto alcancen cierto nivel de rendimiento, será cada vez más difícil para estos proveedores destacar entre la multitud.

Temas relacionados

Tim Keary
Technology Specialist
Tim Keary
Editor

Desde enero de 2017, Tim Keary ha sido un escritor y reportero de tecnología independiente que cubre tecnología empresarial y ciberseguridad.