Tout ce que nous savons de Strawberry (ou Q*), la dernière IA d’Open AI

Fiabilité
À RETENIR

  • Strawberry est un projet interne à OpenAI, selon Reuters). Le modèle était auparavant connu sous le nom de Q*.
  • Le modèle d'OpenAI serait doté de capacités de raisonnement améliorées, capables de gérer des tâches plus complexes à plusieurs étapes.
  • Cette solution pourrait fonctionner de manière plus autonome que les LLM existants.

Le développement de l’intelligence artificielle a fait de grands progrès en un temps relativement court, mais il reste encore beaucoup à faire. Des produits de pointe comme ChatGPT ou Copilot offrent des capacités impressionnantes, mais aussi des limites.

La semaine dernière, Reuters a toutefois rapporté qu’OpenAI, le créateur de ChatGPT, travaillait sur une nouvelle approche des modèles d’IA dans le cadre du projet ‘Strawberry‘, également connu sous le nom de ‘Q*‘, qui devrait permettre aux grands modèles de langage (LLM) d’améliorer leur raisonnement.

Bien que la source au fait du dossier n’ait pas confirmé la date de sortie de Strawberry, elle a partagé une documentation interne fournissant quelques détails de base sur le projet.

Techopedia a demandé des précisions à OpenAI, mais la première startup mondiale dans le domaine de l’IA n’a pas répondu immédiatement aux commentaires.

Ce que nous savons sur le projet IA “Strawberry” d’OpenAI

Pour l’instant, les informations sur Strawberry sont rares, mais l’un des documents examinés par Reuters décrit un projet qui utilise les modèles Strawberry pour naviguer sur l’internet de manière autonome et effectuer des « recherches approfondies ».

Cela permettrait de parcourir Internet, d’extraire des informations d’articles et d’autres contenus, que Strawberry pourrait ensuite utiliser pour améliorer continuellement son raisonnement au fil du temps.

Il convient de noter que l’une des sources de Reuters a noté que Strawberry présente des similitudes avec la technique du Self-Taught Reasonner (STaR) mise au point à Stanford en 2022. Avec STaR, un modèle peut créer de manière itérative ses propres données d’entraînement et devenir plus intelligent au fil du temps.

La source a également affirmé que des documents internes suggèrent que l’OpenAI conçoit Strawberry pour effectuer des tâches à long terme – des tâches plus complexes qui exigent qu’un modèle effectue une série d’actions au fil du temps, bien au-delà de simple prompts ChatGPT que l’on s’arrache actuellement. Donner au modèle la capacité d’effectuer de telles tâches lui conférerait une plus grande indépendance que les LLM d’aujourd’hui.

Alon Yamin, cofondateur et PDG de Copyleaks, a déclaré à Techopedia :

“Le projet ‘Strawberry’ de l’OpenAI marque une avancée significative dans les capacités de l’IA, révolutionnant potentiellement la façon dont nous interagissons avec la technologie générative de l’IA et la façon dont elle résout des problèmes complexes. Les implications pour la recherche, le développement de logiciels et même la découverte scientifique sont immenses. Néanmoins, alors que nous nous engageons dans cette voie, nous devons continuer à donner la priorité à la mise en œuvre de garde-fous exhaustifs. Ces garde-fous garantiront que les progrès de l’IA tels que ‘Strawberry’ sont exploités de manière responsable, en atténuant les risques potentiels et en maximisant leur impact positif sur la société.”

En quoi le projet Strawberry est-il important ?

Si les informations rapportées sont correctes, elles indiquent que le développement du LLM d’OpenAI évolue de manière à ce que ses modèles d’IA soient capables d’apprendre de manière plus indépendante et d’effectuer des tâches complexes en plusieurs étapes.

Les modèles utilisant cette approche seront capables d’automatiser un plus large éventail de tâches que les LLM actuels, qui nécessitent un niveau élevé de supervision humaine. Par exemple, les utilisateurs doivent non seulement saisir des messages-guides pour utiliser ChatGPT, mais ils doivent également vérifier ses résultats pour s’assurer qu’il n’y a pas d’hallucinations ou d’affirmations incorrectes.

En effet, les LLMS ne pensent pas de manière autonome comme les êtres humains. Ils sont formés pour apprendre les schémas du langage humain et prédire les réponses aux données de base. Par conséquent, ils ne pensent pas comme le ferait un être humain et n’ont aucune notion de bon sens ou de logique.

Ne soyons pas trop enthousiastes pour l’instant avec Strawberry

Il ne fait aucun doute que Strawberry apportera quelques innovations sur le marché, mais à ce stade, il est important de ne pas trop s’emballer. Après tout, avant la sortie de GPT-4o, de nombreuses rumeurs annonçaient la sortie de GPT-5.

Bien que le GPT-4o ait constitué une solide entrée multimodale sur le marché du LLM, il n’a pas vraiment été en mesure de se démarquer des autres modèles linguistiques populaires tels que Claude 3 Opus/Sonnet ou Gemini en termes de performances.

Ceci étant dit, si Strawberry dévoile de nouvelles techniques qui peuvent améliorer les capacités de raisonnement des LLMS, alors il sera un ajout bienvenu sur le marché, de la même manière que la génération augmentée de récupération (RAG ou Retrieval Augmented Generation) et d’autres techniques l’ont été.

Les implications à long terme de Strawberry

Tant que nous n’aurons pas reçu de confirmation de la part d’OpenAI, dans un sens ou dans l’autre, il est difficile d’identifier les implications à long terme de Strawberry. Le projet est-il légitime ? Pourrait-il être mis de côté ?

Mais si l’information est crédible, cela indiquerait que les LLM évoluent au-delà de l’assistance humaine vers un rôle plus autonome, avec la capacité de créer leurs propres ensembles de données d’entraînement et d’effectuer des tâches avec une assistance minimale.

La capacité à automatiser la création de données d’entraînement pourrait alléger la charge de travail des chercheurs en IA et en apprentissage automatique, qui doivent généralement conserver des ensembles de données, tandis que la capacité à gérer des automatisations complexes ouvrira la porte à un plus large éventail de cas d’utilisation dans des domaines comme le développement de logiciels.

Une telle approche pourrait également accroître les risques. Si les modèles sont plus indépendants, il y aura inévitablement moins de surveillance et de contrôle humains. Cela soulève la question de savoir si les données d’entraînement générées par l’IA et les actions autonomes peuvent être maintenues dans le cadre d’un développement responsable de l’IA.

Strawberry serait en mesure de répondre à des questions plus complexes et constituerait un petit pas sur le chemin d’OpenAI vers le développement de l’Intelligence Artificielle Générale (AGI), un type d’IA dont les performances seraient comparables à celles de l’intelligence humaine.

Termes connexes

Articles Liés

Alexandre Robert
Administrateur de Techopedia France

L'écriture sous toutes ces formes, voici ce qui dirige une partie de ma vie et de mon travail ! A commencer par mes études, à l'EJCAM (Ecole de Journalisme et de Communication d'Aix-Marseille), pour ensuite avoir la chance d'exercer mon métier durant plus de 3 ans au sein de la Presse Quotidienne Régionale des Bouches du Rhône : La Provence et La Marseillaise. Pour compléter mon apprentissage éditorial, c'est vers le web que je me suis par la suite tourné, où j'ai eu la chance de poser mes mots sur les sites de Superprof, Food Spring, Decathlon et bien d'autres…