GTP-4o OpenAI : Une présentation « Wow » du nouveau modèle

Fiabilité

Mardi 13 mai 2024 – La société OpenAI de Sam Altman qui développe l’intelligence artificielle la plus performante à ce jour a annoncé le 13 mai 2024 la sortie de son nouveau modèle : GPT-4o (« o » pour « omni », qui signifie « tout »).

Après ses premières versions de LLM (Large Language Model) déjà utilisées par plus de 100 millions de personnes dans le monde, les nouvelles fonctionnalités annoncées cette fois semblent venues du futur.

GPT-4o est une nouvelle étape pour améliorer les interactions entre les hommes et les machines et les rendre plus naturelles. Désormais, les entrées et les sorties peuvent être une combinaison de texte, d’audio et d’image, offrant donc un potentiel à 360° pour les utilisateurs du produit d’OpenAI.

Avec un temps de réponse moyen de 320 millisecondes pour répondre à une demande audio, GPT-4o permet désormais d’avoir une conversation naturelle et similaire au temps de réponse humain.

L’une des principales avancées du nouveau modèle GPT-4o est également son coût, puisque l’API est désormais 50 % moins cher qu’auparavant, tout ayant accès à des fonctions améliorées à tous les niveaux.

La démonstration de la chef de la technologie, Mira Murati, nous a particulièrement bluffé. Les émotions du modèle, les conversations fluides dans de nombreuses langues et ses performances semblent dépasser tous les standards actuellement proposés sur le marché de l’IA.

Les points clefs de GTP-4o

  • Génération et interprétations en temps réel avec audio, vidéo, image et texte en 50 langues différentes (dont le français).
  • Certainement la plus grande mise à jour de GPT jusqu’à présent, offrant des interactions naturelles entre l’Humain et la machine.
  • GPT-4o est capable de simuler des émotions, de participer à une conversation avec plusieurs personnes et est doté de capacités proches de l’humain en termes d’interaction.
  • Amélioration de la vitesse et de la qualité de plus de 50 langues disponibles sur GPT-4o offrant un accès du modèle aux plus grandes zones géographiques.
  • OpenAI travaille en collaboration avec les gouvernements et parties prenantes pour limiter les risques liés à l’utilisation malveillante des capacités audio et vidéo en temps réel de GPT-4o
  • GPT-4o sera disponible gratuitement sur MacOS et Windows dans les prochaines semaines et son API pour les développeurs aura un coût réduit de 50 % par rapport au modèle précédent.

Les avancées annoncées par OpenAI viennent devancer les annonces de Google prévues pour le mardi 14 mai 2024. C’est une véritable guerre de l’intelligence artificielle entre ChatGPT et ses concurrents.

Présentation officielle de GPT-4o

Pour le moment, la présentatrice et chef de la technologie Mira Murati a annoncé que GPT-4o est lancé uniquement sur ordinateur personnel, avant d’être disponible sur iOS et Android.

Rapidement, elle a annoncé que : « l’UI a été rafraîchi, pour rendre son utilisation beaucoup plus simple ». Mais ce n’est évidemment pas l’annonce la plus importante effectuée durant ce Live Stream d’OpenAI.

Rappelant que la mission de sa société OpenAI est de « Proposer un outil avancé d’intelligence artificielle accessible à tous et gratuit », Mira Murati a annoncé que le nouveau modèle GPT-4o va enfin permettre de réduire cette friction entre l’Humain et la machine.

L’application GPT-4o a ensuite été annoncée et dévoilée durant ce Live, offrant la possibilité aux utilisateurs d’accéder au LLM peu importe où ils sont, sans ajouter une nouvelle couche de complexité à son utilisation.

L’UI (Interface Utilisateur) a été pensée pour être naturelle et pour rester concentré uniquement sur votre collaboration avec l’intelligence artificielle. Et ce, malgré les nouvelles possibilités qu’offre GPT-4o.

C’est seulement après avoir introduit la nouvelle application que Mira Murati a ensuite dévoilé le nouveau modèle d’OpenAI : GPT-4o. Acclamée par les personnes présentes dans l’auditoire, la chef de la technologie de Sam Altman a annoncé que le modèle offre des capacités : « Texte, vision et audio ».

présentation openai gpt-4o

Présenté comme un Omnimodel, la société semble appuyer sur le fait que GPT-4o est l’un des plus grands pas effectués depuis l’arrivée de l’intelligence artificielle sur le marché, se concentrant sur la qualité d’interaction entre l’Humain et la machine.

 

« Les interactions deviennent beaucoup plus naturelles et beaucoup plus simples », selon Mira Murati.

 

La présentatrice a ensuite énuméré les complexités d’un tel LLM : les bruits de fonds, les multiples voix dans une conversation, la compréhension du ton de la voix et bien d’autres.

Avec plus de 100 millions de personnes qui créent, apprennent et travaillent actuellement avec ChatGPT, les équipes ont souhaité répondre à ces problématiques en combinant la vision, le texte et l’audio sur un seul modèle.

C’est à ce moment précis que Mira Murati a fait certainement l’une des plus grandes annonces : « Grâce à l’efficacité de GPT-4o, nous pouvons apporter tous ces outils avancés gratuitement, à tous. ».

Les créateurs d’applications sur le GPT Store ont alors été rapidement rassurés, puisque la chef de la technologie a annoncé que « Grâce à cet accès gratuit, les créateurs auront la chance d’avoir une plus grande visibilité. »

Des exemples précis ont été utilisés :

 

« Les professeurs pourront créer du contenu pour leurs étudiants et les créateurs de podcasts pourront produire pour leurs auditeurs. »

 

La présentation de la fonction Vision de GPT-4o a également été un point central pour Mira Murati, qui annonce que les utilisateurs peuvent désormais ajouter un screenshot, un document ou une photo pour commencer une conversation grâce à ce contenu.

Toutes les conversations de ce nouveau modèle sont également gardées en mémoire sur notre propre session OpenAI, permettant de revenir sur certains sujets ou permettant simplement au modèle de s’adapter à l’utilisateur.

La fonction d’analyse de données et de création de chartes graphiques de GPT-4o est également une nouvelle avancée pour les utilisateurs gratuits de ce nouveau modèle OpenAI.

Ensuite, Mira Murati a évidemment annoncé les bonnes nouvelles pour les développeurs : « Un API deux fois plus rapide, 50 % moins cher et des limites 5 fois plus élevées que GPT-Turbo. »

Les auditeurs ont ensuite pu découvrir les mesures d’OpenAI pour répondre aux différents dangers de la génération audio et vidéo en temps réel : « Nous travaillons en collaboration avec les médias, les gouvernements et toutes les industries pour trouver le meilleur moyen d’apporter cette technologie au monde. »

live demo openai gpt-4o

C’est à ce moment précis que la Démo Live de GPT-4o a été effectuée, avec beaucoup d’humour et surtout un véritable effet « Wow », avec une démonstration des émotions du modèle, totalement bluffante.

OpenAI a parfaitement choisi sa date pour l’annonce officielle de GPT-4o, seulement quelques heures avant la conférence des développeurs de Google, qui devrait également être centrée autour de l’Intelligence Artificielle.

Références 

Pierre Kryzowski
Expert en Cryptomonnaies
Pierre Kryzowski
Expert en Cryptomonnaies

Pierre Kryzowski est un spécialiste reconnu dans les domaines des casinos en ligne et des cryptomonnaies, avec une expertise approfondie et une expérience riche acquise à Paris, Île-de-France, et au-delà. Actuellement co-fondateur de crash-casino.io depuis juillet 2022, Pierre a joué un rôle clé dans l'établissement et la croissance de ce site influent dans le secteur du Gaming, en mettant l'accent sur les aspects techniques et stratégiques du jeu en ligne. Sa collaboration avec Catena Media en tant que freelance a mis en lumière son savoir-faire dans le domaine des casinos en ligne. Il a participé activement à des conférences SIGMA,…