Le modèle Grok-2 de xAI inclut de nouvelles fonctionnalités de génération d’images pour tous les abonnés X Premium. Ce modèle s’appuie sur un modèle de génération Flux mis en place par Black Forest Labs.
Malgré la controverse, Elon Musk lance la nouvelle version de son modèle d’IA Grok
La plateforme X, appartenant au milliardaire américain Elon Musk, fait actuellement l’objet d’une controverse pour avoir utilisé des tweets sur sa propre plateforme de médias sociaux, sans recueillir le consentement de ses utilisateurs, afin d’entraîner ses modèles d’Intelligence Artificielle.
La polémique n’a pas empêché la startup xAI de publier la nouvelle version de son modèle Grok. Cette nouvelle version se distingue de la version précédente en étant capable de générer des images. Elle intègre également une interface de messagerie instantanée totalement refondue pour tous les abonnés X Premium.
Un peu plus tôt dans la journée, xAI a lancé la nouvelle génération de modèles, Grok-2 et Grok-2 mini, en version bêta. Ces modèles sont désormais disponibles pour les utilisateurs abonnés de X, bien qu’il semble que seuls les utilisateurs Premium puissent essayer le modèle en son intégralité tandis que les utilisateurs abonnés de catégorie intermédiaire sont limités à la version « mini ».
xAI a déclaré que les nouveaux modèles présentent des améliorations significatives par rapport à l’ancien modèle Grok-1.5 et sont capables de rivaliser par rapport à d’autres modèles concurrents « dans des domaines tels que les connaissances scientifiques de niveau supérieur (GPQA), les connaissances générales (MMLU, MMLU-Pro) et les problèmes de compétition mathématique (MATH) ».
Bien que xAI ne révèle pas la quantité de données utilisée pour l’entraînement de ses modèles, on peut toutefois supposer que Grok-1 pourrait reposer sur plus de 314 milliards de paramètres pour son entraînement.
Dans son communiqué, l’entreprise affirme que la version de test de Grok-2 surpasse les modèles concurrents comme GPT-4-Turbo d’OpenAI et Claude 3.5 Sonnet d’Anthropic sur le « LMSYS Chatbot Arena leaderboard », une plateforme participative spécialisée dans le classement des chatbots.
Nous n’avons cependant pas été en mesure de vérifier par nous-mêmes les performances du modèle de test sur le leaderboard en direct.
Des images réalistes et une prise en charge efficace du texte dans les images
La fonctionnalité de génération d’images est basée sur « Flux », un modèle de génération d’images par IA mis en place par Black Forest Labs et connu pour générer des images particulièrement réalistes.
Comme d’autres modèles de génération d’images à partir de texte, Flux est capable de reproduire les textures de la peau humaine. Il se distingue par sa capacité à écrire du texte selon les instructions, ce que d’autres modèles d’IA génératives ne parviennent pas à faire.
En plus d’être capable de générer des images à la volée, Grok serait également capable d’analyser et de comprendre les images fournies par les utilisateurs. Cette capacité a été annoncée lors de la sortie du modèle Grok-1.5 Vision, mais les fonctionnalités n’ont pas encore été intégrées dans le chatbot destiné aux utilisateurs. xAI met les nouveaux modèles à la disposition des développeurs qui peuvent les intégrer dans leurs applications et plateformes à l’aide d’une API spécialement conçue pour interagir automatiquement avec le modèle Grok.