Le nouveau modèle d’intelligence artificielle de Nvidia, Llama-3.1-Nemotron-70B-Instruct, surpasse ses concurrents.
Il marque une évolution vers des logiciels avancés et défie les leaders de l’industrie.
Nvidia a présenté un nouveau modèle d’Intelligence Artificielle le 15 octobre. Le modèle Llama-3.1-Nemotron-70B-Instruct est apparu sur la plateforme Hugging Face AI sans annonce officielle.
Il a rapidement attiré l’attention par ses performances impressionnantes dans de nombreux tests de référence.
Our Llama-3.1-Nemotron-70B-Instruct model is a leading model on the 🏆 Arena Hard benchmark (85) from @lmarena_ai.
Arena Hard uses a data pipeline to build high-quality benchmarks from live data in Chatbot Arena, and is known for its predictive ability of Chatbot Arena Elo… pic.twitter.com/HczLQQ6EOp
— NVIDIA AI Developer (@NVIDIAAIDev) October 15, 2024
Le modèle AI de Nvidia surpasse ses concurrents
Nvidia affirme que son nouveau modèle obtient les meilleurs scores dans des évaluations clés :
- 85,0 sur le benchmark Arena Hard,
- 8,98 sur le GPT-4-Turbo MT-Bench,
- 57,6 sur AlpacaEval 2 LC.
Ces résultats positionnent Nvidia en tant que leader de la compréhension et de la génération de langage d’IA, surpassant des modèles très respectés comme GPT-4o d’OpenAI et Claude 3.5 Sonnet d’Anthropic.
L’entreprise a créé Llama-3.1-Nemotron-70B-Instruct en affinant le modèle open-source Llama 3.1 de Meta avec des techniques avancées telles que l’apprentissage par renforcement à partir du feedback humain (RLHF).
Cette méthode permet à l’IA de s’adapter aux préférences humaines et de produire des réponses plus intuitives et mieux adaptées au contexte.
Le modèle excelle dans le traitement de requêtes complexes sans aide supplémentaire.
Toutefois, s’il constitue une solution d’IA puissante pour les entreprises, il peut manquer de précision dans des domaines spécialisés tels que les mathématiques ou le raisonnement juridique, ce qui souligne la nécessité d’une utilisation responsable et de mesures de protection.
Alors que les développeurs testent le Llama-3.1-Nemotron-70B-Instruct, de nouvelles applications sont attendues dans les domaines de la santé, de la finance et de l’éducation, à l’image d’Apple qui ne cesse de développer ses applications d’Intelligence Artificielle pour iPhone.
Le succès dépend de la transformation des résultats des tests en solutions pratiques.
Nvidia transforme le paysage de l’IA
La publication du nouveau modèle d’IA marque un tournant pour Nvidia, qui passe d’une focalisation traditionnelle sur les GPU au développement de logiciels d’IA avancés.
Avec le lancement en septembre des modèles multimodaux NVLM 1.0, dont le NVLM-D-72B à 72 milliards de paramètres, Nvidia est prête à défier les systèmes propriétaires comme le GPT-4o dans l’interprétation d’images et la résolution de problèmes complexes.
En proposant à la fois des modèles multimodaux et textuels, Nvidia se positionne comme un fournisseur de solutions d’IA complètes. Cette stratégie pourrait remodeler le secteur et accélérer l’innovation chez les rivaux.