IBM a dévoilé sa nouvelle suite de modèles d’IA générative, “Granite 3.0”, destinée aux entreprises.
Les modèles Granite 3.0, comme les prédécesseurs de la famille Granite, seront open-source sous licence Apache 2.0.
Dans un communiqué de presse, IBM a déclaré que le grand modèle linguistique large (LLM) Granite 3.0 peut surpasser ou égaler des modèles de taille similaire provenant des principaux fournisseurs de modèles sur divers tests universitaires et industriels.
Outre les modèles gratuits, IBM propose Watsonx, une plateforme payante qui permet aux organisations d’exécuter et de personnaliser certaines variantes des modèles d’IA Granite 3.0 dans leurs propres environnements.
Dario Gil, directeur de la recherche chez IBM, a déclaré que les modèles Granite 3.0 ont été développés à l’aide des GPU H100 de Nvidia.
Performances de Granite 3.0
IBM affirme que ses modèles Granite 3.0 ont été entraînés sur plus de 12 billions de tokens dans plusieurs langages de programmation et qu’ils utilisent une méthode d’entraînement en deux étapes optimisée par des milliers d’expériences.
La variante du modèle Granite 3.0 8B Instruct surpasse d’autres modèles open-source de taille similaire de sociétés telles que Meta et Mistral, comme l’évalue le tableau de classement OpenLLM de Hugging Face, a déclaré IBM.
Le modèle Granite 3.0 8B Instruct est le plus performant pour les tâches axées sur l’entreprise, selon IBM.
Parmi ces fonctionnalités, nous citons :
- La Génération Augmentée de Récupération (RAG) ;
- L’utilisation d’outils ;
- La cybersécurité
L’ensemble des modèles Granite 3.0 et les modèles de séries temporelles mis à jour peuvent être téléchargés sur HuggingFace, une plateforme qui symbolise le futur de l’IA générative.
Par ailleurs, d’autres variantes devraient être publiées prochainement.
Au cours des derniers mois, IBM a redoublé d’efforts dans le domaine de la recherche en IA.
L’entreprise technologique nord-américaine a récemment annoncé la sortie de son modèle de prévision, TinyTimeMixer (TTM) AI.