Meta a lancé NotebookLlama, un générateur de podcasts IA open-source qui transforme les documents PDF en conversations audio.
Qu’est-ce que le NotebookLlama de Meta ?
Selon les fichiers partagés sur GitHub, la solution a été développée avec le modèle Llama de Meta. L’outil est accessible au public via téléchargement.
Similaire au NotebookLM de Google, qui fournit aux utilisateurs une fonction de génération de podcast en un clic, NotebookLlama de Meta permet aux utilisateurs de transformer des documents en audio conversationnel mettant en scène deux voix d’IA.
NotebookLlama traite les fichiers PDF téléchargés par les utilisateurs en plusieurs étapes. à travers les modèles Llama 3.1 de Meta.
- Le modèle Llama 3.2 1B convertit le PDF en format texte.
- Ensuite, le modèle Llama 3.1 70B crée un script de podcast à partir du texte,
- Puis, un modèle plus léger, le Llama 3.1 8B, ajoute un ton conversationnel.
- Enfin, l’outil Parler TTS de Meta transforme le script en audio, produisant un dialogue dynamique entre les personnages IA.
NotebookLlama est en retard par rapport à NotebookLM
Malgré le potentiel de l’outil, certains utilisateurs ont souligné plusieurs limitations.
Des utilisateurs ont rapporté sur X que le résultat audio n’était pas aussi fluide que ceux de NotebookLM, signalant des chevauchements occasionnels où les interlocuteurs IA parlent involontairement en même temps.
Wow! Meta dropped an open NotebookLM recipe: NotebookLlama 🔥
It uses L3.2 1B/ 3B for pre-processing the PDF, L3.1 70B for Transcript creation, L3.1 8B for re-writes and Parler TTS for Text to Speech ⚡
Step 1: Pre-process PDF: Use Llama-3.2-1B-Instruct to pre-process the PDF… pic.twitter.com/L7hb5GsMtl
— Vaibhav (VB) Srivastav (@reach_vb) October 27, 2024
Meta a reconnu ces problèmes et envisage des mises à niveau pour améliorer le flux de dialogue et la qualité sonore.
Les améliorations prévues comprennent l’utilisation de différents modèles de langage pour chaque personnage IA afin de mieux simuler les discussions d’une manière qui rende l’audio plus naturel.
Positionné comme un concurrent direct de NotebookLM de Google, NotebookLlama s’aligne sur la stratégie open-source plus large de Meta dans le secteur de l’IA, où la société mère de Facebook a publié plusieurs autres modèles d’IA open-source tels que DINOv2 et ReAgent.