Ethan

Un développeur a ouvert NotebookLM de Google en API — podcasts, quiz et vidéos générés en ligne de commande, gratuitement

ia, ia agentique, IA générative, intelligence artificielle, NotebookLM

Google NotebookLM est l’un des outils IA les plus sous-estimés de 2025. Vous lui donnez des documents — PDF, pages web, vidéos YouTube, fichiers audio — et il les transforme en podcasts, quiz, flashcards, présentations, mind maps ou résumés. Le tout gratuitement, propulsé par Gemini. Le problème : tout passe par l’interface web. Pas d’API. Pas d’automatisation possible. Pas de moyen de l’intégrer dans un workflow.

Un développeur nommé Teng Lin a résolu ce problème. Son projet notebooklm-py, publié sur GitHub sous licence MIT, fournit un accès programmatique complet à NotebookLM — y compris des fonctionnalités que l’interface web elle-même ne propose pas. Le repo a atteint 3 100 étoiles, 397 forks, et s’est hissé au 4e rang des dépôts tendance sur GitHub.

Ce que ça fait concrètement

Suivez LJG sur Google

Ajoutez LJG à vos sources préférées pour voir nos articles en priorité dans "À la une".

notebooklm-py est une bibliothèque Python qui communique avec les API RPC internes (non documentées) de Google NotebookLM. Elle s’utilise de trois manières : en Python, en ligne de commande, ou via des skills pour agents IA comme Claude Code, Codex ou OpenClaw. (Son url Github : https://github.com/teng-lin/notebooklm-py)

En pratique, quelques lignes de commande suffisent :

notebooklm create "Ma recherche"
notebooklm source add "https://exemple.com/article"
notebooklm source add "./rapport.pdf"
notebooklm generate audio "rends-le engageant" --wait
notebooklm download audio ./podcast.mp3

Cinq commandes. Un podcast généré à partir de vos documents, téléchargé en MP3. Gratuitement.

Mais l’outil va bien au-delà du podcast. Il couvre la totalité des fonctionnalités de NotebookLM Studio : audio overview (4 formats, 3 durées, 50+ langues), vidéo overview (9 styles visuels dont whiteboard, kawaii et anime), présentations avec révision slide par slide, quiz et flashcards configurables, infographies, mind maps, tableaux de données, et rapports.

Ce que l’interface web ne fait pas

L’intérêt principal de notebooklm-py n’est pas de reproduire l’interface web en ligne de commande. C’est de débloquer des fonctionnalités que Google n’expose pas dans son interface :

Le téléchargement batch de tous les artefacts d’un type donné. L’export de quiz et flashcards en JSON, Markdown ou HTML — l’interface web ne montre qu’une vue interactive. L’extraction des mind maps en JSON hiérarchique exploitable par des outils de visualisation. Le téléchargement des présentations en PPTX éditable — l’interface web ne propose que le PDF. La révision de slides individuelles par prompt en langage naturel. L’accès au texte intégral indexé de n’importe quelle source. La gestion programmatique du partage et des permissions.

A lire :  Sora d'OpenAI : 1 million par jour de coûts, 2,1 millions de revenus en 6 mois

Pour un développeur ou un créateur de contenu qui travaille avec NotebookLM au quotidien, c’est un changement de paradigme. Plus besoin de cliquer, d’attendre, de télécharger manuellement. Tout s’automatise.

L’angle agents IA

C’est là que ça devient intéressant pour l’écosystème. notebooklm-py embarque un skill Claude Code installable en une commande (notebooklm skill install). Une fois installé, l’agent comprend des instructions en langage naturel : « crée un podcast sur le computing quantique », « télécharge le quiz en markdown », « génère une vidéo style whiteboard ».

L’implication est considérable. NotebookLM devient une brique utilisable dans des pipelines d’agents autonomes — un agent qui recherche des sources, les importe dans un notebook, génère un podcast et le publie, le tout sans intervention humaine. Branché sur un orchestrateur comme OpenClaw ou un workflow Dify, c’est une chaîne de production de contenu multimédia complètement automatisée.

Les limites à connaître

Le projet est explicite sur ses limites. C’est une bibliothèque non officielle qui utilise des API internes non documentées de Google. Ces API peuvent changer sans préavis — et quand elles changent, la bibliothèque casse. Le rate limiting est gracieux (l’outil retourne un statut plutôt que de planter), mais un usage intensif sera bridé par Google.

Le projet n’est pas affilié à Google. L’authentification passe par les cookies de session du navigateur — il faut se connecter une première fois via Playwright/Chromium, et les sessions expirent selon les règles de Google. C’est adapté au prototypage, à la recherche et aux projets personnels. Pas à une production critique.

A lire :  De la transcription aux obus Caesar : Mistral AI entre dans l'armée française

La version actuelle (v0.3.3, 3 mars 2026) tourne sur Python 3.10 à 3.14, macOS, Linux et Windows. Le développement est actif : 486 commits, 7 releases, une architecture en cinq couches (CLI → Client → Core → RPC → Encoder/Decoder) bien documentée.

Ce que ça raconte sur l’IA en 2026

notebooklm-py est un symptôme d’un phénomène plus large : la communauté open source déverrouille les outils IA des géants avant que ceux-ci ne proposent leurs propres API. Google n’a pas jugé utile de publier une API officielle pour NotebookLM. Un développeur indépendant l’a fait à sa place, gratuitement, sous licence MIT, avec une documentation que beaucoup de produits commerciaux envieraient.

C’est exactement ce qui s’était passé avec les API non officielles de ChatGPT en 2023, avant qu’OpenAI ne lance son API officielle. L’histoire se répète : la demande crée l’offre, même quand l’éditeur ne la fournit pas. Et quand l’éditeur finit par réagir — en publiant une API officielle ou en bloquant l’accès non autorisé — l’écosystème a déjà prouvé le marché.

En attendant, notebooklm-py transforme NotebookLM d’un outil de bureau en une infrastructure programmable. Et ça, pour quiconque travaille avec du contenu, de la recherche ou de la formation, c’est une rupture.

Je suis Ethan, journaliste spécialisé en intelligence artificielle et nouvelles technologies. Je couvre l’actualité de l’IA agentique, des grands modèles de langage et des outils qui transforment nos usages numériques. Mon objectif : rendre accessibles les avancées technologiques les plus complexes, avec rigueur et sans jargon inutile.