Ethan

Gemini 3 Flash : Google déploie son IA ultra-rapide dans la recherche mondiale

gemini, google, ia, intelligence artificielle

Google frappe fort. Un mois après le lancement de Gemini 3 Pro qui avait déclenché un « code red » chez OpenAI, la firme de Mountain View dégaine Gemini 3 Flash — un modèle aussi intelligent que son grand frère, mais trois fois plus rapide. Et surtout, il devient dès aujourd’hui le moteur par défaut de la recherche Google pour des milliards d’utilisateurs dans le monde.

L’IA à la vitesse de la recherche classique

Suivez LJG sur Google

Ajoutez LJG à vos sources préférées pour voir nos articles en priorité dans "À la une".

Fini le compromis entre puissance et rapidité.

Gemini 3 Flash promet des réponses aussi instantanées qu’une recherche Google traditionnelle, tout en conservant les capacités de raisonnement avancé qui ont fait le succès de Gemini 3 Pro. Le modèle remplace immédiatement Gemini 2.5 Flash comme option par défaut dans l’application Gemini et dans le mode IA de Google Search, déployé mondialement.

« Gemini 3 Flash met fin au compromis entre vitesse et intelligence », affirme Josh Woodward, vice-président de Google Labs. « Il délivre à la fois la puissance de raisonnement et la rapidité. »

Concrètement, l’utilisateur peut désormais poser des questions complexes — planifier un voyage de dernière minute, comprendre un concept scientifique, comparer des options d’achat — et obtenir des réponses structurées, visuellement digestes, enrichies de liens et d’informations en temps réel. Le tout sans attendre.

Des performances qui rivalisent avec les meilleurs

Les benchmarks parlent d’eux-mêmes.

Sur GPQA Diamond, un test de raisonnement scientifique niveau doctorat, Gemini 3 Flash atteint 90,4%. Sur MMMU Pro, le benchmark multimodal de référence, il décroche 81,2% — à égalité avec Gemini 3 Pro et devant tous les concurrents. Sur Humanity’s Last Exam, conçu pour pousser l’IA dans ses retranchements, il obtient 33,7%, juste derrière les 37,5% de son grand frère et quasi à égalité avec GPT-5.2 d’OpenAI (34,5%).

Plus surprenant encore : en coding, Gemini 3 Flash dépasse Gemini 3 Pro. Sur SWE-bench Verified, le benchmark de référence pour les agents de développement, Flash obtient 78% contre 72,8% pour Pro. Une inversion rare qui suggère une optimisation spécifique des capacités de raisonnement sur le code lors du processus de distillation.

Le tout en étant trois fois plus rapide que Gemini 2.5 Pro et en consommant 30% de tokens en moins pour les tâches courantes.

A lire :  Meta libère Llama 2 : une IA ouverte à tous… sauf aux européens

Gratuit pour tous, partout

Pas besoin d’abonnement pour tester Gemini 3 Flash. Le modèle est accessible gratuitement via google.com en mode IA, et dans l’application Gemini disponible sur iOS et Android.

Deux modes s’offrent aux utilisateurs : « Fast » pour les réponses rapides du quotidien, et « Thinking » pour les problèmes complexes nécessitant une réflexion approfondie. Le modèle adapte automatiquement son niveau de raisonnement à la difficulté de la question — une innovation baptisée « pensée adaptative » par Google.

Aux États-Unis, les utilisateurs ont également accès à Gemini 3 Pro via l’option « Thinking with 3 Pro » dans le menu déroulant, ainsi qu’à Nano Banana Pro pour la génération d’images. Les abonnés Google AI Pro et Ultra bénéficient de limites d’utilisation plus élevées sur ces fonctionnalités premium.

La guerre Google-OpenAI s’intensifie

Ce lancement intervient dans un contexte de compétition féroce.

Début décembre, le trafic de ChatGPT a chuté tandis que Gemini gagnait des parts de marché. Sam Altman aurait envoyé un mémo « code red » en interne chez OpenAI — ironie du sort, puisque Google avait vécu la même situation trois ans plus tôt au lancement de ChatGPT. OpenAI a riposté avec GPT-5.2 et un nouveau modèle de génération d’images, mais Google garde l’avantage de l’ubiquité.

Depuis le lancement de Gemini 3 en novembre, Google traite plus de 1 000 milliards de tokens par jour sur son API. Un volume qui témoigne de l’adoption massive du modèle.

« La course à l’IA devient de plus en plus un duel entre Google et OpenAI », analyse Axios. « Mais Google a l’avantage de la distribution : Gemini est intégré dans la recherche et dans toutes les applications Google, touchant des milliards d’utilisateurs instantanément. »

Les entreprises déjà converties

Les grands noms de la tech n’ont pas attendu pour adopter Gemini 3 Flash.

JetBrains l’utilise pour son assistance au développement. Figma l’intègre dans ses outils de design collaboratif. Cursor, l’éditeur de code propulsé par l’IA, mise sur sa rapidité. Harvey, la startup juridique, exploite son raisonnement pour l’analyse de documents. Salesforce, Workday et Bridgewater Associates — le plus grand hedge fund au monde — sont également clients.

A lire :  Arrestation et deepfake : l'administration Trump invente les larmes d'une avocate

Resemble AI utilise Gemini 3 Flash pour la détection de deepfakes en temps quasi réel, avec une analyse multimodale quatre fois plus rapide qu’avec la version précédente. Latitude l’exploite pour générer des personnages plus intelligents et des mondes plus réalistes dans ses jeux. Astrocade transforme des prompts en jeux jouables grâce à ses capacités de génération de code.

Pour les développeurs, le modèle est disponible via l’API Gemini dans Google AI Studio, Antigravity (la nouvelle plateforme de développement agentique de Google), Gemini CLI et Android Studio. Côté entreprises, Vertex AI et Gemini Enterprise donnent accès à l’ensemble des fonctionnalités.

Un prix agressif pour dominer le marché

Google joue aussi la carte tarifaire.

Gemini 3 Flash coûte 0,50 dollar par million de tokens en entrée et 3 dollars par million en sortie. C’est légèrement plus cher que Gemini 2.5 Flash (0,30 et 2,50 dollars), mais quatre fois moins que Gemini 3 Pro. Pour des performances parfois supérieures.

« Nous positionnons Flash comme le modèle de travail quotidien », explique Tulsee Doshi, directrice produit pour les modèles Gemini chez Google DeepMind. « Les prix plus bas permettent aux entreprises de gérer des tâches en volume. »

Cette stratégie vise à rendre l’IA de pointe accessible au plus grand nombre — particuliers comme développeurs — tout en maintenant la pression sur OpenAI et Anthropic. Avec Gemini 3 Flash intégré nativement dans la recherche Google, le géant de Mountain View mise sur l’effet de masse pour imposer son modèle comme nouveau standard.

Sources : Google Blog, TechCrunch, Bloomberg

Je suis Ethan, journaliste spécialisé en intelligence artificielle et nouvelles technologies. Je couvre l’actualité de l’IA agentique, des grands modèles de langage et des outils qui transforment nos usages numériques. Mon objectif : rendre accessibles les avancées technologiques les plus complexes, avec rigueur et sans jargon inutile.