Ethan

ChatGPT vs Nano Banana : OpenAI sort l’artillerie lourde pour rattraper Google

chatgpt, gemini, google, ia, intelligence artificielle, openai

La guerre des générateurs d’images IA s’intensifie. OpenAI vient de lancer GPT Image 1.5, son nouveau modèle de génération d’images pour ChatGPT, promettant une vitesse multipliée par quatre et des capacités d’édition nettement améliorées. Ce lancement intervient dans un contexte de tension maximale avec Google, dont les modèles Nano Banana et Nano Banana Pro ont conquis le marché ces derniers mois et propulsé Gemini en tête des classements LMArena.

Une riposte au « code red » déclenché par Google

Suivez LJG sur Google

Ajoutez LJG à vos sources préférées pour voir nos articles en priorité dans "À la une".

Ce lancement s’inscrit dans la stratégie d’urgence d’OpenAI depuis que Sam Altman a déclaré un « code red » interne en novembre 2025. Un mémo ayant fuité détaillait les plans de la startup pour reconquérir sa position de leader face à Google, qui a enchaîné les succès avec Gemini 3 et Nano Banana Pro, deux modèles ayant dominé les benchmarks du LMArena leaderboard.

OpenAI avait initialement prévu de lancer ce nouveau générateur d’images en janvier 2026. L’entreprise de San Francisco a accéléré son calendrier pour riposter au succès viral de Google. Le précédent modèle, GPT Image 1, datait d’avril 2025 et avait lui-même connu un succès fulgurant avec plus de 700 millions d’images générées en une seule semaine lors de son lancement en mars, notamment grâce aux illustrations façon Studio Ghibli qui avaient envahi les réseaux sociaux.

Mais Google a repris l’avantage en septembre avec Nano Banana (nom de code pour Gemini 2.5 Flash Image), puis en novembre avec Nano Banana Pro (Gemini 3 Pro Image). Ces modèles ont attiré des millions de nouveaux utilisateurs vers Gemini grâce à leur capacité d’édition précise et leur rendu de texte quasi parfait, devenant viraux sur X, TikTok et Instagram.

Quatre fois plus rapide avec une édition chirurgicale

GPT Image 1.5 génère des images jusqu’à quatre fois plus rapidement que son prédécesseur. Cette accélération suggère une architecture plus efficace en termes de ressources matérielles, réduisant à la fois les temps d’attente et les coûts d’exploitation pour OpenAI. Les utilisateurs peuvent désormais lancer plusieurs générations simultanément sans attendre la fin des précédentes.

L’amélioration majeure concerne l’édition d’images. Les générateurs IA souffrent traditionnellement d’un défaut frustrant : lorsqu’on demande une modification spécifique comme « change l’expression du visage » ou « rends l’éclairage plus froid », le modèle réinterprète souvent l’image entière au lieu d’appliquer le changement ciblé. GPT Image 1.5 promet de résoudre ce problème en préservant la cohérence visuelle : éclairage, composition, ressemblance faciale et tonalité restent intacts d’une édition à l’autre.

Cette capacité intéresse particulièrement les professionnels du marketing et du e-commerce. Wix utilise déjà le modèle pour générer des catalogues produits complets à partir d’une seule image source, en déclinant différents angles, scènes et variantes tout en conservant les logos et éléments de marque.

Un rendu de texte enfin exploitable

Le rendu de texte dans les images générées par IA a longtemps été le talon d’Achille du secteur. Les modèles produisaient des caractères illisibles, des mots mal orthographiés ou des layouts chaotiques. GPT Image 1.5 améliore significativement ce point, gérant désormais des textes plus denses et plus petits avec une fiabilité accrue.

A lire :  Amazon prêt à lâcher 10 milliards sur OpenAI : le coup de poker qui change tout

Cette avancée ouvre des cas d’usage jusqu’ici impossibles : création d’infographies, de posters marketing, d’invitations ou de maquettes graphiques nécessitant du texte lisible. OpenAI a démontré la capacité du modèle à générer une grille 6×6 de 36 objets distincts avec leurs légendes, une tâche qui aurait fait échouer les versions précédentes.

Toutefois, les tests comparatifs montrent que Nano Banana Pro de Google conserve l’avantage sur le rendu de texte multilingue et la résolution maximale (jusqu’à 4K). Un évaluateur professionnel résume : « La raison numéro un pour laquelle Nano Banana Pro reste devant, c’est son rendu de texte parfait dans les images générées. »

Une nouvelle interface « studio créatif » dans ChatGPT

Au-delà du modèle lui-même, OpenAI repense l’expérience utilisateur. Une nouvelle section « Images » apparaît dans la barre latérale de ChatGPT, transformant l’interface de chat en véritable studio créatif. Cette zone dédiée propose des filtres préréglés (Vintage, Néon, Réaliste), des prompts tendance et des suggestions pour démarrer rapidement.

Fidji Simo, CEO des applications d’OpenAI, explique cette évolution : « L’interface de chat n’a pas été conçue à l’origine pour créer des images. Les nouveaux écrans de visualisation et d’édition facilitent la création d’images correspondant à votre vision ou l’inspiration à partir de prompts tendance et de filtres préréglés. »

Cette approche vise à démocratiser l’accès sans nécessiter de prompts élaborés. OpenAI reconnaît que le succès viral de Nano Banana ne repose pas uniquement sur ses performances techniques, mais aussi sur son accessibilité qui a séduit le grand public. L’entreprise tente de recréer cette dynamique virale sur son propre terrain.

Fidji Simo, la Française qui pilote la riposte d’OpenAI

Derrière ce lancement se trouve Fidji Simo, 40 ans, nommée CEO des applications d’OpenAI en mai 2025. Native de Sète dans l’Hérault, cette ancienne de HEC a fait ses armes chez Facebook pendant une décennie avant de diriger Instacart jusqu’à son introduction en bourse en 2023.

Chez Meta, elle a supervisé le lancement de Facebook Live, développé Facebook Watch et piloté la monétisation publicitaire de l’application principale. Ces compétences en croissance utilisateur et engagement font d’elle la pièce maîtresse de la stratégie d’OpenAI pour transformer ChatGPT en plateforme grand public indispensable.

Sam Altman lui a confié la responsabilité des produits et opérations, se concentrant lui-même sur la recherche, l’infrastructure de calcul et la sécurité. Cette organisation à deux CEO reflète la double ambition d’OpenAI : maintenir l’avance scientifique tout en accélérant la commercialisation.

20% moins cher pour les développeurs

GPT Image 1.5 est accessible immédiatement via l’API pour les développeurs, avec une réduction de 20% des coûts par rapport à GPT Image 1. La tarification s’établit à 8 dollars par million de tokens d’entrée image et 32 dollars par million de tokens de sortie. Les tokens texte coûtent 5 dollars (entrée) et 10 dollars (sortie) par million.

Cette baisse de prix, combinée aux améliorations de performance, positionne le modèle comme particulièrement attractif pour les équipes marketing, les plateformes e-commerce et les développeurs d’outils créatifs. OpenAI mise sur l’effet volume pour compenser les marges réduites.

A lire :  Anthropic accuse DeepSeek, MiniMax et Moonshot d'avoir piraté Claude à grande échelle

Pour les utilisateurs gratuits de ChatGPT, le modèle est accessible sans surcoût. Les comptes Business et Enterprise recevront la mise à jour ultérieurement. Le déploiement s’effectue automatiquement, sans action requise de la part des utilisateurs.

OpenAI reconnaît des « résultats imparfaits »

Dans une communication inhabituellement mesurée, OpenAI admet que « les résultats restent imparfaits » malgré les améliorations. L’entreprise précise qu’« il reste une marge significative de progression pour les itérations futures ». Ce ton contraste avec l’enthousiasme qui avait accompagné le lancement de Nano Banana Pro.

Les limitations identifiées incluent un support limité pour certains styles de dessin et des erreurs occasionnelles sur les images nécessitant des connaissances scientifiques précises. Les tests montrent que le modèle corrige environ 70% des inexactitudes scientifiques par rapport à son prédécesseur, mais des erreurs persistent.

Sur les prompts complexes testés par The Decoder, comme un cheval chevauchant un astronaute (situation jamais vue à l’entraînement), GPT Image 1.5 performe au niveau de Nano Banana Pro. Mais sur le photoréalisme pur, notamment pour simuler des photos de smartphone, le modèle de Google conserve l’avantage avec des résultats plus naturels.

La course aux images IA s’accélère

Ce lancement illustre l’intensification de la compétition entre OpenAI et Google dans le domaine de l’IA générative. Les deux géants se répondent désormais coup pour coup, avec des cycles de lancement qui s’accélèrent.

Google a prévu le déploiement de Nano Banana Pro avec des fonctionnalités avancées de contrôle de caméra et d’éclairage, la capacité de fusionner jusqu’à 14 images sources et le maintien de la ressemblance de jusqu’à 5 personnes. Le modèle intègre également le watermark invisible SynthID pour tracer la provenance des images générées, une fonctionnalité de sécurité qu’OpenAI n’a pas encore égalée.

De son côté, OpenAI prépare l’intégration des personnages Disney dans ChatGPT Images et Sora suite à l’accord d’un milliard de dollars signé avec le géant du divertissement. Plus de 200 personnages iconiques comme Mickey Mouse, les héros Marvel, Pixar et Star Wars devraient être disponibles début 2026.

La bataille pour la domination de l’image IA ne fait que commencer. Comme le résume Axios : « La course à l’IA semble se réduire à une compétition binaire entre OpenAI et Google, avec des fronts de bataille qui s’élargissent. »


Sources : OpenAI, TechCrunch, The Decoder,