OpenAI a dévoilé GPT-5.5 le 23 avril 2026, à peine six semaines après GPT-5.4 et une semaine après le Claude Opus 4.7 d’Anthropic. Le modèle, développé sous le nom de code “Spud” (oui, comme la patate), est en cours de déploiement pour les abonnés payants de ChatGPT et Codex, tandis que l’API publique est annoncée pour les jours qui viennent. Le timing n’est pas un hasard : c’est une riposte frontale dans la guerre des modèles d’IA, avec un positionnement clair sur l’autonomie agentique et des tarifs API qui doublent.
Une “nouvelle classe d’intelligence” taillée pour l’autonomie
Greg Brockman, président d’OpenAI, qualifie GPT-5.5 de “nouvelle classe d’intelligence”. Derrière le slogan, le modèle repose sur un réentraînement complet du modèle de base, le premier depuis GPT-4.5, ce qui explique le saut de version plutôt qu’un simple incrément. L’architecture est nativement omnimodale (texte, image, audio, vidéo), avec une fenêtre de contexte d’un million de tokens et une latence par token équivalente à celle de GPT-5.4, le tout en consommant moins de tokens pour accomplir les mêmes tâches.
La vraie promesse, c’est l’autonomie. OpenAI décrit un modèle capable de “planifier, utiliser des outils, vérifier son travail, naviguer dans l’ambiguïté et persévérer”. En clair, GPT-5.5 ne se contente plus de répondre à une question : il est conçu pour mener des tâches complexes de bout en bout. Là où les modèles précédents exigeaient des instructions ultra-précises étape par étape, GPT-5.5 accepte des demandes longues, parfois brouillonnes, et se charge lui-même de planifier, d’utiliser les outils nécessaires et de corriger ses erreurs. Les domaines mis en avant : codage agentique, pilotage autonome d’environnements informatiques, travail de bureau et recherche scientifique exploratoire, notamment en biologie et en mathématiques (avec la découverte de nouveaux résultats en combinatoires, mis en forme sur Lean).
Les benchmarks : GPT-5.5 domine presque partout, sauf en code
Sur Terminal-Bench 2.0, qui évalue des workflows complexes en ligne de commande, GPT-5.5 atteint 82,7% de précision contre 69,4% pour Claude Opus 4.7 et 68,5% pour Gemini 3.1 Pro. L’écart est massif. Sur GDPval, un benchmark qui mesure la capacité à produire du travail qualifié dans 44 métiers, GPT-5.5 affiche 84,9% contre 80,3% pour Claude Opus 4.7 et 67,3% pour Gemini 3.1 Pro. Sur OSWorld-Verified (pilotage autonome d’environnements informatiques), c’est plus serré : 78,7% contre 78,0% pour Claude Opus 4.7.
Mais il y a un point noir. Sur SWE-Bench Pro, le benchmark de codage, GPT-5.5 plafonne à 58,6% là où Claude Opus 4.7 atteint 64,3%. OpenAI accuse subtilement Anthropic d’avoir “triché (ou ‘mémorisé’) certaines données sur les tests de code”. Et pour corser le tout, Claude Mythos Preview (réservé à un consortium de défense cyber) affiche 77,8% sur ce même benchmark.
Sur le terrain juridique, GPT-5.5 brille avec 91,7% sur le BigLaw Bench du cabinet Harvey. La Bank of New York, qui a testé le modèle en avant-première, salue une résistance aux hallucinations nettement supérieure, un critère déterminant pour les institutions soumises à des obligations réglementaires strictes.
Tarifs doublés et accès restreint : la fin de la gratuité (ou presque)
Pour la première fois depuis longtemps, un nouveau modèle OpenAI n’est pas disponible pour les utilisateurs gratuits de ChatGPT. GPT-5.5 est en cours de déploiement pour les abonnés Plus, Pro, Business et Enterprise sur ChatGPT et Codex. La version GPT-5.5 Pro, elle, est réservée aux tiers supérieurs (Pro, Business, Enterprise). Les premiers testeurs jugent ses réponses “significativement plus complètes, mieux structurées, plus précises, plus pertinentes et plus utiles”, avec des performances particulièrement élevées en business, droit, éducation et data science. L’API publique sera disponible très prochainement.
Côté tarification API, le doublement est net : 5 dollars par million de tokens en entrée et 30 dollars en sortie pour GPT-5.5 standard (soit le double de GPT-5.4). Pour la version Pro, on passe à 30 dollars en entrée et 180 dollars en sortie. OpenAI justifie cette hausse par une efficacité accrue en tokens consommés : le modèle accomplirait davantage avec moins de requêtes intermédiaires. Un mode “GPT-5.5 Thinking” est également proposé pour les usages professionnels exigeants impliquant un volume important de documents.
La vibe “remontada” : OpenAI veut reprendre le trône
Le contexte est limpide. Dans le classement LMArena d’avril 2026, Anthropic plaçait ses quatre modèles Claude aux premières places, OpenAI se retrouvant en neuvième position. Anthropic s’attend même à gagner plus d’argent qu’OpenAI cette année. Le rythme de publication d’OpenAI depuis début 2026 est révélateur de cette urgence : GPT-5.4 début mars, déclinaisons mini et nano mi-mars, GPT-5.4-Cyber quelques jours avant GPT-5.5, puis l’annonce du 23 avril. Un rythme qualifié de “particulièrement soutenu”.
La cybersécurité devient aussi un terrain d’affrontement. OpenAI a déployé des garde-fous plus stricts et élargi son programme “Trusted Access for Cyber” aux professionnels de la cyberdéfense. GPT-5.5 est classé au niveau “High” dans le Preparedness Framework maison. En face, Anthropic a lancé Claude Mythos Preview, réservé à un consortium de défense cyber, qui surpasse GPT-5.5 sur la majorité des benchmarks partagés.
Côté Codex, les améliorations accompagnent le dévoilement : génération améliorée de tableurs, présentations, PDF, navigateur intégré, génération d’images, fonctions d’auto-review, et capacité de “voir” l’écran, cliquer, taper et naviguer entre logiciels. Plus de 85% d’OpenAI utiliserait Codex avec GPT-5.5 chaque semaine en interne. ChatGPT revendique désormais plus de 900 millions d’actifs hebdomadaires et 50 millions d’abonnés payants. La guerre des modèles, elle, ne fait que s’accélérer.

Je suis Ethan, journaliste spécialisé en intelligence artificielle et nouvelles technologies. Je couvre l’actualité de l’IA agentique, des grands modèles de langage et des outils qui transforment nos usages numériques. Mon objectif : rendre accessibles les avancées technologiques les plus complexes, avec rigueur et sans jargon inutile.