OpenAI lance GPT 5.2 pour contrer Gemini de Google
Les dernières modèles Gemini de Google ont relancé la guerre sur les LLM. OpenAI voit sa position fortement menacée par Google. Et les concurrents se bousculent. OpenAI se devait de réagir vite et de reprendre la main sur les modèles, au moins, temporairement. GPT 5.2 est le modèle qui doit repositionner OpenAI.
Plusieurs modèles sont annoncés :
- GPT-5.2 Instant progresse nettement sur les recherches d’information, les guides pratiques, la rédaction technique et la traduction. Il est également plus efficace pour soutenir les études et le développement de compétences, tout en offrant des conseils d'orientation professionnelle plus clairs.
- GPT-5.2 Thinking est le meilleur modèle pour les usages professionnels : il résout des problèmes plus complexes avec plus de finesse, gère remarquablement le formatage de feuilles de calcul et montre des avancées dans la création de présentations.
- GPT-5.2 Pro est le modèle le plus intelligent et le plus digne de confiance pour les questions complexes où une réponse de meilleure qualité vaut la peine d'attendre. Lors des premiers tests, il a démontré une précision accrue, moins d'erreurs importantes et une performance renforcée dans des domaines complexes comme la programmation.
GPT 5.2 est premier modèle OpenAI à obtenir des scores de niveau expert sur GDPval, le benchmark d’OpenAI couvrant 44 tâches professionnelles concrètes : création de tableaux, rédaction de documents, préparation de présentations, etc.
Pour les développeurs, GPT-5.2 apporte des progrès importants en intelligence générale, compréhension de longs contextes, exécution d’outils par agents, et vision. Résultat : il surpasse tous les modèles précédents pour l’exécution de tâches complexes, de bout en bout.
Des clients comme Ramp, Box, Shopify, Zoom, Hex et Triple Whale soulignent l’excellence du modèle dans leurs workflows orientés agents. Des entreprises comme Cursor, Windsurf, Lovable, JetBrains, Azad, Cline, Charlie Labs et Kilo Code ont également été impressionnées par ses capacités en développement logiciel.
GPT‑5.2 Thinking établit un nouveau record de 55,6 % sur SWE-Bench Pro, une évaluation rigoureuse du génie logiciel en conditions réelles. Contrairement à SWE-Bench Verified, qui ne teste que Python, SWE-Bench Pro évalue quatre langages et se veut plus résistant au risque de contamination des données d’entraînement, plus exigeant, plus diversifié et plus représentatif des usages industriels.
Par exemple, dans le computer vision, GPT 5.2 devrait être beaucoup plus précis que la modèle 5.1, détectant 2 à 3 fois plusieurs d'éléments.