OpenAI sort des LLM open source : GPT-OSS

François Tonic

6 août 2025 — 1 min read

OpenAI annonce GPT-OSS, un LLM open source sous licence Apache 2. Il s'agit d'une annonce importante pour OpenAI car il s'agit du premier LLM ouvert depuis GPT-2. Deux modèles sont proposés : 120 milliards de paramètres et 20 milliards. GPT-OSS-120b nécessite une puissance GPU et 80 Go de RAM, le modèle 20b se veut comparable au modèle 03-mini et se contente de 16 Mo de RAM pour tourner. Idéal pour une machine locale. Pour OpenAI, GPT-OSS est un bon compromis pour de l'inférence local avec une capacité de traitement acceptable. Ces modèles sont compatibles avec les API Responses et sont utilisables avec les flux agentiques, les projets Python, etc.

Ils sont disponibles sur Hugging Face. Ils fonctionnent avec PyTorch et supportent Metal d'Apple. On peut utiliser des plateformes et outils tels que Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare. Il supporte nativement MXFP4.

Pour l'utiliser, OpenAI recommande Python 3.12, Xcode CLI tools sur macOS, CUDA sur Linux. Attention : le support Windows n'a été officiellement testé.

Installation via PyPi :

# if you just need the toolspip install gpt-oss# if you want to try the torch implementationpip install gpt-oss[torch]# if you want to try the triton implementationpip install gpt-oss[triton]

Annonce et benchmarks : https://openai.com/index/introducing-gpt-oss/

GitHub : https://github.com/openai/gpt-oss

En partenariat avec le magazine Programmez!, www.programmez.com

Lire plus

Cyber-IA expo : rendez-vous le 3 février 2026

Cyber-IA expo reviendra le 3 février 2026 à Paris. Cyber-IA expo se positionne comme un catalyseur, pour permettre aux organisations de naviguer dans cette convergence technologique inédite, où se croisent pressions géopolitiques, enjeux industriels et transformations numériques profondes. L’objectif est de fédérer l’ensemble de l’écosystème pour transformer

Bulle IA ? Qlik répond à cette question

Le patron de Qlik, Mike Capone, donne son avis sur les inquiétudes sur une possible bulle : « Nombreux sont ceux qui se demandent si une bulle de l'IA est en train de se former. Je ne pense pas que ce soit la meilleure question que nous devions nous poser.

Rubrik Agent Cloud : pour améliorer les déploiements d'agents depuis Microsoft Copilot Studio

Rubrik Agent Cloud propose aux utilisateurs de Copilot Studio un ensemble complet de fonctionnalités couvrant l’ensemble du cycle de vie de l’agent d’IA, incluant l’observabilité, le contrôle, la gestion des performances et la simulation. Ces fonctionnalités sont les suivantes : Agent Monitor - Découverte automatique des agents

Microsoft veut un cycle de vie IA complet

La conférence Ignite a été l'occasion pour Microsoft de dévoiler les nouveautés autour de l'IA. Elles sont nombreuses ! Les principales annonces : * Fabric IQ agrège les données analytiques, temporelles et géolocalisées dans un modèle partagé, ancré dans un contexte métier. Cela permet une vision en temps réel