Remarque : cet article fournit un aperçu général. Les informations de configuration technique sont disponibles sur le site web gpt-oss, GitHub, Hugging Face et les OpenAI Cookbooks.
Aperçu
Présentation de deux modèles de raisonnement à poids ouverts : gpt‑oss‑120b et gpt‑oss‑20b. Ils s’exécutent sur l’infrastructure que vous contrôlez, ou via des fournisseurs d’hébergement.
Remarque : ces modèles ne sont pas servis via l’API OpenAI et ne sont pas disponibles dans ChatGPT.
Pourquoi des poids ouverts
Choix et contrôle : exécutez les modèles sur site ou dans votre cloud privé, conservez la résidence des données et adaptez les performances à vos besoins.
Personnalisation : affinez ou adaptez les modèles avec les outils ouverts de votre choix.
Disponibilité et licence
Licence : Apache 2.0 permet une large utilisation, modification et redistribution, y compris à des fins commerciales (sous réserve de notre politique d’utilisation gpt-oss).
Service : non disponible via l’API OpenAI ; la tarification et les limites de débit de l’API ne s’appliquent donc pas.
Compatibilité : peut être exécuté avec des piles d’inférence ouvertes courantes comme vLLM, Ollama, llama.cpp, ainsi que dans des environnements GPU cloud ou autogérés.
Bien démarrer
Pour obtenir les poids du modèle et les ressources associées, vous pouvez :
Consulter le site web gpt-oss pour un aperçu et des liens directs.
Télécharger les poids depuis la collection Hugging Face — un hub communautaire où vous pouvez trouver les deux modèles, consulter des exemples d’utilisation et, éventuellement, exécuter l’inférence directement via les services de Hugging Face.
Accéder à notre dépôt GitHub pour le code d’inférence de référence.
Utiliser les guides de l’OpenAI Cookbook pour la configuration avec des runtimes pris en charge comme Ollama, vLLM et Transformers. Le Cookbook inclut aussi des instructions étape par étape pour l’exécution locale, l’utilisation de runtimes courants et, lorsque cela est pris en charge, le fine-tuning des modèles gpt‑oss.
gpt‑oss‑safeguard (aperçu de recherche)
gpt‑oss‑safeguard est une paire de modèles de raisonnement de sécurité à poids ouverts construits sur gpt‑oss. Ils sont conçus pour la classification de sécurité fondée sur des politiques et les tâches connexes de confiance & sécurité que vous exécutez sur l’infrastructure que vous contrôlez. Comme les autres modèles gpt‑oss, ces poids ne sont pas servis via l’API OpenAI ni ChatGPT.
Modèles uniquement textuels avec schémas de sorties structurées de référence (p. ex., verdict de politique, justification).
Apportez votre propre politique : le modèle interprète votre politique écrite afin de pouvoir généraliser à plusieurs produits avec un minimum d’ingénierie.
Décisions raisonnées : traces de raisonnement facultatives pour faciliter le débogage et les audits (destinées aux développeurs et aux spécialistes de la sécurité, pas à l’affichage pour l’utilisateur final).
Effort de raisonnement configurable : choisissez faible / moyen / élevé pour arbitrer entre latence et profondeur.
Licence : Apache 2.0 (voir Disponibilité et licence ci-dessous).
gpt‑oss‑safeguard convient au filtrage des entrées/sorties pour les LLM, à l’étiquetage de contenus en ligne et aux workflows d’étiquetage ou de revue par lots hors ligne. Pour les applications générales (chat, agents, etc.), nous recommandons les modèles gpt‑oss principaux.
Vous pouvez adapter le schéma à vos besoins. Veuillez consulter l’OpenAI Cookbook pour des guides sur les prompts et des exemples.
Variantes de modèles & dimensionnement
| Modèle | Utilisation prévue | Notes | | gpt‑oss‑safeguard‑120b | Production, raisonnement de sécurité à grande capacité | 117 Md de paramètres (≈5,1 Md actifs). Conçu pour tenir sur un <br>seul GPU de 80 Go<br> (p. ex., NVIDIA H100 ; fonctionne aussi sur des GPU à mémoire plus importante comme AMD MI300X). | | gpt‑oss‑safeguard‑20b | Latence plus faible / environnements contraints | 21 Md de paramètres (≈3,6 Md actifs). |
Les deux modèles sont affinés à partir de gpt‑oss sans modification d’architecture. Ils utilisent le même modèle de chat que gpt‑oss ; vous pouvez conserver votre configuration existante. Un schéma de prompt recommandé consiste à placer votre politique dans un message développeur et le contenu à évaluer dans un message utilisateur.
Assistance et communauté
Les déploiements à poids ouverts sont autogérés et pris en charge en libre-service. Voici où obtenir de l’aide :
Questions, discussion, conseils : utilisez les pages des modèles Hugging Face pour échanger avec la communauté.
Bugs reproductibles dans le code d’inférence de référence d’OpenAI : ouvrez une issue dans le dépôt GitHub gpt-oss.
Problèmes avec un runtime tiers (p. ex., vLLM, Ollama, llama.cpp) : utilisez le système de suivi des issues, les forums ou le processus d’assistance du projet concerné.
OpenAI ne fournit pas d’assistance, de mise en œuvre pratique ni de support au débogage pour les configurations, environnements ou applications à poids ouverts auto-hébergés ou hébergés par des tiers.
Nous continuerons à collaborer avec la communauté pour améliorer les outils ouverts de sécurité, notamment via la ROOST Model Community (RMC). La RMC réunit des spécialistes et chercheurs en sécurité afin de partager les bonnes pratiques pour intégrer des modèles d’IA open source aux workflows de sécurité, y compris les résultats d’évaluation et les retours sur les modèles. Consultez le dépôt GitHub de la RMC pour en savoir plus sur ce partenariat et découvrir comment participer.
Assistance et communauté
Les déploiements à poids ouverts sont autogérés et pris en charge en libre-service. Voici où obtenir de l’aide :
Questions, discussion, conseils : utilisez les pages des modèles Hugging Face pour échanger avec la communauté.
Bugs reproductibles dans le code d’inférence de référence d’OpenAI : ouvrez une issue dans le dépôt GitHub gpt-oss.
Problèmes avec un runtime tiers (p. ex., vLLM, Ollama, llama.cpp) : utilisez le système de suivi des issues, les forums ou le processus d’assistance du projet concerné.
OpenAI ne fournit pas d’assistance, de mise en œuvre pratique ni de support au débogage pour les configurations, environnements ou applications à poids ouverts auto-hébergés ou hébergés par des tiers.
Confidentialité et sécurité
Confidentialité et données
Ces modèles sont conçus pour s’exécuter sur l’infrastructure que vous contrôlez (sur site, ou dans votre cloud ou chez votre partenaire d’hébergement). OpenAI ne reçoit ni ne traite les données que vous envoyez à ces modèles auto-hébergés, sauf si vous les partagez explicitement avec OpenAI ou si vous utilisez l’un de nos partenaires d’hébergement géré.
Sécurité
Ces modèles ont fait l’objet d’un entraînement et de tests de sécurité approfondis. Pour plus de détails, consultez notre fiche modèle et notre rapport technique.
Signaler des violations de contenu
Si vous pensez qu’un contenu généré avec des modèles gpt‑oss enfreint nos politiques, vous pouvez le signaler via notre formulaire de signalement de contenu. Veuillez fournir autant de détails que possible pour aider notre équipe à examiner votre soumission.
FAQ
Ces modèles sont-ils gratuits ?
Les poids des modèles gpt-oss sont téléchargeables et utilisables gratuitement sous la licence Apache 2.0 et la politique d’utilisation gpt-oss. Cependant, vous êtes responsable de tous les coûts liés à leur exécution, comme les frais de calcul, de stockage ou d’hébergement tiers. Leur tarification dépendra de l’infrastructure ou du fournisseur que vous aurez choisi.
Ces modèles sont-ils « open source » ?
Nous utilisons les termes modèles ouverts ou à poids ouverts pour indiquer que les poids entraînés sont publiquement disponibles sous la licence permissive Apache 2.0 et la politique d’utilisation de gpt-oss. Cela signifie que vous pouvez télécharger les modèles, les exécuter sur votre propre infrastructure ou avec des frameworks d’hébergement pris en charge, et les personnaliser ou les affiner.
Les modèles ouverts donnent aux développeurs et aux organisations davantage de contrôle et de flexibilité. Vous pouvez choisir où les héberger, les adapter à des cas d’utilisation spécifiques et bénéficier d’une licence permettant une large utilisation, modification et redistribution. Même si les poids entraînés sont ouverts, certaines infrastructures ou certains outils associés peuvent rester propriétaires à leurs fournisseurs.
Puis-je accéder à ces modèles via l’API OpenAI ou ChatGPT ?
Non. Ces modèles ne sont pas servis dans l’API OpenAI et n’apparaissent pas dans ChatGPT.
Puis-je affiner les modèles ?
Oui. Vous pouvez les affiner avec des outils open source et l’infrastructure de votre choix. Nous ne proposons pas de fine-tuning via les API OpenAI pour ces modèles.
Les modèles à poids ouverts sont-ils moins chers que l’utilisation de l’API ?
Les coûts varient selon l’infrastructure, la charge de travail et l’approche opérationnelle. L’auto-hébergement peut être moins cher dans certains cas, tandis que notre plateforme API peut être plus efficace en tenant compte de l’hébergement, de la maintenance et des mises à niveau.
Quelles fonctionnalités ces modèles prennent-ils en charge ?
Ces modèles sont actuellement des modèles de raisonnement uniquement textuels. Les runtimes courants prennent en charge le streaming, l’appel de fonction et les sorties structurées. Consultez la documentation de votre runtime pour connaître les capacités exactes.
En quoi est-ce différent de ModAPI ?
Il s’agit d’un modèle de raisonnement très performant qui vous permet d’apporter votre propre politique. Il peut fonctionner en tandem avec ModAPI, mais ne remplace probablement pas les cas d’utilisation à faible latence.
