Opmerking: dit artikel biedt een globaal overzicht. Informatie voor technische installatie vind je op de gpt-oss-website, GitHub, Hugging Face en OpenAI Cookbooks.
Overzicht
Introductie van twee open‑weight redenerende modellen: gpt‑oss‑120b en gpt‑oss‑20b. Ze draaien op infrastructuur die je beheert, of via hostingproviders.
Opmerking: Deze modellen worden niet aangeboden via de OpenAI API en zijn niet beschikbaar in ChatGPT.
Waarom open-weights
Keuze en controle: draai modellen on‑premises of in je private cloud, behoud gegevensresidentie en stem prestaties af op je behoeften.
Aanpassing: fine‑tune of pas de modellen aan met je favoriete open tooling.
Beschikbaarheid en licenties
Licentie: Apache 2.0 staat breed gebruik, aanpassing en herdistributie toe, inclusief commercieel gebruik (onder voorbehoud van ons gpt-oss gebruiksbeleid).
Serving: niet beschikbaar via de OpenAI API, dus API-prijzen en volumelimieten zijn niet van toepassing.
Compatibiliteit: kan worden uitgevoerd met gangbare open inferentiestacks zoals vLLM, Ollama, llama.cpp, en in cloud- of zelfbeheerde GPU-omgevingen.
Aan de slag
Om de modelgewichten en ondersteunende resources te krijgen, kun je:
Bezoek de gpt-oss-website voor een overzicht en directe links.
Download gewichten uit de Hugging Face-collectie — een communityhub waar je beide modellen kunt vinden, gebruiksvoorbeelden kunt bekijken en optioneel inferentie rechtstreeks via de diensten van Hugging Face kunt uitvoeren.
Open onze GitHub-repo voor referentiecode voor inferentie.
Gebruik gidsen in de OpenAI Cookbook voor installatie met ondersteunde runtimes zoals Ollama, vLLM en Transformers. De Cookbook bevat ook stapsgewijze instructies voor lokaal draaien, het gebruik van gangbare runtimes en—waar ondersteund—het fine‑tunen van gpt‑oss-modellen.
gpt‑oss‑safeguard (researchpreview)
gpt‑oss‑safeguard is een paar open‑weight redenerende veiligheidsmodellen gebouwd boven op gpt‑oss. Ze zijn ontworpen voor beleidsgebaseerde veiligheidsclassificatie en gerelateerde trust & safety-taken die je uitvoert op infrastructuur die je beheert. Net als andere gpt‑oss-modellen worden deze gewichten niet aangeboden via de OpenAI API of ChatGPT.
Alleen-tekstmodellen met referentieschema’s voor gestructureerde output (bijv. beleidsbeslissing, onderbouwing).
Gebruik je eigen beleid: het model interpreteert je geschreven beleid zodat het met minimale engineering kan generaliseren over producten.
Onderbouwde beslissingen: optionele redeneringstraces ter ondersteuning van debugging en audits (bedoeld voor ontwikkelaars en veiligheidsexperts, niet voor weergave aan eindgebruikers).
Configureerbare redeneringsinspanning: kies laag / gemiddeld / hoog om latentie tegen diepgang af te wegen.
Licentie: Apache 2.0 (zie Beschikbaarheid en licenties hieronder).
gpt‑oss‑safeguard is geschikt voor input-/outputfiltering voor LLM’s, online contentlabeling en offline batchlabeling of beoordelingsworkflows. Voor algemene toepassingen (chat, agents, enz.) raden we de kernmodellen van gpt‑oss aan.
Je kunt het schema aanpassen aan je behoeften. Raadpleeg de OpenAI Cookbook voor gidsen over prompting en voorbeelden.
Modelvarianten & grootte
| Model | Beoogd gebruik | Opmerkingen |
|---|---|---|
| gpt‑oss‑safeguard‑120b | Productie, veiligheidsredenering met hoge capaciteit | 117B parameters (≈5,1B actief). Ontworpen om te passen op een enkele 80 GB-GPU (bijv. NVIDIA H100; draait ook op GPU’s met meer geheugen, zoals AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Lagere latentie / beperkte omgevingen | 21B parameters (≈3,6B actief). |
Beide modellen zijn vanuit gpt‑oss gefine‑tuned zonder architectuurwijziging. Ze gebruiken dezelfde chatsjabloon als gpt‑oss; je kunt je bestaande setup behouden. Een aanbevolen promptingpatroon is om je beleid in een ontwikkelaarsbericht te plaatsen en de te beoordelen content in een gebruikersbericht.
Ondersteuning en community
Open‑weight-implementaties worden zelf beheerd en ondersteund. Hier kun je ondersteuning krijgen:
Vragen, discussie, tips: gebruik de Hugging Face-modelpagina’s om met de community in contact te komen.
Reproduceerbare bugs in OpenAI’s referentiecode voor inferentie: open een issue in de gpt-oss GitHub-repo.
Problemen met een runtime van derden (bijv. vLLM, Ollama, llama.cpp): gebruik de issuetracker, forums of het ondersteuningsproces van het betreffende project.
OpenAI biedt geen hulp, praktische implementatie of debugging-ondersteuning voor zelfgehoste of door derden gehoste open‑weight-setups, configuraties, omgevingen of toepassingen.
We blijven samen met de community itereren om open veiligheidstooling te verbeteren, onder meer via de ROOST Model Community (RMC). De RMC brengt veiligheidsexperts en onderzoekers samen om best practices te delen voor het implementeren van open‑source AI-modellen in veiligheidsworkflows, inclusief evaluatieresultaten en modelfeedback. Bezoek de RMC GitHub-repo voor meer informatie over deze samenwerking en hoe je kunt meedoen.
Ondersteuning en community
Open‑weight-implementaties worden zelf beheerd en ondersteund. Hier kun je ondersteuning krijgen:
Vragen, discussie, tips: gebruik de Hugging Face-modelpagina’s om met de community in contact te komen.
Reproduceerbare bugs in OpenAI’s referentiecode voor inferentie: open een issue in de gpt-oss GitHub-repo.
Problemen met een runtime van derden (bijv. vLLM, Ollama, llama.cpp): gebruik de issuetracker, forums of het ondersteuningsproces van het betreffende project.
OpenAI biedt geen hulp, praktische implementatie of debugging-ondersteuning voor zelfgehoste of door derden gehoste open‑weight-setups, configuraties, omgevingen of toepassingen.
Privacy en veiligheid
Privacy en gegevens
Deze modellen zijn ontworpen om te draaien op infrastructuur die je beheert (on-premises of in je cloud of bij je hostingpartner). OpenAI ontvangt of verwerkt de gegevens die je naar deze zelfgehoste modellen stuurt niet, tenzij je deze expliciet met OpenAI deelt of een van onze beheerde hostingpartners gebruikt.
Veiligheid
Deze modellen hebben uitgebreide veiligheidstraining en -tests ondergaan. Zie voor meer informatie onze modelkaart en ons technisch rapport.
Contentschendingen melden
Als je denkt dat content die met gpt‑oss-modellen is gegenereerd ons beleid schendt, kun je dit melden via ons formulier Content melden. Geef zo veel mogelijk details op om ons team te helpen je inzending te beoordelen.
Veelgestelde vragen
Zijn deze modellen gratis?
De gpt-oss-modelgewichten zijn gratis te downloaden en te gebruiken onder de Apache 2.0-licentie en het gpt-oss gebruiksbeleid. Je bent echter verantwoordelijk voor alle kosten die samenhangen met het draaien ervan — zoals compute, opslag of hostingkosten van derden. De prijzen daarvoor hangen af van je gekozen infrastructuur of provider.
Zijn deze modellen ‘open source’?
We gebruiken de term open modellen of open-weight om aan te geven dat de getrainde gewichten openbaar beschikbaar zijn onder de permissieve Apache 2.0-licentie en het gpt-oss gebruiksbeleid. Dit betekent dat je de modellen kunt downloaden, ze op je eigen infrastructuur of met ondersteunde hostingframeworks kunt draaien en ze kunt aanpassen of fine-tunen.
Open modellen geven ontwikkelaars en organisaties meer controle en flexibiliteit. Je kunt kiezen waar je host, de modellen aanpassen voor specifieke usecases en profiteren van licenties die breed gebruik, aanpassing en herdistributie toestaan. Hoewel de getrainde gewichten open zijn, kan sommige omliggende infrastructuur of tooling eigendom blijven van de providers.
Kan ik toegang krijgen tot deze modellen via de OpenAI API of ChatGPT?
Nee. Deze modellen worden niet aangeboden in de OpenAI API en verschijnen niet in ChatGPT.
Kan ik de modellen fine‑tunen?
Ja. Je kunt fine‑tunen met open‑source tools en je voorkeursinfrastructuur. We bieden voor deze modellen geen fine‑tuning via OpenAI API’s.
Zijn open‑weight-modellen goedkoper dan het gebruik van de API?
Kosten variëren op basis van infrastructuur, workload en operationele aanpak. Zelf hosten kan in sommige gevallen goedkoper zijn, terwijl ons API-platform efficiënter kan zijn wanneer je hosting, onderhoud en upgrades meerekent.
Welke functies ondersteunen deze modellen?
Deze modellen zijn momenteel redenerende modellen die alleen tekst ondersteunen. Gangbare runtimes ondersteunen streaming, functies aanroepen en gestructureerde output. Raadpleeg de documentatie van je runtime voor de exacte mogelijkheden.
Waarin verschilt dit van ModAPI?
Dit is een zeer capabel redenerend model waarmee je je eigen beleid kunt gebruiken. Het kan samenwerken met ModAPI, maar is waarschijnlijk geen vervanging voor usecases met lage latentie.
