Nota: questo articolo offre una panoramica generale. Le informazioni per la configurazione tecnica sono disponibili sul sito web gpt-oss, su GitHub, su Hugging Face e negli OpenAI Cookbooks.
Panoramica
Presentiamo due modelli di ragionamento a pesi aperti: gpt‑oss‑120b e gpt‑oss‑20b. Funzionano sull’infrastruttura che controlli o tramite provider di hosting.
Nota: questi modelli non sono serviti tramite l’API OpenAI e non sono disponibili in ChatGPT.
Perché i pesi aperti
Scelta e controllo: esegui i modelli on-premises o nel tuo cloud privato, mantieni la residenza dei dati e adatta le prestazioni alle tue esigenze.
Personalizzazione: esegui il fine-tuning o adatta i modelli con gli strumenti aperti che preferisci.
Disponibilità e licenze
Licenza: Apache 2.0 consente un ampio uso, modifica e ridistribuzione, incluso l’uso commerciale (soggetto alla nostra policy di utilizzo di gpt-oss).
Serving: non disponibile tramite l’API OpenAI, quindi i prezzi dell’API e i limiti di richieste non si applicano.
Compatibilità: può essere eseguito con stack di inferenza aperti comuni come vLLM, Ollama, llama.cpp e in ambienti GPU cloud o autogestiti.
Primi passi
Per ottenere i pesi del modello e le risorse di supporto, puoi:
Visitare il sito web gpt-oss per una panoramica e link diretti.
Scaricare i pesi dalla raccolta Hugging Face — un hub della community in cui puoi trovare entrambi i modelli, vedere esempi d’uso e, facoltativamente, eseguire l’inferenza direttamente tramite i servizi di Hugging Face.
Accedere al nostro repository GitHub per il codice di inferenza di riferimento.
Usare le guide nell’OpenAI Cookbook per la configurazione con runtime supportati come Ollama, vLLM e Transformers. Il Cookbook include anche istruzioni dettagliate per l’esecuzione locale, l’uso di runtime comuni e, dove supportato, il fine-tuning dei modelli gpt‑oss.
gpt‑oss‑safeguard (anteprima di ricerca)
gpt‑oss‑safeguard è una coppia di modelli di ragionamento per la sicurezza a pesi aperti basati su gpt‑oss. Sono progettati per la classificazione della sicurezza basata su policy e attività correlate di trust & safety eseguite sull’infrastruttura che controlli. Come altri modelli gpt‑oss, questi pesi non sono serviti tramite l’API OpenAI o ChatGPT.
Modelli solo testuali con schemi di riferimento per risultati strutturati (ad es. verdetto della policy, motivazione).
Porta la tua policy: il modello interpreta la tua policy scritta per generalizzare tra prodotti con un intervento tecnico minimo.
Decisioni ragionate: tracce di ragionamento opzionali per facilitare debug e audit (destinate a sviluppatori e professionisti della sicurezza, non alla visualizzazione per gli utenti finali).
Sforzo di ragionamento configurabile: scegli basso / medio / alto per bilanciare latenza e profondità.
Licenza: Apache 2.0 (vedi Disponibilità e licenze di seguito).
gpt‑oss‑safeguard è adatto al filtraggio input/output per LLM, all’etichettatura di contenuti online e ai flussi di lavoro di etichettatura o revisione batch offline. Per applicazioni generali (chat, agenti, ecc.), consigliamo i modelli gpt‑oss principali.
Puoi adattare lo schema alle tue esigenze. Consulta l’OpenAI Cookbook per guide sui prompt ed esempi.
Varianti e dimensionamento dei modelli
| Modello | Uso previsto | Note | | gpt‑oss‑safeguard‑120b | Produzione, ragionamento sulla sicurezza ad alta capacità | 117B parametri (≈5,1B attivi). Progettato per funzionare su una <br>singola GPU da 80 GB<br> (ad es. NVIDIA H100; funziona anche su GPU con più memoria, come AMD MI300X). | | gpt‑oss‑safeguard‑20b | Latenza inferiore / ambienti vincolati | 21B parametri (≈3,6B attivi). |
Entrambi i modelli sono sottoposti a fine-tuning a partire da gpt‑oss senza modifiche all’architettura. Usano lo stesso template di chat di gpt‑oss; puoi mantenere la configurazione esistente. Un pattern di prompting consigliato consiste nell’inserire la tua policy in un messaggio dello sviluppatore e il contenuto da valutare in un messaggio dell’utente.
Supporto e community
Le distribuzioni a pesi aperti sono autogestite e con supporto autonomo. Ecco dove ottenere supporto:
Domande, discussioni, suggerimenti: usa le pagine dei modelli su Hugging Face per interagire con la community.
Bug riproducibili nel codice di inferenza di riferimento di OpenAI: apri una issue nel repository GitHub di gpt-oss.
Problemi con un runtime di terze parti (ad es. vLLM, Ollama, llama.cpp): usa il tracker delle issue, i forum o la procedura di supporto del rispettivo progetto.
OpenAI non fornisce assistenza, implementazione pratica o supporto di debug per configurazioni, ambienti o applicazioni a pesi aperti self-hosted o ospitati da terze parti.
Continueremo a collaborare con la community per migliorare gli strumenti aperti per la sicurezza, anche tramite la ROOST Model Community (RMC). La RMC riunisce professionisti e ricercatori della sicurezza per condividere best practice per integrare modelli di IA open source nei flussi di lavoro di sicurezza, inclusi risultati di valutazione e feedback sui modelli. Visita il repository GitHub della RMC per saperne di più su questa partnership e su come partecipare.
Supporto e community
Le distribuzioni a pesi aperti sono autogestite e con supporto autonomo. Ecco dove ottenere supporto:
Domande, discussioni, suggerimenti: usa le pagine dei modelli su Hugging Face per interagire con la community.
Bug riproducibili nel codice di inferenza di riferimento di OpenAI: apri una issue nel repository GitHub di gpt-oss.
Problemi con un runtime di terze parti (ad es. vLLM, Ollama, llama.cpp): usa il tracker delle issue, i forum o la procedura di supporto del rispettivo progetto.
OpenAI non fornisce assistenza, implementazione pratica o supporto di debug per configurazioni, ambienti o applicazioni a pesi aperti self-hosted o ospitati da terze parti.
Privacy e sicurezza
Privacy e dati
Questi modelli sono progettati per essere eseguiti sull’infrastruttura che controlli (on-premises o nel tuo cloud o partner di hosting). OpenAI non riceve né elabora i dati che invii a questi modelli self-hosted, a meno che tu non li condivida esplicitamente con OpenAI o usi uno dei nostri partner di hosting gestito.
Sicurezza
Questi modelli sono stati sottoposti a un ampio addestramento e a test approfonditi sulla sicurezza. Per maggiori dettagli, consulta la nostra scheda modello e il rapporto tecnico.
Segnalazione di violazioni dei contenuti
Se ritieni che contenuti generati con i modelli gpt‑oss violino le nostre policy, puoi segnalarli tramite il nostro modulo di segnalazione dei contenuti. Fornisci il maggior numero possibile di dettagli per aiutare il nostro team a esaminare la tua segnalazione.
FAQ
Questi modelli sono gratuiti?
I pesi dei modelli gpt-oss sono scaricabili e utilizzabili gratuitamente con la licenza Apache 2.0 e la policy di utilizzo di gpt-oss. Tuttavia, sei responsabile di eventuali costi associati alla loro esecuzione, come calcolo, storage o tariffe di hosting di terze parti. I relativi prezzi dipenderanno dall’infrastruttura o dal provider scelto.
Questi modelli sono “open source”?
Usiamo il termine modelli aperti o a pesi aperti per indicare che i pesi addestrati sono disponibili pubblicamente con la licenza permissiva Apache 2.0 e la policy di utilizzo di gpt-oss. Ciò significa che puoi scaricare i modelli, eseguirli sulla tua infrastruttura o con framework di hosting supportati, e personalizzarli o sottoporli a fine-tuning.
I modelli aperti offrono a sviluppatori e organizzazioni maggiore controllo e flessibilità. Puoi scegliere dove ospitarli, adattare i modelli a casi d’uso specifici e beneficiare di una licenza che consente un ampio uso, modifica e ridistribuzione. Sebbene i pesi addestrati siano aperti, alcune infrastrutture o strumenti circostanti possono restare proprietari dei rispettivi provider.
Posso accedere a questi modelli tramite l’API OpenAI o ChatGPT?
No. Questi modelli non sono serviti nell’API OpenAI e non compaiono in ChatGPT.
Posso eseguire il fine-tuning dei modelli?
Sì. Puoi eseguire il fine-tuning usando strumenti open source e l’infrastruttura che preferisci. Non offriamo il fine-tuning tramite le API OpenAI per questi modelli.
I modelli a pesi aperti sono più economici rispetto all’uso dell’API?
I costi variano in base all’infrastruttura, al carico di lavoro e all’approccio operativo. Il self-hosting può essere più economico in alcuni casi, mentre la nostra piattaforma API può risultare più efficiente considerando hosting, manutenzione e aggiornamenti.
Quali funzionalità supportano questi modelli?
Attualmente questi modelli sono modelli di ragionamento solo testuali. I runtime comuni supportano streaming, chiamata di funzioni e risultati strutturati. Consulta la documentazione del tuo runtime per le capacità esatte.
In che modo è diverso da ModAPI?
È un modello di ragionamento altamente capace che ti consente di portare la tua policy. Può funzionare insieme a ModAPI, ma probabilmente non ne sostituisce l’uso nei casi a bassa latenza.
