Observação: Este artigo fornece uma visão geral de alto nível. Informações para configuração técnica podem ser encontradas no site do gpt-oss, no GitHub, no Hugging Face e no OpenAI Cookbooks.
Visão geral
Apresentamos dois modelos de raciocínio de pesos abertos: gpt‑oss‑120b e gpt‑oss‑20b. Eles rodam em uma infraestrutura sob seu controle ou por meio de provedores de hospedagem.
Observação: Esses modelos não são disponibilizados pela API da OpenAI e não estão disponíveis no ChatGPT.
Por que pesos abertos
Escolha e controle: Execute os modelos on‑premises ou na sua nuvem privada, mantenha a residência dos dados e ajuste o desempenho às suas necessidades.
Personalização: Faça fine‑tuning ou adapte os modelos com as ferramentas abertas de sua preferência.
Disponibilidade e licenciamento
Licença: A Apache 2.0 permite amplo uso, modificação e redistribuição, inclusive uso comercial (sujeito à política de uso do gpt-oss).
Disponibilização: Não disponível pela API da OpenAI, portanto preços e limites de taxa da API não se aplicam.
Compatibilidade: Pode ser executado com stacks abertos comuns de inferência, como vLLM, Ollama, llama.cpp, e em ambientes de GPU na nuvem ou autogerenciados.
Primeiros passos
Para obter os pesos do modelo e recursos de apoio, você pode:
Visitar o site do gpt-oss para uma visão geral e links diretos.
Baixar os pesos na coleção do Hugging Face — um hub da comunidade onde você encontra os dois modelos, vê exemplos de uso e, opcionalmente, executa inferência diretamente pelos serviços do Hugging Face.
Acessar nosso repositório no GitHub para código de inferência de referência.
Usar os guias do OpenAI Cookbook para configuração com runtimes suportados como Ollama, vLLM e Transformers. O Cookbook também inclui instruções passo a passo para executar localmente, usar runtimes comuns e — quando suportado — fazer fine‑tuning dos modelos gpt‑oss.
gpt‑oss‑safeguard (prévia de pesquisa)
gpt‑oss‑safeguard é um par de modelos de raciocínio de segurança de pesos abertos construídos sobre o gpt‑oss. Eles foram projetados para classificação de segurança baseada em políticas e tarefas relacionadas de confiança e segurança que você executa em uma infraestrutura sob seu controle. Assim como outros modelos gpt‑oss, esses pesos não são disponibilizados pela API da OpenAI nem pelo ChatGPT.
Modelos somente de texto com schemas de saída estruturada de referência (por exemplo, veredito de política, justificativa).
Traga sua própria política: o modelo interpreta sua política escrita para conseguir generalizar entre produtos com mínima engenharia.
Decisões fundamentadas: rastros de raciocínio opcionais para ajudar em depuração e auditorias (destinados a desenvolvedores e profissionais de segurança, não para exibição ao usuário final).
Esforço de raciocínio configurável: escolha baixo / médio / alto para equilibrar latência vs. profundidade.
Licença: Apache 2.0 (veja Disponibilidade e licenciamento abaixo).
gpt‑oss‑safeguard é uma boa opção para filtragem de entrada/saída para LLMs, rotulagem de conteúdo online e fluxos de trabalho de rotulagem ou revisão em lote offline. Para aplicações gerais (chat, agentes etc.), recomendamos os modelos gpt‑oss principais.
Você pode adaptar o schema às suas necessidades. Consulte o OpenAI Cookbook para guias de prompting e exemplos.
Variantes do modelo e dimensionamento
| Modelo | Uso pretendido | Observações |
| gpt‑oss‑safeguard‑120b | Produção, raciocínio de segurança de alta capacidade | 117B parâmetros (≈5,1B ativos). Projetado para caber em uma única GPU de 80 GB (por exemplo, NVIDIA H100; também roda em GPUs com maior memória, como a AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Menor latência / ambientes restritos | 21B parâmetros (≈3,6B ativos). |
Ambos os modelos são fine‑tuned a partir do gpt‑oss sem mudança de arquitetura. Eles usam o mesmo template de chat do gpt‑oss; você pode manter sua configuração existente. Um padrão de prompting recomendado é colocar sua política em uma mensagem de desenvolvedor e o conteúdo a avaliar em uma mensagem de usuário.
Suporte e comunidade
Implantações de pesos abertos são autogerenciadas e de autoatendimento. Veja onde obter suporte:
Perguntas, discussão, dicas: Use as páginas dos modelos no Hugging Face para interagir com a comunidade.
Bugs reproduzíveis no código de inferência de referência da OpenAI: Abra uma issue no repositório gpt-oss no GitHub.
Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): Use o rastreador de issues, fóruns ou processo de suporte do respectivo projeto.
A OpenAI não oferece assistência, implementação prática ou suporte de depuração para quaisquer configurações, ambientes ou aplicações de pesos abertos auto-hospedadas ou hospedadas por terceiros.
Continuaremos a iterar com a comunidade para melhorar as ferramentas abertas de segurança, inclusive por meio da ROOST Model Community (RMC). A RMC reúne profissionais e pesquisadores de segurança para compartilhar boas práticas de implementação de modelos de IA open source em fluxos de trabalho de segurança, incluindo resultados de avaliações e feedback de modelos. Visite o repositório da RMC no GitHub para saber mais sobre essa parceria e como participar.
Suporte e comunidade
Implantações de pesos abertos são autogerenciadas e de autoatendimento. Veja onde obter suporte:
Perguntas, discussão, dicas: Use as páginas dos modelos no Hugging Face para interagir com a comunidade.
Bugs reproduzíveis no código de inferência de referência da OpenAI: Abra uma issue no repositório gpt-oss no GitHub.
Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): Use o rastreador de issues, fóruns ou processo de suporte do respectivo projeto.
A OpenAI não oferece assistência, implementação prática ou suporte de depuração para quaisquer configurações, ambientes ou aplicações de pesos abertos auto-hospedadas ou hospedadas por terceiros.
Privacidade e segurança
Privacidade e dados
Esses modelos foram projetados para rodar em uma infraestrutura sob seu controle (on-premises ou na sua nuvem ou em um parceiro de hospedagem). A OpenAI não recebe nem processa os dados que você envia para esses modelos auto-hospedados, a menos que você os compartilhe explicitamente com a OpenAI ou use um de nossos parceiros de hospedagem gerenciada.
Segurança
Esses modelos passaram por amplo treinamento e testes de segurança. Para mais detalhes, veja nosso model card e o relatório técnico.
Denunciar violações de conteúdo
Se você acredita que conteúdo gerado com modelos gpt‑oss viola nossas políticas, pode denunciá-lo por meio do nosso formulário Report Content. Forneça o máximo de detalhes possível para ajudar nossa equipe a analisar seu envio.
Perguntas frequentes
Esses modelos são gratuitos?
Os pesos do modelo gpt-oss podem ser baixados e usados gratuitamente sob a licença Apache 2.0 e a política de uso do gpt-oss. No entanto, você é responsável por quaisquer custos associados à execução — como computação, armazenamento ou taxas de hospedagem de terceiros. Os preços dependerão da infraestrutura ou do provedor escolhido.
Esses modelos são “open source”?
Usamos o termo modelos abertos ou pesos abertos para indicar que os pesos treinados estão disponíveis publicamente sob a licença permissiva Apache 2.0 e a política de uso do gpt-oss. Isso significa que você pode baixar os modelos, executá-los na sua própria infraestrutura ou com frameworks de hospedagem suportados e personalizá-los ou fazer fine-tuning.
Modelos abertos oferecem a desenvolvedores e organizações maior controle e flexibilidade. Você pode escolher onde hospedar, adaptar os modelos para casos de uso específicos e se beneficiar de um licenciamento que permite amplo uso, modificação e redistribuição. Embora os pesos treinados sejam abertos, parte da infraestrutura ou das ferramentas ao redor pode continuar proprietária de seus provedores.
Posso acessar esses modelos pela API da OpenAI ou pelo ChatGPT?
Não. Esses modelos não são disponibilizados na API da OpenAI e não aparecem no ChatGPT.
Posso fazer fine‑tuning dos modelos?
Sim. Você pode fazer fine‑tuning usando ferramentas open source e a infraestrutura de sua preferência. Não oferecemos fine‑tuning via APIs da OpenAI para esses modelos.
Modelos de pesos abertos são mais baratos do que usar a API?
Os custos variam conforme infraestrutura, carga de trabalho e abordagem operacional. Em alguns casos, a auto-hospedagem pode ser mais barata, enquanto nossa Plataforma de API pode ser mais eficiente ao considerar hospedagem, manutenção e upgrades.
Quais recursos esses modelos suportam?
Atualmente, esses modelos são modelos de raciocínio somente de texto. Runtimes comuns suportam streaming, function calling e saídas estruturadas. Consulte a documentação do seu runtime para saber as capacidades exatas.
Em que isso difere da ModAPI?
Este é um modelo de raciocínio altamente capaz que permite que você traga sua própria política. Ele pode funcionar em conjunto com a ModAPI, mas provavelmente não a substitui em casos de uso de baixa latência.
