Más información sobre los modelos open-weight de OpenAI (gpt-oss) y dónde obtener ayuda

Nota: este artículo ofrece una visión general de alto nivel. La información para la configuración técnica se encuentra en el sitio web de gpt-oss, GitHub, Hugging Face y OpenAI Cookbooks.

Resumen

Presentamos dos modelos de razonamiento de pesos abiertos: gpt‑oss‑120b y gpt‑oss‑20b. Se ejecutan en infraestructura que controlas o a través de proveedores de alojamiento.

Nota: Estos modelos no se sirven a través de la API de OpenAI y no están disponibles en ChatGPT.

Por qué pesos abiertos

Elección y control: ejecuta modelos en local o en tu nube privada, mantén la residencia de datos y adapta el rendimiento a tus necesidades.
Personalización: ajusta o adapta los modelos con tus herramientas abiertas preferidas.

Disponibilidad y licencias

Licencia: Apache 2.0 permite un uso, modificación y redistribución amplios, incluido el uso comercial (sujeto a nuestra política de uso de gpt-oss).
Servicio: no está disponible a través de la API de OpenAI, por lo que no se aplican los precios ni los límites de solicitudes de la API.
Compatibilidad: puede ejecutarse con stacks de inferencia abiertos habituales, como vLLM, Ollama y llama.cpp, y en entornos de GPU en la nube o autogestionados.

Primeros pasos

Para obtener los pesos del modelo y los recursos de apoyo, puedes:

Visitar el sitio web de gpt-oss para ver un resumen y enlaces directos.
Descargar los pesos desde la colección de Hugging Face: un centro comunitario donde puedes encontrar ambos modelos, ver ejemplos de uso y, opcionalmente, ejecutar inferencia directamente mediante los servicios de Hugging Face.
Acceder a nuestro repositorio de GitHub para consultar el código de inferencia de referencia.
Usar guías del OpenAI Cookbook para configurarlo con runtimes compatibles como Ollama, vLLM y Transformers. El Cookbook también incluye instrucciones paso a paso para ejecutarlos localmente, usar runtimes habituales y, cuando sea compatible, ajustar modelos gpt‑oss.

gpt‑oss‑safeguard (vista previa de investigación)

gpt‑oss‑safeguard es un par de modelos de razonamiento de seguridad de pesos abiertos creados sobre gpt‑oss. Están diseñados para la clasificación de seguridad basada en políticas y tareas relacionadas de confianza y seguridad que ejecutas en infraestructura que controlas. Como otros modelos gpt‑oss, estos pesos no se sirven a través de la API de OpenAI ni de ChatGPT.

Modelos solo de texto con esquemas de resultados estructurados de referencia (p. ej., veredicto de política, razonamiento).
Trae tu propia política: el modelo interpreta tu política escrita para poder generalizar entre productos con una ingeniería mínima.
Decisiones razonadas: trazas de razonamiento opcionales para facilitar la depuración y las auditorías (pensadas para desarrolladores y profesionales de seguridad, no para mostrarlas a usuarios finales).
Esfuerzo de razonamiento configurable: elige bajo / medio / alto para equilibrar latencia y profundidad.
Licencia: Apache 2.0 (consulta Disponibilidad y licencias más abajo).

gpt‑oss‑safeguard es adecuado para filtrar entradas/salidas de LLM, etiquetar contenido en línea y etiquetar o revisar por lotes sin conexión. Para aplicaciones generales (chat, agentes, etc.), recomendamos los modelos gpt‑oss principales.

Puedes adaptar el esquema a tus necesidades. Consulta el OpenAI Cookbook para ver guías sobre prompting y ejemplos.

Variantes y tamaños de los modelos

Modelo	Uso previsto	Notas
gpt‑oss‑safeguard‑120b	Producción, razonamiento de seguridad de alta capacidad	117 B de parámetros (≈5,1 B activos). Diseñado para caber en una sola GPU de 80 GB (p. ej., NVIDIA H100; también se ejecuta en GPU con más memoria, como AMD MI300X).
gpt‑oss‑safeguard‑20b	Menor latencia / entornos restringidos	21 B de parámetros (≈3,6 B activos).

Ambos modelos están ajustados a partir de gpt‑oss sin cambios en la arquitectura. Usan la misma plantilla de chat que gpt‑oss; puedes mantener tu configuración actual. Un patrón de prompts recomendado es colocar tu política en un mensaje de desarrollador y el contenido que se va a evaluar en un mensaje de usuario.

Soporte y comunidad

Los despliegues de pesos abiertos son autogestionados y autoservicio. Aquí puedes obtener soporte:

Preguntas, debate, consejos: usa las páginas de modelos de Hugging Face para interactuar con la comunidad.
Errores reproducibles en el código de inferencia de referencia de OpenAI: abre una incidencia en el repositorio de GitHub de gpt-oss.
Problemas con un runtime de terceros (p. ej., vLLM, Ollama, llama.cpp): usa el sistema de incidencias, los foros o el proceso de soporte del proyecto correspondiente.

OpenAI no proporciona asistencia, implementación práctica ni soporte de depuración para ninguna configuración, entorno o aplicación de pesos abiertos autoalojada o alojada por terceros.

Seguiremos iterando con la comunidad para mejorar las herramientas de seguridad abiertas, incluso a través de la ROOST Model Community (RMC). La RMC reúne a profesionales e investigadores de seguridad para compartir mejores prácticas para implementar modelos de IA de código abierto en flujos de trabajo de seguridad, incluidos resultados de evaluación y comentarios sobre modelos. Visita el repositorio de GitHub de RMC para obtener más información sobre esta colaboración y cómo participar.

Soporte y comunidad

Los despliegues de pesos abiertos son autogestionados y autoservicio. Aquí puedes obtener soporte:

Preguntas, debate, consejos: usa las páginas de modelos de Hugging Face para interactuar con la comunidad.
Errores reproducibles en el código de inferencia de referencia de OpenAI: abre una incidencia en el repositorio de GitHub de gpt-oss.
Problemas con un runtime de terceros (p. ej., vLLM, Ollama, llama.cpp): usa el sistema de incidencias, los foros o el proceso de soporte del proyecto correspondiente.

OpenAI no proporciona asistencia, implementación práctica ni soporte de depuración para ninguna configuración, entorno o aplicación de pesos abiertos autoalojada o alojada por terceros.

Privacidad y seguridad

Privacidad y datos

Estos modelos están diseñados para ejecutarse en infraestructura que controlas (en local, en tu nube o con tu socio de alojamiento). OpenAI no recibe ni procesa los datos que envías a estos modelos autoalojados salvo que los compartas explícitamente con OpenAI o uses uno de nuestros socios de alojamiento gestionado.

Seguridad

Estos modelos se sometieron a una amplia formación y pruebas de seguridad. Para obtener más información, consulta nuestra tarjeta del modelo y el informe técnico.

Informar de infracciones de contenido

Si crees que el contenido generado con modelos gpt‑oss infringe nuestras políticas, puedes informarlo mediante nuestro formulario Report Content. Proporciona tantos detalles como sea posible para ayudar a nuestro equipo a revisar tu envío.

Preguntas frecuentes

¿Estos modelos son gratuitos?

Los pesos de los modelos gpt-oss se pueden descargar y usar gratis bajo la licencia Apache 2.0 y la política de uso de gpt-oss. Sin embargo, eres responsable de cualquier coste asociado a ejecutarlos, como computación, almacenamiento o tarifas de alojamiento de terceros. El precio de esos servicios dependerá de la infraestructura o el proveedor que elijas.

¿Son estos modelos de «código abierto»?

Usamos el término modelos abiertos o de pesos abiertos para indicar que los pesos entrenados están disponibles públicamente bajo la licencia permisiva Apache 2.0 y la política de uso de gpt-oss. Esto significa que puedes descargar los modelos, ejecutarlos en tu propia infraestructura o con marcos de alojamiento compatibles, y personalizarlos o ajustarlos.

Los modelos abiertos ofrecen a desarrolladores y organizaciones mayor control y flexibilidad. Puedes elegir dónde alojarlos, adaptar los modelos para casos de uso específicos y beneficiarte de una licencia que permite un uso, modificación y redistribución amplios. Aunque los pesos entrenados son abiertos, parte de la infraestructura o las herramientas relacionadas pueden seguir siendo propietarias de sus proveedores.

¿Puedo acceder a estos modelos a través de la API de OpenAI o de ChatGPT?

No. Estos modelos no se sirven en la API de OpenAI y no aparecen en ChatGPT.

¿Puedo ajustar los modelos?

Sí. Puedes ajustarlos con herramientas de código abierto y tu infraestructura preferida. No ofrecemos ajuste a través de las API de OpenAI para estos modelos.

¿Son los modelos de pesos abiertos más baratos que usar la API?

Los costes varían según la infraestructura, la carga de trabajo y el enfoque operativo. El autoalojamiento puede ser más barato en algunos casos, mientras que nuestra plataforma API puede ser más eficiente al tener en cuenta el alojamiento, el mantenimiento y las actualizaciones.

¿Qué funciones admiten estos modelos?

Actualmente, estos modelos son modelos de razonamiento solo de texto. Los runtimes habituales admiten streaming, llamada a funciones y resultados estructurados. Consulta la documentación de tu runtime para conocer las capacidades exactas.

¿En qué se diferencia de ModAPI?

Es un modelo de razonamiento muy capaz que te permite aportar tu propia política. Puede funcionar junto con ModAPI, pero probablemente no sea un sustituto para casos de uso de baja latencia.

Modelos open-weight de OpenAI (gpt-oss)

Resumen

Por qué pesos abiertos

Disponibilidad y licencias

Primeros pasos

gpt‑oss‑safeguard (vista previa de investigación)

Variantes y tamaños de los modelos

Soporte y comunidad

Soporte y comunidad

Privacidad y seguridad

Privacidad y datos

Seguridad

Informar de infracciones de contenido

Preguntas frecuentes

¿Estos modelos son gratuitos?

¿Son estos modelos de «código abierto»?

¿Puedo acceder a estos modelos a través de la API de OpenAI o de ChatGPT?

¿Puedo ajustar los modelos?

¿Son los modelos de pesos abiertos más baratos que usar la API?

¿Qué funciones admiten estos modelos?

¿En qué se diferencia de ModAPI?

¿Te ha resultado útil este artículo?