Creemos en un desarrollo y una implementación responsables e iterativos como medio para lograr una inteligencia artificial general segura. Realizamos una cantidad considerable de pruebas y mitigación de seguridad y alineación antes de lanzar cualquier modelo al público, y también contamos con sistemas automatizados y humanos para ayudar a detectar contenido problemático que aparece en nuestros servicios para particulares, como ChatGPT y GPTs. A continuación describimos algunas de esas iniciativas.

ChatGPT e ImageGen

Usamos herramientas automatizadas, como una versión interna de nuestra /moderations API, para detectar contenido (prompts, respuestas y cargas) que pueda ser perjudicial o infringir nuestras políticas de uso. Si detectamos contenido problemático, normalmente te avisaremos de que tu contenido puede infringir nuestras políticas de uso o impediremos que el modelo responda a tu prompt. También podemos impedir que se comparta el chat con el prompt o la respuesta problemáticos. En un conjunto muy limitado de circunstancias, también podemos suspender tu cuenta por comportamientos graves.

También aceptamos denuncias de personas sobre contenido problemático en ChatGPT. Usamos una combinación de sistemas automatizados y un equipo formado de expertos para revisar estas denuncias.

ChatGPT: si alguien comparte un chat que crees que contiene contenido problemático, también puedes denunciárnoslo.

Para obtener más información sobre cómo denunciar contenido directamente en ChatGPT, consulta este artículo.

GPTs

También usamos herramientas automatizadas, como nuestra /moderation API, para comprobar si un GPT puede ser problemático. Si detectamos contenido problemático asociado al GPT, tomaremos medidas, como impedir que se distribuya. El creador puede editar la configuración del GPT o la API para eliminar el contenido problemático, o puede apelar la decisión mediante un flujo dentro del producto. En un conjunto muy limitado de circunstancias, también podemos suspender la cuenta del creador por comportamientos graves.

También aceptamos denuncias de personas sobre GPTs problemáticos. Si ves un GPT que crees que infringe nuestras políticas de uso o que refleja de algún otro modo contenido problemático, también puedes denunciárnoslo. Usamos una combinación de sistemas automatizados y un equipo formado de expertos para revisar estas denuncias.

Cómo identificamos contenido problemático en nuestros servicios para particulares

ChatGPT e ImageGen

GPTs

¿Te ha resultado útil este artículo?