Creemos en un desarrollo e implementación responsables e iterativos como medio para lograr una inteligencia artificial general segura. Realizamos una cantidad considerable de pruebas y medidas de mitigación de seguridad y alineación antes de lanzar un modelo al público, y también contamos con sistemas automatizados y humanos para ayudar a detectar contenido problemático que aparece en nuestros servicios para particulares, como ChatGPT y GPTs. A continuación describimos algunas de esas iniciativas.
ChatGPT, ImageGen y SORA
Utilizamos herramientas automatizadas, como una versión interna de nuestra API /moderations, para detectar contenido (prompts, respuestas, cargas) que pueda ser perjudicial o infringir nuestras Políticas de uso. Si detectamos contenido problemático, normalmente te advertiremos de que tu contenido puede infringir nuestras políticas de uso o bloquearemos la respuesta del modelo a tu prompt. También podemos impedir que se comparta el chat con el prompt o la respuesta problemáticos. En un conjunto muy limitado de circunstancias, también podemos suspender tu cuenta por conducta grave.
También aceptamos denuncias humanas de contenido problemático en ChatGPT y SORA. Utilizamos una combinación de sistemas automatizados y un equipo de expertos capacitados para revisar estas denuncias.
ChatGPT: Si alguien comparte un chat que crees que contiene contenido problemático, también puedes denunciárnoslo.
SORA: Si ves un vídeo o una imagen en tu feed que crees que contiene contenido problemático, puedes denunciárnoslo.
Para obtener más información sobre cómo denunciar contenido directamente en ChatGPT o SORA, consulta este artículo.
GPTs
También utilizamos herramientas automatizadas como nuestra API /moderation para comprobar si un GPT es potencialmente problemático. Si detectamos contenido problemático asociado al GPT, tomaremos medidas, como impedir su distribución. La persona creadora puede editar la configuración del GPT o de la API para eliminar el contenido problemático, o puede apelar la decisión mediante un flujo dentro del producto. En un conjunto muy limitado de circunstancias, también podemos suspender la cuenta de la persona creadora por conducta grave.
También aceptamos denuncias humanas de GPTs problemáticos. Si ves un GPT que crees que infringe nuestras políticas de uso o que refleja contenido problemático de otro modo, también puedes denunciárnoslo. Utilizamos una combinación de sistemas automatizados y un equipo de expertos capacitados para revisar estas denuncias.
