Acreditamos em um desenvolvimento e uma implantação responsáveis e iterativos como forma de alcançar uma inteligência artificial geral segura. Realizamos uma quantidade considerável de testes e mitigação de segurança e alinhamento antes mesmo de lançar um modelo ao público e também temos sistemas automatizados e humanos para ajudar a detectar conteúdo problemático que aparece em nossos serviços para pessoas físicas, como ChatGPT e GPTs. A seguir, descrevemos alguns desses esforços.
ChatGPT, ImageGen e SORA
Usamos ferramentas automatizadas, como uma versão interna da nossa API /moderations, para detectar conteúdo (prompts, respostas, uploads) que possa ser prejudicial ou violar nossas Políticas de Uso. Se detectarmos conteúdo problemático, em geral vamos alertar você de que seu conteúdo pode violar nossas políticas de uso ou impedir que o modelo responda ao seu prompt. Também podemos impedir que o chat com o prompt ou a resposta problemáticos seja compartilhado. Em um conjunto muito limitado de circunstâncias, também podemos banir sua conta por comportamento grave.
Também aceitamos denúncias de pessoas sobre conteúdo problemático no ChatGPT e no SORA. Usamos uma combinação de sistemas automatizados e uma equipe treinada de especialistas para analisar essas denúncias.
ChatGPT: se alguém compartilhar um chat que você acredita conter conteúdo problemático, você também pode denunciá-lo para nós.
SORA: se você vir um vídeo ou imagem no seu feed que você acredita conter conteúdo problemático, você pode denunciá-lo para nós.
Para mais detalhes sobre como denunciar conteúdo diretamente no ChatGPT ou no SORA, consulte este artigo.
GPTs
Também usamos ferramentas automatizadas, como nossa API /moderation, para verificar se um GPT é potencialmente problemático. Se detectarmos conteúdo problemático associado ao GPT, vamos tomar medidas, como impedir que ele seja distribuído. O criador pode editar a configuração do GPT ou da API para remover o conteúdo problemático ou pode recorrer da decisão por meio de um fluxo dentro do produto. Em um conjunto muito limitado de circunstâncias, também podemos banir a conta do criador por comportamento grave.
Também aceitamos denúncias de pessoas sobre GPTs problemáticos. Se você vir um GPT que acredita estar violando nossas políticas de uso ou que de outra forma reflita conteúdo problemático, você também pode denunciá-lo para nós. Usamos uma combinação de sistemas automatizados e uma equipe treinada de especialistas para analisar essas denúncias.
