Kami percaya pada pengembangan dan penerapan yang bertanggung jawab dan iteratif sebagai cara untuk mencapai kecerdasan umum buatan yang aman. Kami melakukan banyak pengujian serta mitigasi terkait keamanan dan penyelarasan sebelum meluncurkan model apa pun ke publik, dan kami juga memiliki sistem otomatis dan sistem yang melibatkan manusia untuk membantu mendeteksi konten bermasalah yang muncul di layanan kami untuk individu seperti ChatGPT dan GPT. Kami menguraikan beberapa upaya tersebut di bawah ini.
ChatGPT, ImageGen dan SORA
Kami menggunakan alat otomatis, seperti versi internal dari API /moderations kami, untuk mendeteksi konten (prompt, completion, unggahan) yang mungkin berbahaya atau melanggar Kebijakan Penggunaan kami. Jika kami mendeteksi konten bermasalah, biasanya kami akan memperingatkan Anda bahwa konten Anda mungkin melanggar kebijakan penggunaan kami atau memblokir model agar tidak merespons prompt Anda. Kami juga dapat mencegah chat dengan prompt atau completion yang bermasalah untuk dibagikan. Dalam keadaan yang sangat terbatas, kami juga dapat memblokir akun Anda karena perilaku yang sangat serius.
Kami juga menerima laporan dari manusia tentang konten bermasalah di ChatGPT dan SORA. Kami menggunakan kombinasi sistem otomatis dan tim ahli terlatih untuk meninjau laporan-laporan ini.
ChatGPT: Jika seseorang membagikan chat yang menurut Anda berisi konten bermasalah, Anda juga dapat melaporkannya kepada kami.
SORA: Jika Anda melihat video atau gambar di feed Anda yang menurut Anda berisi konten bermasalah, Anda dapat melaporkannya kepada kami.
Untuk detail lebih lanjut tentang cara melaporkan konten langsung di ChatGPT atau SORA, lihat artikel ini.
GPT
Kami juga menggunakan alat otomatis seperti API /moderation kami untuk melihat apakah suatu GPT berpotensi bermasalah. Jika kami mendeteksi konten bermasalah yang terkait dengan GPT tersebut, kami akan mengambil tindakan, seperti mencegahnya untuk didistribusikan. Pembuat dapat mengedit konfigurasi GPT atau API untuk menghapus konten bermasalah, atau dapat mengajukan banding atas keputusan tersebut melalui alur di dalam produk. Dalam keadaan yang sangat terbatas, kami juga dapat memblokir akun pembuat karena perilaku yang sangat serius.
Kami juga menerima laporan dari manusia tentang GPT yang bermasalah. Jika Anda melihat GPT yang menurut Anda melanggar kebijakan penggunaan kami atau dengan cara lain mencerminkan konten bermasalah, Anda juga dapat melaporkannya kepada kami. Kami menggunakan kombinasi sistem otomatis dan tim ahli terlatih untuk meninjau laporan-laporan ini.
