Kami percaya pada pengembangan dan penerapan yang bertanggung jawab dan iteratif sebagai sarana untuk mencapai kecerdasan umum buatan yang aman. Kami melakukan sejumlah besar pengujian keselamatan dan penyelarasan pengujian serta mitigasi sebelum meluncurkan model apa pun kepada publik, dan kami juga telah menerapkan sistem otomatis dan sistem manusia untuk membantu mendeteksi konten bermasalah yang muncul di layanan kami untuk individu, seperti ChatGPT dan GPT. Kami menguraikan beberapa upaya tersebut di bawah ini.

ChatGPT dan ImageGen

Kami menggunakan alat otomatis, seperti versi internal dari /moderations API kami, untuk mendeteksi konten (prompt, penyelesaian, unggahan) yang mungkin berbahaya atau melanggar Kebijakan Penggunaan kami. Jika kami mendeteksi konten bermasalah, kami biasanya akan memperingatkan Anda bahwa konten mungkin melanggar kebijakan penggunaan kami atau memblokir model agar tidak merespons prompt Anda. Kami juga dapat mencegah percakapan dengan prompt atau penyelesaian yang bermasalah dibagikan. Dalam sejumlah keadaan yang sangat terbatas, kami juga dapat memblokir akun Anda karena perilaku yang sangat serius.

Kami juga menerima laporan manual mengenai konten bermasalah di ChatGPT. Kami menggunakan kombinasi sistem otomatis dan tim ahli yang terlatih untuk meninjau laporan ini.

ChatGPT: Jika seseorang membagikan percakapan yang menurut Anda berisi konten bermasalah, Anda juga dapat melaporkannya kepada kami.

Untuk detail selengkapnya tentang cara melaporkan konten secara langsung di ChatGPT, lihat artikel ini.

GPT

Kami juga menggunakan alat otomatis seperti /moderation API kami untuk melihat apakah suatu GPT berpotensi bermasalah. Jika kami mendeteksi konten bermasalah yang terkait dengan GPT tersebut, kami akan mengambil tindakan, seperti mencegahnya didistribusikan. Pembuatnya dapat mengedit konfigurasi GPT atau API untuk menghapus konten yang bermasalah atau dapat mengajukan banding atas keputusan tersebut melalui alur dalam produk. Dalam keadaan yang sangat terbatas, kami juga dapat memblokir akun pembuat karena perilaku yang sangat buruk.

Kami juga menerima laporan manual tentang GPT yang bermasalah. Jika Anda melihat GPT yang menurut Anda melanggar kebijakan penggunaan kami atau mencerminkan konten bermasalah, Anda juga dapat melaporkannya kepada kami. Kami menggunakan kombinasi sistem otomatis dan tim ahli yang terlatih untuk meninjau laporan ini.

Cara kami mengidentifikasi konten bermasalah di layanan kami untuk individu

ChatGPT dan ImageGen

GPT

Apakah artikel ini membantu?