OpenAI menawarkan sistem AI generatif yang tersedia untuk umum di negara bagian California. Kami mengembangkan sistem ini menggunakan berbagai sumber data, termasuk data yang tersedia untuk umum, data yang kami akses melalui kerja sama dengan pihak ketiga, serta informasi yang disediakan atau dihasilkan oleh pengguna, pelatih manusia, dan peneliti kami. Kami juga mengembangkan sistem kami menggunakan data sintetis.
Kami menggunakan data untuk membantu sistem kami lebih memahami bahasa manusia dan dunia. Hal itu, pada gilirannya, memungkinkan sistem kami meningkatkan kreativitas manusia, memajukan penemuan ilmiah dan riset medis, serta membantu ratusan juta orang memperbaiki kehidupan sehari-hari mereka. Sistem kami dikembangkan menggunakan kumpulan data yang berisi triliunan token yang mencakup konten teks, gambar, audio, dan audiovisual.
Kami menggunakan beragam data untuk mengembangkan sistem kami, termasuk data yang mungkin dilindungi hak cipta dan data yang berada dalam domain publik. Meskipun kami mengambil langkah-langkah untuk mengurangi jumlah informasi pribadi dalam kumpulan data pelatihan kami, sebagian data kami mungkin mencakup informasi pribadi dan informasi konsumen agregat sebagaimana didefinisikan dalam Pasal 1798.140 Kitab Undang-Undang Hukum Perdata California. Pengguna kami dapat memilih agar konten mereka tidak digunakan untuk pelatihan, serta meminta penghapusan informasi pribadi tertentu dari respons ChatGPT, melalui Portal Privasi kami. Kami menggunakan berbagai teknik untuk memproses kumpulan data kami guna meningkatkan kinerja dan akurasi model kami.
Kami mulai mengumpulkan data untuk mengembangkan sistem kami sekitar tahun 2018, dan kami terus mengumpulkan data hingga saat ini. Kami pertama kali menggunakan kumpulan data kami untuk pengembangan sistem pada tahun 2021.
Informasi tambahan tentang pengembangan sistem kami dapat ditemukan di kartu sistem kami.
Ringkasan Data Pelatihan Sesuai dengan Pasal 3111 Kitab Undang-Undang Hukum Perdata California
Diperbarui: 5 days ago
