Catatan: Artikel ini memberikan ikhtisar tingkat tinggi. Informasi untuk setup teknis dapat ditemukan di situs web gpt-oss, GitHub, Hugging Face, dan OpenAI Cookbooks.
Ikhtisar
Memperkenalkan dua model penalaran berbobot terbuka: gpt‑oss‑120b dan gpt‑oss‑20b. Keduanya berjalan di infrastruktur yang Anda kendalikan, atau melalui penyedia hosting.
Catatan: Model-model ini tidak disajikan melalui API OpenAI dan tidak tersedia di ChatGPT.
Mengapa bobot terbuka
Pilihan dan kontrol: Jalankan model secara on‑premises atau di cloud privat Anda, pertahankan residensi data, dan sesuaikan performa dengan kebutuhan Anda.
Kustomisasi: Fine‑tune atau adaptasikan model dengan tooling terbuka pilihan Anda.
Ketersediaan dan lisensi
Lisensi: Apache 2.0 memungkinkan penggunaan, modifikasi, dan redistribusi yang luas, termasuk penggunaan komersial (tunduk pada kebijakan penggunaan gpt-oss kami).
Penyajian: Tidak tersedia melalui API OpenAI, sehingga harga API dan batas laju tidak berlaku.
Kompatibilitas: Dapat dijalankan dengan stack inferensi terbuka umum seperti vLLM, Ollama, llama.cpp, dan di lingkungan GPU cloud atau yang dikelola sendiri.
Memulai
Untuk mendapatkan bobot model dan sumber daya pendukung, Anda dapat:
Kunjungi situs web gpt-oss untuk ikhtisar dan tautan langsung.
Unduh bobot dari koleksi Hugging Face — hub komunitas tempat Anda dapat menemukan kedua model, melihat contoh penggunaan, dan secara opsional menjalankan inferensi langsung melalui layanan Hugging Face.
Akses repo GitHub kami untuk kode inferensi referensi.
Gunakan panduan di OpenAI Cookbook untuk setup dengan runtime yang didukung seperti Ollama, vLLM, dan Transformers. Cookbook juga menyertakan instruksi langkah demi langkah untuk menjalankan secara lokal, menggunakan runtime umum, dan—jika didukung—melakukan fine‑tuning pada model gpt‑oss.
gpt‑oss‑safeguard (pratinjau riset)
gpt‑oss‑safeguard adalah sepasang model penalaran keamanan berbobot terbuka yang dibangun di atas gpt‑oss. Keduanya dirancang untuk klasifikasi keamanan berbasis kebijakan dan tugas kepercayaan & keamanan terkait yang Anda jalankan di infrastruktur yang Anda kendalikan. Seperti model gpt‑oss lainnya, bobot ini tidak disajikan melalui API OpenAI atau ChatGPT.
Model khusus teks dengan skema output terstruktur referensi (mis., putusan kebijakan, alasan).
Bawa kebijakan Anda sendiri: model menafsirkan kebijakan tertulis Anda agar dapat menggeneralisasi lintas produk dengan rekayasa minimal.
Keputusan beralasan: jejak penalaran opsional untuk membantu debugging dan audit (ditujukan bagi developer dan praktisi keamanan, bukan untuk ditampilkan kepada pengguna akhir).
Upaya penalaran yang dapat dikonfigurasi: pilih rendah / sedang / tinggi untuk menukar latensi dengan kedalaman.
Lisensi: Apache 2.0 (lihat Ketersediaan dan lisensi di bawah).
gpt‑oss‑safeguard cocok untuk pemfilteran input/output bagi LLM, pelabelan konten online, dan alur kerja pelabelan atau peninjauan batch offline. Untuk aplikasi umum (chat, agen, dll.), kami merekomendasikan model inti gpt‑oss.
Anda dapat menyesuaikan skema dengan kebutuhan Anda. Silakan lihat OpenAI Cookbook untuk panduan tentang prompting dan contoh.
Varian model & ukuran
| Model | Penggunaan yang dimaksudkan | Catatan | | gpt‑oss‑safeguard‑120b | Produksi, penalaran keamanan berkapasitas tinggi | 117B parameter (≈5.1B aktif). Dirancang agar muat pada <br>satu GPU 80 GB<br> (mis., NVIDIA H100; juga berjalan pada GPU bermemori lebih besar seperti AMD MI300X). | | gpt‑oss‑safeguard‑20b | Latensi lebih rendah / lingkungan terbatas | 21B parameter (≈3.6B aktif). |
Kedua model di-fine-tune dari gpt‑oss tanpa perubahan arsitektur. Keduanya menggunakan template chat yang sama seperti gpt‑oss; Anda dapat mempertahankan setup yang ada. Pola prompting yang direkomendasikan adalah menempatkan kebijakan Anda dalam pesan developer dan konten yang akan dievaluasi dalam pesan pengguna.
Dukungan dan komunitas
Deployment berbobot terbuka dikelola dan dilayani secara mandiri. Berikut tempat mendapatkan dukungan:
Pertanyaan, diskusi, tips: Gunakan halaman model Hugging Face untuk berinteraksi dengan komunitas.
Bug yang dapat direproduksi dalam kode inferensi referensi OpenAI: Buka issue di repo GitHub gpt-oss.
Masalah dengan runtime pihak ketiga (mis., vLLM, Ollama, llama.cpp): Gunakan pelacak issue, forum, atau proses dukungan proyek terkait.
OpenAI tidak menyediakan bantuan, implementasi langsung, atau dukungan debugging untuk setup, konfigurasi, lingkungan, atau aplikasi berbobot terbuka apa pun yang dihosting sendiri atau dihosting pihak ketiga.
Kami akan terus beriterasi bersama komunitas untuk meningkatkan tooling keamanan terbuka, termasuk melalui ROOST Model Community (RMC). RMC mempertemukan praktisi dan peneliti keamanan untuk berbagi praktik terbaik dalam menerapkan model AI open source ke alur kerja keamanan, termasuk hasil evaluasi dan masukan model. Kunjungi repo GitHub RMC untuk mempelajari lebih lanjut tentang kemitraan ini dan cara terlibat.
Dukungan dan komunitas
Deployment berbobot terbuka dikelola dan dilayani secara mandiri. Berikut tempat mendapatkan dukungan:
Pertanyaan, diskusi, tips: Gunakan halaman model Hugging Face untuk berinteraksi dengan komunitas.
Bug yang dapat direproduksi dalam kode inferensi referensi OpenAI: Buka issue di repo GitHub gpt-oss.
Masalah dengan runtime pihak ketiga (mis., vLLM, Ollama, llama.cpp): Gunakan pelacak issue, forum, atau proses dukungan proyek terkait.
OpenAI tidak menyediakan bantuan, implementasi langsung, atau dukungan debugging untuk setup, konfigurasi, lingkungan, atau aplikasi berbobot terbuka apa pun yang dihosting sendiri atau dihosting pihak ketiga.
Privasi dan keamanan
Privasi dan data
Model-model ini dirancang untuk berjalan di infrastruktur yang Anda kendalikan (on-premises atau di cloud maupun mitra hosting Anda). OpenAI tidak menerima atau memproses data yang Anda kirim ke model yang dihosting sendiri ini kecuali Anda secara eksplisit membagikannya dengan OpenAI, atau menggunakan salah satu mitra hosting terkelola kami.
Keamanan
Model-model ini menjalani pelatihan dan pengujian keamanan yang ekstensif. Untuk detail selengkapnya, lihat kartu model dan laporan teknis kami.
Melaporkan pelanggaran konten
Jika Anda yakin konten yang dihasilkan dengan model gpt‑oss melanggar kebijakan kami, Anda dapat melaporkannya melalui formulir Laporkan Konten kami. Berikan sedetail mungkin untuk membantu tim kami meninjau kiriman Anda.
FAQ
Apakah model-model ini gratis?
Bobot model gpt-oss gratis untuk diunduh dan digunakan di bawah lisensi Apache 2.0 dan kebijakan penggunaan gpt-oss. Namun, Anda bertanggung jawab atas biaya apa pun yang terkait dengan menjalankannya — seperti biaya komputasi, penyimpanan, atau hosting pihak ketiga. Harga untuk hal tersebut akan bergantung pada infrastruktur atau penyedia yang Anda pilih.
Apakah model-model ini “open source”?
Kami menggunakan istilah open model atau berbobot terbuka untuk menunjukkan bahwa bobot terlatih tersedia untuk publik di bawah lisensi permisif Apache 2.0 dan kebijakan penggunaan gpt-oss. Ini berarti Anda dapat mengunduh model, menjalankannya di infrastruktur Anda sendiri atau dengan kerangka hosting yang didukung, serta menyesuaikan atau melakukan fine-tune pada model tersebut.
Open model memberi developer dan organisasi kontrol serta fleksibilitas yang lebih besar. Anda dapat memilih tempat hosting, menyesuaikan model untuk kasus penggunaan tertentu, dan memperoleh manfaat dari lisensi yang memungkinkan penggunaan, modifikasi, dan redistribusi yang luas. Meskipun bobot terlatih bersifat terbuka, beberapa infrastruktur atau alat pendukung mungkin tetap menjadi hak milik penyedianya.
Dapatkah saya mengakses model-model ini melalui API OpenAI atau ChatGPT?
Tidak. Model-model ini tidak disajikan di API OpenAI dan tidak muncul di ChatGPT.
Dapatkah saya melakukan fine‑tune pada model?
Ya. Anda dapat melakukan fine‑tune menggunakan alat open‑source dan infrastruktur pilihan Anda. Kami tidak menawarkan fine‑tuning melalui API OpenAI untuk model-model ini.
Apakah model berbobot terbuka lebih murah daripada menggunakan API?
Biaya bervariasi berdasarkan infrastruktur, beban kerja, dan pendekatan operasional. Hosting mandiri mungkin lebih murah dalam beberapa kasus, sedangkan Platform API kami mungkin lebih efisien jika memperhitungkan hosting, pemeliharaan, dan peningkatan.
Fitur apa yang didukung model-model ini?
Model-model ini saat ini merupakan model penalaran khusus teks. Runtime umum mendukung streaming, pemanggilan fungsi, dan output terstruktur. Periksa dokumentasi runtime Anda untuk kapabilitas yang tepat.
Apa bedanya ini dengan ModAPI?
Ini adalah model penalaran yang sangat mumpuni dan memungkinkan Anda membawa kebijakan sendiri. Ini dapat bekerja bersama ModAPI, tetapi kemungkinan bukan pengganti untuk kasus penggunaan berlatensi rendah.
