OpenAI
Halaman ini diterjemahkan oleh mesin. Lihat artikel asli dalam bahasa Inggris.

FAQ Audio API

Pertanyaan umum tentang Whisper, speech-to-text, dan Audio API

Diperbarui: 6 days ago

Audio API mendukung dua endpoint speech-to-text:

  • transcriptions

  • translations

Untuk memulai dengan Audio API, silakan baca dokumentasi pengembang speech-to-text kami.

Berapa biaya penggunaan Audio API?

Lihat halaman harga kami untuk detailnya.

Bahasa apa saja yang didukung?

Lihat daftar bahasa yang didukung di sini.

Bagaimana cara menangani file audio berukuran besar?

Untuk unggahan transkripsi Audio API legacy/whisper-1, ukuran permintaan maksimum adalah 25 MiB. Rute transkripsi gpt-4o yang lebih baru mungkin menggunakan validasi yang berbeda, seperti batas durasi atau token, jadi periksa dokumentasi khusus model saat menangani input audio panjang dari pengguna.

Metode streaming apa yang tersedia?

Ada dua cara untuk melakukan streaming transkripsi, bergantung pada kasus penggunaan Anda dan apakah Anda ingin mentranskripsikan rekaman audio yang sudah selesai atau menangani stream audio yang sedang berlangsung serta menggunakan OpenAI untuk deteksi giliran bicara:

Perlu diperhatikan bahwa streaming tidak didukung dengan model whisper-1.

Format file apa saja yang didukung?

Format file yang didukung tercantum dalam dokumentasi API kami.

Bisakah saya mengirim tautan ke file audio ke Audio API?

Tidak, Anda harus mengirim file dalam salah satu format audio yang didukung.

Apakah artikel ini membantu?