De Audio API ondersteunt twee spraak-naar-tekst-endpoints:
transcriptionstranslations
Lees onze ontwikkelaarsdocumentatie voor spraak naar tekst om aan de slag te gaan met de Audio API.
Hoeveel kost het gebruik van de Audio API?
Bekijk onze prijspagina voor meer informatie.
Welke talen worden ondersteund?
Bekijk hier een lijst met ondersteunde talen.
Hoe kunnen we grote audiobestanden verwerken?
Voor transcriptie-uploads via de legacy/whisper-1 Audio API is de maximale aanvraaggrootte 25 MiB. Nieuwere gpt-4o-transcriptieroutes kunnen andere validatie gebruiken, zoals limieten voor duur of tokens. Raadpleeg daarom de modelspecifieke documentatie wanneer je lange audio-invoer van gebruikers verwerkt.
Welke streamingmethoden zijn beschikbaar?
Er zijn twee manieren om je transcriptie te streamen, afhankelijk van je gebruikssituatie en of je een al voltooide audio-opname wilt transcriberen of een lopende audiostream wilt verwerken en OpenAI wilt gebruiken voor beurtdetectie:
Houd er rekening mee dat streaming niet wordt ondersteund met het whisper-1-model.
Welke bestandsindelingen worden ondersteund?
De ondersteunde bestandsindelingen staan in onze API-documentatie.
Kan ik links naar audiobestanden naar de Audio API sturen?
Nee, je moet een bestand in een van de ondersteunde audio-indelingen sturen.
