De latentie van een completionverzoek wordt vooral beïnvloed door twee factoren: het model en het aantal gegenereerde tokens. Lees onze bijgewerkte documentatie voor richtlijnen om latenties te verbeteren.
Latentie optimaliseren met OpenAI API-modellen
Lees over factoren die invloed hebben op reactietijden
Bijgewerkt: 5 days ago
