La latenza di una richiesta di completamento è influenzata principalmente da due fattori: il modello e il numero di token generati. Consulta la nostra documentazione aggiornata per indicazioni su come ridurre la latenza.
Ottimizzare la latenza con i modelli dell’API OpenAI
Scopri i fattori che influenzano i tempi di risposta
Aggiornato: 20 days ago
