Questa pagina è stata tradotta automaticamente. Visualizza l'articolo originale in inglese.

Ottimizzare la latenza con i modelli dell’API OpenAI

Scopri i fattori che influenzano i tempi di risposta

Aggiornato: 20 days ago

La latenza di una richiesta di completamento è influenzata principalmente da due fattori: il modello e il numero di token generati. Consulta la nostra documentazione aggiornata per indicazioni su come ridurre la latenza.

Ottimizzare la latenza con i modelli dell’API OpenAI

Questo articolo è stato utile?