OpenAI

Piattaforma API - Scale Tier per i clienti Enterprise esistenti

Aggiornato: 7 days ago

La funzionalità Scale Tier sulla piattaforma API consente di acquistare in anticipo un numero definito di token di input e output API al minuto (noti come “unità di token”) per accedere a un'istantanea dedicata del modello. Ogni unità di token viene acquistata per un minimo di 30 giorni.

Una volta firmato un modulo d'ordine, puoi aggiungere e rimuovere unità di token tramite il tuo account della piattaforma API. Tieni presente che solo i proprietari dell'organizzazione e gli utenti autorizzati possono visualizzare le impostazioni di Scale Tier e acquistare unità di token di input e di output.

Scopri di più sui prezzi di Scale Tier.

Come posso accedere alle impostazioni di Scale Tier?

I proprietari dell'organizzazione della piattaforma API possono accedere alle impostazioni del loro Scale Tier selezionando l'icona a forma di ingranaggio Impostazioni in alto a destra nella pagina e selezionando Scale Tier nella sezione “Organizzazione“ del menu sul lato sinistro dello schermo.

Image

La pagina delle impostazioni di Scale Tier consente di aggiungere maggiore capacità, visualizzare l'utilizzo dei token di input, pianificare la capacità, visualizzare i token di cui è stato effettuato il provisioning ed esaminare gli acquirenti autorizzati.

Come posso acquistare capacità aggiuntiva?

Puoi acquistare capacità selezionando il pulsante Aggiungi capacità in alto a destra nella pagina Scale Tier. Consulta la nostra pagina principale di Scale Tier per gli ultimi dettagli sulle allocazioni TPM per unità di token di input e di output.

Dopo aver selezionato il tipo di token da acquistare, puoi inserire direttamente una quantità o spostare il cursore per scegliere il numero di token che desideri acquistare. Il cursore consente di visualizzare facilmente le variazioni dei TPM nella sezione Riepilogo mentre modifichi i token. Forniremo inoltre un consiglio sul numero di unità da acquistare per coprire gli ultimi 30 giorni di traffico.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Una volta finalizzata la selezione, fai clic su Checkout per confermare l'acquisto nella finestra modale successiva.

Si noti che i prezzi indicati nel nostro riepilogo sono le tariffe standard e non includono eventuali sconti negoziati nel modulo d'ordine della tua organizzazione. Eventuali sconti applicabili saranno applicati e indicati nella fattura emessa alla tua organizzazione. Le unità acquistate resteranno attive fino all'inizio del periodo di fatturazione successivo e, successivamente, si rinnoveranno ogni giorno.

Come posso abilitare le chiamate per utilizzare i token di Scale Tier?

Dovrai attivare l'opzione Scale Tier abilitato nelle impostazioni del progetto.

Se stai utilizzando l'API per il completamento delle chat, consulta anche la nostra documentazione che spiega la chiave service_tier, per decidere se impostarla manualmente o affidarti al comportamento predefinito.

Le chiamate all'API Risposte usano per impostazione predefinita service_tier=auto. Se per un progetto è abilitato Scale Tier, le richieste che omettono service_tier (o usano auto) utilizzeranno Scale Tier per impostazione predefinita quando è disponibile la quota Scale Tier. Le richieste con service_tier=default utilizzeranno risorse di calcolo condivise/PAYG.

Come posso visualizzare la cronologia dei miei acquisti e i token scaduti?

Puoi visualizzare la cronologia degli acquisti di Scale Tier nella pagina Scale Tier selezionando un modello sotto Token forniti.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Una volta selezionato un modello, potrai visualizzare i token scaduti e le transazioni precedenti in fondo alla pagina.

Image

Come posso modificare la capacità dei miei token?

Puoi modificare la capacità di token di un modello selezionando un modello nella sezione Token forniti nella pagina Scale Tier. Dopo aver selezionato un modello, trova il tuo acquisto sotto l'intestazione Attivi e seleziona Annulla accanto all'acquisto per modificarlo

Image

Nella finestra modale, inserisci direttamente il numero di unità da annullare oppure usa il cursore per regolare il modello TPM mentre effettui la selezione.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Come posso visualizzare i miei RPM/TPM e l'utilizzo di Scale Tier?

Puoi visualizzare un riepilogo dell'utilizzo dell'API per la tua organizzazione nella pagina Scale Tier. Tutte le date e gli orari si basano sul fuso orario UTC e i dati potrebbero subire un ritardo fino a 5 minuti.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Puoi consultare il tuo utilizzo nel Dashboard di utilizzo delle attività selezionando i modelli del tuo Scale Tier nel menu a discesa dei modelli. È possibile visualizzare questi dati in finestre temporali di 30 giorni, 1 giorno e 15 minuti. I dati di utilizzo vengono raggruppati per mostrare la quantità di utilizzo del modello coperta da Scale Tier rispetto alla quantità di utilizzo coperta dal piano dell'account.

Nota: solo i proprietari dell'organizzazione possono visualizzare il dashboard di utilizzo.

Quando vedrò la variazione della mia capacità di token visualizzata nel dashboard di utilizzo?

Potrebbero volerci fino a 24 ore prima che le modifiche che hai apportato vengano visualizzate. Le modifiche entreranno in vigore quasi immediatamente.

Questo articolo è stato utile?