FAQ su Assistants API (v2)

A partire dall’11 marzo 2025, abbiamo rilasciato i componenti fondamentali della nostra nuova piattaforma Agents. Per i dettagli, consulta la nostra documentazione API per la Responses API, gli strumenti inclusi Web Search, File Search e Computer Use, e il nostro Agents SDK con Tracing. Sulla base del vostro feedback sulla beta di Assistants API, abbiamo incorporato miglioramenti chiave nella Responses API. Dopo aver raggiunto la piena parità di funzionalità, annunceremo un piano di deprecazione di Assistants API più avanti nel corso di quest’anno, con una data di dismissione prevista per la prima metà del 2026.

Che cos’è l’Assistants API?

L’Assistants API consente agli sviluppatori di creare facilmente potenti assistenti IA all’interno delle loro app. Questa API elimina la necessità di gestire la cronologia delle conversazioni e aggiunge l’accesso a strumenti ospitati da OpenAI come Code Interpreter e File Search. L’API supporta anche un miglioramento del function calling per strumenti di terze parti.

Posso ancora usare Assistants API v1 beta?

No. A partire dal 18 dicembre 2024 gli utenti non hanno più accesso alla versione v1 della beta di Assistants API. Attualmente supportiamo solo la v2. Consulta questa guida alla migrazione per convertire le tue chiamate API dalla v1 alla v2

Come posso accedervi?

Assistants API è disponibile per chiunque abbia un account OpenAI API. Puoi anche iniziare tramite l’Assistants Playground.

Che cos’è un Assistant?

Un assistant rappresenta un’IA progettata per uno scopo specifico, che utilizza i modelli di OpenAI e può accedere ai file, mantenere thread persistenti e chiamare strumenti.

Che cos’è un Thread?

Un thread è una sessione di conversazione tra un assistant e un utente. I thread semplificano lo sviluppo delle applicazioni memorizzando la cronologia dei messaggi e troncandola quando la conversazione diventa troppo lunga per la lunghezza del contesto del modello.

Che cos’è lo strumento File Search?

Lo strumento file_search implementa diverse best practice di retrieval pronte all’uso per aiutarti a estrarre dai tuoi file i dati corretti per arricchire le risposte del modello. Per maggiori informazioni, leggi la nostra documentazione per sviluppatori.

Per impostazione predefinita, lo strumento file_search utilizza le seguenti impostazioni:

Dimensione dei chunk: 800 token
Sovrapposizione dei chunk: 400 token
Modello di embedding: text-embedding-3-large a 256 dimensioni
Numero massimo di chunk aggiunti al contesto: 20

Quali sono le restrizioni per il caricamento dei file?

Le restrizioni per caricare un file sono:

512 MB per file
5 milioni di token per file
10.000 file per vector store
1 vector store per assistant
1 vector store per thread

Il limite di archiviazione complessivo per ogni progetto in un’organizzazione è di 100 GB.

Quali sono le limitazioni dello strumento File Search?

Ci sono alcune limitazioni note su cui stiamo lavorando per aggiungere il supporto nei prossimi mesi:

Al momento non c’è modo di modificare le impostazioni di chunking, embedding o retrieval.
Non supportiamo l’analisi di immagini all’interno dei documenti.
Non supportiamo retrieval su formati di file strutturati (come file .csv o .jsonl). Vedi i tipi di file supportati.

Quali sono i limiti di rate per Assistants API?

I limiti di rate per Assistants API non sono legati a tier di utilizzo e modello. Invece, esistono limiti predefiniti per tipo di richiesta, con un paio di eccezioni:

GET: 1000 RPM
POST: 300 RPM
- POST a /v1/threads/<thread_id>/runs: 200 RPM
- POST a /v1/threads/runs: 200 RPM
DELETE: 300 richieste al minuto

Come viene tariffato Code Interpreter nell’API?

Code Interpreter costa $0,03 / sessione. Se il tuo assistant richiama Code Interpreter contemporaneamente in due thread diversi, verranno create due sessioni di Code Interpreter (2 * $0,03). Ogni sessione è attiva per impostazione predefinita per un’ora, il che significa che pagheresti questa tariffa una sola volta se il tuo utente continua a dare istruzioni a Code Interpreter nello stesso thread per un massimo di un’ora.

Come viene tariffato File Search nell’API?

File Search costa $0,10/GB al giorno di archiviazione del vector store (il primo GB di archiviazione è gratuito). La dimensione del vector store si basa sulla dimensione risultante del vector store una volta che il file è stato analizzato, suddiviso in chunk e trasformato in embedding.

I vector store creati prima del 17 aprile 2024 saranno gratuiti fino alla fine del 2024, dopodiché saranno:

Fatturati alle tariffe correnti (attualmente $0,10/GB/giorno) se sono stati utilizzati almeno una volta in un Run creato dopo il 17 aprile 2024.
Eliminati se non sono stati utilizzati in neanche un Run tra il 17 aprile 2024 e il 31 dicembre 2024 — per evitare che ti venga addebitato il costo di vector store che potresti aver creato prima che venisse annunciata questa modifica di prezzo, ma che non hai mai usato.

C’è un limite al numero di assistant che posso creare?

Non c’è alcun limite al numero di assistant che un’organizzazione può creare.

Lo streaming è disponibile nell’API?

Sì, lo streaming è disponibile su Assistants API.

La modalità JSON è disponibile in Assistants API?

Sì, la modalità JSON è disponibile su Assistants API tramite il parametro response_format sugli oggetti Assistants o Run.

Assistants API gestirà anche le richieste per le chiamate di funzioni di terze parti?

No. Anche se il function calling consente al modello di selezionare gli strumenti e formattare le richieste per essi, l’esecuzione delle chiamate a strumenti di terze parti non è gestita da OpenAI.

Come vengono gestiti i dati che invio a OpenAI?

Come per il resto della nostra piattaforma, i dati e i file inviati all’OpenAI API non vengono mai usati per addestrare i nostri modelli e puoi eliminare i tuoi dati quando vuoi. I dati caricati su Assistants API vengono archiviati a tempo indeterminato finché un utente non li elimina manualmente.

DALL-E è disponibile tramite Assistants API?

Al momento, DALL-E non è disponibile.

Esiste una UI per Assistants API?

Puoi provare il Playground per Assistants API. Assicurati di trovarti nella vista Assistants nella barra laterale sinistra e di utilizzare un modello compatibile con gli strumenti che vuoi attivare.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Qual è il limite di caratteri per le istruzioni dell’assistant in Assistants API?

Le istruzioni di sistema utilizzate dall’assistant hanno una lunghezza massima di 256.000 caratteri.

Ricevo un errore del tipo “The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. “ Cosa devo fare?

Se ricevi questo errore, potrebbe significare che il tuo prompt non è impostato correttamente. Se continui a riprovare la richiesta e fallisce, ecco alcune cose da provare:

assicurati di ristrutturare il prompt in modo da trattare eventuali comandi simili a funzioni come funzioni
aggiungi eventuali comandi nel prompt come funzione in tools

Perché lo strumento File Search non funziona bene?

Quando usi lo strumento File Search, consigliamo di impostare max_prompt_tokens ad almeno 20.000. Per conversazioni più lunghe o più interazioni con File Search, valuta di aumentare questo limite a 50.000 oppure, idealmente, di rimuovere del tutto i limiti di max_prompt_tokens per ottenere risultati della massima qualità. Leggi di più qui.

Come posso inviare un feedback?

Saremmo felici di ricevere il tuo feedback nel nostro Developer Forum, tramite l’Help Center su help.openai.com, oppure su Twitter @OpenAIDevs.