Preguntas frecuentes sobre la API Assistants (v2)

A fecha del 11 de marzo de 2025, hemos publicado los componentes básicos de nuestra nueva plataforma de agentes. Para obtener más información, consulta nuestra documentación de la API para nuestra API de Responses, herramientas como Búsqueda web, Búsqueda de archivos y Uso del ordenador, y nuestro SDK de Agents con seguimiento. Basándonos en tus comentarios sobre la beta de la API de Assistants, hemos incorporado mejoras clave en la API de Responses. Después de lograr la paridad completa de funciones, anunciaremos un plan de obsolescencia de la API de Assistants más adelante este año, con una fecha objetivo de retirada en la primera mitad de 2026.

¿Qué es la API de Assistants?

La API de Assistants permite a los desarrolladores crear fácilmente potentes asistentes de IA dentro de sus aplicaciones. Esta API elimina la necesidad de gestionar el historial de conversaciones y añade acceso a herramientas alojadas por OpenAI, como el Intérprete de código y Búsqueda de archivos. La API también admite una llamada a funciones mejorada para herramientas de terceros.

¿Puedo seguir usando Assistants API v1 beta?

No. A partir del 18 de diciembre de 2024, los usuarios ya no tienen acceso a la versión v1 de la beta de la API de Assistants. Actualmente solo admitimos v2. Consulta esta guía de migración para convertir tus llamadas a la API de v1 a v2

¿Cómo accedo a ella?

La API de Assistants está disponible para cualquier persona con una cuenta de la API de OpenAI, pero está obsoleta y se eliminará en agosto de 2026. Para proyectos nuevos, usa en su lugar la API de Responses. Si ya usas la API de Assistants, planifica tu migración a la API de Responses. Puedes seguir accediendo a asistentes existentes en Assistants Playground mientras la API siga disponible.

¿Qué es un asistente?

Un asistente representa una IA diseñada para un propósito específico que utiliza los modelos de OpenAI y puede acceder a archivos, mantener hilos persistentes y llamar a herramientas.

¿Qué es un hilo?

Un hilo es una sesión de conversación entre un asistente y un usuario. Los hilos simplifican el desarrollo de aplicaciones al almacenar el historial de mensajes y truncarlo cuando la conversación se vuelve demasiado larga para la longitud de contexto del modelo.

¿Qué es la herramienta Búsqueda de archivos?

La herramienta `file_search` implementa de serie varias prácticas recomendadas de recuperación para ayudarte a extraer los datos adecuados de tus archivos y aumentar las respuestas del modelo. Para obtener más información, lee nuestra documentación para desarrolladores.

De forma predeterminada, la herramienta file_search usa la siguiente configuración:

Tamaño de fragmento: 800 tokens
Solapamiento de fragmentos: 400 tokens
Modelo de embedding: `text-embedding-3-large` con 256 dimensiones
Número máximo de fragmentos añadidos al contexto: 20

¿Cuáles son las restricciones para subir archivos?

Las restricciones para subir un archivo son:

512 MB por archivo
5 M de tokens por archivo
10 000 archivos por almacén vectorial
1 almacén vectorial por asistente
1 almacén vectorial por hilo

El límite de almacenamiento total para cada proyecto de una organización es de 100 GB.

¿Cuáles son las limitaciones de la herramienta Búsqueda de archivos?

Tenemos algunas limitaciones conocidas para las que estamos trabajando en añadir compatibilidad en los próximos meses:

Actualmente no hay forma de modificar la configuración de fragmentación, embedding o recuperación.
No admitimos el análisis de imágenes dentro de documentos.
No admitimos recuperaciones sobre formatos de archivo estructurados (como archivos .csv o .jsonl). Consulta los tipos de archivo admitidos.

¿Cuáles son los límites de solicitudes de la API de Assistants?

Los límites de solicitudes de la API de Assistants no están vinculados al nivel de uso y modelo. En cambio, hay límites predeterminados por tipo de solicitud, con un par de excepciones:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 solicitudes por minuto

¿Cómo se tarifica el Intérprete de código en la API?

El Intérprete de código cuesta 0,03 $ por sesión. Si tu asistente llama al Intérprete de código simultáneamente en dos hilos diferentes, se crearían dos sesiones del Intérprete de código (2 * 0,03 $). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que solo pagarías esta tarifa una vez si tu usuario sigue dando instrucciones al Intérprete de código en el mismo hilo durante un máximo de una hora.

¿Cómo se tarifica Búsqueda de archivos en la API?

Búsqueda de archivos cuesta 0,10 $/GB de almacenamiento de almacén vectorial al día (el primer GB de almacenamiento es gratis). El tamaño del almacén vectorial se basa en el tamaño resultante del almacén vectorial una vez que tu archivo se ha analizado, fragmentado y convertido en embeddings.

Cualquier almacén vectorial que se haya creado antes del 17 de abril de 2024 será gratuito hasta finales de 2024, después de lo cual:

Se facturará a las tarifas vigentes (actualmente 0,10 $/GB/día) si se ha utilizado al menos una vez en un Run creado después del 17 de abril de 2024.
Se eliminará si no se ha utilizado en ningún Run entre el 17 de abril de 2024 y el 31 de diciembre de 2024; esto es para evitar que se te facture por almacenes vectoriales que quizá creaste antes de anunciarse este cambio de precios, pero que nunca usaste.

¿Hay algún límite en la cantidad de asistentes que puedo crear?

No hay ningún límite en la cantidad de asistentes que puede crear una organización.

¿Está disponible el streaming en la API?

Sí, el streaming está disponible en la API de Assistants.

¿Está disponible el modo JSON en la API de Assistants?

Sí, el modo JSON está disponible en la API de Assistants mediante el parámetro response_format en los objetos Assistants o Run.

¿La API de Assistants también gestionará solicitudes para llamadas a funciones de terceros?

No. Aunque la llamada a funciones permite al modelo seleccionar herramientas y dar formato a las solicitudes para ellas, OpenAI no gestiona la ejecución de llamadas a herramientas de terceros.

¿Cómo se gestionan los datos que envío a OpenAI?

Como ocurre con el resto de nuestra plataforma, los datos y archivos enviados a la API de OpenAI nunca se utilizan para entrenar nuestros modelos y puedes eliminar tus datos siempre que lo necesites. Los datos subidos a la API de Assistants se almacenan indefinidamente hasta que un usuario los elimina manualmente.

¿Está DALL-E disponible a través de la API de Assistants?

Por ahora, DALL-E no está disponible.

¿Hay una interfaz de usuario para la API de Assistants?

Puedes consultar el Playground de la API de Assistants. Asegúrate de estar en la vista Assistants de la barra lateral izquierda y de usar un modelo compatible con las herramientas que quieras activar.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

¿Cuál es el límite de caracteres para las instrucciones del asistente en la API de Assistants?

El campo de instrucciones del asistente tiene una longitud máxima de 256 000 caracteres.

Recibo un error como «El servidor tuvo un error al procesar tu solicitud. ¡Lo sentimos! Puedes reintentar tu solicitud o ponerte en contacto con nosotros a través de nuestro centro de ayuda en help.openai.com si el error persiste. ». ¿Qué debo hacer?

Si recibes este error, puede significar que tu prompt no está configurado correctamente. Si sigues reintentando la solicitud y falla, aquí tienes algunas cosas que puedes probar:

asegúrate de reestructurar tu prompt para tratar cualquier comando similar a una función como funciones
añade cualquier comando de tu prompt como una función a tools

¿Por qué mi herramienta Búsqueda de archivos no funciona bien?

Al usar la herramienta Búsqueda de archivos, recomendamos configurar max_prompt_tokens en no menos de 20 000. Para conversaciones más largas o múltiples interacciones con Búsqueda de archivos, plantéate aumentar este límite a 50 000 o, idealmente, eliminar por completo los límites de max_prompt_tokens para obtener resultados de la máxima calidad. Lee más aquí.

¿Cómo puedo enviar comentarios?

Nos encantaría conocer tus comentarios en nuestro foro de desarrolladores, a través del Centro de ayuda en help.openai.com o en Twitter @OpenAIDevs.