A fecha de 11 de marzo de 2025, hemos lanzado los componentes básicos de nuestra nueva plataforma Agents. Para más detalles, consulta nuestra documentación de la API para nuestra API de Responses, las herramientas, entre ellas Búsqueda web, Búsqueda de archivos y Uso del ordenador, y nuestro SDK de Agents con Tracing. A partir de vuestros comentarios sobre la beta de la API Assistants, hemos incorporado mejoras clave a la API de Responses. Cuando logremos la paridad total de funciones, anunciaremos un plan de retirada de la API Assistants más adelante este año, con una fecha prevista de fin de servicio en el primer semestre de 2026.
¿Qué es la API Assistants?
La API Assistants permite a los desarrolladores crear fácilmente asistentes de IA potentes dentro de sus aplicaciones. Esta API elimina la necesidad de gestionar el historial de conversación y añade acceso a herramientas alojadas por OpenAI, como Intérprete de código y Búsqueda de archivos. La API también admite una llamada a funciones mejorada para herramientas de terceros.
¿Puedo seguir usando la beta v1 de la API Assistants?
No. Desde el 18 de diciembre de 2024, los usuarios ya no tienen acceso a la versión v1 de la beta de la API Assistant. Actualmente solo admitimos v2. Consulta esta guía de migración para convertir tus llamadas a la API de v1 a v2
¿Cómo accedo a ella?
La API Assistants está disponible para cualquier persona con una cuenta de la API de OpenAI. También puedes empezar a usarla a través del Playground de Assistants.
¿Qué es un Assistant?
Un assistant representa una IA creada para un propósito específico que utiliza los modelos de OpenAI y puede acceder a archivos, mantener threads persistentes y llamar herramientas.
¿Qué es un Thread?
Un thread es una sesión de conversación entre un assistant y un usuario. Los threads simplifican el desarrollo de aplicaciones al almacenar el historial de mensajes y truncarlo cuando la conversación se vuelve demasiado larga para la longitud de contexto del modelo.
¿Qué es la herramienta File Search?
La herramienta file_search implementa varias prácticas recomendadas de recuperación listas para usar para ayudarte a extraer los datos correctos de tus archivos y mejorar las respuestas del modelo. Para más información, consulta nuestra documentación para desarrolladores.
De forma predeterminada, la herramienta file_search utiliza la siguiente configuración:
Tamaño de fragmento: 800 tokens
Solapamiento de fragmentos: 400 tokens
Modelo de embedding:
text-embedding-3-largecon 256 dimensionesNúmero máximo de fragmentos añadidos al contexto: 20
¿Cuáles son las restricciones para la carga de archivos?
Las restricciones para subir un archivo son:
512 MB por archivo
5M tokens por archivo
10k archivos por almacén de vectores
1 almacén de vectores por assistant
1 almacén de vectores por thread
El límite total de almacenamiento para cada proyecto de una organización es de 100 GB.
¿Cuáles son las limitaciones de la herramienta File Search?
Tenemos algunas limitaciones conocidas para las que estamos trabajando en añadir compatibilidad en los próximos meses:
Actualmente no hay forma de modificar la configuración de fragmentación, embedding o recuperación.
No admitimos el análisis de imágenes dentro de documentos.
No admitimos recuperaciones sobre formatos de archivo estructurados (como archivos .csv o .jsonl). Consulta los tipos de archivo compatibles.
¿Cuáles son los límites de velocidad de la API Assistants?
Los límites de velocidad de la API Assistants no están vinculados al nivel de uso y al modelo. En su lugar, hay límites predeterminados por tipo de solicitud, con un par de excepciones:
GET: 1000 RPM
POST: 300 RPM
POST a
/v1/threads/<thread_id>/runs: 200 RPMPOST a
/v1/threads/runs: 200 RPM
DELETE: 300 solicitudes por minuto
¿Cómo se tarifica Intérprete de código en la API?
Intérprete de código tiene un precio de 0,03 $ por sesión. Si tu assistant llama a Intérprete de código simultáneamente en dos threads diferentes, esto crearía dos sesiones de Intérprete de código (2 * 0,03 $). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que solo pagarías esta tarifa una vez si tu usuario sigue dando instrucciones a Intérprete de código en el mismo thread durante hasta una hora.
¿Cómo se tarifica File Search en la API?
File Search tiene un precio de 0,10 $/GB de almacenamiento del almacén de vectores al día (el primer GB de almacenamiento es gratuito). El tamaño del almacén de vectores se basa en el tamaño resultante del almacén de vectores una vez que el archivo se ha analizado, fragmentado y vectorizado.
Cualquier almacén de vectores que se haya creado antes del 17 de abril de 2024 será gratuito hasta finales de 2024; después, ocurrirá una de estas dos cosas:
Se facturará a las tarifas vigentes (actualmente 0,10 $/GB/día) si se ha utilizado al menos una vez en un Run creado después del 17 de abril de 2024.
Se eliminará si no se ha utilizado en ningún Run entre el 17 de abril de 2024 y el 31 de diciembre de 2024; esto es para evitar que se te facture por almacenes de vectores que pudieras haber creado antes de que se anunciara este cambio de precios, pero que nunca llegaste a usar.
¿Hay un límite en el número de assistants que puedo crear?
No hay límite en el número de assistants que puede crear una organización.
¿Está disponible el streaming en la API?
Sí, el streaming está disponible en la API Assistants.
¿Está disponible el modo JSON en la API Assistants?
Sí, el modo JSON está disponible en la API Assistants a través del parámetro response_format en los objetos Assistants o Run.
¿La API Assistants también gestionará las solicitudes de llamadas a funciones de terceros?
No. Aunque la llamada a funciones permite que el modelo seleccione herramientas y les dé formato a las solicitudes, la ejecución de llamadas a herramientas de terceros no la gestiona OpenAI.
¿Cómo se gestionan los datos que envío a OpenAI?
Como ocurre con el resto de nuestra plataforma, los datos y archivos enviados a la API de OpenAI nunca se utilizan para entrenar nuestros modelos y puedes eliminar tus datos siempre que lo necesites. Los datos subidos a la API Assistants se almacenan indefinidamente hasta que un usuario los elimina manualmente.
¿Está disponible DALL-E a través de la API Assistants?
En este momento, DALL-E no está disponible.
¿Existe una interfaz de usuario para la API Assistants?
Puedes consultar el Playground de la API Assistants. Asegúrate de estar en la vista Assistants de la barra lateral izquierda y de usar un modelo compatible con las herramientas que quieras activar.

¿Cuál es el límite de caracteres para las instrucciones del assistant en la API Assistants?
Las instrucciones del sistema que utiliza el assistant tienen una longitud máxima de 256.000 caracteres.
Estoy recibiendo un error como «The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. » ¿Qué debo hacer?
Si recibes este error, podría significar que tu prompt no está configurado correctamente. Si sigues reintentando la solicitud y falla, aquí tienes algunas cosas que puedes probar:
asegúrate de reestructurar tu prompt para tratar cualquier comando similar a una función como si fuera una función
añade cualquier comando de tu prompt como una función a
tools
¿Por qué mi herramienta File Search no funciona bien?
Al usar la herramienta File Search, recomendamos establecer max_prompt_tokens en no menos de 20.000. Para conversaciones más largas o múltiples interacciones con File Search, plantéate aumentar este límite a 50.000 o, idealmente, eliminar por completo los límites de max_prompt_tokens para obtener resultados de la máxima calidad. Más información aquí.
¿Cómo puedo enviar comentarios?
Nos encantaría conocer tus comentarios en nuestro foro para desarrolladores, a través del Centro de ayuda en help.openai.com o en Twitter @OpenAIDevs.
