Preguntas frecuentes sobre la API Batch

¿Cómo funciona la API Batch?

El punto de acceso de la API Batch, tal como se documenta aquí, permite a los usuarios enviar solicitudes para su procesamiento por lotes de forma asíncrona. Procesaremos estas solicitudes en un plazo de 24 horas. Los detalles de cada solicitud se leerán de un archivo cargado previamente, y las respuestas se escribirán en un archivo de salida. Puedes consultar el objeto de lote para obtener actualizaciones de estado y resultados.

¿Cuál es el precio de la API Batch?

Cada modelo se ofrecerá con un descuento del 50 % en el coste frente a las API síncronas. Aquí tienes más información sobre los precios de nuestra API.

¿Qué modelos puedo usar por lotes?

La API Batch está ampliamente disponible en la mayoría de nuestros modelos, pero no en todos. Consulta la documentación de referencia de modelos para asegurarte de que el modelo que usas admite la API Batch.

¿Qué ocurre si la API no completa mi solicitud dentro del plazo prometido?

Nuestro objetivo es completar todas las solicitudes en un plazo de 24 horas. Si un lote caduca (es decir, no se pudo completar dentro del plazo del SLA), el trabajo restante se cancela y se devuelve cualquier trabajo ya completado. Se cobrará a los desarrolladores por cualquier trabajo completado.

¿Cuál es el límite de solicitudes que puedo procesar por lotes?

Las API de embeddings tienen un límite de 1 millón de solicitudes en cola a la vez.

Para todas las demás API, no hay límite en el número de solicitudes que puedes procesar por lotes; sin embargo, cada nivel de uso tiene un límite de solicitudes por lotes asociado. Tu límite de solicitudes por lotes incluye el número máximo de tokens de entrada que tienes en cola a la vez. Puedes encontrar tus límites de solicitudes aquí.

¿Puedo cambiar el tiempo que tarda en responder la API Batch?

Nuestro plazo especificado actual es de 24 horas. Actualmente no podemos cambiar este plazo.

¿Se admite el streaming en la API Batch?

No, el streaming no se admite en la API Batch. Las solicitudes por lotes devuelven resultados mediante archivos de salida en lugar de respuestas transmitidas por streaming.

¿Se admiten imágenes en la API Batch?

Sí, se admiten imágenes en la API Batch.

He recibido el mensaje de error «La URL proporcionada para esta solicitud no coincide por prefijo con el punto de acceso de lote». ¿Qué debo hacer?

Si recibes este error, significa que tu URL tiene un formato incorrecto para el punto de acceso de la API Batch. Consulta nuestra documentación aquí para asegurarte de que estás llamando correctamente al punto de acceso.

¿El uso de la API Batch cuenta para mis otros límites de solicitudes?

Los límites de solicitudes de la API Batch son completamente independientes de los límites existentes.

¿Qué ocurre si se cancela un lote?

Si un lote se cancela manualmente, se devuelven los resultados que ya se hayan completado. Se cobrará a los desarrolladores por cualquier trabajo completado.

¿Qué ocurre si un lote caduca?

Si un lote caduca (es decir, no se pudo completar dentro del plazo del SLA), el trabajo restante se cancela y se devuelve cualquier trabajo ya completado. Se cobrará a los desarrolladores por cualquier trabajo completado.

¿Qué estados puedo esperar en los trabajos por lotes?

El trabajo por lotes puede tener cualquiera de los siguientes estados: validando, fallido, en curso, finalizando, completado, caducado, cancelando y cancelado. Si compruebas los valores de estado de la API mediante programación, usa los literales en minúsculas: validating, failed, in_progress, finalizing, completed, expired, cancelling y cancelled.

Validando: la validación del archivo cargado está en curso antes de que el lote pueda comenzar.
Fallido: el archivo no ha superado el proceso de validación.
En curso: el archivo se ha validado correctamente y el proceso por lotes está en marcha.
Finalizando: el trabajo por lotes se ha completado y se están preparando los resultados.
Completado: el trabajo por lotes está completo y los resultados están listos.
Caducado: el lote no se pudo completar dentro del plazo del SLA.
Cancelando: se ha iniciado la cancelación del trabajo por lotes.
Cancelado: el trabajo por lotes se ha cancelado.

¿Cómo puedo comprobar qué trabajos por lotes ya he creado?

Puedes obtener una lista de todos tus trabajos por lotes mediante la llamada a la API especificada aquí.

¿Se admite sin retención de datos en este punto de acceso?

Si tienes activada la opción sin retención de datos para tu organización, ten en cuenta que sin retención de datos no se aplica a la API Batch. Las organizaciones con ZDR pueden crear trabajos por lotes, pero los archivos de entrada por lotes, las salidas, los errores y los artefactos intermedios se conservan de acuerdo con las políticas configuradas de retención de Batch, File Service y Sediment.