OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Preguntas frecuentes sobre recuperación visual con PDF

Actualización: 18 days ago

¿Qué es esta función?

ChatGPT Enterprise ahora permite leer y comprender elementos visuales (imágenes, gráficos, diagramas, etc.) incrustados en archivos PDF incluidos en los prompts. Los usuarios pueden subir un PDF, y ChatGPT puede interpretar el texto y cualquier elemento visual dentro de ese archivo.

¿Cómo funciona?

  1. Haz clic en el icono del clip (archivo adjunto) en el chat para subir tu PDF.

  2. ChatGPT leerá tanto el texto como cualquier imagen o diagrama incrustado en el PDF.

  3. Después, puedes hacer preguntas o pedir resúmenes: desde extraer los puntos principales de un informe hasta explicar gráficos complejos.

¿Es compatible con GPT y Proyectos?

Parcialmente. Los PDF subidos como Conocimiento de GPT o archivos de proyecto se procesan mediante recuperación solo de texto. Los PDF que suben los usuarios durante interacciones con un GPT publicado o dentro de una conversación de proyecto se procesan mediante recuperación visual.

¿Quién puede usarlo?

Esta capacidad solo está disponible para clientes de ChatGPT Enterprise. No es compatible con cuentas de ChatGPT Gratis, Pro, Team o Edu.

¿Qué problema resuelve?

Antes, ChatGPT solo podía procesar imágenes cuando se subían por separado (p. ej., como PNG/JPEG). Los elementos visuales incrustados en un PDF se pasaban por alto. Ahora, ChatGPT puede ofrecer un análisis más completo, combinando el texto y los elementos visuales de una sola vez, lo que da lugar a respuestas más precisas y con más contexto.

¿Esta función acabará ampliándose a otros planes?

Actualmente es exclusiva de Enterprise y podría ampliarse en el futuro. Estamos supervisando los comentarios de los clientes para determinar cuándo y cómo ampliar la compatibilidad.

¿Te ha resultado útil este artículo?