Preguntas frecuentes sobre recuperación visual con PDF

¿Qué es esta función?

ChatGPT Enterprise ahora permite leer y comprender elementos visuales (imágenes, gráficos, diagramas, etc.) incrustados en archivos PDF incluidos en prompts. Los usuarios pueden subir un PDF, y ChatGPT puede interpretar el texto y cualquier elemento visual dentro de ese archivo.

¿Cómo funciona?

Haz clic en el icono del clip (adjuntar) en el chat para subir tu PDF.
ChatGPT leerá tanto el texto como cualquier imagen o diagrama incrustado en el PDF.
Después puedes hacer preguntas o solicitar resúmenes: desde extraer los puntos principales de un informe hasta explicar gráficos complejos.

¿Es compatible con GPTs y Proyectos?

Parcialmente. Los PDF subidos como Conocimiento de GPT o Archivos de proyecto se procesan mediante recuperación solo de texto. Los PDF que suben los usuarios durante interacciones con un GPT publicado o dentro de una conversación de proyecto se procesan mediante recuperación visual.

¿Quién puede usarla?

Esta capacidad está disponible solo para clientes de ChatGPT Enterprise. No se admite en cuentas de ChatGPT Gratis, Pro, Team o Edu.

¿Qué problema resuelve?

Antes, ChatGPT solo podía procesar imágenes cuando se subían por separado (p. ej., como PNG/JPEG). Los elementos visuales incrustados en un PDF se pasaban por alto. Ahora, ChatGPT puede ofrecer un análisis más integral —combinando el texto y los elementos visuales de una vez—, lo que da lugar a respuestas más precisas y ricas en contexto.

¿Se ampliará esta función a otros planes más adelante?

Actualmente es exclusiva de Enterprise y podría ampliarse en el futuro. Estamos supervisando los comentarios de los clientes para determinar cuándo y cómo ampliar la compatibilidad.