Nota: La conservación de datos para determinados servicios puede verse afectada por novedades legales recientes; consulta nuestra entrada del blog para más detalles
Preguntas frecuentes generales
¿Qué son los chats de voz?
Las conversaciones de voz te permiten mantener una conversación hablada con ChatGPT, lo que posibilita una interacción más conversacional y natural. Puedes hacer preguntas o mantener debates mediante entrada de voz y recibir una respuesta hablada de ChatGPT. Las conversaciones de voz funcionan con modelos multimodales nativos y están disponibles para todos los usuarios que hayan iniciado sesión en las apps móviles de ChatGPT y en la web de escritorio en ChatGPT.com.
Las conversaciones de voz pueden cometer errores, así que comprueba la información importante. Puedes obtener más información sobre ChatGPT y la precisión aquí. El acceso a Voice y los límites de uso asociados están sujetos a cambios.
¿Cómo inicio una conversación de voz?
En móvil
Para iniciar una conversación de voz, selecciona el icono de Voz en la parte inferior derecha de la pantalla:
La voz de ChatGPT puede aparecer como una experiencia de voz dentro del chat principal o como un modo independiente (la pantalla del orbe azul). La mayoría de los usuarios de iOS y Android verán la experiencia integrada de forma predeterminada, pero algunas cuentas pueden tener temporalmente solo el modo independiente mientras implementamos actualizaciones. Puedes cambiar al modo independiente (o volver) en Configuración → Voz → Modo independiente.
Cuando estés manteniendo una conversación de voz, puedes silenciar o activar tu micrófono seleccionando el icono del micrófono en la parte inferior izquierda de la pantalla.
Puedes finalizar la conversación pulsando el icono de salida en la parte inferior derecha de la pantalla.
Si inicias un chat de voz por primera vez, también se te pedirá que elijas una voz. Ten en cuenta que el volumen de la voz en el selector puede ser diferente del volumen durante la conversación de voz. Puedes cambiar tu voz en cualquier momento en la configuración o desde el modo de voz usando el menú de personalización en la esquina superior derecha.
Ten en cuenta que tendrás que conceder a la app de ChatGPT permiso para acceder al micrófono para usar esta función.
En la web
Las conversaciones de voz están disponibles en la web de escritorio en ChatGPT.com.
Para iniciar una conversación de voz en chatgpt.com, selecciona el icono de Voz en el lado derecho de la ventana del prompt:

Si es la primera vez que usas la voz en tu navegador, es posible que tengas que conceder permiso al navegador para acceder al micrófono de tu dispositivo.
Cuando estés manteniendo una conversación de voz, puedes silenciar o activar tu micrófono seleccionando el icono del micrófono en la parte inferior izquierda de la pantalla.
Puedes finalizar la conversación pulsando el icono de salida en la parte inferior derecha de la pantalla.
Si inicias un chat de voz por primera vez, también se te pedirá que elijas una voz. Ten en cuenta que el volumen de la voz en el selector puede ser diferente del volumen durante la conversación de voz.
Puedes cambiar tu voz en cualquier momento en la configuración o desde el modo de voz usando el menú de personalización en la esquina superior derecha.
¿Cómo comparto mi vídeo con ChatGPT durante una conversación de voz?
El vídeo está habilitado en las apps móviles de iOS y Android para suscriptores. Puedes compartir vídeo desde tus dispositivos en cualquier momento durante un chat de voz seleccionando el botón de la cámara en la parte inferior de la pantalla.
Puedes volver a pulsar este botón para dejar de compartir tu vídeo con ChatGPT.
¿Cómo comparto una foto o mi pantalla con ChatGPT durante una conversación de voz?
La compartición de pantalla y las subidas de imágenes están habilitadas en las apps móviles de iOS y Android solo para suscriptores. Puedes pulsar el botón de los tres puntos y seleccionar Compartir pantalla en el menú emergente para compartir una imagen o tu pantalla con ChatGPT.
Si eliges la opción de hacer una foto, se abrirá tu cámara para que puedas hacerla y subirla a tu conversación de voz de inmediato. Si eliges la opción de subir una foto, podrás seleccionar entre las imágenes de tu teléfono para compartirla con ChatGPT en tu conversación de voz.
Si seleccionas compartir pantalla, aparecerán las opciones de compartición de pantalla de tu teléfono, lo que te permitirá transmitir tu pantalla a ChatGPT.
¿Cómo dejo de compartir mi pantalla con ChatGPT durante una conversación de voz?
Una vez que hayas comenzado a compartir pantalla, puedes volver a tocar el botón de compartir pantalla para dejar de compartir tu pantalla con ChatGPT.
Si estás compartiendo pantalla fuera de la app, puedes tocar el indicador del sistema de tu teléfono (Apple muestra un punto rojo en la parte superior de la pantalla y Android muestra un micrófono verde en la parte superior de la pantalla). Aparecerá una ventana emergente en la pantalla indicándote que detengas la compartición de pantalla. También puedes volver a la app y detenerla directamente tocando el botón de compartir pantalla o el botón «x», lo que también finalizará la conversación.
¿Cuántas opciones de voz hay disponibles?
Elige entre nueve voces de salida realistas para ChatGPT, cada una con su propio tono y carácter distintivos:
Arbor - Desenfadada y versátil
Breeze - Expresiva y sincera
Cove - Serena y directa
Ember - Segura y optimista
Juniper - Abierta y animada
Maple - Alegre y franca
Sol - Astuta y relajada
Spruce - Tranquila y reafirmante
Vale - Brillante e inquisitiva
¿Durante cuánto tiempo puedo tener chats de voz (solo audio)?
Para los suscriptores, tu uso diario de la voz de ChatGPT es prácticamente ilimitado cada día, y los límites pueden cambiar. Para estos usuarios, las sesiones de voz comienzan automáticamente con nuestro modelo de voz más avanzado: GPT-4o. Cuando hayas usado todos tus minutos diarios de GPT-4o, podrás seguir chateando en modo de voz con GPT-4o mini.
Para usuarios empresariales con planes de precios flexibles, el uso de la voz de ChatGPT con GPT-4o es ilimitado, sujeto al consumo de créditos. Más información sobre los planes de precios flexibles.
Para los usuarios Free que hayan iniciado sesión, el uso de la voz de ChatGPT funciona con GPT-4o mini y está sujeto a un límite de 2 horas al día. Los límites pueden cambiar.
Los suscriptores Pro tienen uso ilimitado de la voz con GPT-4o, sujeto a medidas de protección contra abusos. Más información sobre nuestro plan Pro y los límites asociados.
¿Durante cuánto tiempo puedo usar vídeo y compartir pantalla en mis chats de voz?
Por usuario, el uso de las funciones de vídeo y de compartir pantalla está limitado diariamente en todos los planes aptos. Mostramos un aviso cuando te acercas al límite diario.
Para los suscriptores, una vez alcanzado el límite diario de uso de voz con GPT-4o, pasarás a GPT-4o mini y ya no podrás compartir nuevo contenido de vídeo o de pantalla hasta que se restablezca tu límite de uso de GPT-4o.
El uso de las funciones de vídeo y de compartir pantalla también está limitado por conversación. Si alcanzas el límite de conversación, podrás iniciar un nuevo chat para seguir usando vídeo y compartición de pantalla hasta alcanzar tu límite de uso.
¿Por qué solo veo la pantalla de voz con el orbe azul y puedo cambiarla?
La voz de ChatGPT puede aparecer como una experiencia de voz dentro del chat principal o como un modo independiente (la pantalla del orbe azul). La mayoría de los usuarios de iOS y Android verán la experiencia integrada de forma predeterminada, pero algunas cuentas pueden tener temporalmente solo el modo independiente mientras implementamos actualizaciones. Puedes cambiar al modo independiente (o volver) en Configuración → Voz → Modo independiente.
¿Puedo mantener una conversación en segundo plano mientras uso otras apps o con la pantalla del teléfono bloqueada?
Sí, puedes mantener una conversación en segundo plano activando «Conversaciones en segundo plano» en la configuración.
Si inicias una conversación de voz con la opción de conversaciones en segundo plano activada, la conversación continuará hasta que ocurra una de las siguientes situaciones:
Finalizas la conversación manualmente
Fuerzas el cierre de la app
Alcanzas tu límite diario de uso (que varía según tu plan de ChatGPT)
La conversación supera 1 hora de duración
Mientras compartes pantalla con la app de ChatGPT en segundo plano, seguirás compartiendo pantalla hasta que ocurra una de las situaciones anteriores, desactives la compartición de pantalla o bloquees la pantalla.
¿Tenéis algún consejo para evitar interrupciones en las conversaciones de voz?
Ocasionalmente, pueden producirse interrupciones durante una conversación de voz. Recomendamos mantener las conversaciones de voz con auriculares.
En iPhone, activar el modo de micrófono Aislamiento de voz puede ayudar a evitar interrupciones no intencionadas. Puedes activar Aislamiento de voz abriendo tu Centro de control mientras mantienes una conversación de voz, seleccionando Modo de micrófono y cambiando a Aislamiento de voz.
Si sigues teniendo problemas, te recomendamos cerrar la app y reiniciarla, subir el volumen de tu asistente o ir a un entorno más silencioso.
¿Puedo tener conversaciones de voz con GPT?
Sí, las conversaciones de voz están disponibles con GPT. Los GPT tienen su propia opción de voz llamada Shimmer, claramente distinta de las nueve voces de salida disponibles para usar al mantener conversaciones de voz con ChatGPT.
Ten en cuenta que el modo de voz aún no admite herramientas como la generación de imágenes, las subidas de archivos o el Intérprete de código. Las acciones personalizadas en los GPT no están disponibles en el modo de voz.
¿Cómo cambio de voz durante un chat de voz?
Puedes cambiar tu voz en la configuración o desde el menú de personalización en la esquina superior derecha del modo de voz.
Las voces se establecen por conversación. Si cambias tu voz dentro del modo de voz, se te pedirá que inicies un nuevo chat.
¿Por qué las transcripciones de voz a veces no coinciden con la conversación que tuve?
Las conversaciones de voz son inherentemente multimodales, lo que permite un intercambio directo de audio entre tú y el modelo. Como resultado, al transcribirse ese audio, es posible que la transcripción no siempre coincida perfectamente con la conversación original.
¿Las conversaciones de voz incluyen subtítulos?
Puedes activar subtítulos para las respuestas del modelo en iOS y Android pulsando el botón «cc» en la esquina superior derecha dentro del modo de voz.
Cuando salgas de una conversación de voz, la transcripción se añadirá a tu conversación actual basada en texto con ChatGPT. Puedes volver a consultar la transcripción de tu conversación en tu historial de chats, en el lado izquierdo de la app de ChatGPT en la web y en el menú del lado izquierdo de la app móvil de ChatGPT.
¿Cuántas conversaciones de voz puedo tener a la vez?
Solo puedes tener un chat de voz a la vez.
¿Por qué el modo de voz o el dictado detectan un idioma distinto del que estoy hablando?
A veces, el idioma que hablas puede no reflejarse con precisión en nuestra función de entrada por voz. Puedes corregir verbalmente al modelo para que hable el idioma que prefieras. En el caso del dictado, también puedes especificar un idioma preferido en la Configuración de la app para lograr una detección más precisa.
Abre la barra lateral seleccionando las dos líneas de la parte superior izquierda de la pantalla y selecciona tu nombre en la parte inferior para abrir Configuración.
En la página de Configuración, desplázate hacia abajo hasta la sección Voz. Haz clic en el desplegable «Idioma principal» para seleccionar tu idioma.
Privacidad y controles
¿Cuánto tiempo conserváis los clips de audio y vídeo de mis chats de voz?
Con las conversaciones de voz, los clips de audio y vídeo de tus chats de voz se almacenan junto con la transcripción que aparece en tu historial de chats. Mostramos un indicador visual en el historial de chats que señala qué chats se realizan con el modo de voz avanzado: solo tienes que buscar el texto atenuado y el pequeño micrófono o la cámara.
Los clips de audio y vídeo de los mensajes de tus chats de voz se conservarán durante 30 días. Cuando elimines el chat, también eliminaremos el clip de audio y vídeo asociado en un plazo de 30 días, salvo que necesitemos conservarlo por motivos legales o de seguridad, o si anteriormente compartiste tus clips de audio o vídeo con nosotros para entrenar nuestros modelos y el clip de audio o vídeo ya se había desvinculado de tu cuenta.
No puedes recuperar los chats una vez los eliminas. Si quieres que un chat deje de ser visible en tu historial, pero conservarlo en tu cuenta, debes usar la función de archivo. Los clips de audio y vídeo asociados a chats archivados se siguen conservando.
Consulta este artículo para entender cómo se puede usar el contenido para entrenar nuestros modelos y qué opciones tienes.
Si estás usando nuestro antiguo modo de voz estándar, los clips de audio de ChatGPT se transcriben antes de que generemos una respuesta. Eliminamos los clips de audio una vez completada la transcripción, a menos que hayas decidido compartir tus clips de audio para entrenar nuestros modelos. (Nota: los clips de audio se eliminan incluso si la propia transcripción falla). Más información sobre cómo compartir tu audio para entrenar nuestros modelos.
¿Entrenáis vuestros modelos con clips de audio o vídeo de chats de voz?
No, a menos que elijas compartir clips de audio o vídeo de chats de voz para que entrenemos nuestros modelos.
Si tienes activado Mejorar el modelo para todos, podremos usar transcripciones y otros archivos (como imágenes subidas a la conversación) de tus chats de voz para entrenar nuestros modelos, según tus opciones y tu plan. Pero no usaremos los clips de audio o vídeo asociados para entrenar nuestros modelos a menos que nos los hayas compartido para el entrenamiento del modelo. Más información sobre tus opciones.
Compartir audio o vídeo para entrenar nuestros modelos
De forma predeterminada, no entrenaremos nuestros modelos con clips de audio o vídeo, incluidos clips de compartición de pantalla, de chats de voz. Pero los usuarios de Free, Plus y Pro pueden elegir compartir clips de audio y vídeo de sus chats de voz para ayudarnos a entrenar nuestros modelos activando Mejorar el modelo para todos en Controles de datos y activando Incluir tus grabaciones de audio y Incluir tus grabaciones de vídeo.
También puedes responder afirmativamente cuando te invitemos a compartir clips de audio y vídeo para el entrenamiento.
Si tienes Mejorar el modelo para todos activado, podremos usar transcripciones y otros archivos (como imágenes subidas a la conversación) de tus chats de voz para entrenar nuestros modelos, incluso si no compartes clips de audio o vídeo de tus chats de voz.
¿Quién puede compartir audio y vídeo para entrenar modelos?
Los usuarios de ChatGPT con planes Free, Plus y Pro pueden compartir audio y/o vídeo desde Áreas de trabajo personales. Los usuarios no pueden compartir audio ni vídeo de chats de voz en Áreas de trabajo de ChatGPT Business, Edu y Enterprise.
¿Qué pasa si comparto mi audio y vídeo para entrenar modelos?
Si eliges compartir tu audio y vídeo de chats de voz, a partir de ese momento usaremos el audio y el vídeo de tu conversación para entrenar nuestros modelos. Más información sobre cómo usamos tu contenido para entrenar nuestros modelos. Puede que sea necesario que nuestro equipo revise los clips de audio o vídeo que hayas compartido con nosotros para poder utilizarlos en el entrenamiento. Por ejemplo, una persona de nuestro equipo podría escuchar una grabación de audio asociada a una señal de comentarios negativos para identificar dónde ChatGPT podría haber malinterpretado lo que se dijo.
¿Cómo puedo dejar de compartir audio y vídeo?
Puedes dejar de compartirlo desde la página de controles de datos en la configuración de ChatGPT. Solo tienes que desactivar los interruptores incluir tus grabaciones de audio o incluir tus grabaciones de vídeo, o desactivar por completo Mejorar el modelo para todos.
¿Qué pasa si decido dejar de compartir mi audio o vídeo?
Si eliges dejar de compartirlo, el audio o vídeo de los nuevos chats de voz dejará de usarse para entrenar nuestros modelos. El audio y vídeo que ya se haya desvinculado de tu cuenta podrá seguir utilizándose para entrenar nuestros modelos. Antes de usar clips de audio o vídeo de chats de voz para el entrenamiento, tomamos medidas para reducir la cantidad de información personal en el clip.
Si dejas de compartir el audio o vídeo de tus chats de voz, podremos seguir usando transcripciones y otros archivos, como subidas de imágenes, de esos chats para entrenar nuestro modelo si tienes Mejorar el modelo para todos activado. Para excluirte por completo del entrenamiento de nuestros modelos, desactiva Mejorar el modelo para todos.
¿Mi elección de compartir audio o vídeo para el entrenamiento del modelo es una configuración específica del dispositivo?
Tu elección de compartir audio o vídeo de chats de voz para el entrenamiento del modelo está vinculada a tu cuenta. Si eliges compartirlo, esa elección también se aplicará a otros dispositivos en los que hayas iniciado sesión. Puedes dejar de compartir audio o vídeo desde la configuración de Controles de datos en ChatGPT.
