OpenAI
Esta página foi traduzida automaticamente. Veja o artigo original em inglês.

FAQ do modo voz

Seu guia para chats por voz com o ChatGPT, desde a configuração e uso do modo voz até o entendimento de seus recursos e limitações.

Atualizado: 23 hours ago

Observação: a retenção de dados para determinados serviços pode ser afetada por desenvolvimentos legais recentes — consulte nossa publicação no blog para mais detalhes

Perguntas frequentes gerais

O que são chats por voz?

As conversas por voz permitem que você tenha uma conversa falada com o ChatGPT, proporcionando uma interação mais conversacional e natural. Você pode fazer perguntas ou ter discussões por entrada de voz e receber uma resposta falada do ChatGPT. As conversas por voz são alimentadas por modelos multimodais nativos e estão disponíveis para todos os usuários conectados nos apps móveis do ChatGPT e na web para desktop em ChatGPT.com.

As conversas por voz podem cometer erros, então verifique informações importantes. Você pode saber mais sobre o ChatGPT e precisão aqui. O acesso à Voz e aos limites de uso associados está sujeito a alterações.

Como inicio uma conversa por voz?

No celular

Para iniciar uma conversa por voz, selecione o ícone de Voz no canto inferior direito da tela:

ChatGPT message bar with Voice Mode button next to the microphone icon

A voz do ChatGPT pode aparecer como uma experiência de voz dentro do chat principal ou como um modo separado (a tela com orbe azul). A maioria dos usuários no iOS e Android verá a experiência integrada por padrão, mas algumas contas podem temporariamente ter apenas o modo separado enquanto lançamos atualizações. Você pode mudar para o Modo separado (ou voltar) em Configurações → Voz → Modo separado.

Quando você estiver em uma conversa por voz, poderá ativar ou desativar o som do microfone selecionando o ícone de microfone no canto inferior esquerdo da tela.

Você pode encerrar a conversa pressionando o ícone de sair no canto inferior direito da tela.

Se você iniciar um chat por voz pela primeira vez, também será solicitado a escolher uma voz. Observe que o volume da voz no seletor pode ser diferente do volume durante a conversa por voz. Você pode mudar sua voz a qualquer momento nas configurações ou no modo voz usando o menu de personalização no canto superior direito.

Observe que você precisará conceder ao app do ChatGPT permissão de Microfone para usar esse recurso.

Na web

As conversas por voz estão disponíveis na web para desktop em ChatGPT.com.

Para iniciar uma conversa por voz em chatgpt.com, selecione o ícone de Voz no lado direito da janela de prompt:

ChatGPT message bar with microphone and Voice Mode wave icon

Se זו for a primeira vez que você usa voz no navegador, talvez seja necessário conceder ao navegador permissão para acessar o microfone do seu dispositivo.

Quando você estiver em uma conversa por voz, poderá ativar ou desativar o som do microfone selecionando o ícone de microfone no canto inferior esquerdo da tela.

Voice Mode microphone permission prompt for MacBook Pro Microphone built-in

Você pode encerrar a conversa pressionando o ícone de sair no canto inferior direito da tela.

Se você iniciar um chat por voz pela primeira vez, também será solicitado a escolher uma voz. Observe que o volume da voz no seletor pode ser diferente do volume durante a conversa por voz.

Você pode mudar sua voz a qualquer momento nas configurações ou no modo voz usando o menu de personalização no canto superior direito.

Como compartilho meu vídeo com o ChatGPT durante uma conversa por voz?

O vídeo está habilitado nos apps móveis para iOS e Android para assinantes. Você pode compartilhar vídeo dos seus dispositivos a qualquer momento durante um chat por voz selecionando o botão da câmera na parte inferior da tela.

Image

Você pode pressionar esse botão novamente para parar de compartilhar seu vídeo com o ChatGPT.

Como compartilho uma foto ou minha tela com o ChatGPT durante uma conversa por voz?

O compartilhamento de tela e o envio de imagens estão habilitados apenas nos apps móveis para iOS e Android para assinantes. Você pode pressionar o botão de três pontos e selecionar Compartilhar tela no menu pop-up para compartilhar uma imagem ou sua tela com o ChatGPT.

Voice Mode attachment menu with Share Screen, Upload Photo, and Take Photo options

Escolher a opção de tirar uma foto abrirá a câmera para que você possa capturá-la e enviá-la para sua conversa por voz imediatamente. Escolher a opção de enviar uma foto permitirá selecionar entre as imagens do seu telefone para compartilhar com o ChatGPT na sua conversa por voz.

Selecionar compartilhar tela abrirá as opções de compartilhamento de tela do seu telefone, permitindo transmitir sua tela para o ChatGPT.

Como paro de compartilhar minha tela com o ChatGPT durante uma conversa por voz?

Depois de iniciar o compartilhamento de tela, você pode tocar novamente no botão de compartilhamento de tela para parar de compartilhar sua tela com o ChatGPT.

Voice Mode orb with a cast icon in the center

Se você estiver compartilhando a tela fora do app, pode tocar no indicador do sistema do seu telefone (a Apple mostra um ponto vermelho na parte superior da tela e o Android mostra um microfone verde na parte superior da tela). Um pop-up aparecerá na tela solicitando que você pare o compartilhamento de tela. Como alternativa, você pode voltar ao app e interromper o compartilhamento diretamente tocando no botão de compartilhamento de tela ou no botão “x”, o que também encerrará a conversa.

Quantas opções de voz estão disponíveis?

Escolha entre nove vozes de saída realistas para o ChatGPT, cada uma com seu próprio tom e caráter distintos:

  • Arbor - Descontraída e versátil

  • Breeze - Animada e sincera

  • Cove - Composta e direta

  • Ember - Confiante e otimista

  • Juniper - Aberta e animada

  • Maple - Alegre e franca

  • Sol - Experiente e relaxada

  • Spruce - Calma e encorajadora

  • Vale - Brilhante e inquisitiva

Por quanto tempo posso fazer chats por voz (somente áudio)?

Para assinantes, seu uso diário da voz do ChatGPT é quase ilimitado a cada dia, e os limites podem mudar. Para esses usuários, as sessões de voz começam automaticamente com nosso modelo de voz mais avançado: GPT-4o. Quando você tiver usado todos os seus minutos de GPT-4o naquele dia, poderá continuar conversando no modo voz com o GPT-4o mini.

Para usuários empresariais em planos com preços flexíveis, o uso da voz do ChatGPT com GPT-4o é ilimitado, sujeito ao consumo de créditos. Saiba mais sobre planos com preços flexíveis.

Para usuários Free conectados, o uso da voz do ChatGPT é alimentado por GPT-4o mini e está sujeito a um limite de 2 horas por dia. Os limites podem mudar.

Assinantes Pro têm uso ilimitado da voz do GPT-4o, sujeito a proteções contra abuso. Saiba mais sobre nosso plano Pro e os limites associados.

Voice Mode notice that the GPT-4o daily voice limit is reached and calls will continue with GPT-4o-mini
ChatGPT voice mode notice that the voice usage limit has been reached

Por quanto tempo posso usar vídeo e compartilhamento de tela nos meus chats por voz?

Por usuário, o uso dos recursos de vídeo e compartilhamento de tela é limitado diariamente para todos os planos elegíveis. Enviamos um aviso quando você está se aproximando do limite diário.

Para assinantes, quando o limite diário de uso de voz do GPT-4o for atingido, você passará a usar o GPT-4o mini e não poderá mais compartilhar novo conteúdo de vídeo ou de tela até que seu limite de uso do GPT-4o seja redefinido.

O uso dos recursos de vídeo e compartilhamento de tela também é limitado por conversa. Se você atingir o limite da conversa, poderá iniciar um novo chat para continuar usando vídeo e compartilhamento de tela até atingir seu limite de uso.

Por que só vejo a tela de voz com orbe azul e posso alterá-la?

A voz do ChatGPT pode aparecer como uma experiência de voz dentro do chat principal ou como um modo separado (a tela com orbe azul). A maioria dos usuários no iOS e Android verá a experiência integrada por padrão, mas algumas contas podem temporariamente ter apenas o modo separado enquanto lançamos atualizações. Você pode mudar para o Modo separado (ou voltar) em Configurações → Voz → Modo separado.

Posso manter uma conversa em segundo plano enquanto uso outros apps ou com a tela do telefone bloqueada?

Sim, você pode manter uma conversa em segundo plano ativando “Conversas em segundo plano” nas configurações.

Se você iniciar uma conversa por voz com a configuração de conversas em segundo plano ativada, sua conversa continuará até que uma das seguintes situações ocorra:

  • Você encerrar a conversa manualmente

  • Você forçar o fechamento do app

  • Você atingir seu limite diário de uso (que varia conforme seu plano do ChatGPT)

  • Sua conversa ultrapassar 1 hora de duração

Enquanto você estiver compartilhando a tela com o app do ChatGPT em segundo plano, o compartilhamento continuará até que uma das situações acima ocorra, você desative o compartilhamento de tela ou bloqueie a tela.

Vocês têm dicas para evitar interrupções nas conversas por voz?

Ocasionalmente, podem ocorrer interrupções durante uma conversa por voz. Recomendamos fazer conversas por voz com fones de ouvido.

No iPhone, ativar o modo de microfone Isolamento de Voz pode ajudar a evitar interrupções não intencionais. Você pode ativar o Isolamento de Voz abrindo a Central de Controle durante uma conversa por voz, selecionando Modo do microfone e mudando para Isolamento de Voz.

Se você ainda estiver enfrentando problemas, recomendamos fechar e reiniciar o app, aumentar o volume do seu assistente ou ir para um ambiente mais silencioso.

Posso ter conversas por voz com GPTs?

Sim, conversas por voz estão disponíveis com GPTs. Os GPTs têm sua própria opção de voz chamada Shimmer, que é claramente diferente das nove vozes de saída disponíveis para uso em conversas por voz com o ChatGPT.

Observe que o modo voz ainda não oferece suporte a ferramentas como geração de imagens, envio de arquivos ou o Code Interpreter. Ações personalizadas em GPTs não estão disponíveis no modo voz.

Como mudo as vozes durante um chat por voz?

Você pode mudar sua voz nas configurações ou no menu de personalização no canto superior direito do modo voz.

As vozes são definidas por conversa. Se você mudar sua voz dentro do modo voz, será solicitado a iniciar um novo chat.

Por que as transcrições de voz às vezes não correspondem à conversa que tive?

As conversas por voz são inerentemente multimodais, permitindo troca direta de áudio entre você e o modelo. Como resultado, quando esse áudio é transcrito, a transcrição pode nem sempre se alinhar perfeitamente com a conversa original.

As conversas por voz incluem legendas?

Você pode ativar legendas para respostas do modelo no iOS e Android tocando no botão ‘cc’ no canto superior direito dentro do modo voz.

Depois que você sair de uma conversa por voz, a transcrição será adicionada à sua conversa atual baseada em texto com o ChatGPT. Você pode consultar a transcrição da sua conversa no seu histórico de chat no lado esquerdo do app do ChatGPT na web e no menu do lado esquerdo do app móvel do ChatGPT.

Quantas conversas por voz posso ter ao mesmo tempo?

Você só pode ter um chat por voz por vez.

Por que o modo voz ou o ditado detecta um idioma diferente daquele que estou falando?

Às vezes, o idioma que você fala pode não ser refletido com precisão em nosso recurso de entrada por voz. Você pode corrigir verbalmente o modelo para falar o idioma de sua preferência. No caso do ditado, você também pode especificar um idioma preferido nas Configurações do app para uma detecção mais precisa.

  1. Abra a barra lateral selecionando as duas linhas no canto superior esquerdo da tela e selecione seu nome na parte inferior para abrir as Configurações.

  2. Na página Configurações, role para baixo até a seção Fala. Clique no menu suspenso "Idioma principal" para selecionar seu idioma.

Speech settings with Main Language set to Auto-Detect

Privacidade e controles

Por quanto tempo vocês retêm clipes de áudio e vídeo dos meus chats por voz?

Nas conversas por voz, clipes de áudio e vídeo dos seus chats por voz são armazenados junto com a transcrição que aparece no seu histórico de chat. Fornecemos um indicador visual no histórico de chat que mostra quais chats ocorreram no modo de Voz avançada: basta procurar o texto acinzentado e o pequeno microfone ou câmera.

Image

Os clipes de áudio e vídeo das mensagens nos seus chats por voz serão mantidos por 30 dias. Quando você excluir o chat, também excluiremos o clipe de áudio e vídeo associado em até 30 dias, a menos que precisemos mantê-lo por motivos de segurança ou legais, ou se você tiver compartilhado anteriormente seus clipes de áudio ou vídeo conosco para treinar nossos modelos e o clipe de áudio ou vídeo já tiver sido desvinculado da sua conta.

Você não pode recuperar chats depois de excluí-los. Se quiser remover um chat da visibilidade no seu histórico de chat, mas mantê-lo na sua conta, use a função de arquivamento. Os clipes de áudio e vídeo associados a chats arquivados continuam sendo mantidos.

Consulte este artigo para entender como o conteúdo pode ser usado para treinar nossos modelos e quais opções você tem.

Se você estiver usando nosso legado modo voz padrão, os clipes de áudio do ChatGPT são transcritos antes de gerarmos uma resposta. Excluímos os clipes de áudio assim que a transcrição é concluída, a menos que você tenha optado por compartilhar seus clipes de áudio para treinar nossos modelos. (Observação: os clipes de áudio são excluídos mesmo se a própria transcrição falhar). Saiba mais sobre compartilhar seu áudio para treinar nossos modelos.

Vocês treinam seus modelos com clipes de áudio ou vídeo de chats por voz?

Não, a menos que você escolha compartilhar clipes de áudio ou vídeo de chats por voz para treinarmos nossos modelos.

Se você tiver Melhorar o modelo para todos ativado, poderemos usar transcrições e outros arquivos (como imagens enviadas para a conversa) dos seus chats por voz para treinar nossos modelos, dependendo das suas escolhas e do seu plano. Mas não usaremos os clipes de áudio ou vídeo associados para treinar nossos modelos, a menos que você os tenha compartilhado conosco para treinamento de modelos. Saiba mais sobre suas opções.

Compartilhamento de áudio ou vídeo para treinar nossos modelos

Por padrão, não treinaremos nossos modelos com clipes de áudio ou vídeo, incluindo clipes de compartilhamento de tela, de chats por voz. Mas usuários Free, Plus e Pro podem optar por compartilhar clipes de áudio e vídeo de seus chats por voz para nos ajudar a treinar nossos modelos ativando Melhorar o modelo para todos em Controles de dados e ativando Incluir suas gravações de áudio e Incluir suas gravações de vídeo.

Image

Você também pode responder afirmativamente quando convidarmos você a compartilhar clipes de áudio e vídeo para treinamento.

Se você tiver Melhorar o modelo para todos ativado, poderemos usar transcrições e outros arquivos (como imagens enviadas na conversa) dos seus chats por voz para treinar nossos modelos, mesmo que você não esteja compartilhando clipes de áudio ou vídeo dos seus chats por voz.

Quem pode compartilhar áudio e vídeo para treinar modelos?

Usuários do ChatGPT nos planos Free, Plus e Pro podem compartilhar áudio e/ou vídeo de workspaces pessoais. Usuários não podem compartilhar áudio ou vídeo de chats por voz em workspaces ChatGPT Business, Edu e Enterprise.

O que acontece se eu compartilhar meu áudio e vídeo para treinar modelos?

Se você optar por compartilhar seu áudio e vídeo de chats por voz, daqui para frente usaremos áudio e vídeo da sua conversa para treinar nossos modelos. Saiba mais sobre como usamos seu conteúdo para treinar nossos modelos. Pode ser necessário que nossa equipe revise os clipes de áudio ou vídeo que você compartilhou conosco para que possamos usá-los no treinamento. Por exemplo, alguém da nossa equipe pode ouvir uma gravação de áudio associada a um sinal de feedback negativo para identificar onde o ChatGPT pode ter interpretado incorretamente o que foi dito.

Como posso parar de compartilhar áudio e vídeo?

Você pode parar de compartilhar pela página de controles de dados nas configurações do seu ChatGPT. Basta desativar as opções incluir suas gravações de áudio ou incluir suas gravações de vídeo, ou desativar totalmente Melhorar o modelo para todos.

O que acontece se eu decidir parar de compartilhar meu áudio ou vídeo?

Se você optar por parar de compartilhar, o áudio ou vídeo de novos chats por voz não será mais usado para treinar nossos modelos. Áudio e vídeo que já tenham sido desvinculados da sua conta podem continuar sendo usados para treinar nossos modelos. Antes de usar clipes de áudio ou vídeo de chats por voz para treinamento, tomamos medidas para reduzir a quantidade de informações pessoais no clipe.

Se você parar de compartilhar seu áudio ou vídeo dos seus chats por voz, ainda poderemos usar transcrições e outros arquivos, como envios de imagens, desses chats para treinar nosso modelo, se você tiver Melhorar o modelo para todos ativado. Para desativar totalmente o treinamento dos nossos modelos, desative Melhorar o modelo para todos.

Minha escolha de compartilhar áudio ou vídeo para treinamento de modelos é uma configuração específica do dispositivo?

Sua escolha de compartilhar áudio ou vídeo de chats por voz para treinamento de modelos está vinculada à sua conta. Se você optar por compartilhar, essa escolha também será aplicada a outros dispositivos nos quais você estiver conectado. Você pode parar de compartilhar áudio ou vídeo pelas configurações de Controle de dados no ChatGPT.

Este artigo foi útil?