OpenAI
Diese Seite wurde maschinell übersetzt. Den Originalartikel auf Englisch ansehen.

Sprachmodus-FAQ

Dein Leitfaden für Sprachchats mit ChatGPT – vom Einrichten und Nutzen des Sprachmodus bis zum Verständnis seiner Funktionen und Einschränkungen.

Aktualisiert: 21 hours ago

Hinweis: Die Datenspeicherung für bestimmte Dienste kann durch aktuelle rechtliche Entwicklungen beeinflusst werden – weitere Details findest du in unserem Blogbeitrag

Allgemeine FAQ

Was sind Sprachchats?

Sprachgespräche ermöglichen es dir, ein gesprochenes Gespräch mit ChatGPT zu führen und so natürlicher und dialogorientierter zu interagieren. Du kannst Fragen stellen oder Diskussionen per Spracheingabe führen und eine gesprochene Antwort von ChatGPT erhalten. Sprachgespräche werden von nativ multimodalen Modellen unterstützt und sind für alle angemeldeten Nutzer:innen in den mobilen ChatGPT-Apps und im Desktop-Web unter ChatGPT.com verfügbar.

Sprachgespräche können Fehler machen, also überprüfe bitte wichtige Informationen. Mehr über ChatGPT und Genauigkeit erfährst du hier. Der Zugriff auf Sprachgespräche und die damit verbundenen Nutzungslimits können sich ändern.

Wie starte ich ein Sprachgespräch?

Auf Mobilgeräten

Um ein Sprachgespräch zu starten, wähle das Sprachsymbol unten rechts auf dem Bildschirm aus:

ChatGPT message bar with Voice Mode button next to the microphone icon

ChatGPT Voice kann entweder als Spracherlebnis innerhalb der Hauptchatseite oder als separater Modus erscheinen (der blaue Orb-Bildschirm). Die meisten Nutzer:innen auf iOS und Android sehen standardmäßig das integrierte Erlebnis, aber einige Konten haben möglicherweise vorübergehend nur den separaten Modus, während wir Updates ausrollen. Du kannst in Einstellungen → Voice → Separate Mode zum separaten Modus wechseln (oder zurück).

Während du ein Sprachgespräch führst, kannst du dein Mikrofon stummschalten oder die Stummschaltung aufheben, indem du unten links auf dem Bildschirm das Mikrofonsymbol auswählst.

Du kannst das Gespräch beenden, indem du unten rechts auf dem Bildschirm auf das Beenden-Symbol drückst.

Wenn du zum ersten Mal einen Sprachchat startest, wirst du außerdem aufgefordert, eine Stimme auszuwählen. Bitte beachte, dass die Lautstärke der Stimme in der Auswahl von der Lautstärke während des Sprachgesprächs abweichen kann. Du kannst deine Stimme jederzeit in den Einstellungen oder im Sprachmodus über das Anpassungsmenü oben rechts ändern.

Bitte beachte, dass du der ChatGPT-App die Mikrofonberechtigung erteilen musst, um diese Funktion zu nutzen.

Im Web

Sprachgespräche sind im Desktop-Web auf ChatGPT.com verfügbar.

Um ein Sprachgespräch auf chatgpt.com zu starten, wähle das Sprachsymbol auf der rechten Seite des Prompt-Fensters aus:

ChatGPT message bar with microphone and Voice Mode wave icon

Wenn du Sprache in deinem Browser zum ersten Mal verwendest, musst du deinem Browser möglicherweise die Berechtigung erteilen, auf das Mikrofon deines Geräts zuzugreifen.

Während du ein Sprachgespräch führst, kannst du dein Mikrofon stummschalten oder die Stummschaltung aufheben, indem du das Mikrofonsymbol unten links auf dem Bildschirm auswählst.

Voice Mode microphone permission prompt for MacBook Pro Microphone built-in

Du kannst das Gespräch beenden, indem du unten rechts auf dem Bildschirm auf das Beenden-Symbol drückst.

Wenn du zum ersten Mal einen Sprachchat startest, wirst du außerdem aufgefordert, eine Stimme auszuwählen. Bitte beachte, dass die Lautstärke der Stimme in der Auswahl von der Lautstärke während des Sprachgesprächs abweichen kann.

Du kannst deine Stimme jederzeit in den Einstellungen oder im Sprachmodus über das Anpassungsmenü oben rechts ändern.

Wie teile ich mein Video mit ChatGPT während eines Sprachgesprächs?

Video ist in den mobilen iOS- und Android-Apps für Abonnent:innen aktiviert. Du kannst während eines Sprachchats jederzeit Video von deinen Geräten teilen, indem du unten auf dem Bildschirm die Kameraschaltfläche auswählst.

Image

Du kannst diese Schaltfläche erneut drücken, um das Teilen deines Videos mit ChatGPT zu beenden.

Wie teile ich ein Foto oder meinen Bildschirm mit ChatGPT während eines Sprachgesprächs?

Bildschirmfreigabe und Bild-Uploads sind nur in den mobilen iOS- und Android-Apps für Abonnent:innen verfügbar. Du kannst auf die Schaltfläche mit den drei Punkten tippen und im Pop-up-Menü Bildschirm teilen auswählen, um ein Bild oder deinen Bildschirm mit ChatGPT zu teilen.

Voice Mode attachment menu with Share Screen, Upload Photo, and Take Photo options

Wenn du die Option zum Aufnehmen eines Fotos wählst, öffnet sich deine Kamera, damit du es sofort aufnehmen und in dein Sprachgespräch hochladen kannst. Wenn du die Option zum Hochladen eines Fotos wählst, kannst du aus den Bildern auf deinem Handy auswählen, was du in deinem Sprachgespräch mit ChatGPT teilen möchtest.

Wenn du Bildschirm teilen auswählst, werden die Bildschirmfreigabe-Optionen deines Handys angezeigt, sodass du deinen Bildschirm an ChatGPT übertragen kannst.

Wie beende ich die Bildschirmfreigabe mit ChatGPT während eines Sprachgesprächs?

Sobald du die Bildschirmfreigabe gestartet hast, kannst du erneut auf die Schaltfläche für die Bildschirmfreigabe tippen, um das Teilen deines Bildschirms mit ChatGPT zu beenden.

Voice Mode orb with a cast icon in the center

Wenn du deinen Bildschirm außerhalb der App teilst, kannst du auf die Systemanzeige deines Handys tippen (bei Apple ist das ein roter Punkt oben auf dem Bildschirm, bei Android ein grünes Mikrofon oben auf dem Bildschirm). Auf dem Bildschirm erscheint ein Pop-up, das dich auffordert, die Bildschirmfreigabe zu beenden. Alternativ kannst du in die App zurückkehren und das Teilen direkt beenden, indem du auf die Schaltfläche für die Bildschirmfreigabe oder auf die Schaltfläche „x“ tippst, wodurch auch das Gespräch beendet wird.

Wie viele Sprachoptionen sind verfügbar?

Wähle aus neun lebensechten Ausgabestimmen für ChatGPT, jede mit ihrem eigenen Ton und Charakter:

  • Arbor - Locker und vielseitig

  • Breeze - Lebhaft und aufrichtig

  • Cove - Gelassen und direkt

  • Ember - Selbstbewusst und optimistisch

  • Juniper - Offen und gut gelaunt

  • Maple - Fröhlich und unverblümt

  • Sol - Gewandt und entspannt

  • Spruce - Ruhig und bestätigend

  • Vale - Hell und neugierig

Wie lange kann ich Sprachchats nutzen (nur Audio)?

Für Abonnent:innen ist die tägliche Nutzung von ChatGPT Voice fast unbegrenzt, und die Limits können sich ändern. Für diese Nutzer:innen beginnen Sprachsitzungen automatisch mit unserem fortschrittlichsten Sprachmodell: GPT-4o. Wenn du alle deine GPT-4o-Minuten für diesen Tag aufgebraucht hast, kannst du im Sprachmodus mit GPT-4o mini weiterchatten.

Für Enterprise-Nutzer:innen mit flexiblen Preisplänen ist die Nutzung von ChatGPT Voice mit GPT-4o unbegrenzt, vorbehaltlich des Kreditverbrauchs. Erfahre mehr über flexible Preispläne.

Für angemeldete Free-Nutzer:innen wird ChatGPT Voice von GPT-4o mini unterstützt und ist auf 2 Stunden pro Tag begrenzt. Die Limits können sich ändern.

Pro-Abonnent:innen haben unbegrenzten Zugriff auf GPT-4o Voice, vorbehaltlich von Schutzmaßnahmen gegen Missbrauch. Erfahre mehr über unseren Pro-Plan und die zugehörigen Limits.

Voice Mode notice that the GPT-4o daily voice limit is reached and calls will continue with GPT-4o-mini
ChatGPT voice mode notice that the voice usage limit has been reached

Wie lange kann ich Video und Bildschirmfreigabe in meinen Sprachchats nutzen?

Die Nutzung von Video- und Bildschirmfreigabefunktionen ist pro Nutzer:in und Tag für alle berechtigten Pläne begrenzt. Wir zeigen einen Hinweis an, wenn du dich dem Tageslimit näherst.

Für Abonnent:innen gilt: Sobald dein tägliches Nutzungslimit für GPT-4o-Sprachgespräche erreicht ist, fällst du auf GPT-4o mini zurück und kannst keine neuen Video- oder Bildschirmfreigabe-Inhalte mehr teilen, bis dein GPT-4o-Nutzungslimit zurückgesetzt wird.

Die Nutzung von Video- und Bildschirmfreigabefunktionen ist auch pro Gespräch begrenzt. Wenn du das Gesprächslimit erreichst, kannst du einen neuen Chat starten, um Video und Bildschirmfreigabe weiter zu nutzen, bis du dein Nutzungslimit erreichst.

Warum sehe ich nur den blauen Orb-Sprachbildschirm, und kann ich ihn ändern?

ChatGPT Voice kann entweder als Spracherlebnis innerhalb der Hauptchatseite oder als separater Modus erscheinen (der blaue Orb-Bildschirm). Die meisten Nutzer:innen auf iOS und Android sehen standardmäßig das integrierte Erlebnis, aber einige Konten haben möglicherweise vorübergehend nur den separaten Modus, während wir Updates ausrollen. Du kannst in Einstellungen → Voice → Separate Mode zum separaten Modus wechseln (oder zurück).

Kann ich ein Gespräch im Hintergrund weiterführen, während ich andere Apps nutze oder mein Handybildschirm gesperrt ist?

Ja, du kannst ein Gespräch im Hintergrund weiterführen, indem du in den Einstellungen „Hintergrundgespräche“ aktivierst.

Wenn du ein Sprachgespräch mit aktivierter Einstellung für Hintergrundgespräche startest, läuft dein Gespräch weiter, bis einer der folgenden Fälle eintritt:

  • Du beendest das Gespräch manuell

  • Du erzwingst das Schließen der App

  • Du erreichst dein tägliches Nutzungslimit, das je nach ChatGPT-Abo variiert

  • Dein Gespräch dauert länger als 1 Stunde

Während du mit der ChatGPT-App im Hintergrund deinen Bildschirm teilst, wird die Bildschirmfreigabe fortgesetzt, bis einer der oben genannten Fälle eintritt, du die Bildschirmfreigabe beendest oder deinen Bildschirm sperrst.

Habt ihr Tipps, um Unterbrechungen bei Sprachgesprächen zu vermeiden?

Gelegentlich kann es während eines Sprachgesprächs zu Unterbrechungen kommen. Wir empfehlen, Sprachgespräche mit Kopfhörern zu führen.

Auf dem iPhone kann das Aktivieren des Mikrofonmodus „Sprachisolation“ helfen, unbeabsichtigte Unterbrechungen zu vermeiden. Du kannst „Sprachisolation“ aktivieren, indem du während eines Sprachgesprächs dein Kontrollzentrum öffnest, „Mikrofonmodus“ auswählst und zu „Sprachisolation“ wechselst.

Wenn weiterhin Probleme auftreten, empfehlen wir, die App zu schließen und neu zu starten, die Lautstärke deines Assistenten zu erhöhen oder dich in eine ruhigere Umgebung zu begeben.

Kann ich Sprachgespräche mit GPTs führen?

Ja, Sprachgespräche sind mit GPTs verfügbar. GPTs haben ihre eigene Sprachoption namens Shimmer, die sich deutlich von den neun Ausgabestimmen unterscheidet, die für Sprachgespräche mit ChatGPT verfügbar sind.

Bitte beachte, dass der Sprachmodus Tools wie Bildgenerierung, Dateiuploads oder den Code Interpreter noch nicht unterstützt. Benutzerdefinierte Aktionen in GPTs sind im Sprachmodus nicht verfügbar.

Wie ändere ich Stimmen während eines Sprachchats?

Du kannst deine Stimme in den Einstellungen oder über das Anpassungsmenü oben rechts im Sprachmodus ändern.

Stimmen werden pro Gespräch festgelegt. Wenn du deine Stimme im Sprachmodus änderst, wirst du aufgefordert, einen neuen Chat zu starten.

Warum stimmen Sprachtranskripte manchmal nicht mit dem Gespräch überein, das ich geführt habe?

Sprachgespräche sind von Natur aus multimodal und ermöglichen einen direkten Audioaustausch zwischen dir und dem Modell. Daher stimmt die Transkription dieses Audios möglicherweise nicht immer perfekt mit dem ursprünglichen Gespräch überein.

Enthalten Sprachgespräche Untertitel?

Du kannst Untertitel für Modellantworten auf iOS und Android aktivieren, indem du im Sprachmodus oben rechts auf die Schaltfläche „cc“ tippst.

Nachdem du ein Sprachgespräch beendet hast, wird die Transkription zu deinem aktuellen textbasierten Gespräch mit ChatGPT hinzugefügt. Du kannst die Transkription deines Gesprächs in deinem Chatverlauf auf der linken Seite der ChatGPT-Web-App und im Menü auf der linken Seite der mobilen ChatGPT-App erneut aufrufen.

Wie viele Sprachgespräche kann ich gleichzeitig führen?

Du kannst immer nur einen Sprachchat gleichzeitig führen.

Warum erkennt der Sprachmodus oder die Diktierfunktion manchmal eine andere Sprache als die, die ich spreche?

Mitunter wird die Sprache, die du sprichst, von unserer Spracheingabefunktion nicht korrekt erkannt. Du kannst das Modell mündlich korrigieren, damit es deine gewünschte Sprache spricht. Für die Diktierfunktion kannst du außerdem in den App-Einstellungen eine bevorzugte Sprache festlegen, damit die Erkennung genauer ist.

  1. Öffne die Seitenleiste, indem du oben links auf dem Bildschirm die zwei Linien auswählst, und wähle unten deinen Namen aus, um die Einstellungen zu öffnen.

  2. Scrolle auf der Seite „Einstellungen“ nach unten zum Abschnitt „Sprache“. Klicke auf das Dropdown-Menü „Hauptsprache“, um deine Sprache auszuwählen.

Speech settings with Main Language set to Auto-Detect

Datenschutz & Steuerung

Wie lange speichert ihr Audio- und Videoclips aus meinen Sprachchats?

Bei Sprachgesprächen werden Audio- und Videoclips aus deinen Sprachchats zusammen mit der Transkription gespeichert, die in deinem Chatverlauf erscheint. Im Chatverlauf zeigen wir einen visuellen Hinweis an, der zeigt, welche Chats im erweiterten Sprachmodus stattfinden: Achte einfach auf den ausgegrauten Text und das kleine Mikrofon- oder Kamerasymbol.

Image

Audio- und Videoclips für Nachrichten in deinen Sprachchats werden 30 Tage lang gespeichert. Wenn du den Chat löschst, löschen wir auch den zugehörigen Audio- bzw. Videoclip innerhalb von 30 Tagen, es sei denn, wir müssen ihn aus Sicherheits- oder rechtlichen Gründen aufbewahren oder du hast deine Audio- oder Videoclips zuvor mit uns geteilt, um unsere Modelle zu trainieren, und der Audio- oder Videoclip wurde bereits von deinem Konto getrennt.

Du kannst Chats nicht wiederherstellen, nachdem du sie gelöscht hast. Wenn du einen Chat aus deinem sichtbaren Chatverlauf entfernen, ihn aber in deinem Konto behalten möchtest, solltest du die Archivierungsfunktion verwenden. Audio- und Videoclips, die mit archivierten Chats verknüpft sind, werden weiterhin gespeichert.

In diesem Artikel erfährst du, wie Inhalte zum Trainieren unserer Modelle verwendet werden können und welche Wahlmöglichkeiten du hast.

Wenn du unseren älteren Standard-Sprachmodus verwendest, werden Audioclips aus ChatGPT transkribiert, bevor wir eine Antwort generieren. Wir löschen Audioclips, sobald die Transkription abgeschlossen ist, es sei denn, du hast dich dafür entschieden, deine Audioclips zum Trainieren unserer Modelle zu teilen. (Hinweis: Audioclips werden auch dann gelöscht, wenn die Transkription selbst fehlschlägt.) Erfahre mehr darüber, wie du dein Audio zum Trainieren unserer Modelle teilst.

Trainiert ihr eure Modelle mit Audio- oder Videoclips aus Sprachchats?

Nein, außer du entscheidest dich, Audio- oder Videoclips aus Sprachchats mit uns zu teilen, damit wir unsere Modelle trainieren können.

Wenn du Das Modell für alle verbessern aktiviert hast, können wir je nach deinen Einstellungen und deinem Plan Transkripte und andere Dateien (z. B. in das Gespräch hochgeladene Bilder) aus deinen Sprachchats zum Trainieren unserer Modelle verwenden. Die zugehörigen Audio- oder Videoclips verwenden wir jedoch nicht zum Trainieren unserer Modelle, es sei denn, du hast sie uns für das Modelltraining zur Verfügung gestellt. Erfahre mehr über deine Wahlmöglichkeiten.

Audio oder Video zum Trainieren unserer Modelle teilen

Standardmäßig trainieren wir unsere Modelle nicht mit Audio- oder Videoclips aus Sprachchats, einschließlich Clips aus Bildschirmfreigaben. Nutzer:innen der Free-, Plus- und Pro-Pläne können jedoch Audio- und Videoclips aus ihren Sprachchats teilen, um uns beim Trainieren unserer Modelle zu helfen, indem sie in den Datenkontrollen Das Modell für alle verbessern aktivieren und Eigene Audioaufnahmen einbeziehen sowie Eigene Videoaufnahmen einbeziehen einschalten.

Image

Du kannst auch zustimmend antworten, wenn wir dich einladen, Audio- und Videoclips für das Training zu teilen.

Wenn du Das Modell für alle verbessern aktiviert hast, können wir Transkripte und andere Dateien (z. B. in das Gespräch hochgeladene Bilder) aus deinen Sprachchats zum Trainieren unserer Modelle verwenden, auch wenn du keine Audio- oder Videoclips aus deinen Sprachchats teilst.

Wer kann Audio und Video zum Trainieren von Modellen teilen?

ChatGPT-Nutzer:innen mit Free-, Plus- und Pro-Plänen können Audio und/oder Video aus persönlichen Workspaces teilen. Nutzer:innen können Audio oder Video aus Sprachchats in ChatGPT Business-, Edu- und Enterprise-Workspaces nicht teilen.

Was passiert, wenn ich mein Audio und Video zum Trainieren von Modellen teile?

Wenn du dich entscheidest, dein Audio und Video aus Sprachchats zu teilen, verwenden wir Audio und Video aus deinem Gespräch künftig zum Trainieren unserer Modelle. Erfahre mehr darüber, wie wir deine Inhalte zum Trainieren unserer Modelle verwenden. Es kann notwendig sein, dass unser Team die Audio- oder Videoclips, die du mit uns geteilt hast, überprüft, um sie für das Training zu verwenden. So kann es zum Beispiel sein, dass eine Person in unserem Team sich eine Audioaufnahme anhört, die mit einem „Daumen runter“-Feedbacksignal verknüpft ist, um festzustellen, wo ChatGPT das Gesagte möglicherweise falsch interpretiert hat.

Wie kann ich das Teilen von Audio und Video beenden?

Du kannst das Teilen auf der Seite für Datenkontrollen in deinen ChatGPT-Einstellungen beenden. Deaktiviere einfach die Schalter Eigene Audioaufnahmen einbeziehen oder Eigene Videoaufnahmen einbeziehen oder schalte Das Modell für alle verbessern vollständig aus.

Was passiert, wenn ich entscheide, mein Audio oder Video nicht mehr zu teilen?

Wenn du dich entscheidest, das Teilen zu beenden, wird Audio oder Video aus neuen Sprachchats nicht mehr zum Trainieren unserer Modelle verwendet. Audio und Video, das zuvor von deinem Konto getrennt wurde, kann weiterhin zum Trainieren unserer Modelle verwendet werden. Bevor wir Audio- oder Videoclips aus Sprachchats für das Training verwenden, unternehmen wir Schritte, um die Menge an personenbezogenen Informationen im Clip zu reduzieren.

Wenn du das Teilen deines Audios oder Videos aus deinen Sprachchats beendest, können wir Transkriptionen und andere Dateien, wie Bild-Uploads, aus diesen Chats möglicherweise weiterhin zum Trainieren unseres Modells verwenden, wenn du Das Modell für alle verbessern aktiviert hast. Wenn du der Nutzung zum Trainieren unserer Modelle vollständig widersprechen möchtest, deaktiviere bitte Das Modell für alle verbessern.

Ist meine Entscheidung, Audio oder Video für das Modelltraining zu teilen, eine gerätespezifische Einstellung?

Deine Entscheidung, Audio oder Video aus Sprachchats für das Modelltraining zu teilen, ist mit deinem Konto verknüpft. Wenn du dich für das Teilen entscheidest, gilt diese Entscheidung auch für andere Geräte, auf denen du angemeldet bist. Du kannst das Teilen von Audio oder Video über deine Einstellungen für Datenkontrollen in ChatGPT beenden.

War dieser Artikel hilfreich?