Überblick

Was ist ChatGPT Sprachchat?

Mit ChatGPT Sprachchat kannst du mit ChatGPT sprechen und eine gesprochene Antwort hören. Sprachchat funktioniert innerhalb eines Chats. Du kannst also zuhören und die Antwort zugleich als Text verfolgen, tippen, wenn du nicht sprechen kannst, und frühere Nachrichten ansehen, ohne neu zu beginnen.

Wenn du stattdessen eine einzelne Aufnahme in bearbeitbaren Text umwandeln möchtest, verwende ChatGPT-Diktat.

Die Option Live kann gleichzeitig zuhören und sprechen. Dadurch wirken Sprecherwechsel und Unterbrechungen natürlicher. Live kann außerdem Websuche und Memory nutzen, visuelle Ergebnisse über unterstützte Widgets anzeigen und mit Text und Bildern arbeiten, wenn diese Funktionen für dein Konto verfügbar sind.

ChatGPT kann Fehler machen. Überprüfe wichtige Informationen, besonders bei Fragen, die von Datum, Uhrzeit oder Ort abhängen. Sprachchat nutzt die Zeitzone deines Geräts oder Browsers, um Begriffe wie „heute“ oder „morgen“ zu verstehen. Wenn eine Antwort nicht richtig wirkt, prüfe deine Zeitzone oder nenne in deiner Frage das genaue Datum, die Zeitzone oder den Ort. Mehr zu ChatGPT und Genauigkeit.

Welche Sprachchat-Optionen gibt es?

Unter Einstellungen → Sprachchat werden dir möglicherweise folgende Optionen angezeigt:

Live: Unser neuestes Sprachchat-Erlebnis, unterstützt von GPT-Live-1 in kostenpflichtigen Tarifen und GPT-Live-1 mini in Free. Live ist für natürliche Gespräche in beide Richtungen gedacht. Es kann Websuche und Memory nutzen, visuelle Ergebnisse über unterstützte Widgets anzeigen und im selben Chat mit Text und Bildern arbeiten. Live unterstützt zu Beginn keine Videos, keine Bildschirmfreigabe, keine verbundenen Apps und keine Plugins.
Advanced: Der bisherige Echtzeit-Sprachchat. Verwende Advanced, wenn du unterstützte mobile Funktionen wie Video oder Bildschirmfreigabe brauchst.
Standard: Ein Sprachchat Schritt für Schritt, der deine Sprache transkribiert, bevor eine Antwort erzeugt wird.

Welche Optionen dir zur Verfügung stehen, kann von deinem Tarif, den Workspace-Einstellungen, deiner Region und der App-Version abhängen.

Um zwischen verfügbaren Optionen zu wechseln, öffne Einstellungen → Sprachchat und wähle Live, Advanced oder Standard.

Verfügbarkeit für Business-, Enterprise-, Edu- und Healthcare-Workspaces

ChatGPT Sprachchat ist in berechtigten Business-, Enterprise-, Edu- und Healthcare-Workspaces verfügbar, sofern die Workspace-Einstellungen dies zulassen.

Es gibt zwei Möglichkeiten für den Sprachchat:

Sprachchat in Chat: Führe natürliche Unterhaltungen in Echtzeit, um Fragen zu stellen, Ideen zu sammeln und Ansätze zu erkunden. Sprachchat in Chat basiert auf GPT-Live und ist in Desktop-Chat sowie in unterstützten Web-, iOS- und Android-Versionen verfügbar.
Sprachchat in Work und Codex: Starte per Sprache Aufgaben, prüfe den Fortschritt, stelle Fragen zu deinen Agents und koordiniere mehrere Agents in einer einzigen Unterhaltung. Verfügbar in der ChatGPT-Desktop-App für macOS und Windows sowie per gekoppeltem Fernzugriff über iOS. Eigenständiger Sprachchat in Work und Codex ist weder im Web noch auf Mobilgeräten verfügbar.

In Enterprise-, Edu- und Healthcare-Workspaces beginnt Live mit einer zweiwöchigen Vorabzugriffsphase. Während dieser Phase müssen Workspace-Verantwortliche sowohl Sprachchat als auch Vorabzugriff auf Modelle aktivieren, bevor Mitglieder Live verwenden können.

Sobald beide Einstellungen aktiviert sind, können Mitglieder Live unter Einstellungen → Sprachchat auswählen. Bestehende Unterhaltungen im erweiterten Sprachmodus werden während der Vorabzugriffsphase nicht automatisch auf Live umgestellt.

Wenn Sprachchat deaktiviert ist, steht der Sprachchat nicht zur Verfügung. Wenn Sprachchat aktiviert, aber Vorabzugriff auf Modelle deaktiviert ist, können Mitglieder den erweiterten Sprachmodus weiterhin verwenden. Live bleibt jedoch nicht verfügbar.

Nach der Vorabzugriffsphase wird Live zum standardmäßigen Sprachchat für Workspaces, in denen Sprachchat aktiviert ist. Workspace-Verantwortliche können den Sprachchat vollständig ausschalten, indem sie Sprachchat deaktivieren.

Nutzungslimits

Die Live-Nutzung wird über einen gleitenden Zeitraum von 24 Stunden gemessen, und Limits können sich ändern. ChatGPT benachrichtigt dich, wenn du ein Limit erreichst.

ChatGPT Pro (200 USD/Monat): Unbegrenzter Zugriff auf GPT-Live-1.
ChatGPT Pro (100 USD/Monat): Bis zu 12 Stunden mit GPT-Live-1 bei Intelligenzstufe Instant, 12 Stunden bei Mittel oder Hoch und 24 Stunden mit GPT-Live-1 mini.
ChatGPT Go und Plus: Bis zu 1 Stunde mit GPT-Live-1 bei Intelligenzstufe Instant, 1 Stunde bei Mittel oder Hoch und 2 Stunden mit GPT-Live-1 mini.
ChatGPT Free: Begrenzter Zugriff auf GPT-Live-1 mini während jedes gleitenden 24-Stunden-Zeitraums. Dieses Limit kann sich ändern.
ChatGPT Business: Bis zu 1 Stunde Live mit Intelligenzstufe Instant und 1 Stunde mit Mittel oder Hoch. Zusätzliche Nutzung verbraucht 5 Credits pro Minute.
ChatGPT Enterprise-, Edu- und Healthcare-Workspaces mit flexibler Preisgestaltung: Live verbraucht 5 Credits pro Minute.
Legacy-Tarife für ChatGPT Enterprise und Edu: Bis zu 1 Stunde Live und 2 Stunden Live mini.

Eine einzelne Live-Unterhaltung kann bis zu 2 Stunden dauern.

Weitere Informationen findest du in der ChatGPT-Preisliste für Business, Enterprise und Edu.

Sprachunterhaltung starten

Unter iOS und Android

Wähle in der Nachrichtenleiste das Symbol Sprachchat.
Erlaube der ChatGPT-App den Zugriff auf dein Mikrofon, wenn du dazu aufgefordert wirst.
Wenn dies deine erste Sprachunterhaltung ist, wähle eine bevorzugte Stimme aus.
Sobald Sprachchat geöffnet ist, beginne zu sprechen, um die Unterhaltung zu starten.

Wähle während der Unterhaltung die Mikrofonsteuerung, um dich stummzuschalten oder die Stummschaltung aufzuheben. Wähle die Beenden-Steuerung, um die Sprachunterhaltung zu beenden.

Im Web

Gehe zu ChatGPT.com.
Wähle im Prompt-Fenster das Symbol Sprachchat.
Erlaube deinem Browser den Zugriff auf dein Mikrofon, wenn du dazu aufgefordert wirst.
Sobald Sprachchat geöffnet ist, beginne zu sprechen, um die Unterhaltung zu starten.

Wähle während der Unterhaltung die Mikrofonsteuerung, um dich stummzuschalten oder die Stummschaltung aufzuheben. Wähle die Beenden-Steuerung, um die Sprachunterhaltung zu beenden.

Text und Bilder mit Live verwenden

Live kann Text und Bilder im selben Chat wie deine Sprachunterhaltung annehmen. Während der Sprachchat aktiv ist, kannst du über die Hinzufügen-Schaltfläche in der Nachrichtenleiste ein verfügbares Bild anhängen oder statt zu sprechen eine Nachricht eingeben. ChatGPT kann per Sprachchat antworten, ohne einen separaten Chat zu starten.

Verfügbare Bildtypen und Limits hängen von deinem Tarif und Konto ab.

Live kann derzeit keine Dateien aus deiner ChatGPT-Bibliothek finden oder hinzufügen. Je nach Konto kannst du möglicherweise trotzdem manuell eine unterstützte Datei an den Chat anhängen.

Video oder Bildschirm teilen

Live unterstützt zum Start keine Videos und keine Bildschirmfreigabe.

Video und Bildschirmfreigabe bleiben für berechtigte Abonnentinnen und Abonnenten in den ChatGPT-Apps für iOS und Android verfügbar, wenn Advanced verwendet wird:

Um Live-Video zu teilen, wähle während einer Sprachunterhaltung die Kameraschaltfläche. Wähle sie erneut aus, um das Teilen zu beenden.
Um deinen Bildschirm zu teilen, wähle das Menü für weitere Optionen, dann Bildschirm teilen, und folge den Anweisungen deines Geräts.
Um die Bildschirmfreigabe zu beenden, kehre zu ChatGPT zurück und wähle die Bildschirmfreigabe-Steuerung erneut aus. Du kannst das Teilen auch über die Systemsteuerung deines Geräts für die Bildschirmfreigabe beenden.

Wenn du ein Video- oder Bildschirmfreigabe-Limit erreichst, kannst du die Sprachunterhaltung möglicherweise fortsetzen, ohne eine neue Video- oder Bildschirmfreigabe-Eingabe zu starten.

Bevorzugte Stimme ändern

Öffne Einstellungen → Sprachchat und wähle dann Stimme, um aus diesen Optionen zu wählen:

Arbor: gelassen und vielseitig
Breeze: lebendig und aufrichtig
Cove: ruhig und direkt
Ember: selbstbewusst und optimistisch
Juniper: offen und positiv
Maple: fröhlich und offen
Sol: gewandt und entspannt
Spruce: ruhig und bestärkend
Vale: klar und neugierig

Wenn du während einer Sprachunterhaltung die ausgewählte Stimme änderst, startet im selben Chat ein neuer Sprachanruf.

Bevorzugte Sprache ändern

Öffne Einstellungen → Sprachchat und wähle dann Sprache. Wenn du die Sprache auswählst, die du am häufigsten sprichst, kann ChatGPT deine Sprache genauer verstehen. Du kannst ChatGPT während einer Sprachunterhaltung auch bitten, eine andere Sprache zu sprechen.

Antwortstil ändern

Voreingestellte ChatGPT-Persönlichkeiten gelten derzeit nicht für Live.

Du kannst ChatGPT während einer einzelnen Sprachunterhaltung weiterhin bitten, Ton, Tempo oder Antwortstil zu ändern.

Du kannst ChatGPT bitten, schneller oder langsamer zu sprechen. Genaue Regler für die Wiedergabegeschwindigkeit gibt es derzeit jedoch nicht.

Intelligenzstufe ändern

Wenn die Einstellung Intelligenz für dein Konto verfügbar ist, öffne Einstellungen → Sprachchat → Intelligenz und wähle Instant, Mittel oder Hoch. Diese Einstellung steuert, wie ChatGPT während einer Sprachunterhaltung mit schwierigeren Fragen umgeht. Die verfügbaren Stufen können von deinem Tarif abhängen.

Höhere Intelligenzstufen können länger für Antworten brauchen, besonders wenn Sprachchat das Web durchsucht.

Sprachchat in CarPlay verwenden

ChatGPT ist in Apple CarPlay auf unterstützten iPhones verfügbar. Über deinen CarPlay-Bildschirm kannst du eine Sprachunterhaltung starten, einen kürzlich verwendeten oder angehefteten Chat fortsetzen oder eine Unterhaltung in einem Projekt beginnen. Mehr zur Verwendung von ChatGPT in CarPlay.

Verwende dein Mobilgerät nur, wenn es gesetzlich erlaubt ist und die Bedingungen eine sichere Nutzung zulassen. Richte die App vor der Fahrt ein und vermeide es, dein Gerät zu bedienen, während das Fahrzeug in Bewegung ist.

Unterhaltung im Hintergrund fortführen

Um eine Sprachunterhaltung fortzusetzen, während du andere Apps nutzt oder dein Telefon gesperrt ist, aktiviere unter Einstellungen → Sprachchat die Option Hintergrundunterhaltungen.

Eine Unterhaltung im Hintergrund endet, wenn du sie beendest, die App zwangsweise schließt, ein Nutzungslimit erreichst oder die maximale Sitzungsdauer erreicht ist. Wenn du in Advanced deinen Bildschirm teilst, endet die Bildschirmfreigabe ebenfalls, sobald du sie beendest oder deinen Bildschirm sperrst.

ChatGPT mit Sprachchat starten

Aktiviere in unterstützten Versionen der mobilen App unter Einstellungen → Sprachchat die Option Mit Sprachchat starten. Wenn diese Einstellung aktiviert ist, startet der Sprachchat automatisch, wenn du ChatGPT mit einer neuen oder leeren Unterhaltung öffnest.

Um den Sprachchat in CarPlay automatisch zu starten, aktiviere unter Einstellungen → Sprachchat die Option Automatisch in CarPlay starten. Diese Einstellung erscheint, nachdem du ChatGPT in CarPlay verwendet hast.

Datenkontrollen

Wie lange speichert OpenAI Audio- und Videoclips?

Audioclips aus Live- und Advanced-Sprachunterhaltungen sowie Videoclips aus Advanced-Sprachunterhaltungen werden zusammen mit dem Transkript gespeichert, das in deinem Chatverlauf erscheint. Clips werden 30 Tage lang aufbewahrt.

Wenn du einen Chat löschst, löschen wir innerhalb von 30 Tagen auch die zugehörigen Audio- und Videoclips, es sei denn, wir müssen sie aus Gründen der Sicherheit oder aus rechtlichen Gründen aufbewahren, wie in unserer Datenschutzrichtlinie beschrieben, oder du hast zuvor entschieden, die Clips zum Training unserer Modelle zu teilen, und sie wurden bereits von deinem Konto getrennt.

Das Löschen eines Chats, einschließlich zugehöriger Audio- oder Videodaten, kann nicht rückgängig gemacht werden. Beim Archivieren wird der Chat nur aus deiner Seitenleiste entfernt. Der Chat und die zugehörigen Audio- oder Videoclips werden nicht gelöscht.

Bei Standard wird Audio transkribiert, bevor ChatGPT eine Antwort erzeugt. Wir löschen das Audio, nachdem die Transkription abgeschlossen ist, es sei denn, du hast dich entschieden, Audio zum Training unserer Modelle zu teilen. Audio wird auch gelöscht, wenn die Transkription fehlschlägt.

Trainiert OpenAI Modelle mit Audio- oder Videoclips?

Nein, außer du entscheidest dich, Audio- oder Videoclips zu teilen, um beim Training unserer Modelle zu helfen, oder du hast in deinen OpenAI-Kontoeinstellungen die Schalter „Audioaufnahmen einbeziehen“ oder „Videoaufnahmen einbeziehen“ aktiviert. Mehr über deine Datenkontrollen erfährst du hier.

Wenn Das Modell für alle verbessern aktiviert ist, können wir je nach Tarif und Einstellungen Transkripte und andere Dateien aus deinen Sprachunterhaltungen verwenden, um unsere Modelle zu trainieren. Die zugehörigen Audio- oder Videoclips verwenden wir nicht für das Training, es sei denn, du entscheidest dich, sie wie oben beschrieben zur Verbesserung des Modells zu teilen.

Personen mit Free, Plus oder Pro in persönlichen Workspaces können Clips teilen, indem sie Einstellungen → Datenkontrollen öffnen, Das Modell für alle verbessern aktivieren und dann Audioaufnahmen einbeziehen oder Videoaufnahmen einbeziehen einschalten. In ChatGPT Business-, Enterprise- oder Edu-Workspaces können Personen keine Audio- oder Videoclips aus Sprachunterhaltungen teilen.

Wenn du Audio- oder Videoclips teilst, können unsere Teams geteilte Clips prüfen, um das Verhalten der Modelle zu verbessern, etwa um zu verstehen, wo ChatGPT etwas falsch gehört oder falsch interpretiert hat. Bevor wir geteilte Clips für das Training verwenden, ergreifen wir Maßnahmen, um die Menge personenbezogener Informationen im Clip zu reduzieren.

Wenn du das Teilen beendest, werden neue Clips nicht mehr zum Training unserer Modelle verwendet. Clips, die zuvor von deinem Konto getrennt wurden, können weiterhin verwendet werden. Deine Auswahl ist an dein Konto gebunden und gilt für jedes Gerät, auf dem du angemeldet bist.

Mehr zu Datenkontrollen und dazu, wie deine Daten zur Verbesserung der Modellleistung verwendet werden.

Häufig gestellte Fragen

Kann ich sprechen, während ChatGPT spricht?

Ja. Live kann gleichzeitig zuhören und sprechen. Du kannst ChatGPT also unterbrechen oder weitersprechen, während es antwortet. ChatGPT sollte dem neuesten Teil der Unterhaltung folgen. Überschneidende Sprache, Hintergrundgeräusche, Netzwerkbedingungen und Mikrofoneinstellungen können jedoch beeinflussen, was es hört.

Können mehrere Personen gleichzeitig mit ChatGPT sprechen?

Live ist vor allem für Gespräche zu zweit ausgelegt. Es kann mit Hintergrundgeräuschen umgehen, ist aber noch nicht für Unterhaltungen mit mehreren sprechenden Personen optimiert. Es kann antworten, wenn Personen miteinander statt mit ChatGPT sprechen.

Warum unterbricht mich ChatGPT oder hört auf zu sprechen?

Unterbrechungen können weiterhin auftreten, besonders bei Hintergrundgeräuschen, langen Pausen oder Ton von anderen sprechenden Personen. Versuche es mit Kopfhörern, wechsle in eine ruhigere Umgebung oder erhöhe die Lautstärke deines Geräts. Auf dem iPhone kannst du während einer Sprachunterhaltung außerdem das Kontrollzentrum öffnen, Mikrofonmodus auswählen und Stimmisolation aktivieren.

Kann ich Voice bitten zu warten, während ich laut nachdenke?

Zu Beginn der Unterhaltung kannst du Live bitten zu warten, bis du bereit für eine Antwort bist, zum Beispiel: „Warte, bis ich dich bitte zu antworten.“ Lange Pausen, Stimmen im Hintergrund oder andere Geräusche können trotzdem dazu führen, dass Live antwortet.

Kann ich Live mit GPTs, Work oder Codex verwenden?

In der ChatGPT-Desktop-App für macOS und Windows kann ChatGPT Sprachchat deinen Computer steuern und mehrere Agents mithilfe der in Work oder Codex verfügbaren Tools und Berechtigungen koordinieren.

Mit ChatGPT Sprachchat in Work und Codex kannst du:

Aufgaben starten, priorisieren, unterbrechen oder neu ausrichten, während die Arbeit im Hintergrund weiterläuft.
Mehrere Agents über aktive Unterhaltungen und Projekte hinweg koordinieren.
Bestehende Aufgaben mit dem verfügbaren Projektkontext und unterstützten verbundenen Tools fortsetzen, darunter Dokumente, Kalender, Kontakte und Kommunikationsdienste.
Gesprochene oder auf dem Bildschirm angezeigte Fortschrittsmeldungen erhalten, auch wenn Aufgaben blockiert oder abgeschlossen sind.
Erkennen, wann ChatGPT zuhört, und das Mikrofon während einer Unterhaltung stummschalten oder ausschalten.

Sprachchat in Work und Codex hat eigene Nutzungskontingente und Preise für Work beziehungsweise Codex. In Business- und Enterprise-Workspaces mit flexibler Preisgestaltung kostet die Nutzung etwa 6 Credits pro Minute. Ältere Enterprise-Workspaces umfassen etwa 45 Minuten pro Fünf-Stunden-Zeitraum. Delegierte Aufgaben werden zu den Standardtarifen vom bestehenden gemeinsamen Nutzungskontingent abgezogen.

Eigenständiger Sprachchat in Work und Codex ist weder im Web noch auf Mobilgeräten verfügbar. Der gekoppelte Fernzugriff über iOS wird jedoch unterstützt.

In Enterprise-Workspaces müssen für Sprachchat in Work und Codex sowohl Sprachchat als auch Vorabzugriff auf Modelle aktiviert sein.

Live ist mit benutzerdefinierten GPTs nicht verfügbar. Sprachunterhaltungen mit GPTs verwenden weiterhin den erweiterten Sprachmodus und die Stimme Shimmer. Je nach Konto und Sitzung kannst du möglicherweise Dateien und Fotos hochladen. Bildgenerierung, Datenanalyse und benutzerdefinierte Aktionen sind in Sprachunterhaltungen mit GPTs nicht verfügbar.

Wann sollte ich Sprachchat statt Diktat verwenden?

Verwende Sprachchat für ein Live-Gespräch in beide Richtungen oder um Ideen laut durchzugehen. Verwende ChatGPT-Diktat, wenn du einen Prompt aufnehmen, die Transkription prüfen und bearbeiten und ihn anschließend als Text senden möchtest. Sprachchat-Transkripte sind keine wörtlichen Aufzeichnungen und stimmen möglicherweise nicht genau mit dem Gesagten überein.

Warum stimmt das Transkript nicht genau mit der Unterhaltung überein?

Nach einer Sprachunterhaltung wird dem Chat ein Transkript hinzugefügt. Es stimmt möglicherweise nicht genau mit dem überein, was du oder ChatGPT gesagt habt, besonders wenn sich Sprache überschneidet, Hintergrundgeräusche vorhanden sind oder die Unterhaltung schnell verläuft.

Bei Live erscheinen die Antworten von ChatGPT außerdem im Chat als Text, während sie gesprochen werden. Nachdem du die Sprachunterhaltung beendet hast, kannst du sie in deinem Chatverlauf ansehen.

Gibt es Untertitel in Sprachunterhaltungen?

Bei Live erscheinen die Antworten von ChatGPT im Chat als Text, während sie gesprochen werden. Wähle unter iOS und Android mit Advanced während einer Sprachunterhaltung die Schaltfläche cc, um Untertitel für die Antworten von ChatGPT anzuzeigen.

Nachdem du eine Sprachunterhaltung beendet hast, wird das Transkript zum Chat hinzugefügt, damit du es in deinem Chatverlauf ansehen kannst.

Warum wurde meine Sprachunterhaltung beendet?

Eine Sprachunterhaltung kann enden, wenn du ein Nutzungslimit, die maximale Sitzungsdauer oder in einer langen Unterhaltung das Kontextlimit erreichst. ChatGPT zeigt nach Möglichkeit einen Hinweis an. Du kannst im Text fortfahren oder Sprachchat erneut starten.

Wie viele Sprachunterhaltungen kann ich gleichzeitig führen?

Du kannst jeweils eine Sprachunterhaltung führen.

Warum sehe ich Live nicht in meinen Sprachchat-Einstellungen?

Live wird schrittweise eingeführt. Die Verfügbarkeit hängt von Tarif, Region, Workspace und App-Version ab. Stelle sicher, dass ChatGPT aktualisiert ist. Wenn Live nicht verfügbar ist, kannst du Advanced oder Standard Voice weiterverwenden.

ChatGPT Sprachchat