ChatGPTs neuer Voice Mode enttäuscht: Was OpenAI noch liefern muss

Angekündigte Features wie Bildanalyse und Internet-Suche fehlen – Europa bleibt ausgeschlossen.

Zusammenfassung | AI Caramba, 01.10.24
ChatGPT Voice
Flux Schnell | All-AI.de

Worum geht es?

OpenAI führt Advanced Voice Mode ein, aber nicht alle angekündigten Funktionen

OpenAI hat den Advanced Voice Mode für ChatGPT-Plus- und Team-Nutzer eingeführt. Obwohl CEO Sam Altman die Einführung des Sprachinteraktions-Modus offiziell bekannt gab, fehlen viele der zuvor demonstrierten Features. Zudem bleibt die Funktion in Europa, einschließlich der EU, Großbritannien und der Schweiz, unzugänglich.

News

Was ist neu?

Der Advanced Voice Mode ermöglicht Sprachinteraktionen mit dem KI-Assistenten und verspricht eine verbesserte Konversationsgeschwindigkeit sowie optimierte Akzente. Zu den neuen Features gehören:

- Custom Instructions: Nutzer können individuelle Anweisungen geben, um die Interaktionen zu personalisieren.

- Memory: Der Assistent kann sich bestimmte Informationen aus den Konversationen merken, um zukünftige Gespräche zu verbessern.

- Neue Stimmen: Fünf neue Stimmen sollen die Sprachinteraktionen natürlicher gestalten.

Was fehlt?

Obwohl einige Verbesserungen eingeführt wurden, bleiben viele der bei der Vorstellung von GPT-4o angekündigten Fähigkeiten außen vor. Insbesondere die Funktionen im Bereich der visuellen Verarbeitung sind noch nicht verfügbar. Hierzu zählen:

- Analyse von Bildern und Videos: OpenAI hatte demonstriert, wie der Assistent Grafiken in Echtzeit analysieren und Emotionen in Gesichtern erkennen kann. In der aktuellen Version des Advanced Voice Mode fehlen diese Fähigkeiten.

- Mathematik-Lernen mit Kindern: In den Präsentationen zeigte OpenAI, wie der Modus Kindern bei mathematischen Aufgaben hilft, indem er Zeichnungen auf einem iPad analysiert. Diese praktische Anwendung ist momentan nicht möglich.

- Singen und Summen: Auch das Singen und Summen, das während der Demos präsentiert wurde, wurde nicht implementiert.

- Internet-Suche: Aktuell kann der Advanced Voice Mode keine Informationen aus dem Internet abrufen.

- Wechsel von Text zu Sprache: Ein Übergang von einer Textkonversation in den Advanced Voice Mode ist derzeit nicht möglich. Ebenso fehlt die Option, ein Gespräch im Standardmodus in den erweiterten Sprachmodus zu überführen.

Warum fehlen diese Features?

Ein möglicher Grund für die eingeschränkte Verfügbarkeit in Europa, insbesondere in der EU, Großbritannien und der Schweiz, könnte in der Fähigkeit des Systems zur Emotionserkennung liegen. Der EU AI Act verbietet diese Funktion, was erklären könnte, warum der Advanced Voice Mode in diesen Regionen nicht eingeführt wurde.

Darüber hinaus hat OpenAI noch keine Gründe für das Fehlen der anderen angekündigten Funktionen genannt. Insbesondere die bei der Vorstellung von GPT-4o gezeigten multimodalen Fähigkeiten, wie die Generierung von Bildern, bleiben weiterhin aus.

Konkurrenz und Alternativen

Seit der Vorstellung des Advanced Voice Modes im Mai haben andere Unternehmen ähnliche Produkte vorgestellt. Google führte beispielsweise Gemini Live ein, und es gibt mittlerweile auch eine erste Open-Source-Alternative namens Moshi, die jedoch in ihrer Leistungsfähigkeit hinter dem Advanced Voice Mode zurückbleibt.

Ausblick

Der Advanced Voice Mode von ChatGPT stellt eine interessante Neuerung dar, kommt aber noch lange nicht an die in den Demos versprochenen Fähigkeiten heran. Die aktuelle Version bleibt in einigen Bereichen eingeschränkt und ist in Europa nicht verfügbar. Angesichts der schnellen Entwicklung im KI-Bereich bleibt abzuwarten, wann OpenAI die fehlenden Features nachliefert und ob der Advanced Voice Mode seinen Weg in die europäischen Märkte finden wird.

Profilbild AI Caramba

Short

  • OpenAI hat den Advanced Voice Mode für ChatGPT-Plus- und Team-Nutzer eingeführt, jedoch fehlen viele der zuvor angekündigten Features.
  • Neue Funktionen wie individuelle Anweisungen und Gedächtnis sind enthalten, während die angekündigten Fähigkeiten zur Bild- und Videoanalyse fehlen.
  • Der Advanced Voice Mode ist in Europa, einschließlich der EU, Großbritannien und der Schweiz, nicht verfügbar.
  • Die fehlenden Features könnten auf rechtliche Einschränkungen, wie den EU AI Act, zurückzuführen sein.
  • Andere Unternehmen wie Google bieten inzwischen ähnliche Sprachfunktionen an, bleiben aber hinter OpenAIs Versprechen zurück.

Quellen:

1. OpenAI, 30.09.2024

Kommentieren, diskutieren und teilen!

Anmelden