Ein Google Logo mit Sprache

Google AI Studio Leak zeigt Voice Cloning

Neue Funktion erlaubt Nutzung eigener Stimmen und verspricht native Integration für konsistente Audio-Ausgabe bei KI-Videos.

Andreas Becker Nano Banana
Ein Google Logo mit Sprache

Ein Leak im Google AI Studio enthüllt eine neue Funktion namens "Create your Voice" für Gemini 3 Flash. Nutzer sollen damit künftig eigene Stimmen klonen und nativ im Modell verwenden können.

Eigene Stimme als KI-Modell

Entwickler stießen in der Benutzeroberfläche von Google AI Studio auf diese neuen Einstellungsoptionen. Der Menüpunkt "Custom Voice" erlaubt das Hochladen eigener Sprachaufnahmen oder das direkte Einsprechen von Referenzmaterial. Die KI analysiert diese Daten in wenigen Augenblicken und generiert daraus ein synthetisches Stimmprofil.

Das Ziel ist eine personalisierte Audio-Ausgabe mit hohem Nutzwert. Anstatt auf vorgefertigte Standardstimmen zurückzugreifen, antwortet der Chatbot künftig mit dem Timbre des Nutzers oder einer spezifisch definierten Charakterstimme. Diese Funktion tauchte kurzzeitig in der Testumgebung auf, was auf eine baldige Integration in die Entwickler-Tools hindeutet.

Quelle: testingcatalog.com

Durchbruch für Video-KI

Besonders für Content Creator und die Filmindustrie löst diese Funktion ein beständiges Problem. Video-Modelle haben aktuell noch Schwierigkeiten, Stimmen gekonnt und konsistent mit Charakteren zu verbinden. Produzenten nutzen daher oft umständliche Workflows über externe Anbieter wie ElevenLabs.

Die native Zuweisung einer festen Stimme direkt im Modell könnte die Synchronisation revolutionieren. Gerade für KI-Influencer oder automatisierte Videoproduktionen sorgt dies für eine durchgängige Charakteridentität. Die Stimme bleibt stabil, egal was der Charakter sagt oder in welcher Sprache er spricht.

Anzeige

Sicherheit vor Release

Die Technologie birgt jedoch Risiken. Die Erstellung von Deepfakes wird durch solche integrierten Tools vereinfacht. Google arbeitet daher im Hintergrund an strengen Sicherheitsmechanismen und Wasserzeichen für Audio-Daten. Aktuell bleibt die Funktion im AI Studio verborgen oder ist nur für einen sehr kleinen Kreis von Testern sichtbar. Ein offizielles Release-Datum mit diesen Audio-Features steht noch aus.

KI-Wissen ohne Paywall

Unsere Inhalte sind und bleiben kostenlos. Wenn dir unsere News und Tutorials gefallen oder weiterhelfen, freuen wir uns über eine kleine Unterstützung.

Jeder Beitrag zählt – auch das Teilen.