Googles neues Modell komponiert Musik in voller Länge

Die neue Version überwindet das alte Zeitlimit. Nutzer erstellen vollständige Tracks direkt aus multimodalen Prompts.

Andreas Becker25.03.26 Nano Banana

Kurzfassung Quellen

Google veröffentlicht das verbesserte KI-Modell Lyria 3 Pro für die professionelle Audio-Generierung.
Das Modell erstellt nun zusammenhängende Musikstücke mit einer Länge von bis zu drei Minuten und löst damit das 30-Sekunden-Limit des Vorgängers ab.
Die Technologie steht ab sofort für professionelle Anwender zur Verfügung und ist unter anderem direkt in die Plattform ProducerAI integriert.

Google veröffentlicht mit Lyria 3 Pro ein neues KI-Modell für die professionelle Musikproduktion. Die erweiterte Version durchbricht bisherige Zeitlimits und generiert vollständige, dreiminütige Audiotracks direkt aus multimodalen Eingaben wie Text oder Bild.

Die Grenzen des bisherigen Vorgängermodells

Das bisherige KI-Modell Lyria 3 legte den Grundstein für die multimodale Audio-Generierung bei Google. Nutzer erstellten durch präzises Prompting hochwertige Kompositionen direkt aus Texten, visuellen Inhalten und kurzen Videoclips. Das System lieferte dabei stets realistische Gesangsstimmen.

Zudem ordnete die Architektur passend generierte Liedtexte nahtlos in das jeweilige Arrangement ein. Allerdings endete die musikalische Ausgabe strikt nach genau 30 Sekunden. Diese starke Limitierung schränkte die Produktion längerer Titel erheblich ein, da Anwender die kurzen Elemente aufwendig kombinieren mussten.

Erweiterte Laufzeit und komplexe Songstrukturen

Lyria 3 Pro löst das bisherige Problem der strengen zeitlichen Begrenzung. Das erweiterte KI-Modell generiert zusammenhängende Musikstücke mit einer maximalen Länge von bis zu drei vollen Minuten. Anwender konstruieren auf diese Weise komplette Songs in einem einzigen Durchlauf.

Zudem erfasst die Architektur den musikalischen Aufbau eines Tracks deutlich präziser als der Vorgänger. Nutzer fordern über gezieltes Prompting spezifische musikalische Bausteine wie Intros, Strophen, Refrains und Bridges an. Dies erleichtert das Experimentieren mit unterschiedlichen Musikstilen spürbar. Gleichzeitig erzeugt das Modell komplexe musikalische Übergänge innerhalb der Audiospur völlig nahtlos.

Breite Verfügbarkeit und Plattform-Integration

Google positioniert das neue KI-Modell über verschiedene Vertriebswege für eine breite Zielgruppe. Kreative greifen unter anderem über die Plattform ProducerAI auf die Technologie zu, um dort umfassende Musiktitel detailliert auszuarbeiten. Parallel dazu steht die längere Audio-Generierung ab sofort den zahlenden Abonnenten in der regulären Gemini-App bereit. Dort untermalen Nutzer beispielsweise Podcasts oder Videoblogs mit passenden Tracks.

Für den geschäftlichen Einsatz bietet das Unternehmen Lyria 3 Pro als Preview über Vertex AI an. Firmen skalieren damit die Produktion von hochwertigen Audiospuren für Videospiele oder integrieren die Audio-Generierung in eigene Plattformen. Softwareentwickler greifen parallel für den Aufbau neuer Applikationen direkt auf die Gemini-API sowie das Google AI Studio zu.

Die unsichtbare Kennzeichnung aller produzierten Inhalte erfolgt plattformübergreifend und verlässlich über digitale Wasserzeichen.