Lied mit einer Google-Note

Googles neues Modell komponiert Musik in voller Länge

Die neue Version überwindet das alte Zeitlimit. Nutzer erstellen vollständige Tracks direkt aus multimodalen Prompts.

Andreas Becker Nano Banana
Lied mit einer Google-Note

Google veröffentlicht mit Lyria 3 Pro ein neues KI-Modell für die professionelle Musikproduktion. Die erweiterte Version durchbricht bisherige Zeitlimits und generiert vollständige, dreiminütige Audiotracks direkt aus multimodalen Eingaben wie Text oder Bild.

Die Grenzen des bisherigen Vorgängermodells

Das bisherige KI-Modell Lyria 3 legte den Grundstein für die multimodale Audio-Generierung bei Google. Nutzer erstellten durch präzises Prompting hochwertige Kompositionen direkt aus Texten, visuellen Inhalten und kurzen Videoclips. Das System lieferte dabei stets realistische Gesangsstimmen.

Zudem ordnete die Architektur passend generierte Liedtexte nahtlos in das jeweilige Arrangement ein. Allerdings endete die musikalische Ausgabe strikt nach genau 30 Sekunden. Diese starke Limitierung schränkte die Produktion längerer Titel erheblich ein, da Anwender die kurzen Elemente aufwendig kombinieren mussten.

Anzeige

Erweiterte Laufzeit und komplexe Songstrukturen

Lyria 3 Pro löst das bisherige Problem der strengen zeitlichen Begrenzung. Das erweiterte KI-Modell generiert zusammenhängende Musikstücke mit einer maximalen Länge von bis zu drei vollen Minuten. Anwender konstruieren auf diese Weise komplette Songs in einem einzigen Durchlauf.

Zudem erfasst die Architektur den musikalischen Aufbau eines Tracks deutlich präziser als der Vorgänger. Nutzer fordern über gezieltes Prompting spezifische musikalische Bausteine wie Intros, Strophen, Refrains und Bridges an. Dies erleichtert das Experimentieren mit unterschiedlichen Musikstilen spürbar. Gleichzeitig erzeugt das Modell komplexe musikalische Übergänge innerhalb der Audiospur völlig nahtlos.

Breite Verfügbarkeit und Plattform-Integration

Google positioniert das neue KI-Modell über verschiedene Vertriebswege für eine breite Zielgruppe. Kreative greifen unter anderem über die Plattform ProducerAI auf die Technologie zu, um dort umfassende Musiktitel detailliert auszuarbeiten. Parallel dazu steht die längere Audio-Generierung ab sofort den zahlenden Abonnenten in der regulären Gemini-App bereit. Dort untermalen Nutzer beispielsweise Podcasts oder Videoblogs mit passenden Tracks.

Für den geschäftlichen Einsatz bietet das Unternehmen Lyria 3 Pro als Preview über Vertex AI an. Firmen skalieren damit die Produktion von hochwertigen Audiospuren für Videospiele oder integrieren die Audio-Generierung in eigene Plattformen. Softwareentwickler greifen parallel für den Aufbau neuer Applikationen direkt auf die Gemini-API sowie das Google AI Studio zu.

Die unsichtbare Kennzeichnung aller produzierten Inhalte erfolgt plattformübergreifend und verlässlich über digitale Wasserzeichen.

KI-Wissen ohne Paywall

Unsere Inhalte sind und bleiben kostenlos. Wenn dir unsere News und Tutorials gefallen oder weiterhelfen, freuen wir uns über eine kleine Unterstützung.

Jeder Beitrag zählt – auch das Teilen.