Ein futuristisches AI-Musik-Studio

Musik in Sekunden: Diese Audio-KI ersetzt das Tonstudio

Stable Audio 2.5 generiert Tracks in Studioqualität – und braucht dafür nur zwei Sekunden.

Ein futuristisches AI-Musik-Studio
gpt-image-1 | All-AI.de

EINLEITUNG

Stability AI geht mit seiner Audio-KI in die nächste Runde – und spricht jetzt gezielt Unternehmen an. Stable Audio 2.5 erzeugt komplette Musikstücke in Studioqualität und braucht dafür weniger Zeit, als ein Track zum Laden braucht. Möglich macht das eine neue Trainingsmethode namens ARC. Gleichzeitig bringt das Update Funktionen, die das Modell für professionelle Audio-Workflows interessant machen sollen – etwa das nahtlose Ergänzen bestehender Aufnahmen.

NEWS

Was das Modell kann

Stable Audio 2.5 generiert bis zu drei Minuten lange Tracks in unter zwei Sekunden – zumindest auf den dafür optimierten Nvidia H100-GPUs. Dabei sind die Strukturen komplexer als bisher: Intros, Spannungsbögen, Breaks und Outros lassen sich gezielt erzeugen. Auch auf Stimmungen und Genres reagiert das Modell jetzt feinfühliger. Prompts wie „epischer Soundtrack“ oder „uplifting Electro mit breiten Synths“ liefern laut Stability AI hörbar bessere Ergebnisse.

Ein Highlight ist die neue Inpainting-Funktion. Nutzer laden einen Audioschnipsel hoch, markieren den Einstiegspunkt – und die KI ergänzt den Rest des Tracks passend dazu. Das ist praktisch, wenn etwa ein Loop verlängert oder ein halbfertiger Jingle fertiggestellt werden soll. Auch Text-zu-Audio bleibt möglich. Die generierten Dateien lassen sich direkt in kreative Workflows integrieren.

Tempo durch neue Methode

Das Geschwindigkeits-Upgrade kommt durch ARC, kurz für „Adversarial Relativistic-Contrastive“. Statt den generativen Prozess durch ein zweites Modell zu verlangsamen, trainiert ARC direkt auf Relevanz und Kontrast. Das spart Rechenzeit und verbessert die Ausgabegenauigkeit – bei deutlich weniger Inferenzschritten. Schon in der mobilen Version „Stable Audio Open Small“ war diese Methode im Einsatz.

Die Kombination aus Geschwindigkeit, Qualität und Flexibilität macht das Modell interessant für professionelle Audioproduktion – etwa in Agenturen oder internen Content-Teams. Stability AI stellt Stable Audio 2.5 über eine API, Partner-Plattformen und als Enterprise-Modell bereit. Laut Anbieter wurde der Trainingsdatensatz vollständig lizenziert, zudem prüft ein internes System automatisch die Einhaltung von Urheberrechten.

Sound als Markenidentität

Das Ziel: Unternehmen sollen mit wenigen Klicks eine eigene Klangsprache entwickeln – für Werbespots, Spiele, UX-Sounds oder sogar Kreditkartentöne. Dafür kooperiert Stability AI mit der Soundbranding-Agentur Amp, die zur WPP-Gruppe gehört. Die neueste Version von Stable Audio soll über WPP Open bereitgestellt werden – und so direkt in die Audiostrategie globaler Marken einfließen.

Damit wird klar: Nach dem Boom der Bild-KIs verschiebt sich der Fokus zunehmend Richtung Audio. Und Stability AI setzt alles daran, nicht nur mitzuspielen, sondern die Regeln zu schreiben.

DEIN VORTEIL - DEINE HILFE

Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung.

Teile diesen Beitrag

Folge uns auf Social Media

Keine KI-News mehr verpassen und direkt kommentieren!

Unterstütze uns direkt

Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support!

KURZFASSUNG

  • Stability AI veröffentlicht Stable Audio 2.5 für Enterprise-Sound-Produktion mit dreiminütigen Tracks in unter zwei Sekunden.
  • Neu sind Audio-Inpainting, bessere Songstrukturen und präzisere Reaktionen auf Stimmungs- und Genre-Prompts.
  • Die ARC-Methode beschleunigt die Generierung deutlich; Verfügbarkeit über API und Partnerplattformen.
  • Mit WPP/amp peilt Stability AI skalierbares Sound-Branding über WPP Open an.

QUELLEN