ElevenLabs ermöglicht KI-Hörbücher per Klick für Spotify
Autoren können KI-Hörbücher nun zentral erstellen, bearbeiten und ohne Umwege im Streaming-Dienst publizieren.

ElevenLabs erweitert seine Plattform um ein dediziertes "Audiobooks"-Modul, das die Erstellung langer Audioformate technisch neu strukturiert. Autoren erhalten damit einen durchgängigen Workflow von der Textverarbeitung bis zur Veröffentlichung auf Spotify und der hauseigenen Reader-App.
Vom Schnipsel zum Langformat
Bislang eigneten sich KI-Sprachgeneratoren vornehmlich für kurze Textabschnitte oder dialogbasierte Anwendungen. Mit der Einführung von "Audiobooks" im Bereich ElevenCreative adressiert das Unternehmen nun die technische Hürde der Kohärenz bei Langformaten. Das neue Toolkit ermöglicht es, ganze Bücher kapitelweise zu importieren und als einheitliches Projekt zu verwalten.
Der technische Fokus liegt auf der granularen Kontrolle der Audioausgabe. Nutzer können spezifischen Textpassagen unterschiedliche Sprecherprofile zuweisen – etwa für Dialoge zwischen verschiedenen Romanfiguren – und die Betonung sowie das Tempo manuell nachjustieren. Der Hersteller verspricht hierbei eine "Studio-Qualität", die den Aufwand für Post-Production minimieren soll. In der Praxis dürfte jedoch weiterhin menschliches Eingreifen notwendig sein, um unnatürliche Pausensetzungen oder monotone Sprachmelodien über eine Laufzeit von mehreren Stunden zu vermeiden.
Quelle: selbst erstellt mit Firefly
Geschlossene Distributionskette
Strategisch relevant ist weniger die reine Synthese-Technologie, sondern die Integration der Vertriebskanäle. ElevenLabs koppelt das Erstellungswerkzeug direkt an Distributionsplattformen. Fertige Hörbücher lassen sich unmittelbar in die ElevenReader-App exportieren, die das Unternehmen im Zuge der Übernahme des Omnivore-Teams massiv ausgebaut hat.
Noch gewichtiger wiegt die Schnittstelle zu Spotify. Durch eine Partnerschaft können Autoren ihre KI-narratierten Werke direkt in den Streaming-Katalog einspeisen. Dies senkt die Eintrittsbarriere für Independent-Autoren erheblich, da klassische Produktionskosten für Sprecher und Tonstudio entfallen. Für den Endkunden werden diese Inhalte voraussichtlich klar als KI-generiert gekennzeichnet, um Transparenz im wachsenden Katalog zu gewährleisten.
Einordnung: Bewertung und Marktdruck
Der Zeitpunkt der Veröffentlichung korreliert mit einer neuen Finanzierungsrunde, die ElevenLabs laut Berichten eine Bewertung von rund 11 Milliarden US-Dollar einbringt. Diese Kapitalisierung unterstreicht die Wette der Investoren darauf, dass synthetische Medien die Content-Produktion dauerhaft verändern.
Technisch gesehen bewegt sich ElevenLabs damit weg vom reinen Tool-Anbieter hin zu einer Plattform-Ökonomie. Indem das Unternehmen nicht nur die Erstellung, sondern auch die Verteilung kontrolliert, baut es ein geschlossenes Ökosystem auf. Für professionelle Sprecher dürfte diese Entwicklung den Druck im Segment der Sachbücher und der kostengünstigen Belletristik weiter erhöhen, während Premium-Produktionen vorerst noch auf menschliche Nuancen setzen dürften.
