ElevenLabs & Deepgram: Die neuen Giganten der Audio-KI
Mit 330 Millionen Dollar Umsatz und neuer Einhorn-Bewertung definieren diese Startups die Zukunft der Sprachsteuerung.

Der Markt für künstliche Stimmen wächst exponentiell und generiert nun massive Umsätze. ElevenLabs bestätigte einen jährlich wiederkehrenden Umsatz von 330 Millionen US-Dollar, während Konkurrent Deepgram eine Bewertung von über einer Milliarde erreicht. Das unterstreicht die finanzielle Relevanz von Audio-KI.
Rekordzahlen durch synthetische Stimmen
Mati Staniszewski, CEO des KI-Startups ElevenLabs, gab bekannt, dass das Unternehmen das Jahr 2025 mit einem jährlich wiederkehrenden Umsatz (ARR) von 330 Millionen US-Dollar abgeschlossen hat. Diese Kennzahl ist im Software-Bereich entscheidend, da sie die planbaren Einnahmen aus laufenden Abonnements widerspiegelt und somit die Stabilität des Geschäftsmodells anzeigt.
Der Erfolg des Unternehmens beruht auf einer Technologie, die Text in extrem realistisch klingende Sprache umwandelt. Was als Werkzeug für Kreative begann, hat sich zu einer festen Größe für Medienhäuser und Tech-Konzerne entwickelt. Die enorme Summe verdeutlicht die rasante Skalierung des Startups, das sich innerhalb kürzester Zeit an die Spitze des Segments für generative Audio-KI gesetzt hat.
Deepgram sichert sich 130 Millionen Dollar
Auch die Konkurrenz schläft nicht und sorgt am selben Tag für Schlagzeilen. Deepgram verkündete fast zeitgleich eine erfolgreiche Finanzierungsrunde der Serie C in Höhe von 130 Millionen US-Dollar. Durch diese Investition steigt die Bewertung des Unternehmens offiziell auf 1,3 Milliarden US-Dollar.
Anders als ElevenLabs, das oft für die Sprachsynthese (Text-to-Speech) bekannt ist, liegt der Fokus von Deepgram stark auf der Infrastruktur für Spracherkennung (Speech-to-Text) und dem Verstehen von Sprache. Das Unternehmen nutzt das frische Kapital sofort für strategisches Wachstum: Bestätigt wurde die Übernahme eines weiteren KI-Startups aus dem renommierten Y-Combinator-Programm.
Anzeige
Audio-KI wird zum Milliardengeschäft
Die aktuellen Meldungen markieren einen Wendepunkt für die Branche. Generative Audio-Technologie hat die Phase technischer Spielereien endgültig verlassen und etabliert sich als profitables Infrastruktur-Element. Investoren setzen massives Kapital darauf, dass sprachgesteuerte Interaktionen die nächste dominante Schnittstelle zwischen Mensch und Maschine werden.
Die Parallelität dieser Ankündigungen zeigt, dass sich der Markt diversifiziert. Während einige Anbieter die perfekte Ausgabe menschlicher Stimmen anstreben, konzentrieren sich andere auf die schnelle Verarbeitung und Analyse gesprochener Worte. Für die Industrie bedeutet dies eine breitere Auswahl an hochspezialisierten Werkzeugen, die nun mit ausreichend Kapital für den Massenmarkt skaliert werden.
