ELEVENLABS 2025 - komplettes Tutorial mit Geheimtipps für die deutsche Sprache!

Vom Anfänger zum Profi! Basis-Funktionen, 11 geheime Tipps, Emotionen, Stimme einzigartig machen, Custom GPT nutzen, Stimme klonen. Ein komplettes Tutorial in Text und Videoform!

Elevenlabs - Teil 1/5

Tool-Bewertung | Caramba, 15.11.24
Elevenlabs Tutorial
Flux Schnell | All-AI.de

Info + Inhaltsverzeichnis

Erfahrung ist King!

Wir haben bereits mehr als 10 Text-to-Speech-Tools getestet und setzen Elevenlabs seit über einem Jahr speziell für die deutsche Sprache ein. Aus diesen Erfahrungen ist nun das bisher größte Elevenlabs-Tutorial entstanden. Wir werden die einzelnen Funktionen genau erklären und auch Tipps geben, was am besten funktioniert.

Viel interessanter werden aber im zweiten Teil die Besonderheiten von Elevenlabs, die kaum jemand kennt. Wir werden viel emotionalere Sprachen erzeugen. Wir werden mit einer CustomGPT dem Text mit einem Klick Emotionen hinzufügen und dann auch noch verschiedene Möglichkeiten zeigen, wie man mit Elevenlabs einzigartige Sprachen generieren kann.

Im dritten Teil werden wir uns dann ganz dem Klonen von Sprachen widmen. Wir schauen uns beide Möglichkeiten an und sagen euch, worauf ihr achten müsst, wenn ihr das bestmögliche Ergebnis erzielen wollt.

Im vierten Teil konzentrieren wir uns auf größere Projekte und zeigen Möglichkeiten auf wie und wofür man Elevenlabs in der Praxis verwenden kann.

Und im fünften Teil gehen wir dann noch auf häufige Fragen (FAQ) zu Elevenlabs und TTS-Programmen ein.

Das Ganze wird mit guten und lustigen Beispielen untermauert. Das Tutorial ist hier als Text und auf Youtube als Video verfügbar. Bei Fragen entweder direkt hier oder auf Youtube kommentieren.

* Im Free-Plan - 10.000 Credits / Monat gratis - Affliate Link

Inhaltsverzeichnis:

1 - Tutorial als Video

Überzeugt euch selbst statt langer Erklärungen: In dem kurzen Trailer hört ihr meine Stimme und zahlreiche Elevenlabs-Stimmen. Die drei Tutorial-Episoden dazu gibt’s direkt auf YouTube.

Hier folgen mit dem Erscheinen auf Youtube die Tutorials auch in Videoform in den nächsten 1-2 Wochen.

1. Video Elevenlabs: Teil 1

2. Video Elevenlabs: Teil 2

3. Video Elevenlabs: Teil 3

2 - Allgemeines zu Elevenlabs

2.1 Was ist Elevenlabs und wofür wird es verwendet?

Elevenlabs ist vor allem für seine herausragende „Text-to-Speech“-Funktion (TTS) bekannt. Wenn ein Tool in dieser Disziplin überzeugt, kann man davon ausgehen, dass auch die anderen Funktionen auf hohem Niveau sind. Im Gegensatz dazu: Eine schlechte KI bleibt eben eine schlechte KI. Elevenlabs zählt hier unbestritten zu den besten Anbietern und ist deshalb so erfolgreich. Besonders für die deutsche Sprache ist es derzeit führend, da viele andere TTS-Tools sich hauptsächlich auf Englisch und andere große Sprachen wie Spanisch konzentrieren. Wer auf Deutsch setzt, kommt an Elevenlabs kaum vorbei. Am Ende dieses Artikels habe ich einige interessante Alternativen verlinkt – viele davon könnt ihr kostenlos ausprobieren, um euch selbst ein Bild zu machen.

So hört sich der Abschnitt mit Elevenlabs (unbearbeitet) an:

2.2 Die Sprachmodelle von Elevenlabs

Mittlerweile bietet Elevenlabs mehrere Sprachmodelle an, darunter „Eleven Multilingual v1“, „Eleven English v1“, „Eleven Turbo v2“, „Eleven Turbo v2.5“ und „Eleven Multilingual v2“. Wenn ihr eine Stimme auswählt, wird euch automatisch das passende Sprachmodell vorgeschlagen, und in 99 % der Fälle solltet ihr dieses auch übernehmen.

Für die deutsche Sprache sind vor allem die Modelle „Eleven Turbo v2.5“ und „Eleven Multilingual v2“ relevant. Das „Turbo“-Modell hat den Vorteil, dass es 50 % weniger Tokens verbraucht, was bedeutet, dass ihr damit doppelt so viel Text generieren könnt. Dennoch würde ich in den meisten Fällen das qualitativ hochwertigere „Eleven Multilingual v2“-Modell empfehlen. Das „Turbo“-Modell eignet sich eher für zeitkritische Projekte.

fas fa-info-circle

Maximale Qualität (DE): Eleven Multilingual v2

Schneller und kostengünstiger (DE): Eleven Turbo v2.5

2.3 Sprachen und Dialekte

Elevenlabs unterstützt eine Vielzahl an Sprachen und Dialekten. Besonders bemerkenswert ist, dass die Stimmen nicht nur korrekt, sondern auch natürlich klingen – ein „roboterhaftes“ Klangbild, wie es bei vielen TTS-Tools der Fall ist, bleibt hier aus. Noch beeindruckender: Viele Stimmen funktionieren in mehreren Sprachen. Wählt man etwa eine „ausländische“ Stimme und kombiniert sie mit deutschem Text, entsteht ein authentischer ausländischer Akzent. Umgekehrt kann man deutsche Stimmen verwenden, um englische Texte mit einem typischen deutschen Akzent vorzulesen. So bietet Elevenlabs vielseitige Möglichkeiten für individuelle Anforderungen.

Wiener Dialekt:

Amerikaner spricht Deutsch:

2.4 Kosten von Elevenlabs

Mit Elevenlabs könnt ihr nicht nur kostenlos starten, sondern auch jeden Monat 10.000 Credits im Free-Plan nutzen – das reicht für etwa 10 Minuten Audio. Einem ersten Test steht also nichts im Weg: Einfach anmelden und direkt ausprobieren. Praktisch ist, dass ihr flexibel zwischen den verschiedenen Plänen wechseln könnt. Startet im Free-Plan, und wenn es gefällt, wechselt ihr zum Beispiel in den Starter-Plan. Braucht ihr zwischendurch keinen Zugang, könnt ihr ohne Kündigung einfach per Klick wieder in den Free-Plan zurück. Diese unkomplizierte Lösung gefällt!

Eine detaillierte Übersicht zu den einzelnen Plänen ist weiter unten zu finden.

elevenlabs

ANZEIGE

Kostenlos ausprobieren

Wenn Dir das Tutorial geholfen hat und du öfter sehr ausführliche Tutorials zu den besten KI-Tools haben möchtest, dann kannst du uns helfen, indem du dir über einen Klick auf das Bild einen kostenlosen Account erstellst. Dir entstehen dadurch keinerlei Kosten, zusätzliche Gebühren oder Nachteile. Und kostenlos ausprobieren sollte Elevenlabs jeder! Vielen Dank.

3 - Benutzeroberfläche und Einstellungen bei Elevenlabs

Elevenlabs ist logisch und übersichtlich gestaltet, sodass es nur zwei wesentliche Einstellungen benötigt, um das Tool optimal zu nutzen.

3.1 Dark Mode in Elevenlabs

Leider bietet Elevenlabs keinen integrierten Dark Mode an. Das ist etwas schade, lässt sich aber leicht beheben. Mit der Browser-Erweiterung „Dark Reader“ könnt ihr Elevenlabs problemlos im Dark Mode nutzen. Ich habe in den letzten Monaten keinerlei Nachteile bemerkt – es ist wirklich nur ein Klick, und ihr könnt den Dark Mode sogar gezielt nur für Elevenlabs aktivieren.

elevenlabs
elevenlabs

3.2 Von „Simple“ auf „Advanced“ umstellen

Um vollen Zugriff auf alle Funktionen zu erhalten, wechselt ihr einfach oben rechts von „Simple“ auf „Advanced“. Damit sind alle Optionen sofort im Blick und verfügbar – das war’s auch schon.

4 - Funktionen - Auswahl der Stimme

4.1 Voices – Auswahl der Stimme

Die Hauptstimmen von Elevenlabs sind zweifellos von hoher Qualität, werden aber von vielen Nutzern verwendet. Das ist der Nachteil, wenn man das beste Tool auf dem Markt nutzt. Aus diesem Grund empfehle ich, eine professionelle Stimme aus der „Library“ zu wählen. Dort gibt es inzwischen hunderte Stimmen, darunter viele sehr gute deutsche Optionen. Allerdings merkt man auch hier, dass diese Stimmen von vielen Menschen genutzt werden. Auch muss man hier erwähnen, dass mit dem Free-Plan nicht alle Stimmen auswählbar sind.

fas fa-info-circle

Im zweiten Teil werde ich euch noch Varianten zeigen, wie ihr jede Stimme einzigartig machen könnt. Auch die Hauptstimmen im Free-Plan!

4.2 Start mit Elevenlabs

Im Free-Plan habt ihr drei Slots, in denen ihr Stimmen speichern könnt. In höheren Abonnements steigt die Anzahl der verfügbaren Slots. Allerdings könnt ihr die Stimmen in den Slots auch löschen und durch neue ersetzen. Das kann jedoch lästig werden, wenn man regelmäßig mit mehreren Stimmen arbeitet.

4.2.1 Die richtige Auswahl treffen

Der erste Schritt besteht darin, die richtige Sprache auszuwählen, um unerwünschte Akzente zu vermeiden. Nutzt ihr einen englischen Charakter mit deutscher Sprache, führt das zu einem Akzent. Klickt oben auf „Library“ und verwendet die Filteroptionen. Als Sprache könnt ihr z.B. "German" auswählen.

4.2.2 Zweck der Stimme festlegen

Ein wichtiger Aspekt ist, wofür die Stimme verwendet wird. Es macht einen großen Unterschied, ob ihr einen nüchternen Nachrichtensprecher, einen Geschichtenerzähler oder eine Verkäuferstimme auswählt. Wenn ihr zum Beispiel eine Verkäuferstimme für Lehrinhalte verwendet, wirkt das schnell unpassend.

Beispieltext: "Es geht in die letzte Minute beim WM-Finale zwischen Deutschland und Brasilien und da fällt das entscheidende Tor! Die Menge jubelt" he said enthusiastically.

Meditations-Stimme:

Entertainer-Stimme:

4.2.3 Stimmen vorspielen lassen

Mit einem Klick auf „Abspielen“ könnt ihr euch eine Vorschau der ausgewählten Stimme anhören, um einen ersten Eindruck zu gewinnen. Achten solltet ihr auf:

Professional Voice Clone: Dies sollte euer Mindeststandard sein.

Professional Voice Clone + HQ: Hier steht HQ für „High Quality“. Das bedeutet, dass die Aufnahme den Guidelines von Elevenlabs entspricht und zusätzlich von ihnen geprüft wurde.

4.2.4 Weitere Informationen zu den Stimmen

Wenn ihr auf eine Stimme klickt, erhaltet ihr zusätzliche Informationen, etwa wie viele Nutzer die Stimme derzeit verwenden oder wie viel Content bereits damit generiert wurde. Besonders wichtig: Ihr seht auch, wie lange die Stimme garantiert verfügbar sein wird. Manche Stimmen können vom Ersteller entfernt werden, aber ihr habt dann z. B. noch zwei Jahre Zeit, sie weiter zu nutzen.

4.3 Stimme anpassen

Stimmprofile und Einstellungen

Ihr könnt die generierte Stimme weiter anpassen und habt dafür vier wichtige Einstellungen:

  1. Stability (Stabilität): Regelt, wie konsistent die Stimme über einen Text hinweg klingt. Höhere Stabilität sorgt für einen gleichmäßigen, natürlichen Klang, während geringere Stabilität zu mehr Dynamik, aber auch zu größeren Variationen führen kann.
  2. Similarity (Ähnlichkeit): Beeinflusst, wie ähnlich die Stimme der Originalreferenz klingt. Höhere Werte sorgen für größere Übereinstimmung, während niedrigere Einstellungen die Stimme etwas freier klingen lassen.
  3. Style Exaggeration (Stilübertreibung): Dieser Regler verstärkt den Ausdruck und die Betonung der Stimme. Höhere Werte machen die Stimme ausdrucksstärker und dramatischer, während niedrigere Werte einen neutraleren Klang bewirken.
  4. Speaker Boost (Sprecherverstärkung): Erhöht die Lautstärke und Präsenz der Stimme, sodass sie lauter und dominanter wirkt.

Meine Empfehlung: Für deutsche Stimmen solltet ihr es nicht übertreiben. Die Voreinstellungen sind meist gut gewählt. Der „Speaker Boost“ sollte auf „AN“ stehen, die anderen Einstellungen nur bei Bedarf angepasst werden. Bei langen Texten empfiehlt es sich, mit den Standardeinstellungen zu arbeiten, um unerwünschte Aussetzer zu vermeiden.

4.4 Voice Design

Voice Design ist eine Art Zufallsgenerator für einzigartige Stimmen. Jede generierte Stimme ist einzigartig, auch bei gleichen Einstellungen. Manchmal entstehen großartige Stimmen, manchmal eher weniger überzeugende. Ihr könnt hier allgemeine Angaben wie Geschlecht, Alter und Akzent machen. Allerdings ist diese Funktion bisher nur für englische Stimmen wirklich nützlich. Einige erfolgreiche Stimmen in der Library tragen das „Voice Design“-Emblem.

4.4.1 Aktualisierung (11/24)

Diese Option wurde angepasst und ist jetzt viel besser geworden. Man kann nun per Texteingabe komplett neue und verrückte Sprache erstellen lassen.

Beispiel: "Ein alter deutscher Mann spricht wie ein Ork in Herr der Ringe."

Alter Mann + Ork-Style:

4.5 Instant Voice Cloning

Diese Funktion ist ab dem Starter-Plan verfügbar. Mit nur einer Minute Sprachaufnahme könnt ihr eine neue Stimme generieren lassen. Das Ergebnis ist oft gut, aber noch weit entfernt von der Qualität des „Professional Voice Cloning“.

4.6 Professional Voice Cloning

Beim „Professional Voice Cloning“ solltet ihr den Anweisungen von Elevenlabs folgen, um die besten Ergebnisse zu erzielen. Idealerweise verwendet ihr mehrere Stunden Sprachmaterial in hoher Qualität und ohne Hintergrundgeräusche. Das Ergebnis ist beeindruckend und kaum von der Originalstimme zu unterscheiden.

fas fa-info-circle

In Teil 3 gehen wir detailliert auf das Cloning ein. Lest das unbedingt, bevor ihr mit professionellem Voice Cloning startet! Ihr könnt euer Ergebniss deutlich verbessern.

5 - Funktionen - Text to Speech

Das Eingabefenster

Die Hauptfunktion von Elevenlabs ist natürlich die Umwandlung von Text in Sprache. Dafür steht euch ein einfaches Eingabefeld zur Verfügung, in das ihr euren Text eingeben könnt.

Vor dem Klick auf „Generate Speech“ seht ihr die anfallenden Kosten. Im Free-Plan könnt ihr pro Vorgang bis zu 2.500 Credits verwenden, im Starter-Plan sind es 5.000 Credits. Bei längeren Texten müsst ihr diese also eventuell aufteilen. Eine Alternative für längere Texte ist die Nutzung von Projekten, auf die wir später noch näher eingehen.

Unten links findet ihr die Optionen zur Stimmwahl. Hier könnt ihr zwischen den letzten fünf verwendeten Stimmen, personalisierten Vorschlägen und den Standardstimmen von Elevenlabs wählen, die qualitativ sehr hochwertig sind. Außerdem könnt ihr hier auf eure gespeicherten Stimmen zugreifen.

Zu den Einstellungen habe ich bereits einiges erklärt: Beginnt immer mit den Standardeinstellungen und nehmt dann nur kleine Anpassungen vor, um das beste Ergebnis zu erzielen.

Ein kleines Rätsel

Bei so vielen Informationen muss auch mal ein kleines Rätsel drin sein. Außerdem bekommt ihr so einen weiteren Eindruck über die diversen Sprach-Möglichkeiten.

Gefährlicher Mann: „Ich bin immer da, wenn du mich nicht erwartest, und bringe oft Dunkelheit mit mir.“

Junge Frau: „Wenn ich dich sehe, ist es oft zu spät.“

Katze: „Bei mir kommt er sogar Sieben mal!“

Sportreporter im Stadion: „Und das Spiel endet jetzt, es gibt keine Verlängerung mehr – er kommt!“

Roboter: „Wer kommt? Kennst du die Antwort?"

6 - Funktionen - Voice Changer

Das ist Magie

Mit dem Voice Changer von Elevenlabs könnt ihr ein Audio-File hochladen und darüber eine andere Stimme legen. Ihr sprecht euren Text in eurer gewünschten Betonung und Geschwindigkeit ein, und diese werden dann in der neuen Stimme exakt berücksichtigt. Das ist besonders nützlich für wichtige Aufgaben wie ein schnelles Intro – es kann wirklich einen großen Unterschied machen. Man gibt dadurch der KI einfach viele präzise Informationen, die sich die KI sonst selbst ausdenken müsste und bei viel Interpretationsspielraum ist jede KI nicht perfekt.

Die Magie muss man sehen

Wie gut und genau die neue Stimme auf die alte Stimme gelegt wird, sieht man bei einem Text, der von verschiedenen Charaktere genau gleich gesprochen wird. Schaut auch auf die Mundbewegungen und die Synchronität.

Ich spreche den folgenden Text einmalig ein und lasse ihn dann von zwei weiteren Stimme per Voice Changer ändern.

Text: Hi, ich teste hier gerade den Voice Changer und ihr solltet genau auf die Synchronität der Mundbewegungen achten. Dadurch seht ihr, dass die neue Stimme, exakt der Geschwindigkeit der Originalstimmen entspricht.

Stimme 1: Meine Stimme

Stimme 2: Frau

Stimme 3: Mann

7 - Funktionen - Sound Effekte

Soundeffekte auf Knopfdruck, per Texteingabe

Eine meiner absoluten Lieblingsoptionen bei Elevenlabs ist die Möglichkeit, eigene Soundeffekte zu erstellen. Das spart nicht nur die Kosten für ein teures Abo bei einem Soundeffekte-Anbieter, sondern geht oft auch viel schneller und präziser, als manuell nach dem passenden Sound zu suchen.

So funktioniert es:

Bei den Einstellungen könnt ihr eine Zeitspanne zwischen 0,5 und 22 Sekunden festlegen und auswählen, wie stark die KI dem Prompt folgen soll. Je weiter ihr den Regler nach links („kreativer“), desto mehr Freiraum hat die KI, was oft zu interessanteren Ergebnissen führt. Möchtet ihr jedoch schneller zu einem präzisen Ergebnis kommen, schiebt den Regler eher nach rechts, damit die KI näher am ursprünglichen Prompt bleibt.

Wenn ihr nur einen Versuch („Prompt“) nutzen möchtet, stellt den Regler lieber etwas weiter nach rechts. Wenn ihr die bestmögliche Ausgabe erzielen wollt und bereit seid, mehrmals zu experimentieren, lasst den Regler weiter links.

Pro Sekunde generierter Sound fallen 40 Credits an – und das Beste: Diese Funktion ist sogar im Free-Plan verfügbar.

Beispiel 1: "A deep, resonant orchestral swell that builds slowly, creating a sense of awe and grandeur, as if something divine is descending from the heavens. Soft, angelic choir voices hum gently in the background, gradually increasing in intensity, evoking a heavenly and ethereal presence. The sound includes shimmering chimes and subtle wind gusts as the hand descends, blending seamlessly with the choir, creating a mystical and serene atmo"

Beispiel 2: "Horror screaming from affection"

Inspiration holen

Um ein Gefühl dafür zu bekommen, was alles möglich ist, könnt ihr oben auf „Explore“ klicken. Dort findet ihr zahlreiche Kategorien, Ideen und Beispiele sowie die wöchentlichen Top-Sounds. Diese Sounds könnt ihr allerdings nur mit einem kostenpflichtigen Plan herunterladen. Den Prompt könnt ihr jedoch auch im Free-Plan verwenden, um den Sound selbst neu zu generieren.

Tipps für bessere Prompts

Besonders gut funktioniert es, wenn ihr zuerst beschreibt, welchen Sound ihr wollt, z. B.:

„Loud slow heart beat“

Um die gewünschte Emotion besser zu treffen, könnt ihr dann eine passende Kategorie hinzufügen, z.B. HORROR oder LOVE.

Beispiel 3 "Loud slow heart beat, Horror":

Beispiel 4 "Loud slow heart beat, Love":

Es ist generell hilfreich, der KI ein Gefühl für die Szene zu geben, damit die Soundeffekte genau passen.

Bei der Generierung bekommt man immer direkt 4 Varianten zur Auswahl. Hier kann man also jetzt jeweils 4 Varianten hören:

8 - Funktionen - Voice Isolator

Mit der steigenden Bedeutung von Audioinhalten wird auch die Audioqualität immer wichtiger. Um sicherzustellen, dass Stimmen in den Audioausgaben professionell und sauber klingen, hat Elevenlabs den Voice Isolator entwickelt.

Voice Isolator

Der Voice Isolator ist ein praktisches Tool, um Stimmen von störenden Hintergrundgeräuschen zu trennen. Dieses Feature ist besonders hilfreich, wenn ihr Aufnahmen in lauten Umgebungen gemacht habt. Der Isolator entfernt ungewollte Geräusche wie Computerlüfter oder Wind und sorgt dafür, dass die Stimme klar und deutlich hervortritt. Das Tool ist eigenständig und ihr könnt bis zu 500MB Soundfiles gleichzeitig hochladen und optimieren lassen.

Beispiel 1: Schlechte Originalaufnahme+Lüfter

Beispiel 2: Elevenlabs Voice Isolator

9 - Funktionen - Projekte / Workflows

Während viele TTS-Plattformen nur auf kurze Textpassagen oder einfache Sprachkonvertierungen ausgelegt sind, bietet Elevenlabs leistungsstarke Tools zur Verarbeitung längerer Texte und zum Projektmanagement. Das ist besonders nützlich für Content-Ersteller, die an umfangreichen Projekten wie Hörbüchern, Podcasts oder E-Learning-Inhalten arbeiten.

Das System ist optimiert, um größere Projekte effizient zu verwalten. Längere Texte können in kleinere Abschnitte aufgeteilt und einzeln bearbeitet sowie vertont werden. Ein integriertes Management-Tool sorgt dafür, dass ihr stets den Überblick über den Fortschritt behaltet und alle Audioaufnahmen gut organisiert sind.

Für längere Inhalte bietet Elevenlabs zudem die Möglichkeit, Pausen, Absatzwechsel und sogar Atemgeräusche in den Text einzufügen. So wird eine realistische Erzählweise simuliert, die bei längeren Projekten wie Hörbüchern oder Podcasts eine flüssige und natürliche Wiedergabe unterstützt.

Konkret

Mit diesen Funktionen könnt ihr Texte in andere Sprachen umwandeln (dubben), die Inhalte eurer Webseite automatisch in Sprache konvertieren lassen und viele weitere Dinge. Im dritten Teil gehen wir ausführlich auf diesen Bereich ein und zeigen euch einige konkrete Anwendungsbeispiele.

10 - Kosten / Abo-Modelle

Elevenlabs bietet verschiedene Abomodelle, die auf die unterschiedlichen Bedürfnisse seiner Nutzer abgestimmt sind. Für die meisten dürfte einer der ersten drei Pläne – Free, Starter und Creator – passend sein. Der Creator-Plan bietet dabei den vollen Funktionsumfang, inklusive professionellem Voice-Cloning. Daher empfehlen wir, zunächst den Free-Plan kostenfrei auszuprobieren. Sollte Elevenlabs überzeugen, lohnt sich der Wechsel in den Creator-Plan für den ersten Monat, da dieser mit 50 % Rabatt angeboten wird. So kann man alle Funktionen intensiv testen und bei Bedarf anschließend problemlos wieder mit einem Klick in den Free-Plan zurückwechseln.

Übersicht

Stand: 11/2024 - Angaben ohne Gewähr

10.1 Free Plan: 10.000 Credits pro Monat

Kosten: 0 $ – keine versteckten Gebühren

Mit dem Free Plan könnt ihr jeden Monat bis zu 10.000 Credits kostenlos nutzen, was für etwa 10 Minuten Sprachgenerierung ausreicht. Ideal, um Elevenlabs auszuprobieren und kleinere Projekte umzusetzen. Der Nachteil: Die generierte Sprache darf nicht kommerziell verwendet werden, und es gibt Einschränkungen bei den verfügbaren Sprachen und Funktionen, etwa im Bereich „Workflows“. Dennoch bietet der Free Plan eine solide Basis, um die wichtigsten Funktionen kennenzulernen.

Hinweis: Falls euch Elevenlabs gefällt oder ihr die Sprache kommerziell nutzen möchtet, könnt ihr jederzeit auf einen kostenpflichtigen Plan umsteigen. Außerdem lässt sich der Plan monatlich wechseln, sodass ihr flexibel zwischen den Abos hin- und herspringen könnt, je nach Bedarf.

Account erstellen: An dieser Stelle noch mal der Hinweis, dass ihr euch einen kostenlosen Account erstellen könnt und uns dadurch unterstützt. Ihr habt dadurch keinerlei Nachteil oder Kosten. Quasi dieses "Win-Win". Wir werden diesen Artikel natürlich auch auf neue Inhalte, Möglichkeiten und Funktionen anpassen.

Elevenlabs ausprobieren

ANZEIGE

10.2 Starter Plan: 30.000 Credits pro Monat

Kosten: 5 $ + Mehrwertsteuer

Der Starter Plan bietet deutlich mehr Credits und die Möglichkeit der kommerziellen Nutzung. Ihr könnt außerdem mehr Stimmen als Vorlagen speichern und „Instant Voice Cloning“ nutzen, was jedoch nicht an die Qualität des Professional Voice Cloning des Creator Plans herankommt.

10.3 Creator Plan: 100.000 Credits pro Monat

Kosten: 22 $ + Mehrwertsteuer

Der Creator Plan bietet Zugang zu dem beeindruckenden Professional Voice Cloning, wo mit mehreren Stunden Audio-Material trainiert wird. Das ermöglicht euch, eure Stimme zu klonen und diese eventuell sogar im Marketplace anzubieten, um damit Geld zu verdienen. Außerdem könnt ihr Projekte anlegen, was bei längeren Texten oder dem Einsatz mehrerer Stimmen hilfreich ist.

10.4 Pro Plan: 500.000 Credits pro Monat

Kosten: 99 $ + Mehrwertsteuer

Der Pro Plan bietet vor allem mehr Credits und eine etwas bessere Audioqualität. Diese zusätzlichen Features sind für reine Sprachprojekte jedoch oft nicht unbedingt notwendig.

10.5 Scale Plan: 2.000.000 Credits pro Monat (ca. 40 Stunden)

Kosten: 330 $ + Mehrwertsteuer

Dieser Plan richtet sich an Power-User und Unternehmen, die große Mengen an Content produzieren. Neben den Credits bietet dieser Plan auch eine priorisierte Behandlung beim Support.

10.6 Business Plan: 11.000.000 Credits pro Monat (ca. 180 Stunden)

Kosten: 1.320 $ + Mehrwertsteuer

Dieser Plan richtet sich klar an Unternehmen. Er bietet die Möglichkeit, mehrere professionelle Stimmen zu klonen und umfangreiche Projekte effizient zu managen.

10.7 Enterprise Plan: Individuelle Anpassungen und unlimitierte Credits

Kosten: Auf Anfrage

Hier sind praktisch keine Grenzen gesetzt. Der Enterprise Plan ermöglicht API-Zugriff auf alle Funktionen und die Erstellung beliebig vieler Stimmen – ideal für Unternehmen, die ihre eigenen Apps oder Plattformen mit Elevenlabs-Stimmen ausstatten möchten.

Monatliches oder jährliches Abo?

Ich persönlich bevorzuge das monatliche Abo, da es flexibel bleibt und jederzeit angepasst werden kann. Wenn ihr jedoch sicher seid, dass ihr den Service langfristig nutzen möchtet, lohnt sich das jährliche Abo: Hier spart ihr zwei Monate. So zahlt ihr für den Starter-Plan nur 4,17 $ statt 5 $ pro Monat und für den Creator-Plan 18,33 $ statt 22 $.

fas fa-info-circle

Nutzt den Creator-Plan zu Beginn mit 50 % Rabatt, um die Funktionen von Elevenlabs ausführlich zu testen. Danach könnt ihr je nach Bedarf problemlos in den Starter- oder Free-Plan wechseln.

11 - Alternative TTS Tools

Es gibt Alternativen...

Unser gesamtes Tutorial sowie alle Aussagen sind unbezahlt und basieren ausschließlich auf unseren eigenen Erfahrungen. Um euch einen umfassenden Überblick über die Welt der Text-to-Speech-Tools zu geben, möchten wir auch einige Alternativen zu Elevenlabs vorstellen.

Obwohl Elevenlabs für uns die klare Nummer 1 ist, bieten auch andere Tools gute Optionen – insbesondere für englische Texte. Einige Alternativen eignen sich gut, wenn die Anforderungen nicht ganz so hoch sind. Amazon Polly zum Beispiel ist eine preisgünstige Wahl und kann im ersten Jahr überwiegend kostenlos genutzt werden.

Einen ausführlichen Vergleichstest findet ihr hier: TTS-Vergleichs-Test

Amazon Polly
Tool Bewertung

Amazon Polly

⭐⭐⭐⭐
Amazon Polly hebt sich besonders durch seine hohe Flexibilität und die Qualität der generierten Stimmen von anderen TTS-Tools ab. Insbesondere die neuralen Stimmen bieten eine äußerst natürliche Sprachwiedergabe, die besonders bei längeren Texten und professionellen Anwendungen, wie etwa Hörbüchern oder im Kundenservice, gut zur Geltung kommt. Dank der Integration in die AWS-Umgebung und der Unterstützung für SSML (Speech Synthesis Markup Language) ermöglicht Polly außerdem eine präzise Steuerung von Betonung, Intonation und Pausen – ein echter Vorteil für Unternehmen, die individuelle Anpassungen an ihren Sprachprojekten vornehmen möchten.
zum Test
Synthesis TTS
Tool Bewertung

Synthesys.io

⭐⭐⭐⭐
Synthesys.io zeichnet sich besonders durch seine hochentwickelte Text-to-Speech-Engine und die Integration lebensechter Video-Avatare aus, die für eine realistische und ansprechende Content-Produktion sorgen. Dank einer intuitiven Benutzeroberfläche und der Möglichkeit, die Stimmen individuell anzupassen, können Nutzer ohne tiefgehendes technisches Know-how professionelle Voiceovers und Videos erstellen, was Synthesys.io zu einer flexiblen Lösung für die moderne digitale Content-Produktion macht.
zum Test
Murf AI TTS
Tool Bewertung

Murf AI

⭐⭐⭐⭐
Murf AI beeindruckt durch seine realistischen und vielfältigen Stimmen in über 20 Sprachen sowie durch umfassende Anpassungsmöglichkeiten für eine präzise Sprachsynthese. Besonders für Unternehmen und Content Creator, die professionelle Voiceovers und Audio-Content benötigen, bietet das Tool eine benutzerfreundliche Lösung. Die integrierte Medienbibliothek, Kollaborationsfunktionen und API-Integration machen Murf AI zu einem flexiblen Tool, das ideal für Marketing, Bildung, Unternehmenskommunikation und Social Media geeignet ist.
zum Test
PlayHT TTS
Tool Bewertung

Play.ht

⭐⭐⭐
PlayHT zeichnet sich durch seine umfassende Stimmenauswahl mit über 800 Stimmen in 140+ Sprachen sowie die Möglichkeit zur individuellen Stimmklonung aus. Besonders die anpassbaren Ausdrucksstile und der Konversationsmodus machen es zu einem einzigartigen Tool für lebendige, realistische Sprachaufnahmen, die auf verschiedene Projekte und Zielgruppen zugeschnitten sind.
zum Test
Speechify TTS
Tool Bewertung

Speechify

⭐⭐⭐⭐
Speechify überzeugt als TTS-Tool besonders durch seine Benutzerfreundlichkeit und die breite Palette an Stimmen und Anpassungsmöglichkeiten. Was es von anderen Tools abhebt, ist die einfache Integration in gängige Plattformen wie Google Docs und Kindle sowie die Möglichkeit, Texte offline und im Hintergrund anzuhören – ideal für Multitasker und unterwegs. Außerdem gibt es bekannte legale Stimmen von z.B. Gwyneth, Snoop oder MrBeast.
zum Test
Natural Reader TTS
Tool Bewertung

NaturalReader

⭐⭐⭐
Natural Reader besticht durch seine benutzerfreundliche Oberfläche und die Unterstützung zahlreicher Textformate – von PDFs über E-Books bis hin zu Webseiten. Mit realistischen Stimmen und flexiblen Audioeinstellungen ermöglicht das Tool eine personalisierte und angenehme Sprachausgabe. Besonders nützlich sind die OCR-Funktion zur Texterkennung in Bildern und die Sprachübersetzung, die es vielseitig für Bildung, Content Creation und barrierefreie Anwendungen macht.
zum Test
LovoAI TTS
Tool Bewertung

Lovo.ai

⭐⭐⭐
Lovo.ai hebt sich durch seine hohe Klangqualität und die Vielzahl an Anpassungsmöglichkeiten von anderen KI-gestützten Sprachsynthese- und Video-Tools ab. Mit dem „Genny“-Editor und der umfangreichen Stimmenbibliothek in über 100 Sprachen bietet die Plattform eine leistungsstarke Lösung für Content Creator, Marketer und Lehrende, die realistische und emotional ansprechende Audiolösungen benötigen.
zum Test
Listnr TTS
Tool Bewertung

Listnr

⭐⭐⭐
Listnr punktet als KI-basiertes Text-to-Speech-Tool mit einer beeindruckenden Auswahl von über 900 Stimmen in 140 Sprachen. Durch die realistische Sprachsynthese und eine benutzerfreundliche Oberfläche eignet es sich hervorragend für verschiedene Einsatzbereiche, darunter Podcasts, E-Learning und Marketing. Besonders hervorzuheben ist die Flexibilität des Tools: Nutzer können Tonhöhe, Geschwindigkeit und Stil der Sprachwiedergabe anpassen, was Listnr vielseitig und individualisierbar macht.
zum Test
Notevibes TTS
Tool Bewertung

Notevibes

⭐⭐⭐
Notevibes überzeugt als flexibles und benutzerfreundliches Text-to-Speech-Tool mit über 200 Stimmen in 22 Sprachen, was es für internationale Projekte und Unternehmen ideal macht. Dank der Optionen zur emotionalen Anpassung und der einfachen Team-Verwaltung ist es besonders für die Produktion von Marketingmaterial, E-Learning und barrierefreien Inhalten geeignet. Mit Funktionen wie Batch Processing und hohen Datenschutzstandards bietet Notevibes Unternehmen eine professionelle und zeitsparende Lösung für die Erstellung hochwertiger Audiodateien.
zum Test

12 - Unsere Bewertung von Elevenlabs

Unsere Bewertung zu Elevenlabs 9,4 / 10 Punkte

Wir haben wirklich alle guten und aktuellen TTS-Tools selbst getestet, und keines kommt auch nur annähernd an die deutsche Sprachqualität von Elevenlabs heran. Als marktführendes Tool, das durch Investoren mit reichlich Kapital unterstützt wird, baut Elevenlabs auch in puncto Funktionen seinen Vorsprung gegenüber der Konkurrenz stetig aus. Trotz der stetig steigenden Funktionen bleibt die Bedienung sehr einfach und übersichtlich.

Abgesehen vom fehlenden Dark Mode und einigen wenigen Syntax-Optionen, konnten wir keine nennenswerten Nachteile feststellen.

Elevenlabs Winner TTS Award
Sprachqualität DE / EN

Sprachqualität DE / EN

Elevenlabs bietet mit Abstand die höchste Qualität in der Sprachgenerierung. Vor allem bei der deutschen Sprache setzt es Maßstäbe, an die kein anderes Programm heranreicht. Dennoch: In der englischen Sprache ist das Ergebnis noch einen Tick besser als auf Deutsch, sodass hier noch etwas Potenzial nach oben besteht.

Umfang

Umfang

Gefühlt bringt Elevenlabs alle 1-2 Monate neue Funktionen heraus, während bestehende Funktionen kontinuierlich erneuert und verbessert werden. Man spürt deutlich, dass große Investoren hinter dem Unternehmen stehen und die Entwicklung kräftig vorantreiben.

Bedienbarkeit

Bedienbarkeit

Viele gute Tools scheitern irgendwann daran, dass die Bedienbarkeit unter einer Fülle neuer Funktionen leidet und die Hauptfunktion vernachlässigt wird. Elevenlabs hingegen gelingt es, neue Funktionen übersichtlich zu integrieren und dabei die Hauptfunktion – die Sprachgenerierung – stetig zu verbessern.

Preis/Leistung

Preis/Leistung

Elevenlabs gehört zwar zu den kostspieligeren Anbietern, überzeugt jedoch durch erstklassige Leistung. Der Wechsel zwischen den Abos ist zudem besonders kundenfreundlich gestaltet.

Wertung: 9,5/10

Multiplikator: x2

Wertung: 10/10

Multiplikator: x1

Wertung: 10/10

Multiplikator: x1

Wertung: 8/10

Multiplikator: x1

Kommentieren, diskutieren und teilen!

Anmelden
AyCaramba antwortete auf das Thema:
28 Nov. 2024 10:55
AyCarambas Avatar
Wird 3 Videos geben... Das Erste erscheint morgen und die anderen beiden dann die nächste Woche.
AyBranda antwortete auf das Thema:
25 Nov. 2024 16:03
AyBrandas Avatar
Hi, weißt du schon, wann die Videos zu Elevenlabs erscheinen?
AyCaramba antwortete auf das Thema:
22 Nov. 2024 19:58
AyCarambas Avatar
Dankeschön :) Nächsten Monat ist ein Tutorial für konstante Charaktere und Avatare geplant. Wird auch wieder zu Elevenlabs passen.
MrX antwortete auf das Thema:
19 Nov. 2024 21:41
MrXs Avatar
Kann ich mich nur anschließen. Kenne auch kein besseres Tutorial zu Elevenlabs und viele coole Beispiele. Top!
MegaOne antwortete auf das Thema:
14 Nov. 2024 19:35
MegaOnes Avatar
Vielen Dank. Mit Abstand das beste Tutorial zu Elevenlabs! Und... "die Borg kommen" xD