Ein Sänger auf einer Bühne, angebunden an KI-Hardware

Elite-Studenten trainieren OpenAIs Musik-KI

Ein überraschender Deal mit der Juilliard School soll die Konkurrenz von Suno und Udio deklassieren.

Andreas Becker Nano Banana
Ein Sänger auf einer Bühne, angebunden an KI-Hardware

Nach Text und Video nimmt sich OpenAI nun die Musik vor. Das Unternehmen entwickelt Berichten zufolge ein neues KI-Modell, das Musik generieren kann. Damit tritt der ChatGPT-Erfinder in direkte Konkurrenz zu den aufstrebenden Startups Suno und Udio, die diesen Markt zuletzt aufmischten.

Vom Text-Prompt zum kompletten Song

Das neue Werkzeug soll nicht nur einfache Textbefehle in Musik umwandeln. Es geht einen Schritt weiter und verarbeitet offenbar auch Audio-Eingaben. Nutzer könnten beispielsweise eine Gesangsspur hochladen und die KI anweisen, eine passende Gitarrenbegleitung oder ein Schlagzeug-Pattern zu ergänzen.

Diese Fähigkeit positioniert das Modell direkt gegen die Dienste von Suno und Udio. Diese beiden Startups hatten in den letzten Monaten für Aufsehen gesorgt, indem sie KI-Musikgenerierung für die breite Masse zugänglich machten. OpenAI will nun offensichtlich ein Stück dieses wachsenden Marktes erobern.

Klassische Expertise für das KI-Training

Um die Qualität des Modells zu sichern, geht OpenAI einen interessanten Weg. Statt sich nur auf Daten aus dem Internet zu verlassen, arbeitet das Unternehmen offenbar mit Studenten der Juilliard School zusammen. Die renommierte New Yorker Kunsthochschule ist weltberühmt für ihre Musikausbildung.

Die Aufgabe der Studenten besteht laut Berichten darin, Notenmaterial professionell aufzubereiten und zu sichten. Dieser Ansatz deutet darauf hin, dass OpenAI ein tieferes musikalisches Verständnis in seine KI integrieren will, anstatt nur Muster von Audio-Dateien zu kopieren. Qualität scheint hier vor reiner Quantität zu stehen.

OpenAIs Rückkehr zur Musik-KI

Ganz neu ist das Feld für das Unternehmen nicht. Bereits 2019 präsentierte OpenAI "MuseNet", das musikalische Stücke komponieren konnte. 2020 folgte "Jukebox", ein Modell, das Musik inklusive Gesang in verschiedenen Stilen erzeugte.

Beide Projekte waren technologisch beeindruckend, aber langsam und für den Massenmarkt ungeeignet. Sie dienten primär der Forschung. Nachdem Konkurrenten die kommerziellen Möglichkeiten bewiesen haben, kehrt OpenAI nun mit einer neuen Generation von Werkzeugen in diesen Sektor zurück. Der Schritt signalisiert OpenAIs Ambition, alle wichtigen kreativen Bereiche – Text, Bild, Video und nun auch Audio – mit eigenen Modellen zu besetzen.

KI-Wissen ohne Paywall

Unsere Artikel, Tests und Tutorials bleiben kostenlos. Wenn dir die Inhalte helfen, unterstütze unsere Arbeit gern.

Danke dir – jeder Euro hilft ❤️