Sam Altman bei einem Schwimmwettbewerb mit Sora 2

OpenAI stellt Sora 2 vor

Mehr Realismus, bessere Kontrolle und integrierter Ton. Das sind die bahnbrechenden Neuerungen der stärksten Video-KI der Welt.

Sam Altman bei einem Schwimmwettbewerb mit Sora 2
OpenAI Sora 2 | All-AI.de

EINLEITUNG

OpenAI hat mit Sora 2 sein neues Top-Modell zur Video- und Audioerstellung vorgestellt. Es ist physikalisch genauer, realistischer und besser steuerbar als frühere Systeme. Die KI stellt einen Quantensprung für die Videogenerierung dar und kann erstmals auch synchronisierte Dialoge und passende Soundeffekte erzeugen. OpenAI selbst spricht vom "GPT-3.5-Moment für Videos" und unterstreicht damit die Tragweite dieser neuen Entwicklungsstufe. Zur Erinnerung: GPT-3.5 war der Moment, in dem ChatGPT erstmals in der Praxis richtig gut nutzbar war.

NEWS

Ein Sprung zur physikalischen Korrektheit

Die Fortschritte von Sora 2 zeigen sich in der Fähigkeit, komplexe Szenarien zu generieren, die für bisherige Modelle unmöglich waren. Dazu gehören olympische Turnübungen oder ein Rückwärtssalto auf einem Paddleboard, bei dem die Dynamik von Auftrieb und Festigkeit korrekt modelliert wird. Der entscheidende Unterschied zu Vorgängern liegt im Umgang mit den Gesetzen der Physik. Frühere Modelle verformten oft die Realität, um eine Anweisung erfolgreich auszuführen.

So konnte es passieren, dass ein Basketball, der den Korb verfehlte, unnatürlich ins Netz teleportiert wurde. Sora 2 verhält sich hier realistischer: Der Ball prallt physikalisch korrekt vom Korbbrett ab. Diese Fähigkeit, nicht nur Erfolge, sondern auch Misserfolge korrekt zu simulieren, ist eine entscheidende Eigenschaft für einen nützlichen Welten-Simulator. Selbst die Fehler, die das Modell noch macht, ähneln oft den Fehlern eines menschlichen Akteurs, den die KI intern zu modellieren scheint.

Quelle: OpenAI - englische und deutsche Sprache

Umfassende Kontrolle und audiovisuelles Erlebnis

Neben dem Realismus wurde die Steuerbarkeit des Modells erheblich verbessert. Sora 2 kann komplizierte Anweisungen über mehrere Einstellungen hinweg befolgen und dabei den Zustand der simulierten Welt konsistent beibehalten. Die KI beherrscht zudem verschiedene Stilrichtungen und erzeugt überzeugende Ergebnisse in realistischen, filmischen oder auch Anime-Stilen.

Das System ist als universelles Werkzeug zur Video- und Audio-Generierung konzipiert. Es ist in der Lage, anspruchsvolle Hintergrundgeräusche, Sprache und Soundeffekte mit einem hohen Grad an Realismus zu erstellen. Damit lassen sich komplette audiovisuelle Szenen aus einer einzigen Anweisung heraus erschaffen.

Sora wird sozial: Die neue App

OpenAI stellt die Technologie von Sora 2 über eine neue soziale iOS-App mit dem Namen "Sora" zur Verfügung. Diese App ist darauf ausgelegt, dass Nutzer KI-generierte Videos nicht nur konsumieren, sondern vor allem selbst erstellen und mit anderen teilen. Die Einführung erfolgt zunächst nur auf Einladungsbasis in den USA und Kanada.

Das Kernstück der App ist eine Funktion namens "Cameos". Sie erlaubt es Nutzern, sich selbst oder Freunde in die KI-generierten Videos einzufügen. Dafür ist eine einmalige Video- und Audio-Aufnahme in der App nötig, um die Identität zu verifizieren und das digitale Abbild zu erstellen. OpenAI betont, dass die Nutzer die volle Kontrolle über ihr Abbild behalten und jederzeit den Zugriff darauf entziehen oder Videos mit ihrem Cameo entfernen können.

MITMACHEN

Hat Dir der Beitrag gefallen oder geholfen? Dann hilf uns mit einem Klick weiter - dauert nur Sekunden.

Teile diesen Beitrag

Folge uns auf Social Media

Unterstütze uns direkt

KI-Tools sind teuer – unser Wissen bleibt kostenlos. Spende einmalig via PayPal oder werde YouTube-Mitglied (ab 0,99 €). Dafür liefern wir täglich News, ehrliche Tests und praxisnahe Anleitungen. Danke dir!

KURZFASSUNG

  • OpenAI startet Sora 2, eine verbesserte KI-Videogenerierung mit realistischer Physik-Simulation und integriertem Audio.
  • Die neue iOS-App "Sora" funktioniert wie TikTok, zeigt aber ausschließlich KI-generierte Videos mit einem "Cameo"-Feature für personalisierte Inhalte.
  • Die App ist zunächst nur in USA und Kanada verfügbar und erfordert eine Einladung, während umfangreiche Sicherheitsmaßnahmen Missbrauch verhindern sollen.
  • OpenAI positioniert sich als direkter Konkurrent zu TikTok und anderen Social-Media-Plattformen in einem wachsenden Markt für KI-Video-Inhalte.

QUELLEN