Google ReCapture: Zoom, Neigen und Schwenken für Videos - nachträglich!

Mit ReCapture können Video-Amateure nun professionelle Kamerabewegungen wie Zoom und Schwenk hinzufügen – und das ohne spezielles Equipment.

Kurzfassung | Caramba, 17.11.24
Google ReCapture
Google | All-AI.de

Worum geht es?

Die neue Methode namens ReCapture von Google gibt auch Laien die Möglichkeit, ihre Videos professionell zu bearbeiten, indem sie Zoom-, Neige- und Schwenkbewegungen nachträglich hinzufügen können. Aber wie funktioniert das – und was macht diese KI-basierte Lösung so besonders?

News

Komplexe Kamerafahrten ohne Spezialeffekte

Die traditionelle Bearbeitung von Kamerabewegungen in fertigen Videos ist eine echte Herausforderung. Bisherige Methoden stoßen oft an ihre Grenzen, wenn es darum geht, verschiedene Videotypen zu bearbeiten und gleichzeitig komplizierte Bewegungen und Details zu bewahren. Google geht bei ReCapture jedoch neue Wege: Anstatt eine explizite 4D-Darstellung zu erstellen, greift das System auf das „Wissen“ zurück, das in generativen Videomodellen über Bewegungsabläufe steckt. Die Nachbearbeitung wird so zur Video-zu-Video-Übersetzung mithilfe der „Stable Video Diffusion“-Technologie.

Zweistufige KI-Bearbeitung für präzise Ergebnisse

ReCapture nutzt einen zweistufigen Ansatz. Zuerst wird ein sogenanntes „Ankervideo“ generiert, das als erste Annäherung an das finale Ergebnis dient. Für diesen Schritt können Diffusionsmodelle wie CAT3D verwendet werden, die das Video aus verschiedenen Perspektiven neu berechnen. Alternativ bietet sich eine Frame-für-Frame-Tiefenschätzung mit Punktwolken-Rendering an.

In der zweiten Phase kommt das maskierte Feintuning zum Einsatz. Eine speziell angepasste zeitliche LoRA-Schicht (Low-Rank Adaptation) analysiert das Ankervideo, um dessen dynamische Abläufe präzise zu erfassen und zu lernen. Dies ermöglicht eine realistische Anpassung von Zoom-, Schwenk- und Kippbewegungen, ohne das gesamte Modell neu zu trainieren.

KI-gestützte Videobearbeitung: Wirklich für jeden geeignet?

Die Funktionsweise von ReCapture zeigt, wie weit KI in der Videobearbeitung mittlerweile gekommen ist. Dennoch bleibt ReCapture aktuell ein Forschungsprojekt. Ein kommerzielles Produkt steht bisher nicht zur Verfügung, und es ist ungewiss, wann oder ob dies geschehen wird. Auf dem Markt dominieren derzeit Start-ups wie Runway mit ihrem Modell „Gen-3 Alpha“, und auch Meta mischt mit „Movie-Gen“ bereits im Feld der KI-Videobearbeitung mit.

Ausblick

ReCapture von Google zeigt eindrucksvoll, wie Künstliche Intelligenz den Zugang zu fortgeschrittenen Videobearbeitungstechniken erleichtern kann. Die Methode könnte in Zukunft eine benutzerfreundliche Lösung für ambitionierte Hobby-Videografen sein, die professionelle Kamerabewegungen ohne spezielles Equipment hinzufügen möchten. Doch ob und wann diese Technologie breitenwirksam zur Verfügung steht, bleibt abzuwarten. Google macht damit jedenfalls einen vielversprechenden Schritt in Richtung einer nutzerfreundlichen KI-Videobearbeitung – wenn auch erst einmal auf Forschungsebene.

Profilbild Caramba

Short

  • Googles ReCapture ermöglicht es Nutzern, Zoom-, Neige- und Schwenkbewegungen nachträglich in Videos einzufügen.
  • Das KI-gestützte Tool arbeitet in zwei Phasen: zuerst wird ein Ankervideo erstellt, danach folgt das Feintuning für realistische Bewegungen.
  • Durch Diffusionsmodelle und LoRA-Schichten kann ReCapture komplexe Kamerabewegungen umsetzen, ohne das Modell neu zu trainieren.
  • Aktuell ist ReCapture ein Forschungsprojekt und nicht kommerziell verfügbar; Google könnte damit aber den Markt für Videobearbeitung revolutionieren.
  • Ob und wann ReCapture als Produkt verfügbar wird, ist noch unklar, doch das Tool zeigt das Potenzial einer nutzerfreundlichen KI-Videobearbeitung.

Kommentieren, diskutieren und teilen!

Anmelden