MIT-Forscher basteln an Videos zum „Hineingreifen“

Wissenschaftler des Massachusetts Institute of Technology (MIT) sind einer revolutionären neuen Technologie auf der Spur, die es ermöglichen soll, Videos interaktiver zu gestalten als bisher. "Interactive Dynamic Video" (IDV) könnte es dem Betrachter eines Videoclips in Zukunft ermöglichen, direkt in das gezeigte Bild "hineinzugreifen", um darin befindliche Objekte auf verschiedene Arten zu manipulieren. [...]

„Wir lernen eine Menge über Objekte, indem wir sie manipulieren: Wir können sie anstoßen oder schubsen und schauen dann einfach, was passiert“, erklärt Abe Davis, PhD-Student am Computer Science and Artificial Intelligence Laboratory (CSAIL) des MIT. „Mithilfe von IDV können wir das physische Verhalten von Objekten einfangen, das uns die Möglichkeit eröffnet, mit ihnen im virtuellen Raum zu spielen“, ergänzt der Wissenschaftler. „Indem wir Videos interaktiver gestalten, können wir vorhersagen, wie sich einzelne Objekte in Anbetracht unbekannter Kräfte verhalten und neue Wege erforschen, was sich mit einem Video alles anstellen lässt“, so Davis.

Enormes Anwendungspotenzial
Die potenziellen Anwendungsmöglichkeiten seien enorm breit gefächert. „Es gibt viele mögliche Einsatzgebiete, von Filmemachern, die damit vollkommen neue Visual Effects in ihren Produktionen umsetzen können, bis hin zu Architekten, die damit überprüfen können, ob die von ihnen entworfenen Gebäude strukturell stabil genug sind“, nennt der Forscher einige Beispiele.
Wenn die Bewegung von Objekten simuliert werden soll, wird für gewöhnlich auf ein 3D-Modell zurückgegriffen. „Diese Methode ist allerdings recht teuer und funktioniert nicht bei allen Objekten“, so Davis. Auch Algorithmen seien nicht ausreichend, um komplexe Bewegungen in unbekannten Umgebungen halbwegs realistisch simulieren zu können. „Bei unserer Technik reichen aber schon ganze fünf Sekunden des Videos, um genug Informationen zu haben, die für eine realistische Simulation reichen“, betont der MIT-Experte.
Um die Objekte in ihrer Bewegung korrekt abbilden zu können, analysierte Davis‘ Team eine Reihe von Videoclips, um bestimmte Frequenzen zu finden, die nur bei spezifischen Bewegungen auftreten. „Wenn wir diese Eigenschaften kennen, können wir auch vorhersagen, wie sich diese Objekte in völlig anderen Situationen verhalten“, erläutert der Forscher.
Eigenen Angaben zufolge hat Davis die IDV-Technologie bereits an einer Reihe von unterschiedlichen Objekten in Videos getestet: an einer Brücke, einem Klettergerüst und einer Ukulele. Dabei konnte er mit wenigen Mausklicks zeigen, dass es möglich ist, das Bild anzustoßen, heranzuziehen und in verschiedene Richtungen zu biegen oder zu bewegen. Bei einem Versuch konnte er sogar demonstrieren, wie sich mit einer Handbewegung in beinahe telekinetischer Art und Weise die Blätter eines Strauches in einem Video bewegen lassen.(pte)

Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*