Da ist Walter: Roboter löst Wimmelbilder

System zeigt Weltenbummler und damit technische Möglichkeiten [...]

img-1
Wimmelbild-Ikone: KI findet Weltenbummler (c) fischerverlage.de

Die Kreativagentur redpepper hat einen Roboter gebaut, der dank Künstlicher Intelligenz (KI) den rot-weiß gekleideten Protagonisten der Kinderbuchreihe „Wo ist Walter?“ aufspürt. Das System, das auf günstige Hardware und quelloffene Software setzt, zeigt tatsächlich auf Walter und löst Wimmelbilder dabei beeindruckend schnell. Der Rekord des Prototyps liegt redpepper zufolge bei 4,45 Sekunden. Das sei schneller, als die meisten Fünfjährigen einen Walter finden.

Wimmelbild-Ikone

Walter, hierzulande bei FISCHER Sauerländer im Programm, ist die vielleicht bekannteste Wimmelbild-Figur der Welt. Dabei tarnt er sich international auch durch eine Vielzahl unterschiedlicher Namen gut. „Wally“ heißt er in seiner britischen Heimat, „Charlie“ in Frankreich und „Waldo“ in Nordamerika. Gegen „There’s Waldo“, den Roboter der US-Agentur, hilft das freilich nicht. Denn der Roboter ist darauf trainiert, Walter einfach an seinem überall im Wesentlichen gleichen Aussehen zu erkennen. Wenn sich die KI zu mindestens 95 Prozent sicher ist, den Weltenbummler aufgespürt zu haben, zeigt sie dann mit einer kleinen Hand an einem Roboterarm auf sein Versteck.

Für die Köpfe hinter dem Projekt ging es vor allem darum, auszuloten, was machbar ist. Denn der Trainings-Datensatz bestand nur aus 62 Walter-Köpfen und 45 ganzen Walter-Figuren aus einer Google-Suche, so Matt Reed, Creative Technologist bei redpepper. „Ich dachte, das wären nicht genug Daten für ein starkes Modell, aber es liefert überraschend gute Vorhersagen für Walter, die nicht Teil des ursprünglichen Trainings-Sets waren“, meint er gegenüber „The Verge“.

Günstig und quelloffen

Der Walter-Suchroboter zeigt auch, dass so ein System mittlerweile mit relativ einfachen Mitteln realisierbar ist. Denn ein günstiger Rasperberry Pi steuert einen „uArm Swift Pro“ von UFACTORY https://www.ufactory.cc mit Kameraerweiterung, um ein Wimmelbild abzusuchen. Um darin Gesichter zu erkennen, setzt das System auf das quelloffene OpenCV https://opencv.org . Für die Analyse, welche davon Walter zeigen, kommt Googles Cloud-Dienst AutoML https://cloud.google.com/automl zum Einsatz.


Mehr Artikel

Ass. Prof. Dr. Johannes Brandstetter, Chief Researcher bei NXAI (c) NXAI
News

KI-Forschung in Österreich: Deep-Learning zur Simulation industrieller Prozesse

Als erstes Team weltweit präsentiert das NXAI-Forscherteam um Johannes Brandstetter eine End-to-End-Deep-Learning Alternative zur Modifizierung industrieller Prozesse, wie Wirbelschichtreaktoren oder Silos. Das Team strebt schnelle Echtzeit-Simulationen an, plant den Aufbau von Foundation Models für Industriekunden und fokussiert sich im nächsten Schritt auf die Generalisierung von Simulationen. […]

img-5
News

Die besten Arbeitgeber der Welt

Great Place To Work hat durch die Befragung von mehr als 7,4 Millionen Mitarbeitenden in den Jahren 2023 und 2024 die 25 World’s Best Workplaces identifiziert. 6 dieser Unternehmen wurden auch in Österreich als Best Workplaces ausgezeichnet. […]

img-6
News

ventopay als Vorreiter der digitalen Transformation

Bei der diesjährigen Verleihung des Digitalpreises „DIGITALOS“ wurde das oberösterreichische Softwareunternehmen ventopay als Sieger in der Kategorie „Digitale Transformation“ ausgezeichnet. Der Preis geht an Unternehmen, die ihre Geschäftsmodelle erfolgreich digitalisiert und zukunftsweisende Lösungen für ihre Branche entwickelt haben. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*