Da ist Walter: Roboter löst Wimmelbilder

System zeigt Weltenbummler und damit technische Möglichkeiten [...]

Wimmelbild-Ikone: KI findet Weltenbummler (c) fischerverlage.de

Die Kreativagentur redpepper hat einen Roboter gebaut, der dank Künstlicher Intelligenz (KI) den rot-weiß gekleideten Protagonisten der Kinderbuchreihe „Wo ist Walter?“ aufspürt. Das System, das auf günstige Hardware und quelloffene Software setzt, zeigt tatsächlich auf Walter und löst Wimmelbilder dabei beeindruckend schnell. Der Rekord des Prototyps liegt redpepper zufolge bei 4,45 Sekunden. Das sei schneller, als die meisten Fünfjährigen einen Walter finden.

Wimmelbild-Ikone

Walter, hierzulande bei FISCHER Sauerländer im Programm, ist die vielleicht bekannteste Wimmelbild-Figur der Welt. Dabei tarnt er sich international auch durch eine Vielzahl unterschiedlicher Namen gut. „Wally“ heißt er in seiner britischen Heimat, „Charlie“ in Frankreich und „Waldo“ in Nordamerika. Gegen „There’s Waldo“, den Roboter der US-Agentur, hilft das freilich nicht. Denn der Roboter ist darauf trainiert, Walter einfach an seinem überall im Wesentlichen gleichen Aussehen zu erkennen. Wenn sich die KI zu mindestens 95 Prozent sicher ist, den Weltenbummler aufgespürt zu haben, zeigt sie dann mit einer kleinen Hand an einem Roboterarm auf sein Versteck.

Für die Köpfe hinter dem Projekt ging es vor allem darum, auszuloten, was machbar ist. Denn der Trainings-Datensatz bestand nur aus 62 Walter-Köpfen und 45 ganzen Walter-Figuren aus einer Google-Suche, so Matt Reed, Creative Technologist bei redpepper. „Ich dachte, das wären nicht genug Daten für ein starkes Modell, aber es liefert überraschend gute Vorhersagen für Walter, die nicht Teil des ursprünglichen Trainings-Sets waren“, meint er gegenüber „The Verge“.

Günstig und quelloffen

Der Walter-Suchroboter zeigt auch, dass so ein System mittlerweile mit relativ einfachen Mitteln realisierbar ist. Denn ein günstiger Rasperberry Pi steuert einen „uArm Swift Pro“ von UFACTORY https://www.ufactory.cc mit Kameraerweiterung, um ein Wimmelbild abzusuchen. Um darin Gesichter zu erkennen, setzt das System auf das quelloffene OpenCV https://opencv.org . Für die Analyse, welche davon Walter zeigen, kommt Googles Cloud-Dienst AutoML https://cloud.google.com/automl zum Einsatz.


Mehr Artikel

News

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*