„Neugier des Körpers“ hilft Robotern

Roboter können sich von Babys einiges abgucken – etwa wie diese erste Bewegungen lernen. Denn Kinder erkunden die Welt spielerisch und entdecken dabei nicht nur ihre Umgebung, sondern auch ihren Körper. Wie Ralf Der, Forscher des Max-Planck-Instituts für Mathematik in den Naturwissenschaften, und Georg Martius, Wissenschaftler des Institute for Science and Technology im österreichischen Klosterneuburg, nun in Simulationen mit Robotern zeigen, braucht deren Gehirn aus künstlichen neuronalen Netzen dafür kein übergeordnetes Zentrum, das Neugier bewirkt. Diese entsteht alleine dadurch, dass ein Roboter Reize seiner Sensoren, die ihn über die Interaktion seines Körpers mit der Umwelt informieren, mit Bewegungsbefehlen rückkoppelt. Anhand der sensorischen Signale erzeugt seine Kontrolleinheit Befehle für neue Bewegungen. Aus anfänglichen kleinen, zunächst sogar passiven Bewegungen entwickelt der Roboter so ohne übergeordnete Vorgaben sein motorisches Repertoire. Bislang bekommen lernfähige Roboter konkrete Ziele gesteckt und werden belohnt, wenn sie diese erreichen. Oder Forscher versuchen ihnen Neugier einzuprogrammieren. [...]

Ganz ähnlich wie bei Menschen, die etwa nach einem Schlaganfall zunächst durch passive Bewegung, die Kontrolle über Arme oder Beine zurückgewinnen, löst der passive sensorische Reiz im Gehirn des Roboters ein erstes Lernsignal aus. Und selbst wenn dieses auch sehr klein ist, erzeugt das sensomotorische Kontrollzentrum daraus den Befehl für eine kleine, aber leicht modifizierte Bewegung, die einen neuen sensorischen Reiz bewirkt, der wiederum in eine Bewegung umgesetzt wird. So schaukeln sich Reize und motorische Befehle gegenseitig auf, bis ein koordiniertes Bewegungsmuster entsteht.

RÜCKKOPPLUNG ERZEUGT NEUGIER

Ein Bewegungsmuster übt der Roboter dann so lange aus, bis er gestört wird. Beispielsweise kriecht er bis zu einem Hindernis, woraufhin er neue Bewegungsmuster entwickelt. Eines davon wird es ihm irgendwann erlauben, das Hindernis zu überwinden oder zu umgehen. „Unsere Roboter verhalten sich also neugierig, schließlich lernen sie immer wieder neue Bewegungen“, erklärt Georg Martius. „Ihre Neugier ergibt sich allerdings alleine aus der Rückkopplung zwischen sensorischem Reiz und Bewegungsbefehl, wenn ihr Körper mit der Umwelt interagiert.“

In Computersimulationen wandten die Forscher ihre Regel auf einfache neuronale Netzwerke von virtuellen sechsfüßigen oder humanoiden Robotern an, die auf diese Weise etwa lernten, sich fortzubewegen. Und sie eigneten sich sogar Bewegungen an, dank derer sie mit Artgenossen kooperieren konnten. So drehten zwei humanoide Roboter nach einer Weile in koordinierter Weise an einem Rad.

Martius betont, dass sich ihr System jeweils recht schnell an neue Situationen anpasst, die von der Umwelt vorgegeben werden. Das sei wichtig, denn: „Es wäre aussichtslos, alle möglichen Bewegungen und Kombination auszuprobieren. Das sind unzählige und würde viel zu lange dauern.“ Das Modell arbeitet deshalb auch nicht mit dem Zufall. Im Gegenteil: Ein bestimmter sensorischer Reiz wird nur in einen einzigen motorischen Befehl umgesetzt. Der gleiche Reiz zieht also immer die gleiche Bewegung nach sich. So leiten sich die Bewegungen des Roboters direkt von seinen vergangenen Handlungen ab. „Allerdings können schon kleine Veränderungen im Signal der Sensoren große Auswirkungen auf die Entwicklung eines Bewegungsmusters haben“, so Georg Martius.

VIELVERSPRECHENDER TEST

Auf längere Sicht wollen die Forscher mehrere Bewegungsmuster aus einem großen Repertoire kombinieren, um komplizierte Handlungen zu ermöglichen. Zunächst werden Ralf Der und Georg Martius ihre Lernregeln nun an echten Robotern testen. Die ersten Experimente mit einem künstlichen Arm verliefen vielversprechend, entwickelte dieser doch Fähigkeiten seines echten Pendants.

Die Versuche bestätigen, dass Roboter und möglicherweise auch das menschliche Gehirn kein übergeordnetes Neugier-Zentrum und keine Zielvorgaben brauchen, um neue Bewegungen zu entwickeln, die sie letztlich auch sinnvoll einsetzen können. Stattdessen bilden sich die dafür nötigen neuronalen Netze offenbar lediglich, weil sich Neuronen, die durch äußere Reize auf gleiche Weise beeinflusst werden, enger verknüpfen. Deshalb haben Ralf Der und Georg Martius in Anlehnung an das Hebb`sche Gesetz auch eine neue Merkregel formuliert: „Chaining together what changes together“. (pi)


Mehr Artikel

Unternehmen legen ihren Fokus auf Investitionen zur Performancesteigerung durch Künstliche Intelligenz. (c) Pexels
News

GenAI: Vom Experiment zum strategischen Werkzeug

KI hat sich von einem Hype zu einem strategischen Gamechanger entwickelt. Laut einer Studie von NTT DATA ist die Experimentierphase für generative KI (GenAI) endgültig vorbei. Stattdessen stehen nun konkrete Pläne zur langfristigen Nutzung im Vordergrund – mit dem Ziel, Performance, Arbeitsplatzkultur, Compliance, Sicherheit und Nachhaltigkeit zu optimieren. […]

News

Internationale Konferenz zeigt den Weg zur datengetriebenen Zukunft

Am 13. November 2024 fand im Bundesministerium für Klimaschutz, Umwelt, Energie, Mobilität, Innovation und Technologie (BMK) die Global Data Spaces Connect 2024 (GDSC24) statt, eine internationale Plattform, die Akteur:innen aus Wirtschaft, Wissenschaft und öffentlicher Verwaltung zu einem Austausch über den aktuellen Stand und die Zukunft der Datenräume (Data Spaces) zusammenbrachte. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*