
Advanced AI - Robot Learning
Ziel des Teams „Robot Learning“ ist es, Methoden und Ansätze zu entwickeln, die es Maschinen ermöglichen, aus der Interaktion zwischen Mensch und Maschine oder aus der zwischen Maschinen zu lernen. Maschinen können dabei entweder robotische Systeme oder synthetische Agenten sein, die in simulierten und echten Umgebungen mit ihren Pendants in Interaktion treten. Dank dieser Ansätze sollen autonome Roboter und synthetische Agenten, die über längere Zeit in einer komplexen Umgebung mit anderen Systemen oder Menschen agieren, fortwährend hinzulernen können. Durch die Interaktion, die dem Lernen zugrunde liegt, können die Roboter nicht nur ihr Verhalten verbessern, sondern sich auch flexibel auf unterschiedliche Anforderungen im Team (mit anderen Maschinen und/oder Menschen) einstellen. Dies ermöglicht eine nachhaltige Zusammenarbeit unter optimaler Nutzung der unterschiedlichen Fähigkeiten der Teammitglieder sowie den Austausch von Wissen und Fähigkeiten.
Das Team entwickelt neue Lernverfahren, die es autonomen Robotern ermöglichen, auf Basis einfacher, generalisierbarer Verhaltensprimitiven komplexes Verhalten zu erlernen, um aus der Interaktion selbst lernen zu können. Im Falle der Mensch-Maschine-Interaktion lässt sich das Verhalten eines Roboters aus der Interaktion heraus so adaptieren, dass es für den Menschen vorhersagbarer wird, wodurch auch die Akzeptanz des Systems als Interaktionspartner erhöht wird. Die Prognostizierbarkeit des Roboters für den Menschen ist wiederum an die Vorhersagbarkeit des Menschen für das System gekoppelt, die einen wichtigen Einfluss auf die Sicherheit der Mensch-Roboter-Interaktion hat. Im Fall der Maschine-Maschine-Interaktion ergeben sich umfängliche Optimierungspotentiale im Rahmen der maschinellen Modellbildung und den kooperativen und konkurrierenden Lösungsverhalten für komplexe, strukturierte wie auch unstrukturierte Problemfelder in der robotischen Interaktion.
Teamleitung: Dr. Patrick Draheim
Intrinsisches interaktives verstärkendes Lernen: Nutzung von Fehler-korrelierten Potentialen
Der Roboter lernt dank menschlichem Negativ-Feedback aus eigenem Fehlverhalten