Experience-Based Behavior Adaptation of Kinematically-Complex Robots
Alexander Dettmann
In n.n., Feb/2021. Universität Bremen.
Zusammenfassung (Abstract)
:
In den letzen Jahrzehnten entwickelten sich Roboter von blind agierenden Maschinen zu intelligenten Agenten, die mit einer Vielzahl von Aktuatoren und Sensoren sowie mit leistungsfähigen Prozessoren ausgestattet sind. Diese kinematisch komplexen Roboter besitzen die nötige Flexibilität und Mobilität, um sowohl präzise Aktionen wiederholt ausführen als auch mit Hilfe von komplexen Kontrollansätzen auf geänderte Umgebungsbedingungen reagieren zu können. Dabei kommen oft reaktive und/oder planende Bewegungssteuerungen zum Einsatz, die je nach Parametrierung Lösungen für einen limitierten Kontextbereich generieren, d.h. für begrenzte Kommandos, Umgebungseigenschaften oder Zustände des Roboters. Zudem können verschiedene Konfigurationen der Bewegungssteuerung die gleiche Aktion realisieren, aber mit unterschiedlichen Leistungsmerkmalen wie Präzision, Stabilität oder Effizienz. Daher muss ein möglichst generischen Roboter, der Aktionen in unterschiedlichen Situationen mit einer anwendungsspezifisch optimale Leistung ausführen soll, seine Bewegungssteuerung kontextabhängig zur Laufzeit anpassen. Das Ziel dieser Arbeit ist, den Kontextbereich in dem ein Roboter agieren kann zu erhöhen, indem dieser selbstständig seine Bewegungssteuerung und somit sein Verhalten auf Basis von aktuellen Kontextinformationen und gesammelten Erfahrungen anpasst. In dieser Arbeit wird ein Konzept präsentiert, wie Erfahrungen - d.h. Werte für anwendungsspezifische Evaluierungskriterien eines ausgeführten Verhaltens in einem detektierten Kontext - erzeugt, verwaltet und für die Verhaltensadaptation genutzt werden. Der entwickelte Ansatz ermöglicht die kontinuierliche Einbindung von neuen Erfahrungen, wodurch die Grundlage für die autonome Verhaltensanpassung mit der Lebenszeit des Roboters wächst und somit mögliche Zustandsänderungen wie Verschleiß berücksichtigt werden. Für die Ableitung des vermeintlich besten Verhaltens für den aktuellen Kontext auf Basis von Erfahrungen werden zwei unterschiedliche Methoden implementiert und miteinander verglichen. Der erste Ansatz basiert auf fallbasiertem Schließen während der zweite einen modellbasierter Ansatz implementiert, welcher eine inkrementelle Gaußprozessregression als internes Simulationsmodell für die Suche nach einem optimalen Verhalten zu Grunde legt. Die erfahrungsbasierte Verhaltensanpassung wird zur echtzeitfähigen Adaptation von Laufverhalten am Beispiel von zwei kinematisch komplexen Robotern angewandt, d.h. am Hexapoden SpaceClimber und am vierbeinigen Laufroboter Charlie. Zur Erzeugung von Laufverhalten wird eine generische Laufsteuerung präsentiert, welche je nach Konfiguration unterschiedliche Posen und Laufmuster für verschiedenartige Laufroboter erzeugt. Ebenso werden Bewertungskriterien und Metriken zur Bestimmung des Kontextes definiert und angewandt. Durch manuelles und automatisiertes Testen von vielen Verhaltensparameterkonfigurationen werden Wissensdatenbanken generiert. Die experimentelle Auswertung zeigt, dass die gesammelten Erfahrungen in Kombination mit dem vorgestellten Ansatz eine erfolgreiche Verhaltensanpassung für die Zielsysteme erlauben. Beide untersuchten Anpassungsstrategien zeigen Vor- und Nachteile, die je nach Anwendung ihren jeweiligen Einsatz rechtfertigen. Der fallbasierte Ansatz hat seine Stärken, wenn mit Hilfe von wenig Erfahrungen viele Verhaltensaparametern angepasst werden müssen, während der modellbasierte Ansatz gerade für feingranulare Anpassungen bei großen Wissensdatenbanken zu empfehlen ist.
Stichworte
:
robotics; control; machine learning; multi-legged systems;
Links:
https://media.suub.uni-bremen.de/handle/elib/4683