BesMan

Behaviors for Mobile Manipulation

Die lernfähige Software und Algorithmen zur Feinmotorik testen DFKI-Forscher zunächst an Roboterdame AILA. Die Technik soll künftig in Weltraumrobotern eingesetzt werden. (Quelle: David Schikora, DFKI GmbH)
Die lernfähige Software und Algorithmen zur Feinmotorik testen DFKI-Forscher zunächst an Roboterdame AILA. Die Technik soll künftig in Weltraumrobotern eingesetzt werden. (Quelle: David Schikora, DFKI GmbH)

Das Hauptziel des Projektes BesMan ist die Entwicklung von generischen Manipulationsfähigkeiten für Roboter unterschiedlicher Morphologie. Dies soll durch die enge Integration von Bewegungsplanung, reaktiver, sensorbasierter Ganzkörperregelung, sowie dynamischer Regelung in ein modulares, roboterunabhängiges und leicht rekonfigurierbares Framework erreicht werden. Der Fokus liegt hierbei auf der Wiederverwendbarkeit von Komponenten um eine Reihe von komplexen Manipulationsaufgaben beschreiben zu können. Des Weiteren soll die Möglichkeit bestehen neue, situationsspezifische Verhalten mit Hilfe einer Lernplattform zu integrieren. Diese Lernplattform beinhaltet ein Interface zu einem menschlichen Operator, welcher dem Roboter demonstriert, wie er mit unbekannten oder unvorhergesehenen Situationen umgehen kann. Das DFKI RIC ist Vorhabenskoordinator und verantwortlich für die Entwicklung der Kontrollmechanismen. Die AG Robotik der Universität Bremen ist verantwortlich für die Entwicklung der Lernplattform und der Simulationsumgebung.

Laufzeit: 01.05.2012 bis 31.07.2016
Zuwendungsempfänger: Deutsches Forschungszentrum für Künstliche Intelligenz GmbH & Universität Bremen
Fördergeber: Bundesministerium für Wirtschaft und Technologie
Deutsches Zentrum für Luft- und Raumfahrt e.V.
Förderkennzeichen: Gefördert von der Raumfahrt-Agentur des Deutschen Zentrums für Luft- und Raumfahrt e.V. mit Mitteln des Bundesministeriums für Wirtschaft und Technologie aufgrund eines Beschlusses des Deutschen Bundestages unter dem Förderkennzeichen 50 RA 1216 (DFKI) und 50 RA 1217 (Universität Bremen).
Anwendungsfelder: Weltraumrobotik
Verwandte Projekte: LIMES
Lernen intelligenter Bewegungen kinematisch komplexer Laufroboter für die Exploration im Weltraum (05.2012- 04.2016)
SpaceClimber
Ein semi-autonomer freikletternder Roboter zur Untersuchung von Kraterwänden und -böden (07.2007- 11.2010)
iMRK
Intelligente Mensch-Roboter-Kollaboration (03.2015- 06.2016)
Verwandte Robotersysteme: AILA
Mobile Dual-Arm-Manipulation
MANTIS
Multi-legged Manipulation and Locomotion System
COMPI
Compliant Robot Arm
Exoskeleton Passive (CAPIO)
Upper body Human-Machine-Interface (HMI) for tele-operation
AILA
Mobile Dual-Arm-Manipulation
iMRK
Intelligenter Zweiarm-Manipulator zur Mensch-Roboter Kollaboration
MANTIS
Mehrbeiniges Manipulations- und Lokomotionssystem
Exoskelett Passiv (CAPIO)
Oberkörper Mensch-Maschine-Interface für die Tele-Operation
COMPI
Roboterarm mit nachgiebiger Regelung
iMRK
iMRK Dual-Arm Robot (Photo: Annemarie Popp, DFKI GmbH)
Verwandte Software: ARC-OPT
Adaptive Robot Control using Optimization
Bagel
Biologically inspired Graph-Based Language
BOLeRo
Behavior Optimization and Learning for Robots
NDLCom
Node Level Data Link Communication
MARS
Machina Arte Robotum Simulans
ARC-OPT
Adaptive Robot Control using Optimization
Bagel
Biologically inspired Graph-Based Language
MARS
Machina Arte Robotum Simulans
BOLeRo
Behavior Optimization and Learning for Robots
NDLCom
Node Level Data Link Communication

Projektdetails

Aus den Neurowissenschaften ist bekannt, dass die herausragenden menschlichen Fertigkeiten bei der Manipulation nicht das Ergebnis leistungsstarker Aktorik oder schnellem, sensormotorischen Feedbacks sind. Der Schlüssel liegt vielmehr in der Organisation der Aufgabenausführung, welche Aktionssequenzen unterschiedlicher Komplexität beinhaltet. Im Projekt BesMan wurde dieses Konzept einbezogen und der sogenannte "Bauplan" definiert, welcher eine Sequenz von Teilaufgaben darstellt die, zusammengenommen, einer komplexen Aufgabe entsprechen, wie z.B. die Konstruktion von Infrastruktur auf dem Mond. Die Teilaufgaben wiederum können auf Verhaltensvorlagen abgebildet werden, welche auf dem Robotersystem verfügbar sind. Die Abbildungen zwischen den Teilaufgaben und den Verhaltensvorlagen sind vorher definiert, die Verhaltensvorlagen selbst sind jedoch zu einem gewissen Grad adaptiv und lassen sich an eine spezifische Situation anpassen.

Um eine solche Allgemeingültigkeit von Aufgaben zu erreichen wurde ein Software Framework entwickelt, mit dem Roboterverhalten beschrieben und gesteuert werden können. Hierzu wurde eine eingebettete Domänenspezifische Sprache (eDSL - Embedded Domain Specific Language) entwickelt, welche verwendet werden kann um einen spezifischen Roboter und das den Roboter steuernde Komponentennetzwerk zu beschreiben. Diese Sprache beinhaltet Tools zum Spezifizieren und Verwenden von komponentenbasierter Software, modellbasierten Algorithmen um Roboterbewegungen und Sensorik zu repräsentieren, ein abstraktes Modell des Regelungssystems und ein Planmanagement zur Beschreibung und Ausführung von Sequenzen von Teilaufgaben.

Auf dem Gebiet der dynamischen Roboterregelung wurden Methoden zur experimentellen Identifikation des Robotermodells entwickelt. Diese beruhen im Wesentlichen auf der Erzeugung von optimalen Trajektorien zur Identifikation und Schätzung von Dynamikparametern aus experimentellen Messdaten. Es wurde eine Software Bibliothek entwickelt, welche zunächst ein initiales Dynamikmodell aus der bekannten Geometrie des Roboters erzeugt. Im zweiten Schritt werden dann Experimente zur Identifikation der verbleibenden unbekannten Parameter durchgeführt. Dazu werden Trajektorien erzeugt, welche die maximale Information bezüglich dieser Parameter generieren können und gleichzeitig die Gelenkgrenzen, maximale Geschwindigkeit, sowie Beschleunigung der Robotergelenke berücksichtigen. Die Modellparameter werden aus den so gewonnenen experimentellen Messdaten geschätzt und bei der Implementierung des Reglers verwendet. 

Im Bereich der Bewegungsplanung zur Manipulation wurde ein auf OMPL basierender Bewegungsplaner implementiert, vergleichbar mit dem MoveIt! Framework. Zusätzlich wurde Funktionalität zur zweiarmigen Planung mit Nebenbedingungen, Roboter-Selbstfilter sowie Neuplanung in dynamisch veränderlichen Umgebungen integriert. 

Im Bereich der Ganzkörperregelung wurde ein Framework zur Robotersteuerung basierend auf Optimierung mit Nebenbedingungen (Constraints) implementiert. Dieses wird zur Planung und Ausführung von reaktiven Roboterbewegungen verwendet und ist in der Lage die physikalischen Limitierungen von Robotersystem und Umgebung zu berücksichtigen sowie die Redundanz komplexer Roboter (wie z.B. AILA) optimal auszunutzen. Insbesondere wurde ein auf Optimierung mit Nebenbedingungen basierender Roboterregler, welcher mehrere verschiedene Zielvorgaben berücksichtigen kann, implementiert und in unser ROCK Framework integriert. Des Weiteren wurde die Infrastruktur bereit gestellt um einen "Bauplan" basierend auf Constraints auszuführen und diesen online zu ändern. Alle aktiven Constraints mit ihren aktuellen Parametern bilden eine Teilaufgabe, welche vom Roboter ausgeführt wird. 

Im Bereich des maschinellen Lernens wurde eine generische Lernplattform entwickelt, welche das Lernen von Roboterverhalten durch menschliche Demonstration ermöglicht. Der Prozess ein neues Verhalten zu erzeugen ist hoch automatisiert und schnell genug um dem Roboter im Einsatz bisher unbekannte Verhalten bereitzustellen und einen Ausweg aus einer neuen, nicht vorhergesehenen Situation zu ermöglichen. Die Lernplattform besteht aus mehreren Komponenten zur Datenakquise und Vorverarbeitung von menschlichen Demonstrationen, Segmentierung des Verhaltens in Basiskomponenten, Imitationslernen, Verfeinerung des Verhaltens durch Reinforcement Learning in Simulation sowie die Generalisierung des Verhaltens auf ähnliche Situationen. 

Das Ergebnis des Projektes ist ein generisches Lern- und Steuerungsframework, welches unabhängig von der Morphologie des Roboters ist, auf dem es eingesetzt wird. Der Transfer der entwickelten Lösungen zwischen verschiedenen Robotersystemen und Anwendungsszenarien (z.B. Raumfahrt, Logistik) wurde beispielhaft demonstriert. Die Ergebnisse sind in den folgenden Videos zu sehen.

Videos

BESMAN: Dritte Demonstration - Robotersystem MANTIS

Video-Vorschaubild
Durch das Abspielen des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.

Dritte offizielle Demonstration: Ausführung einer autonomen Manipulationsaufgabe in einem Raumfahrtszenario und Lernen von Verhalten durch menschliche Demonstration.

BESMAN: Zweite Demonstration - KUKA LBR iiwa

Video-Vorschaubild
Durch das Abspielen des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.

Zweite offizielle Demonstration: Lernen eines Greifverhaltens durch menschliche Demonstration in einem Logistik Szenario

BesMan: Erste Demonstration – Robotersystem AILA

Video-Vorschaubild
Durch das Abspielen des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.

Erste offizielle Demonstration: Ausführung einer autonomen Manipulationsaufgabe in einem Nachbau der ISS

Publikationen

2023

Detection and recognition of human manipulation building blocks
Lisa Gutzeit
Mar/2023. Universität Bremen.

2022

Learning Task Constraints for Whole-Body Control of Robotic Systems
Dennis Mronga
May/2022. Universität Bremen.

2020

Distributed computation and control of robot motion dynamics on FPGAs
Vinzenz Bargsten, José de Gea Fernández
In SN Applied Sciences, Springer Nature, volume 2, number 7, pages 1239-n.n., Jun/2020.
BOLeRo: Behavior Optimization and Learning for Robots
Alexander Fabisch, Malte Langosz, Frank Kirchner
In International Journal of Advanced Robotic Systems, SAGE Publications, volume 17, number 3, pages n.n.-n.n., 2020.

2019

Simple and Robust Automatic Detection and Recognition of Human Movement Patterns in Tasks of Different Complexity
Lisa Gutzeit, Marc Otto, Elsa Andrea Kirchner
Editors: Andreas Holzinger, Alan Pope, Hugo Plácido Silva
In Physiological Computing Systems, Springer, pages 39-57, Jul/2019.
pytransform3d: 3D Transformations for Python
Alexander Fabisch
In Journal of Open Source Software, The Open Journal, Journal of Open Source Software, volume 4, number 33, pages 1159, Jan/2019.

2018

The BesMan Learning Platform for Automated Robot Skill Learning
Lisa Gutzeit, Alexander Fabisch, Marc Otto, Jan Hendrik Metzen, Jonas Hansen, Frank Kirchner, Elsa Andrea Kirchner
In Frontiers in Robotics and AI, o.A., volume 5, pages 43, May/2018.

2016

Manipulation and Control
José de Gea Fernández, Elie Allouis, Karol Seweryn, Frank Kirchner, Yang Gao
Editors: Yang Gao
In Contemporary Planetary Robotics: An Approach Toward Autonomous Systems, Wiley-VCH Verlag GmbH & Co. KGaA, chapter 5, pages 255-319, Aug/2016. ISBN: 978-3-527-41325-6.
Minimum Regret Search for Single- and Multi-Task Optimization
Jan Hendrik Metzen
In International Conference on Machine Learning, (ICML), 19.6.-24.6.2016, New York, o.A., Jun/2016.
Experimental Robot Inverse Dynamics Identification Using Classical and Machine Learning Techniques
Vinzenz Bargsten, José de Gea Fernández, Yohannes Kassahun
In International Symposium on Robotics, (ISR), 21.6.-22.6.2016, München, o.A., 2016.
Automatic Detection and Recognition of Human Movement Patterns in Manipulation Tasks
Lisa Gutzeit, Elsa Andrea Kirchner
In Proceedings of the 3rd International Conference on Physiological Computing Systems, (PHYCS-16), 27.7.-28.7.2016, Lissabon, SciTePress, pages 54-63, 2016.
Zusammen mit Robotern am Arbeitsplatz - Neue Bedienkonzepte eröffnen den Weg für neue Robotikanwendungen
Malte Wirkus, Vinzenz Bargsten
In Industrie 4.0 Management, Gito mbH Verlag für Industrielle Informationstechnik und Organisation, volume 2, pages 29-32, 2016.

2015

Active Contextual Entropy Search
Jan Hendrik Metzen
In 8th Workshop on Optimization for Machine Learning (OPT 2015), (OPT-2015), 11.12.2015, Montreal, o.A., Dec/2015.
Single and Dual Arm Manipulator Motion Planning Library
Behnam Asadi
In Workshop on Task Planning for Intelligent Robots in Service and Manufacturing, (IROS), 2015, o.A., Oct/2015.
Intuitive Interaction with Robots - Technical Approaches and Challenges
Elsa Andrea Kirchner, José de Gea Fernández, Peter Kampmann, Martin Schröer, Jan Hendrik Metzen, Frank Kirchner
In Formal Modeling and Verification of Cyber Physical Systems, Springer Heidelberg, pages 224-248, Sep/2015. ISBN: 978-3-658-09993-0.
Accounting for Task-Difficulty in Active Multi-Task Robot Control Learning
Alexander Fabisch, Jan Hendrik Metzen, Mario Michael Krell, Frank Kirchner
Editors: Hermann Engesser
In KI - Künstliche Intelligenz, German Journal on Artificial Intelligence - Organ des Fachbereiches "Künstliche Intelligenz" der Gesellschaft für Informatik e.V., Springer Verlag GmbH Heidelberg, the final publication is available at http://link.springer.com, volume 29, pages 369-377, 2015.
COMPI: Development of a 6-DOF Compliant Robot Arm for Human-Robot Cooperation
Vinzenz Bargsten, José de Gea Fernández
In Proceedings of the 8th International Workshop on Human-Friendly Robotics, (HFR-2015), 21.10.-23.10.2015, Munich, o.A., 2015. Technische Universität München (TUM).
Towards Describing and Deploying Whole-Body Generic Manipulation Behaviours
José de Gea Fernández, Dennis Mronga, Malte Wirkus, Vinzenz Bargsten, Behnam Asadi, Frank Kirchner
In 2015 Space Robotics Symposium, 29.10.-30.10.2015, Glasgow, IET, University of Strathclyde, 2015.
Bayesian Optimization for Contextual Policy Search
Jan Hendrik Metzen, Alexander Fabisch, Jonas Hansen
In Proceedings of the Second Machine Learning in Planning and Control of Robot Motion Workshop, (IROS MLPC-2015), 02.10.2015, Hamburg, IROS, 2015.

2014

Towards Robot-independent Manipulation Behavior Description
Malte Wirkus
In Proceedings of the 5th International Workshop on Domain-Specific Languages and models for ROBotic systems, (DSLRob-2014), 20.10.2014, Bergamo, o.A., Oct/2014.
Velocity-Based Multiple Change-point Inference for Unsupervised Segmentation of Human Movement Behavior
Lisa Gutzeit, Martin Schröer, Jan Hendrik Metzen, Elsa Andrea Kirchner
In Proceedings of the 22nd International Conference on Pattern Recognition, (ICPR-2014), 24.8.-28.8.2014, Stockholm, IEEE, pages 4564-4569, Aug/2014.
Towards Learning of Generic Skills for Robotic Manipulation
Jan Hendrik Metzen, Alexander Fabisch, Lisa Gutzeit, José de Gea Fernández, Elsa Andrea Kirchner
In KI - Künstliche Intelligenz, German Journal on Artificial Intelligence - Organ des Fachbereiches "Künstliche Intelligenz" der Gesellschaft für Informatik e.V., Springer, volume 28, number 1, pages 15-20, Mar/2014.
Active Contextual Policy Search
Alexander Fabisch, Jan Hendrik Metzen
In Journal of Machine Learning Research, Microtome Publishing, volume 15, pages 3371-3399, 2014.

2013

Learning Graph-based Representations for Continuous Reinforcement Learning Domains
Jan Hendrik Metzen
In Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, (ECML PKDD-2013), 23.9.-27.9.2013, Prag, Springer Verlag GmbH, pages 81-96, Sep/2013.
Learning Skill Templates for Parameterized Tasks
Jan Hendrik Metzen, Alexander Fabisch
In Proceedings of the 11th European Workshop on Reinforcement Learning, (EWRL-13), 04.8.-09.8.2013, Dagstuhl, o.A., Aug/2013.
Online Skill Discovery using Graph-based Clustering
Jan Hendrik Metzen
In Journal of Machine Learning Research, o.A., volume W&CP 24, pages 77-88, 2013.
Incremental Learning of Skill Collections based on Intrinsic Motivation
Jan Hendrik Metzen, Frank Kirchner
In Frontiers in Neurorobotics, o.A., volume 7, number 11, pages 1-12, 2013.

Zurück zur Projektliste
© DFKI GmbH
zuletzt geändert am 11.09.2024