BOLeRo
Behavior Optimization and Learning for Robots
Ansprechpartner/in:
BOLeRo stellt Werkzeuge zum Lernen von Verhalten für Roboter bereit. Das umfasst Verhaltensrepräsentationen sowie bestärkende Lernverfahren, Black-Box-Optimierung, Evolutionäre Algorithmen und Imitationslernverfahren. Es stellt eine C++- und eine Python-Schnittstelle zur Verfügung, um effizient zu sein wo dies erforderlich ist und um flexibel und einfach zu benutzen zu sein, wo Performanz kein Problem ist. Da die Bibliothek eine C++-Schnittstelle bereitstellt, ist sie leicht in die meisten robotischen Frameworks zu integrieren; zum Beispiel ROS oder Rock.
Internetseite: | https://github.com/rock-learning/bolero |
Schlüsselwörter: | Maschinelles Lernen, Evolutionäre Algorithmen, Verhaltenslernen, Optimierung |
Status: | aktiv |
Betriebssystem: | Linux, MacOS, Windows |
Programmiersprachen: | C++, Python |
Lizenz: | BSD-3-Clause / New BSD |
Eigentumsrechte: | Diese Software wurde ursprünglich vom DFKI sowie der Arbeitsgruppe Robotik und der Universität Bremen entwickelt, wird aber jetzt auch von Dritten weiterentwickelt. Bei Fragen und Anregungen wenden sie sich an die Ansprechpartner. |
Softwarebeschreibung
Das Ziel von BOLeRo ist es Verhaltenslernverfahren mit Lernproblemen zu kombinieren. BOLeRo stellt dabei Lernverfahren (Verhaltenssuche), Verhalten, Testumgebungen und Optimierungsverfahren bereit.
Die gesamte Kommunikation zwischen einem Verhalten und der Umgebung findet über Vektoren statt. Dies beinhaltet die Aktionen, die ein Verhalten ausführen möchte und die Sensorinformationen, die in der Umgebung aufgenommen werden.
Die Umgebung definiert das Problem, das wir lösen möchten. Es kapselt alles, das außerhalb des Verhaltenslernverfahren passiert, also
Die gesamte Kommunikation zwischen einem Verhalten und der Umgebung findet über Vektoren statt. Dies beinhaltet die Aktionen, die ein Verhalten ausführen möchte und die Sensorinformationen, die in der Umgebung aufgenommen werden.
Die Umgebung definiert das Problem, das wir lösen möchten. Es kapselt alles, das außerhalb des Verhaltenslernverfahren passiert, also
- sie interpretiert die Aktionen und führt sie aus
- sie kann Sicherheitsmechanismen beinhalten, die beispielsweise Geschwindigkeiten und Beschleunigungen begrenzen oder Kollisionen vermeiden
- sie misst und interpretiert den Zustand des Systems, das aus Agent (zum Beispiel einem Roboter) und der realen Umgebung besteht
- sie generiert das Feedback für den Lernalgorithmus