In vorangegangenen Projekten und Abschlussarbeiten am DFKI Bremen wurde eine Simulation des Labyrinth Spiels der Firma BRIO erstellt und später ein Exemplar des Spiels zu einer Testplattform für autonome Lernverfahren umgerüstet.
Während ein Reinforcement Learning Agent in der Simulation bereits eine erfolgreiche Policy erlernen konnte, ist es noch nicht gelungen diese auf die reale Testplattform zu übertragen.
Das Problems ist als MDP definiert.
Es ergibt für die gesuchte Policy einen sehr großen Suchraum, den ein Lerner auf dem realen System bei vertretbarem Aufwand nicht ausreichend explorieren könnte.
Durch die Anwendung von Methoden des Transfer Learning soll der Lerner in die Lage versetzt werden, in der Simulation gemachte Erfahrungen auf der Testplattform zu nutzen, um so den nötigen Explorationsaufwand auf dem Zielsystem effektiv zu reduzieren.
Im Rahmen dieser Arbeit sollen mehrere Ansätze des Transfer Learning für das gegebene Reinforcement Learning Problem ausgewählt, implementiert und evaluiert werden.