In meiner Bachelor Thesis werde ich Explorationsalgorithmen von Agenten in diskreten Umgebungen evaluieren mit Ausblick auf die Anwendbarkeit in der BRIO-Labyrinth Umgebung. Explorationsalgorithmen steuern den Trade-off, den ein Agent zwischen Exploration und Exploitation machen muss. Die Lerngeschwindigkeit der Agenten variiert sehr stark, abhängig von der Umgebungen des Agenten und dem genutzten Explorationsalgorithmus. Allgemein gibt es keinen Explorationsalgorithmus der in allen Umgebungen optimal ist. Zu verschiedenen Umgebungen gibt es bereits Veröffentlichungen bezüglich der Lerngeschwindigkeit von Explorationsalgorithmen. In meiner Thesis möchte ich untersuchen, wie sich die Algorithmen in diskreten, BRIO-ähnlichen Umgebungen verhalten. Anschließend werde ich prüfen, inwieweit sich die Ergebnisse auch auf die kontinuierliche BRIOUmgebung übertragen lassen.
Vortragsdetails
Evaluation von Explorationsalgorithmen in diskreten BRIO-ähnlichen Umgebungen
In der Regel sind die Vorträge Teil von Lehrveranstaltungsreihen der Universität Bremen und nicht frei zugänglich. Bei Interesse wird um Rücksprache mit dem Sekretariat unter sek-ric(at)dfki.de gebeten.