Vortragsdetails

Untersuchung von impliziten Bewertungen als nicht-binäres Reward Signal beim Reinforcement Learning

Im Rahmen dieser Masterarbeit wird das Nutzen der impliziten Bewertung des Menschen als nicht-binäres Reward Signals untersucht. Als Reward Signal werden die EEG-Aktivitäten des Menschen, insbesondere die Error-related Potentials (ErrPs), welche durch die Fehlererkennung evoziert werden, genutzt.
Dafür werden zwei verschiedene Ansätze verfolgt.
Zum einen soll die Wahrscheinlichkeit eines Klassifikators, dass ein ErrP detektiert wurde, als implizite Bewertung genutzt werden.
Zum anderen wird eine Regression zwischen expliziten Bewertungen und EEG-Merkmalen durchgeführt und die Ausgabe der Regression als implizite Bewertung genutzt.
Für die Verfolgung dieser Ansätze, wurde ein Lernszenario entwickelt, in dem ein simulierter Roboter durch Bewertungen des Menschen trainiert werden kann.

In der Regel sind die Vorträge Teil von Lehrveranstaltungsreihen der Universität Bremen und nicht frei zugänglich. Bei Interesse wird um Rücksprache mit dem Sekretariat unter sek-ric(at)dfki.de gebeten.

© DFKI GmbH
zuletzt geändert am 31.03.2023