Reinforcement Learning

Teilnehmer:	Wahlpflichtfach Masterstudium
Dozent:	Dr.-Ing. Oliver Wallscheid
	(Sprechstunden nach Vereinbarung)

Procedure in the summer term 2020:

The course is organized in the summer term 2020 in a digital format.
You find all information and teaching materials at Panda:
https://panda.uni-paderborn.de/course/view.php?id=11486

Die Veranstaltung vermittelt die Grundlagen des bestärkenden Lernens (engl. reinforcement learning - RL) in einem ingenieurwissenschaftlichen Kontext. Das RL steht für eine Reihe von Methoden des maschinellen Lernens, bei denen ein Agent selbständig eine Strategie (engl. policy) erlernt, um erhaltene Belohnungen in der Interaktion mit einem (unbekannten) System zu maximieren. Dies kann beispielsweise ein Regelkreis sein, bei dem ein adaptiver Regler aus vorangegangen Beobachtungen der Stell- und Messgrößen versucht, ein optimales Regelgesetz zu ermitteln, welches gewisse Gütekriterien bezüglich der Reglerperformanz maximiert. Bekannte Anwendungsfelder sind u.a. der Betrieb von autonomen Fahrzeugen sowie Industrierobotern oder auch das Auffinden optimaler Strategien im Kontext von Freizeitspielen.

Die Veranstaltung hat einen anwendungsbezogenen Fokus in den Ingenieurwissenschaften, richtet sich darüber hinaus fächerübergreifend auch an Studierende der Naturwissenschaften (z.B. Informatik, Mathematik). Neben der Vermittlung der methodischen Grundlagen innerhalb der Vorlesung wird großer Wert auf praktische Implementierungs- und Programmieraufgaben innerhalb der Übung gelegt.

Die Veranstaltung wird inhaltlich folgende Punkte aufgreifen:

Begriffliche Grundlagen und historische Einordnung
Markov-Entscheidungsprozesse
Dynamische Programmierung
Monte-Carlo Lernen
Temporal Difference Learning
Bootstrapping
Funktionsapproximation und tiefes Lernen
On- und Off-Policy Strategien
Policy Gradient Methoden
Sicheres RL
Integration von Expertenwissen