Reinforcement Learning
Teilnehmer: | Wahlpflichtfach Masterstudium |
Dozent: | Dr.-Ing. Oliver Wallscheid |
(Sprechstunden nach Vereinbarung) |
Procedure in the summer term 2020:
The course is organized in the summer term 2020 in a digital format.
You find all information and teaching materials at Panda:
https://panda.uni-paderborn.de/course/view.php?id=11486
Die Veranstaltung vermittelt die Grundlagen des bestärkenden Lernens (engl. reinforcement learning - RL) in einem ingenieurwissenschaftlichen Kontext. Das RL steht für eine Reihe von Methoden des maschinellen Lernens, bei denen ein Agent selbständig eine Strategie (engl. policy) erlernt, um erhaltene Belohnungen in der Interaktion mit einem (unbekannten) System zu maximieren. Dies kann beispielsweise ein Regelkreis sein, bei dem ein adaptiver Regler aus vorangegangen Beobachtungen der Stell- und Messgrößen versucht, ein optimales Regelgesetz zu ermitteln, welches gewisse Gütekriterien bezüglich der Reglerperformanz maximiert. Bekannte Anwendungsfelder sind u.a. der Betrieb von autonomen Fahrzeugen sowie Industrierobotern oder auch das Auffinden optimaler Strategien im Kontext von Freizeitspielen.
Die Veranstaltung hat einen anwendungsbezogenen Fokus in den Ingenieurwissenschaften, richtet sich darüber hinaus fächerübergreifend auch an Studierende der Naturwissenschaften (z.B. Informatik, Mathematik). Neben der Vermittlung der methodischen Grundlagen innerhalb der Vorlesung wird großer Wert auf praktische Implementierungs- und Programmieraufgaben innerhalb der Übung gelegt.
Die Veranstaltung wird inhaltlich folgende Punkte aufgreifen:
- Begriffliche Grundlagen und historische Einordnung
- Markov-Entscheidungsprozesse
- Dynamische Programmierung
- Monte-Carlo Lernen
- Temporal Difference Learning
- Bootstrapping
- Funktionsapproximation und tiefes Lernen
- On- und Off-Policy Strategien
- Policy Gradient Methoden
- Sicheres RL
- Integration von Expertenwissen