Reinforcement Learning
Reinforcement Learning (RL) befasst sich mit dem Lernen von Interaktionen eines Agenten in seiner Umgebung. Die Interaktionen sollen dabei so ausgeführt werden, dass ein bestimmtes Belohnungs-Signal (Reward) optimiert wird. Umgebung und Agenten können in der echten Welt situiert sein (bspw. Autofahren), oder auch vollständig simuliert werden (bspw. Truck Simulator). In dieser Kompetenz lernen wir die grundlegenden Konzepte und Methoden von RL kennen und anwenden.
Einführung und Grundkonzepte Studierende kennen die Struktur von RL-Problemstellungen sowie grundlegende methodische Konzepte und Algorithmen und können diese wiedergeben: Markov Decision Process, Dynamic Programming, Bellman Equation, Value-Based vs. Policy-Based vs. Model-Based RL, Exploration-Exploitation Trade-Off. Algorithmen können implementiert und verwendet werden.
Deep Q- Learning und Deep Policiy Gradient-Methoden Studierende kennen die methodischen Ansätze von Deep Q- Learning (DQN; Experience Replay, (Double) DQN, Dueling DQN, Deadly Triad) und Policy Gradient-Methoden ((Asynchronous) Advantage Actor Critic (A2C/A3C), Proximal Policy Optimization, Impala). Sie sind in der Lage Algorithmen zu erklären, zu implementieren und zielführend einzusetzen.
Machine Learning, Deep Learning, Grundkompetenz Programmieren, Wahrscheinlichkeitsrechnen, Grundlagen der Linearen Algebra, Grundlagen der Analysis
