High Performance Computing Operations
High Performance Computing (HPC) ist zentral für datenintensive Forschung und rechenintensive Anwendungen in Industrie und Wissenschaft. Dieser Kurs vermittelt die Grundlagen des Betriebs moderner HPC-Umgebungen. Behandelt werden Architektur und Aufbau von Peak Throughput Cluster- und GPU-Systemen, Job- und Ressourcenmanagement inklusive Monitoring und Performance-Analyse im HPC Umfeld, Container- und Modulkonzepte in HPC-Umgebungen sowie grundlegende Sicherheits- und Betriebsaspekte bei Schedulingsystemen. Der Kurs zeigt zudem, wie stabile, effiziente und skalierbare HPC-Workflows gestaltet und in wissenschaftliche oder industrielle Prozesse integriert werden.
- Die Studierenden verstehen Zweck, Aufbau und typische Einsatzfelder von HPC-Systemen.
- Sie können grundlegende HPC-Ressourcen planen, konfigurieren und betreiben.
- Sie sind fähig, Job-Scheduling und Ressourcenmanagementsysteme effizient zu nutzen aber auch konfigurieren und zu betreiben.
- Sie können Monitoring- und Performance-Analysewerkzeuge, zugeschnitten auf das HPC-Umfeld, anwenden.
- Sie können stabile, sichere und skalierbare HPC-Workflows gestalten.
