Cloud Infrastructure and Computing
Bereitstellen skalierbarer Infrastrukturen, Containerisierung und Cloud-Computing für Data-Science-Projekte
Moderne Data-Science-Projekte benötigen skalierbare und reproduzierbare Rechenumgebungen. Lokale Systeme stossen dabei schnell an ihre Grenzen. In diesem Modul wird der Weg von der lokalen Entwicklung bis zum produktiven Einsatz in der Cloud behandelt. Dazu werden praxisnahe Kompetenzen in den Bereichen Containerisierung, Orchestrierung, Cloud-Plattformen und parallele Datenverarbeitung vermittelt.
Containerisierung mit Docker
Die Studierenden verstehen das Konzept der Container-Virtualisierung und setzen Docker zur Bereitstellung reproduzierbarer Data Science Umgebungen ein.
Orchestrierung mit Kubernetes
Die Studierenden kennen die Architektur und Grundkonzepte von Kubernetes und können Container-Anwendungen auf einem Cluster betreiben.
Cloud Services
Die Studierenden können fundierte Entscheidungen bei der Auswahl und Nutzung von Cloud-Komponenten treffen, die für Data Science Projekte essentiell sind.
Parallel Computing mit Dask
Die Studierenden verstehen, wie Python-Workloads parallelisiert werden, um grosse Datenmengen effizienter zu verarbeiten, und nutzen hierfür das Framework Dask.
