Lernen Sie die Grundlagen einer nachhaltigen Data-Management-Strategie. Mit dem Wissen über die wichtigsten Technologien des Daten-Managements können Sie deren Einsatz für Data-Science-Projekte in der Praxis richtig einschätzen.
Eine der Praxis-Herausforderungen von Data Scientists ist der Umgang mit Daten aus verschiedenen Quellen (Informations-Beschaffung, -Bewirtschaftung & -Bereitstellung). Die Informationen müssen häufig aus verschiedenen Systemen zusammengeführt, auf Konsistenz geprüft und zugriffsgeschützt abgelegt werden, um eine langfristige Data-Science-Strategie im Betrieb aufzubauen. Lernen Sie die Grundlagen eines nachhaltigen, praxistauglichen und kosteneffizienten Datenmanagements und den Umgang mit verschiedenen Datenbanken.
Modulübersicht
In zwei Unterrichtstagen erhalten Sie eine Einführung in das Thema Enterprise- und Lösungsarchitektur mit Fokus auf Daten-Management, Data Warehousing und verwandte Konzepte wie Data Lakes. Damit werden die Grundlagen für ein nachhaltiges Daten-Management in Data-Science-Projekten geschaffen. Mit dem Wissen über die wichtigsten Technologien des Daten-Managements (SQL, No-SQL, On-Prem vs. Cloud) können Sie deren Einsatz für Data-Science-Projekte in der Praxis richtig einschätzen. Sie kennen die Anforderungen und Rahmenbedingungen an unternehmensweite Datenmodelle und können ein einfaches relationales Data Warehouse-Datenmodell erarbeiten, welches für Data-Science-Zwecke gut geeignet ist. Zusätzlich lernen Sie die Grundlagen von SQL im analytischen Umfeld kennen und sind in der Lage, selbst Abfragen und analytische Datasets zu erstellen.
Sie kennen Lösungsarchitekturen im Kontext des Daten-Managements und können UML für die Modellierung sinnvoll einsetzen.
Sie kennen die gängigsten Referenzarchitekturen für analytische Systeme (z.B. Data Warehouse nach Kimball, Data Lake, etc.) und können deren Vor- und Nachteile beurteilen.
Sie kennen die typischen treibenden Kräfte wie Anforderungen und Rahmenbedingungen an analytische Daten-Architekturen und können diese bei der Evaluierung eines geeigneten IT-Systems für Ihre ML-Projekte berücksichtigen.
Sie kennen die wichtigsten Technologien des Daten-Managements (SQL, No-SQL, On-Prem vs. Cloud) und können deren Einsatz für ML-Projekte in der Praxis richtig einschätzen.
Sie können ein einfaches relationales DWH-Datenmodell im Stern-Schema erarbeiten, welches für Machine Learning Zwecke verwendet werden kann.
Die Teilnehmer lernen die Grundlagen von SQL im analytischen Umfeld und sind in der Lage selbst Abfragen und analytische Datasets zu erstellen. Sie wissen, wie Sie den Code strukturieren müssen, damit dieser auch ausserhalb des Jupyter Notebooks verwendet werden kann.
SQL, NoSQL
Grundkompetenz im Umgang mit Daten- und Informationen sowie grundlegende Affinität zu Programmierung
Bereits Erfahrungen in typischen betrieblichen IT-Fragestellungen sind von Vorteil
Einarbeitung in SQL
Bitte planen Sie etwa 10 Stunden für die Vorbereitung.
Weitere Informationen
Sie erhalten in jedem Fall eine Teilnahmebestätigung. Falls Sie in der festgelegten Leistungsbeurteilung mindestens eine genügende Leistung erbringen, erhalten Sie einen Nachweis, dass Sie das Modul erfolgreich bestanden haben.
Teilnehmenden des DAS- oder MAS-Data-Science-Weiterbildungslehrgangs werden die entsprechenden ETCS-Punkte angerechnet.
Fr. 28. April 2023
Fr. 5. Mai 2023
Sa. 13. Mai 2023
8 Teilnehmende
CHF 1'500.- für ehemalige CAS / DAS Data Science-Teilnehmende CHF 2'000.- für Externe