Eine anwendungsorientierte Einführung in Statistik, Data Wrangling, Machine Learning, Textmining, visuelle Analysen, Zeitreihenanalyse und Empfehlungssysteme.
Eckdaten
Abschluss
CAS
ECTS-Punkte
15
Nächster Start
8. September 2023
Dauer
21 Kurstage
Unterrichtstage
Fr./Sa.
Unterrichtssprache
Deutsch, Grundkenntnisse in Englisch essenziell
Ort
Windisch
Preis
CHF 7’800
Jetzt anmelden! Start der nächsten Durchführungen: 8. September 2023
Die Datenanalyse spielt für Unternehmen eine immer wichtigere Rolle. Die Weiterbildung vermittelt die grundlegenden Methoden zur Analyse und Auswertung von Daten: von den Grundlagen wie Lineare Algebra und Statistik über Data Wrangling, Information Visualization und Data Mining bis zu Machine Learning, Textmining Zeitreihenanalysen und Empfehlungssystemen. Die Dozierenden legen viel Wert auf eine anwendungsorientierte Vermittlung der theoretischen Inhalte. Theorie wird im Unterricht mit «hands-on» Übungen begleitet, um das gelernte Wissen praktisch anwenden und vertiefen zu können.
Melden Sie sich bei der Programmleitung, falls Sie eine individuelle Beratung oder sich mit aktuellen oder ehemaligen Teilnehmenden des Weiterbildungsprogramms CAS Data Science austauschen möchten.
Modulübersicht
Wieso ist Data Science wichtig geworden? Chancen und Risiken
Einführung in den Begriff Data Science und Big Data. Wie sind sie gebunden?
Herausforderungen, Limitierungen -> Chancen und Risiken
Grundaufbau einer Data Science Lösung: Ansätze und Vorgehen
Beispiele aus Forschung und Wirtschaft
Einführung in Python und Arbeitsplattform, als Beispiel einer Data-Science-Umgebung
Vektoren und ihre geometrische Bedeutung
Matrizen als mathematische Operatoren: Matrizenprodukt, Inverse, Rang, Determinante
Lösung von linearen Gleichungssystemen mit Matrizen und Vektoren
Lineare Abbildungen und ihre geometrische Bedeutung
Eigenwerte, Eigenvektoren und Diagonalisierung symmetrischer Marizen
Auseinandersetzung mit dem Numpy-Paket für Python
Einführung Data Mining - Was bringt Data Mining? - Die Aufwertungskette des Data Minings
Data Mining an Objektmengen – Market Basket Analysis
Finden von Assoziationsregeln in Daten
Data-Mining-Modelle
Übungen zu den vorgestellten Verfahren
Deskriptive Statistik
Zufallsgrössen & Wahrscheinlichkeitsverteilungen
Statistische Tests
Prüfen von Erwartungswerten (Parametertests)
Grundlagen
Muster in Daten - was ist das?
Bewertung von Häufigkeit und Relevanz von Mustern
Muster in strukturellen Daten (Strings, Trees, Graphs) finden
Live Demos der Algorithmen an verschiedenen Tools
Übungen zu den vorgestellten Verfahren
Fortgeschrittene Anwendungen
Methoden zur Klassifikation
Logistische Regression
Naïve Bayes
Decision Trees, Random Forests
Support Vector Machines
Methoden zur Dimensionsreduktion: PCA, NMF
Clustering: KMeans
Einführung in Neuronale Netzwerke
Multi-Layer Perceptron
Deep Learning Konzepte und Architekturen
Übersicht ML Projekte in der Praxis
Übungen mit Jupyter notebooks, pandas, matplotlib, seaborn, scikit-learn, keras
Einleitung: Wofür visualisieren?
Daten und grundlegende Grafiken
Grammar of Graphics
Visuelle Wahrnehmung und Informationsdesign
Interaktive Visualisierungssysteme
Anwendungen in der Praxis
Ausreisser-Analyse
Umgang mit unvollständigen / unbalancierten Daten
Anreicherung von Daten
Anonymisierung von Daten
Beschaffung von Daten aus verschiedenen Quellen (API, Web-Crawling, Semantic Web)
Charakterisierung von Zeitreihen
Zerlegung in Komponenten, Stationarität
Modellierung von Zeitreihen als stochastische Prozesse
mit Übung (benutzte Tools: Jupyter notebook, Elasticsearch server, Google collab)
Studium
Personen mit analytischem Interesse, die sich bereits heute schon mit Datenverwaltung und -auswertung beschäftigen oder neu Data Science in Python umsetzen möchten.
21 Kurstage jeweils freitags und samstags. Der Zeitaufwand beträgt total 375 Stunden, das entspricht 15 ECTS-Punkten.
Pro ECTS-Punkt wird mit einem durchschnittlichen Zeitaufwand von 25 Stunden gerechnet. Der CAS Data Science hat einen Umfang von 15 ECTS-Punkten. Deshalb ist mit einem Arbeitsaufwand von 375 Stunden zu rechnen.
Die Hälfte des Zeitaufwands ist dabei für das Selbststudium ausserhalb des Unterrichts für Kursvorbereitungen, Übungen, Repetition des Unterrichtsinhalts, Projektarbeiten und Prüfungsvorbereitungen zu reservieren.
Maximal 16 Personen pro Klasse
Die Aufnahmebedingungen umfassen:
Personen mit analytischem Interesse, die sich bereits heute schon mit Datenverwaltung und -auswertung beschäftigen oder neu Data Science in Python umsetzen möchten.
Abschluss einer Fachhochschule, Universität, technischen Hochschule oder eine Berufsausbildung mit Praxiserfahrung. Studierende, die über keinen Hochschulabschluss verfügen, können (sur Dossier) zugelassen werden, wenn sich die Befähigung zur Teilnahme aus einem anderen Nachweis ergibt.
Sie arbeiten etwa 40-50% der Kurszeit am eigenen Notebook. Wir stellen Ihnen detaillierte Anleitungen und die benötigten Werkzeuge (Software-Tools) zur Verfügung. Bitte installieren Sie diese vorgängig auf dem Laptop und bringen diesen jeweils in den Kurs mit.