Lineare und Logistische Regression

    Nummer
    llr
    ECTS
    3.0
    Anspruchsniveau
    Intermediate
    Inhalt
    Die Statistik ist die Grundlage zur zuverlässigen Auswertung von Daten. Allerdings sind Daten nie perfekt und somit muss ein geeignetes Modell gefunden werden. Das Hauptziel dieser Kompetenz ist zu verstehen, wie Daten in der Data Science durch lineare und logistische Regression praktisch ausgewertet werden können.
    Lernergebnisse

    Lineare Methoden für Regression & Klassifikation Die Studierenden können durch einfache lineare und logistische Regression lineare Zusammenhänge zwischen kontinuierlichen und kategorialen Variablen modellieren und testen, z.B. durch Residuenanalyse. Die Methode der kleinsten Quadrate und Maximum Likelihood Methode sind ihnen bekannt.


    Hypothesentests Die Studierenden verstehen parametrische und nichtparametrische Hypothesentests bei Regressionsproblemen, können sie anhand der vorhandenen Verteilung der Daten anwenden, und deren Zuverlässigkeit durch Fehler der 1. und 2. Art abschätzen.


    Konfidenzintervalle Die Studierenden kennen verschiedene Verteilungen, insbe-sondere die Normalverteilung und die t-Verteilung. Sie können Konfidenzintervalle bestimmen und aussagen, mit welcher Wahrscheinlichkeit ein Parameter zu einer Verteilung gehört. Mittels t-Test können sie bestimmen, ob Mittelwerte von verschiedenen Stichproben vergleichbar sind.


    Modulbewertung
    Note
    Baut auf folgenden Modulen auf
    Statistik: Begriffe wie Mittelwert, Standardabweichung, Funktionen sollten bereits bekannt sein. Explorative Datenanalyse, Data Wrangling, Wahrscheinlichkeitsrechnng, Grundlagen Linear Algebra, Grundlagen der Analysis.
    Modultyp
    Portfoliomodul