Skip to main content

Modulbeschreibung - Natural Language Processing and Probability

Nummer
nlp
ECTS 3.0
Anspruchsniveau advanced
Inhaltsübersicht Turning Words into Data:
Die Verarbeitung von Sprache (Natural Language Processing / NLP) ist ein sehr wichtiger Teil der Informationsbeschaffung und ist deshalb eine Kerndisziplin von Data Science. Ein Grossteil der produzierten Daten ist unstrukturiert, oft in Form von Freitext. Bei NLP geht es um die Interaktion zwischen Computer und natürlicher Sprache, also zwischen Mensch und Maschine.
In diesem Modul werden zuerst die klassischen Ansätze von NLP behandelt, anschliessend folgt ein Überblick über aktuelle Methoden aus dem DeepNLP mit einer Einführung in TensorFlow und Keras.

    Klassische NLP Methoden (mit Python und NLTK):
  • Text Normalization, Letter/Word Statistics (Language Detector)
  • POS Tagging (Regex-, Lookup- & n-Gram Tagger)
  • Named Entity Recognition, Hidden Markov Models
  • Vector Space Model / TF-IDF / Latent Semantic Analysis
  • Kontextfreie Grammatiken, Parser

    Einführung in Deep NLP (mit TensorFlow/Keras):
  • Word Embeddings
  • Language Models (Sequence-to-Sequence Models)
  • Text Summarization (Attention Mechanismus)
  • Machine Translation (Transformer Architektur)
  • Dialog Systems (Bots, Question Answering)
  • Text-To-Speech, Speech-To-Text (Automatic Speech Recognition)

Und weitere ausgewählte Themen.
Lernziele
  • Die Studierenden kennen die Grundlagen des Natural Language Processing und die wichtigsten Anwendungsgebiete.
  • Sie sind in der Lage, NLP-Algorithmen zu implementieren und auf Texte in deutscher und englischer Sprache anzuwenden.
  • Die Studierenden können die gewählten Modelle und Resultate quantitativ analysieren, bewerten und interpretieren.
  • Die Studierenden können mit grossen Text-Corpora umgehen und geeignete NLP Libraries und Tools einsetzen.
Empfohlene Vorkenntnisse
  • Diskrete Stochastik (dist)
  • Data Wrangling (dawr)

  • Leistungsbewertung Erfahrungsnote
    Diese Seite teilen: