Natural Language Processing and Probability

Nummer: nlp
Leitung: -
ECTS: 3.0
Anspruchsniveau: advanced
Inhaltsübersicht: Turning Words into Data: Die Verarbeitung von Sprache (Natural Language Processing / NLP) ist ein sehr wichtiger Teil der Informationsbeschaffung und ist deshalb eine Kerndisziplin von Data Science. Ein Grossteil der produzierten Daten ist unstrukturiert, oft in Form von Freitext. Bei NLP geht es um die Interaktion zwischen Computer und natürlicher Sprache, also zwischen Mensch und Maschine. In diesem Modul werden zuerst die klassischen Ansätze von NLP behandelt, anschliessend folgt ein Überblick über aktuelle Methoden aus dem DeepNLP mit einer Einführung in TensorFlow und Keras.
Klassische NLP Methoden (mit Python und NLTK):
Text Normalization, Letter/Word Statistics (Language Detector)
POS Tagging (Regex-, Lookup- & n-Gram Tagger)
Named Entity Recognition, Hidden Markov Models
Vector Space Model / TF-IDF / Latent Semantic Analysis
Kontextfreie Grammatiken, Parser

Einführung in Deep NLP (mit TensorFlow/Keras):
Word Embeddings
Language Models (Sequence-to-Sequence Models)
Text Summarization (Attention Mechanismus)
Machine Translation (Transformer Architektur)
Dialog Systems (Bots, Question Answering)
Text-To-Speech, Speech-To-Text (Automatic Speech Recognition)
Und weitere ausgewählte Themen.
Lernziele: Die Studierenden kennen die Grundlagen des Natural Language Processing und die wichtigsten Anwendungsgebiete.
Sie sind in der Lage, NLP-Algorithmen zu implementieren und auf Texte in deutscher und englischer Sprache anzuwenden.
Die Studierenden können die gewählten Modelle und Resultate quantitativ analysieren, bewerten und interpretieren.
Die Studierenden können mit grossen Text-Corpora umgehen und geeignete NLP Libraries und Tools einsetzen.
Empfohlene Vorkenntnisse: Diskrete Stochastik (dist)
Data Wrangling (dawr)
Leistungsbewertung: Erfahrungsnote

Natural Language Processing and Probability,

Natural Language Processing and Probability