TI5508 Natural Language Processing

Modulverantwortliche
  • Prof. Dr. Cornelia Meckbach
Lehrende
  • Prof. Dr. Andreas Peter Dominik
  • Prof. Dr. Cornelia Meckbach
Notwendige Voraussetzungen zur Teilnahme

Keine

Kurzbeschreibung

Das Modul vermittelt den Studierenden grundlegende Fähigkeiten und Kenntnisse im Umgang, der Verarbeitung und der Analyse von Textdaten im Gebiet des Natural Language Processing (NLP). Dabei werden nach einem Einblick ins traditionelle NLP, die aktuellen Methoden des NLP mit Deep Learning behandelt.

Inhalte
  • Grundlagen der Verarbeitung von Textdaten (Tokenizing, Tagging, Dokument-Term-Matrix, etc.)
  • Identifikation von Kollokationen
  • Traditionelle Lösungen von Klassifikationsproblemen in Bereich der Sprachverarbeitung
  • Wortvektoren und semantische Ähnlichkeit (word2vec, Embedding)
  • Named-Entity-Recognition (NER)
  • Deep Learning in NLP (z.B. rekurente neuronale Netze (RNNs), Long short-term memory (LSTMs), Convolutional Neural Networks, etc.)
  • Anwendungen von NLP in verschiedenen Bereichen (z.B. Web-Mining, medizinische Forschung, soziale Medien)
  • Ethische und gesellschaftliche Aspekte bezogen auf NLP
Qualifikations- und Lernziele

Fachkompetenzen

  • Die Studierenden können für eine gegebene Problemstellung eine passende Vorverarbeitung der Daten auswählen und anpassen.
  • Sie können für die Sprachverarbeitung in der Informatik verschiedene Sprachmodelle unterscheiden und anwenden.
  • Sie können die Anwendbarkeit von NLP-Technologien in verschiedenen Anwendungen beurteilen und diskutieren.

Methodenkompetenzen

  • Die Studierenden sind in der Lage, Textdaten zu sammeln, zu bereinigen und vorzubereiten, um sie für weitere Analysen zu verwenden.
  • Sie können geeignete Technologien anwenden, um Texte in eine maschinenlesbare Form zu bringen.
  • Sie können fortgeschrittene Techniken der Sprachverarbeitung implementieren.
  • Sie können Sprachmodelle trainieren und validieren, und die erzielten Ergebnisse bewerten.

Sozialkompetenzen

  • Die Studierenden können in Teams arbeiten und ihre Ergebnisse und Erkenntnisse präsentieren und diskutieren.
  • Sie können ihre Arbeit und Entscheidungen transparent und verständlich dokumentieren und kommunizieren.
  • Sie können in Debatten über die ethischen und gesellschaftlichen Implikationen von NLP-Technologien angemessen diskutieren und argumentieren.

Selbstkompetenzen

  • Die Studierenden sind in der Lage, ihre eigene Arbeit und ihre Entscheidungen zu reflektieren und kritisch zu hinterfragen.
  • Sie können ihre eigene Arbeit und ihre Entscheidungen in einen größeren (gesellschaftlichen) Kontext einordnen.
ECTS-Leistungspunkte (CrP)
  • 6 CrP
  • Arbeitsaufwand 180 Std.
  • Präsenzzeit 60 Std.
  • Selbststudium 120 Std.
Lehr- und Lernformen
  • 4 SWS
  • Seminaristischer Unterricht mit Projekt 4 SWS
Studiensemester
  • Informatik (M.Sc. 2022)
Dauer
1 Semester
Häufigkeit des Angebots
Einmal im Jahr
Unterrichtssprache
Deutsch
Bonuspunkte

Ja

Bonuspunkte werden gemäß § 9 (4) der Allgemeinen Bestimmungen vergeben. Art und Weise der Zusatzleistungen wird den Studierenden zu Veranstaltungsbeginn rechtzeitig und in geeigneter Art und Weise mitgeteilt.

Prüfungsleistungen

Prüfungsvorleistung: Übungsaufgaben (Anzahl der Übungsaufgaben wird den Studierenden rechtzeitig und in geeigneter Weise bekannt gegeben.)

Prüfungsleistung: Projektarbeit mit Präsentation

Benotung
Die Bewertung des Moduls erfolgt gemäß §§ 9, ggf. 12 (Teilleistungen), ggf. 18 (Arbeiten, Kolloquien) der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung).
Verwendbarkeit
Gemäß § 5 der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung) Verwendbarkeit in allen Masterstudiengänge der THM möglich.
Literatur, Medien
  • Rao, D.; McMahan, B.: Natural Language Processing with PyTorch. Build Intelligent Language Applications using Deep Learning. O’Reilly.
  • Jurafsky, D.; Martin , J. H.: Speech and language processing. Prentice Hall.

Rechtliche Hinweise