TI5508 Natural Language Processing
- Prof. Dr. Cornelia Meckbach
- Prof. Dr. Andreas Peter Dominik
- Prof. Dr. Cornelia Meckbach
Keine
Das Modul vermittelt den Studierenden grundlegende Fähigkeiten und Kenntnisse im Umgang, der Verarbeitung und der Analyse von Textdaten im Gebiet des Natural Language Processing (NLP). Dabei werden nach einem Einblick ins traditionelle NLP, die aktuellen Methoden des NLP mit Deep Learning behandelt.
- Grundlagen der Verarbeitung von Textdaten (Tokenizing, Tagging, Dokument-Term-Matrix, etc.)
- Identifikation von Kollokationen
- Traditionelle Lösungen von Klassifikationsproblemen in Bereich der Sprachverarbeitung
- Wortvektoren und semantische Ähnlichkeit (word2vec, Embedding)
- Named-Entity-Recognition (NER)
- Deep Learning in NLP (z.B. rekurente neuronale Netze (RNNs), Long short-term memory (LSTMs), Convolutional Neural Networks, etc.)
- Anwendungen von NLP in verschiedenen Bereichen (z.B. Web-Mining, medizinische Forschung, soziale Medien)
- Ethische und gesellschaftliche Aspekte bezogen auf NLP
Fachkompetenzen
- Die Studierenden können für eine gegebene Problemstellung eine passende Vorverarbeitung der Daten auswählen und anpassen.
- Sie können für die Sprachverarbeitung in der Informatik verschiedene Sprachmodelle unterscheiden und anwenden.
- Sie können die Anwendbarkeit von NLP-Technologien in verschiedenen Anwendungen beurteilen und diskutieren.
Methodenkompetenzen
- Die Studierenden sind in der Lage, Textdaten zu sammeln, zu bereinigen und vorzubereiten, um sie für weitere Analysen zu verwenden.
- Sie können geeignete Technologien anwenden, um Texte in eine maschinenlesbare Form zu bringen.
- Sie können fortgeschrittene Techniken der Sprachverarbeitung implementieren.
- Sie können Sprachmodelle trainieren und validieren, und die erzielten Ergebnisse bewerten.
Sozialkompetenzen
- Die Studierenden können in Teams arbeiten und ihre Ergebnisse und Erkenntnisse präsentieren und diskutieren.
- Sie können ihre Arbeit und Entscheidungen transparent und verständlich dokumentieren und kommunizieren.
- Sie können in Debatten über die ethischen und gesellschaftlichen Implikationen von NLP-Technologien angemessen diskutieren und argumentieren.
Selbstkompetenzen
- Die Studierenden sind in der Lage, ihre eigene Arbeit und ihre Entscheidungen zu reflektieren und kritisch zu hinterfragen.
- Sie können ihre eigene Arbeit und ihre Entscheidungen in einen größeren (gesellschaftlichen) Kontext einordnen.
- 6 CrP
- Arbeitsaufwand 180 Std.
- Präsenzzeit 60 Std.
- Selbststudium 120 Std.
- 4 SWS
- Seminaristischer Unterricht mit Projekt 4 SWS
- Informatik (M.Sc. 2022)
Ja
Bonuspunkte werden gemäß § 9 (4) der Allgemeinen Bestimmungen vergeben. Art und Weise der Zusatzleistungen wird den Studierenden zu Veranstaltungsbeginn rechtzeitig und in geeigneter Art und Weise mitgeteilt.
Prüfungsvorleistung: Übungsaufgaben (Anzahl der Übungsaufgaben wird den Studierenden rechtzeitig und in geeigneter Weise bekannt gegeben.)
Prüfungsleistung: Projektarbeit mit Präsentation
- Rao, D.; McMahan, B.: Natural Language Processing with PyTorch. Build Intelligent Language Applications using Deep Learning. O’Reilly.
- Jurafsky, D.; Martin , J. H.: Speech and language processing. Prentice Hall.
Rechtliche Hinweise
- Diese Informationen geben den in den Online-Diensten für Studierende erfassten Datenbestand wieder.
- Die rechtskräftigen und damit verbindlichen Fassungen der Modulhandbücher finden Sie im Amtlichen Mitteilungsblatt der THM (AMB).
- Alle gültigen Prüfungsbestimmungen für die THM-Studiengänge können Sie außerdem in komfortabler Leseversion über den Downloadbereich auf der Homepage des Prüfungsamts einsehen.