PI5005 Datenanalyse, Datamining und maschinelles Lernen

Modulverantwortliche
  • Prof. Dr. Andreas Peter Dominik
Lehrende
  • Prof. Dr. Franz Cemic
  • Prof. Dr. Andreas Peter Dominik
  • Dr. habil. Frank Kammer
  • Prof. Dr. Cornelia Sigges
Notwendige Voraussetzungen zur Teilnahme

Keine

Kurzbeschreibung

Methoden und Verfahren zur Erfassung und Speicherung, Aufbereitung, Verarbeitung und Darstellung von Daten aus verschiedenen Datenquellen, sowie statistische Verfahren.

Inhalte
  • Datenaufbereitung
  • Statistische Verfahren
  • Knowledge Discovery und Machine Learning
  • Algorithmen zur Klassifizierung
  • Algorithmen zur Assoziationsanalyse
  • Algorithmen zum Clustering
Qualifikations- und Lernziele

Fachkompetenzen

  • Die Studierenden können jeweils geeignete Methoden zur Aufbereitung, Verarbeitung und Darstellung von Daten aus sehr großen Datenquellen wie dem Internet, Prozessleitsystemen, betriebswirtschaftliche Datenbanken, Bioinformatik-Anwendungen, etc. auswählen und auf konkrete Datenquellen anwenden.
  • Sie können erkennen, welche Algorithmen zur Regression, Klassifizierung und Clusteranalyse für konkrete Fragestellungen jeweils geeignet sind und können diese anwenden.
  • Sie können für Datensätze geeignete Methoden des Preprocessing auswählen und anwenden.

Methodenkompetenzen (fachlich & überfachlich)

  • Die Studierenden können die grundlegenden Algorithmen zur Regression, Klassifizierung und Clusteranalyse in mindestens einer Programmiersprache implementieren.

Sozialkompetenzen

  • Die Studierenden sind in der Lage für eine Problemstellung geeignete Verfahren auszuwählen, deren Vor- und Nachteile im Team zu diskutieren sowie die Anwendung zu begründen.

Selbstkompetenzen

  • Die Studierenden erkennen die Problematik und die Chancen von Bias in Datensätzen und können dies bei der Analyse berücksichtigen und nutzen.
ECTS-Leistungspunkte (CrP)
  • 6 CrP
  • Arbeitsaufwand 180 Std.
  • Präsenzzeit 60 Std.
  • Selbststudium 120 Std.
Lehr- und Lernformen
  • 4 SWS
  • Vorlesung 2 SWS
  • Praktikum 2 SWS
Studiensemester
  • Informatik (M.Sc. 2022)
  • Ingenieur-Informatik (M.Sc. 2022)
Dauer
1 Semester
Häufigkeit des Angebots
Einmal im Jahr
Unterrichtssprache
Deutsch
Bonuspunkte

Ja

Bonuspunkte werden gemäß § 9 (4) der Allgemeinen Bestimmungen vergeben. Art und Weise der Zusatzleistungen wird den Studierenden zu Veranstaltungsbeginn rechtzeitig und in geeigneter Art und Weise mitgeteilt.

Prüfungsleistungen

Prüfungsvorleistung : Übungsaufgaben (75% der Aufgaben) und regelmäßige Teilnahme (mindestens 80% der Zeit) (Aufgabe gilt nur bei Anwesenheit als erbracht) (Anzahl der Übungsaufgaben wird den Studierenden rechtzeitig und in geeigneter Weise bekannt gegeben.)

Prüfungsleistung : Klausur, mündliche Prüfung oder Projekt mit Präsentation der Ergebnisse und Abgabe der Projektdokumentation (Art und Umfang des Leistungsnachweises wird den Studierenden rechtzeitig und in geeigneter Weise bekannt gegeben.)

Benotung
Die Bewertung des Moduls erfolgt gemäß §§ 9, ggf. 12 (Teilleistungen), ggf. 18 (Arbeiten, Kolloquien) der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung).
Verwendbarkeit
Gemäß § 5 der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung) Verwendbarkeit in allen Masterstudiengänge der THM möglich.
Literatur, Medien
  • Tan, P.-N.; Steinbach, M.; Kumar, V.: Introduction to Data Mining. Pearson.
  • Runkler, T. A.: Data Mining: Methoden und Algorithmen intelligenter Datenanalyse. Vieweg+Teubner.

Rechtliche Hinweise