PI5008 Datenanalyse, Datamining und maschinelles Lernen

Modulverantwortliche
  • Prof. Dr. Andreas Peter Dominik
Lehrende
  • Prof. Dr. Franz Cemic
  • Prof. Dr. Andreas Peter Dominik
  • Dr. habil. Frank Kammer
Notwendige Voraussetzungen zur Teilnahme
Keine
Kurzbeschreibung
Methoden und Verfahren zur Erfassung und Speicherung, Aufbereitung, Verarbeitung und Darstellung von Daten aus verschiedenen Datenquellen, sowie statistische Verfahren.
Inhalte
  • Datenaufbereitung
  • Statistische Verfahren
  • Knowledge Discovery und Machine Learning
  • Algorithmen zur Klassifizierung
  • Algorithmen zur Assoziationsanalyse
  • Algorithmen zum Clustering
Qualifikations- und Lernziele

Fachkompetenzen

  • Die Studierenden können jeweils geeignete Methoden zur Aufbereitung, Verarbeitung und Darstellung von Daten aus sehr großen Datenquellen wie dem Internet, Prozessleitsystemen, betriebswirtschaftliche Datenbanken, Bioinformatik-Anwendungen, etc. auswählen und auf konkrete Datenquellen anwenden.
  • Sie können erkennen, welche Algorithmen zur Regression, Klassifizierung und Clusteranalyse für konkrete Fragestellungen jeweils geeignet sind und können diese anwenden.
  • Sie können für Datensätze geeignete Methoden des Preprocessing auswählen und anwenden.

Methodenkompetenzen (fachlich & überfachlich)

  • Die Studierenden können die grundlegenden Algorithmen zur Regression, Klassifizierung und Clusteranalyse in mindestens einer Programmiersprache implementieren.

Sozialkompetenzen

  • Die Studierenden sind in der Lage für eine Problemstellung geeignete Verfahren auszuwählen, deren Vor- und Nachteile im Team zu diskutieren sowie die Anwendung zu begründen.

Selbstkompetenzen

  • Die Studierenden erkennen die Problematik und die Chancen von Bias in Datensätzen und können dies bei der Analyse berücksichtigen und nutzen.
ECTS-Leistungspunkte (CrP)
  • 6 CrP
  • Arbeitsaufwand 180 Std.
  • Präsenzzeit 60 Std.
  • Selbststudium 120 Std.
Lehr- und Lernformen
  • 4 SWS
  • Vorlesung 2 SWS
  • Praktikum 2 SWS
Studiensemester
  • Informatik (M.Sc. 2010)
  • Ingenieur-Informatik (M.Sc. 2017)
  • Medizinische Informatik (M.Sc. 2014) - 1. - 2. Semester
Dauer
1 Semester
Häufigkeit des Angebots
Einmal im Jahr
Unterrichtssprache
Deutsch
Bonuspunkte

Ja

Bonuspunkte werden gemäß § 9 (4) der Allgemeinen Bestimmungen vergeben. Art und Weise der Zusatzleistungen wird den Studierenden zu Veranstaltungsbeginn rechtzeitig und in geeigneter Art und Weise mitgeteilt.

Prüfungsleistungen

Prüfungsvorleistung: Übungsaufgaben (75% der Aufgaben) und regelmäßige Teilnahme (mindestens 80% der Zeit) (Aufgabe gilt nur bei Anwesenheit als erbracht) (Anzahl der Übungsaufgaben wird den Studierenden rechtzeitig und in geeigneter Weise bekannt gegeben.)

Prüfungsleistung: Klausur

Benotung
Die Bewertung des Moduls erfolgt gemäß §§ 9, ggf. 12 (Teilleistungen), ggf. 18 (Arbeiten, Kolloquien) der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung).
Verwendbarkeit
Gemäß § 5 der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung) Verwendbarkeit in allen Masterstudiengänge der THM möglich.
Literatur, Medien
  • Tan, P.-N.; Steinbach, M.; Kumar, V.: Introduction to Data Mining. Pearson.
  • Runkler, T. A.: Data Mining: Methoden und Algorithmen intelligenter Datenanalyse. Vieweg+Teubner.

Rechtliche Hinweise