Einführung in Big Data Analytics und Methoden der künstlichen Intelligenz

Modulnummer
2402
Modulverantwortliche
  • Prof. Dr. Christoph Gallus
  • Jens Klose
Kurzbeschreibung

Künstliche Intelligenz, maschinelles Lernen, lernende Systeme, Analyse und Wissensentdeckung für große Datenbanken

Qualifikations- und Lernziele

Die Studierenden können die Entwicklung des Gebietes der künstlichen Intelligenz und den aktuellen Stand überblicksartig erläutern. Sie können typische Problemstellungen und Verfahren im Bereich des maschinellen Lernens und der automatisierten Analyse großer Datenmengen benennen. Sie können dabei Querverbindungen zu den Bereichen der mathematischen Optimierung und Statistik herstellen.
Die Studierenden können ausgewählte Ansätze aus den Bereichen Supervised Learning, Unsupervised Learning und Reinforcement Learning unter Verwendung mathematisch formaler Begriffe erklären und differenzieren. Sie können ausgewählte Methoden und Begriffe an einfachen Beispielen erläutern. Sie können Zusammenhänge zwischen der mathematisch-formalen Beschreibung eines Algorithmus und seiner Implementierung in einer zeilenorientierten Programmiersprache ableiten.
Sie können einfache Verfahren und Methoden auf konkrete Lehrbuchprobleme im Bereich der maschinellen Lernverfahren und der automatisierten Datenanalyse anwenden. Sie können entsprechende Berechnungen am Computer beispielhaft selbst durchführen. Sie können einfache Problemstellungen analysieren, die Einsatzmöglichkeiten und ggf. Modifikationsmöglichkeiten für bestehende Softwarepakete einschätzen und die Ergebnisse kritisch beurteilen. Sie können die Auswirkungen hochdimensionaler Problemstellungen auf die Realisierbarkeit von Projekten einschätzen.

Lerninhalte

Überblick über das Feld: Optimierung, multivariate Statistik, künstliche Intelligenz und maschinelles Lernen, Big Data, Data Mining, Predictive Analytics, Prognostics, Prescriptive Analytics
Behandlung formaler Lernprobleme (Klassifikation und Regression) anhand ausgewählter Methoden mit Beispielen. Dabei werden grundsätzliche Ansätze aus den Bereichen Supervised Learning, Unsupervised Learning und Reinforcement
Learning vorgestellt. Diese werden jeweils sowohl auf mathematisch-formaler Ebene, sowie auf Ebene einer zeilenorientierten Programmiersprache (beispielsweise Python) erläutert und eingeübt.
Unter Berücksichtigung des Kenntnisstandes der Studierenden werden ausgewählte Verfahren aus den folgenden Bereichen besprochen: Einfache neuronale Netze, Deep Learning, Stochastic Gradient Descent, Bayessche Netzwerke, Markoff Chain Monte Carlo, k-means-Clustering, k-Nearest Neigbours, Expectation-Maximization, Support-Vektor-Maschinen, Baumverfahren, C4.5

Moduldauer (Semester)
1
Unterrichtssprache
Deutsch
Gesamtaufwand
6.0 CrP; 180 Stunden, davon etwa 60 Stunden Präsenzzeit.
Semesterwochenstunden
4
Lernformen

Seminar

Geprüfte Leistung

Bestehen der Prüfungsleistung (unter Berücksichtigung etwaiger Bonuspunkte)

Bewertungsstandard

Bewertung entsprechend § 9 der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung).

Bonuspunkte

Ja;
Bonuspunkte können gemäß § 9 (4) der Allgemeine Bestimmungen vergeben werden. Die Einzelheiten zur Vergabe von Bonuspunkten werden den Studierenden zu Veranstaltungsbeginn rechtzeitig und in geeigneter Art und Weise mitgeteilt

Häufigkeit des Angebots
Nur im Sommersemester
Literatur

• Geroen, A., Hands-On Machine Learning with Scikit-Learn & TensorFlow: Concepts, Tools, and Techniques for Building Intelligent Systems, O‘Reilly, Sebastopol, 2017
• Goodfellow, I., Bengio, Y., Courville, A., Deep Learning, 2016
• Marsland, S., Machine Learning, 2nd edition, CRC Press, Taylor & Francis Group, 2015
• Murphy, K. P., Machine Learning: A Probabilistic Perspective, MIT Press, 2012
• Sutton, R. S., Barto, A.G., Reinforcement Learning, An Introduction, 2nd ed., MIT Press, 2018
• Steyer, R., Programmierung in Python, Springer Vieweg, 2018
• Trevor, H., Tibshirani, R. und Friedman, J., The Elements of Statistical Learning – Data Mining, Inference and Prediction, 2nd Edition, Springer, 2009.

Studienhilfsmittel

Vortragsfolien und mathematisch-statistisches Kompendium.
Modernes Computer-Anwendungssystem für Big Data und maschinelles Lernen

Empfohlene Vorausetzungen

Mathematisch-statistische Kenntnisse im Umfang von 18 CrP. sowie Kenntnisse in Datenbanken, Programmierung und Business Intelligence werden empfohlen.

Verwendbarkeit des Moduls

Abschlussarbeiten

Rechtliche Hinweise