IIR5012 Deep Learning für Computer Vision

Modulverantwortliche
  • Prof. Dr. Seyed Eghbal Ghobadi
Lehrende
  • Prof. Dr. Franz Cemic
  • Prof. Dr. Andreas Peter Dominik
  • Prof. Dr. Seyed Eghbal Ghobadi
  • Dr. habil. Frank Kammer
Notwendige Voraussetzungen zur Teilnahme

Keine

Kurzbeschreibung

Computer Vision (CV) hat sich in den letzten Jahren durch Deep Learning (DL) wesentlich weiterentwickelt.

In dieser Lehrveranstaltung werden moderne Konzepte von tiefen neuronalen Netzen für fortgeschrittenes Computer-Vision-Aufgaben vermittelt. Zu den Aufgaben des Moduls gehören Objekterkennung und Bildsegmentierung.

Inhalte
  • Einführung in die Deep Learning und Computer Vision
  • Faltungsneuronale Netze für die visuelle Erkennung (Convolutional Neural Networks)
    • ConvNet-Architekturen
    • Convolutional Layer
    • Pooling Layer
    • Normalization Layer
    • Fully-Connected Laye
  • Deep Learning Pipeline mit TensorFlow / Keras
  • Daten Augmentation
  • Transfer Learning
  • 2D Bounding Box Objekt Erkennung
    • Single Shot Detektion (SSD)
    • Region based CNN (R-CNN)
  • Bildsegmentierung durch tiefes neuronales Netz
    • Semantische Segmentierung
    • Instanz Segmentierung
  • Sequenzbasiertes tiefes Lernen
    • Long short-term memory (LSTM)
    • Rekurrentes neuronales Netz (RNN)
    • Transformers
  • Performanz Metriken
  • Ethische Fragestellungen bei künstlicher Intelligenz
Qualifikations- und Lernziele

Fachkompetenzen

  • Die Studierenden können ein Deep-Neural-Network (DNN) für Computer-Vision-Aufgaben erläutern und implementieren.
  • Sie können eine Pipeline für die Implementierung des Deep-Learning-Netzwerks auf der Basis von TensorFlow/Keras einrichten und ihre Vorgehensweise erläutern.
  • Sie können die Leistung des Deep-Learning-Netzes (DNNs) anhand bestimmter Metriken bewerten.

Methodenkompetenzen (fachlich & überfachlich)

  • Die Studierenden können die in der Vorlesung erlernten tiefen neuronalen Netze für verschiedene Anwendungen (Bildsegmentierung, Objekterkennung, etc.) analysieren, auswählen und umsetzen.
  • Sie können, tiefe neuronale Netze so optimieren, dass sie sich für die Hardware-Integration eignen.

Sozialkompetenzen

  • Die Studierenden können im Team die Anforderungen an ein DNN für bestimmte Computer Vision Aufgabe analysieren und gemeinsam die geeignete Architektur auswählen.
  • Sie können DNNs kooperativ und effektiv in Gruppen implementieren.
  • Sie können die Aufgaben von der Datenvorverarbeitung bis zur DNN-Bewertung gemeinsam übernehmen.
  • Sie können das erworbene Wissen in der Vorlesung und speziell in ihrem Team präsentieren.

Selbstkompetenzen

  • Die Studierenden können selbstständig recherchieren, um sich das Wissen aus dem Stand der Technik anzueignen.
  • Sie können ethische Anforderungen an ein DNN für bestimmte Computer Vision Aufgabe einordnen und bei der Umsetzung berücksichtigen.
ECTS-Leistungspunkte (CrP)
  • 6 CrP
  • Arbeitsaufwand 180 Std.
  • Präsenzzeit 60 Std.
  • Selbststudium 120 Std.
Lehr- und Lernformen
  • 4 SWS
  • Seminaristischer Unterricht 4 SWS
Studiensemester
  • Informatik (M.Sc. 2022)
  • Ingenieur-Informatik (M.Sc. 2022)
Dauer
1 Semester
Häufigkeit des Angebots
Einmal im Jahr
Unterrichtssprache
Deutsch
Bonuspunkte

Nein

Bonuspunkte werden gemäß § 9 (4) der Allgemeinen Bestimmungen vergeben. Art und Weise der Zusatzleistungen wird den Studierenden zu Veranstaltungsbeginn rechtzeitig und in geeigneter Art und Weise mitgeteilt.

Prüfungsleistungen

Prüfungsvorleistung: Keine

Prüfungsleistung: Projektarbeit und Präsentation der Ergebnisse (zusammen 100%)

Benotung
Die Bewertung des Moduls erfolgt gemäß §§ 9, ggf. 12 (Teilleistungen), ggf. 18 (Arbeiten, Kolloquien) der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung).
Verwendbarkeit
Gemäß § 5 der Allgemeinen Bestimmungen (Teil I der Prüfungsordnung) Verwendbarkeit in allen Masterstudiengänge der THM möglich.
Literatur, Medien
  • Vorlesungsfolien
  • Chollet, F.: Deep Learning with Python. Manning Publications.
  • Rosebrock, A.: Deep Learning for Computer Vision with Python. PyimageSearch.
  • Goodfellow, I.; Bengio, Y.; Courville, A.: Deep Learning. MIT Press.
  • Brownlee, J.: Deep Learning for Computer Vision. Image Classification, Object Detection, and Face Recognition in Python. Machine Learning Mastery.
  • Bartneck, C.; Lütge, C.; Wagner, A.; Welsh, S.: An Introduction to Ethics in Robotics and AI. Springer International Publishing.

Rechtliche Hinweise