Big Data

Modulnummer
EB2505
Modulverantwortliche
Harald Ritz
Dozenten
Harald Ritz
Kurzbeschreibung

Insbesondere im Bereich Social Media entsteht eine Vielfalt an großen und in der Struktur heterogenen Datenmengen, die teilweise in Echtzeit Erkenntnisse zur Entscheidungsfindung liefern. Auf dem Weg zum datengetriebenen Unternehmen sind daher fortgeschrittene Methoden der Datenhaltung, skalierbare Rechenleistungen und die erweiterten Fähigkeiten der Analytik vonnöten, um diesen Big-Data-Herausforderungen zu genügen. In diesem Modul werden diesbezügliche Technologien und Analysemethoden behandelt.

Qualifikations- und Lernziele

Die Studierenden können den Grundgedanken und den Nutzen von Big-Data-Technologien und -Analysemethoden verstehen und in die Prozesse eines Unternehmens einordnen. Sie kennen die grundlegenden Herausforderungen und sind befähigt Datenmodelle für den Aufbau eines Big Data Warehouses zu konzipieren und zu implementieren. Die Studierenden werden in die Lage versetzt, die Einsatzmöglichkeiten von Big-Data-Technologien für verschiedene betriebliche Einsatzszenarien im Bereich Social Media realistisch zu bewerten, ein Einführungskonzept zu erstellen und mit eigenen Experimenten zu evaluieren.

Lerninhalte
  • Big Data: Grundlagen u. Begriffe
  • Big-Data-Anwendungsszenarien
  • Integrierte Anwendungslandschaft mit Big-DataLösungen
  • Big-Data-Technologien:
  • Speicherlösungen: u.a. Apache Hadoop-Ökosystem
  • Verteilte nicht-relationale Datenbanksysteme ("NoSQL"-Datenbanksysteme)
  • Spaltenorientierte Datenbanken
  • Dokumentenorientierte Datenbanken
  • Schlüssel-Werte-Datenbanken
  • Graphdatenbanken
  • In-Memory-Datenbanken
  • Datenbank- u. Programmiersprachen (inkl. MapeReduce-Programmiermodell)
  • Datenintegrationswerkzeuge
  • Darstellungswerkzeuge zur Visualisierung  Big-Data-Analyseverfahren:
  • Data-Mining-Verfahren
  • Advanced Analytics (Predictive und Prescriptive Analytics)
  • Text und Web Mining (u.a. Sentimentanalyse)
  • Big-Data-Strategieentwicklung
  • Machbarkeitsstudie, Vorgehensmodelle zur Einführung,
  • Wirtschaftlichkeitsbetrachtungen, Reifegradmodelle
     Big-Data-Projektfallstudien mit diversen SoftwareWerkzeugen
Moduldauer (Semester)
1
Unterrichtssprache
Deutsch
Gesamtaufwand
6 CrP; 180 Stunden, davon etwa 60 Stunden Präsenzzeit.
Semesterwochenstunden
4
Lernformen

Seminaristischer Unterricht 2 SWS, Praktikum 2SWS

Geprüfte Leistung

Prüfungsvorleistung: Erfolgreiche Teilnahme an den Fallstudienprojekten

Prüfungsleistung: Klausur, Projekt oder eine Kombination von beiden. Es wird eine Gesamtnote vergeben. (Art des Leistungsnachweises wird den Studierenden zu Semesterbeginn rechtzeitig und auf geeignete Art und Weise bekannt gegeben.)

Bewertungsstandard

Bewertung der Prüfungsleistung nach § 9 der allgemeinen Bestimmungen für Bachelorprüfungsordnungen

Häufigkeit des Angebots
Einmal im Jahr
Literatur
  • Edlich, St. u.a.: NoSQL-Einstieg in die Welt der nichtrelationalen Web 2.0 Datenbanken, Hanser, 2. Aufl., München 2011
  • Redmond, E.; Wilson, J.R.: Sieben Wochen, sieben Datenbanken : moderne Datenbanken und die NoSQL-Bewegung, The Pragmatic Programmers, Dallas 2012
  • Hurwitz, J. u.a.: "Big Data for dummies", Wiley, Hoboken (NJ), 2013
  • DeRoos, D. u.a.: "Hadoop for dummies", Wiley, Hoboken (NJ), 2014
  • Bari, A.; Chaouchi, M.; Jung, T.: "Predictive Analytics for dummies", Wiley, Hoboken (NJ), 2014
  • Cleve, Jürgen; Lämmel, Uwe: Data Mining, de Gruyter Oldenbourg, München 2014
  • Kohlhammer, Jörn; Proff, Dirk U.; Wiener, Andreas: Visual Business Analytics,dpunkt.verlag, Heidelberg 2013
  • BI-Spektrum: Fachzeitschrift für Business Intelligence und Data Warehousing / eine Publikation des TDWI Germany e.V. - Präsenzexemplar im Lesesaal der THMBibliothek
  • Dorschel, Joachim (Hrsg.): "Praxishandbuch Big Data - Wirtschaft-Recht-Technik", Springer Gabler, Wiesbaden, 2015
  • Eine große Auswahl von weiteren Fachbüchern zu Big Data, Hadoop / MapReduce, NoSQL (HBase, MongoDB, CouchDB, Cassandra u.a.), Daten-Visualisierung, Data Mining, Text Mining, Predictive Analytics und Business Intelligence sowie Data Warehousing werden projektspezifisch empfohlen und sind in der THM-Bibliothek verfügbar.
Voraussetzungen

keine