Data Science & Intelligent Analytics BB
Apply Icon
Jetzt
Bewerben

Big Data Processing

Niveau der Lehrveranstaltung/des Moduls laut Lehrplan

Masterstudium

Lernergebnisse der Lehrveranstaltung/des Moduls

Die Studierenden kennen die besonderen Herausforderungen, die bei der Speicherung und Verarbeitung großer Datenmengen (5V-Modell - Volume, Variety, Velocity, Veracity, Value) auftreten. Sie kennen Möglichkeiten, diesen Herausforderungen zu begegnen und können entsprechende Lösungen mit Blick auf eine konkrete Problemstellung selbst entwickeln und zur Anwendung bringen.

Voraussetzungen laut Lehrplan

Softwareentwicklung für Data Science 1 und 2
Data Engineering für Data Science

Lehrinhalte

Den Studierenden werden in die grundlegenden Eigenschaften von Big Data eingeführt. Dabei wird besonderes Augenmerk auf den Umgang mit diesen Daten gelegt und das erworbene Wissen mit Beispielen gefestigt. Für die Lösung von Big Data Problemen, werden geeignete Frameworks vorgestellt und im Rahmen von interaktiven Workshops mit Fallstudien bearbeitet. Als Beispiele hierfür sind zu nennen:

- Apache Hadoop
- Apache Spark
- Apache Flink
- Apache Storm
- Apache Samza
- Apache Kafka

Diese Frameworks sollen anhand von Fallbeispielen erklärt und eingesetzt werden. Dafür kann auf die zentral bereitgestellten Data Labs zugegriffen werden.

empfohlene Fachliteratur

- EMC Education Services (2015) Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. 1. Auflage, Wiley, Indianapolis (ISBN: 978-1118876138).
- O'Neil, C.; Schutt, R. (2013) Doing Data Science. Straight Talk from the Frontline. 1. Auflage, O'Reilly Media, Sebastopol (ISBN: 978-1449358655).
- Provost, F.; Fawcett, T. (2013) Data Science for Business: What you need to know about data mining and data-analytic thinking. 1. Auflage, O'Reilly Media, Sebastopol (ISBN: 978-1449361327).
- Narkhede, N.; Shapira, G.; Palino, T. (2017) Kafka: The Definitive Guide: Real-Time Data and Stream Processing at Scale. 1. Auflage, O'Reilly Media, Farnham (ISBN: 978-1491936160).
- Jain, V. K. (2017) Big Data and Hadoop. 1. Auflage, Khanna Book Publishing, New Delhi (ISBN: 978-9382609131).
- Karau, H.; Warren, R. (2017) High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark. 1. Auflage, O'Reilly Media, Farnham (ISBN: 978-1491943205).

Bewertungsmethoden und -kriterien

Abschlussklausur oder Seminararbeit

Unterrichtssprache

Englisch

Anzahl der zugewiesenen ECTS-Credits

3

geplante Lehr- und Lernmethoden

Vortrag mit Diskussion
Gruppenarbeiten
Interaktiver Workshop

Semester/Trimester, in dem die Lehrveranstaltung/das Modul angeboten wird

3

Semester-Wochen-Stunden (SWS)

2

Name des/der Vortragenden

N.A.

Studienjahr

2

empfohlene optionale Programmeinheiten

N.A.

Kennzahl der Lehrveranstaltungen/des Moduls

DPR.5

Art der Lehrveranstaltung/des Moduls

ILV

Art der Lehrveranstaltung

Präsenzveranstaltung

Praktikum/Praktika

N.A.