Modul 39-Inf-BDA_ver1 Big Data Analytics

Achtung: Auf dieser Seite wird ein auslaufendes Modulangebot angezeigt.

Fakultät

Modulverantwortliche*r

Turnus (Beginn)

Auslaufendes Angebot

Neuere Version dieses Moduls

Leistungspunkte und Dauer

5 Leistungspunkte

Die Angaben zur Moduldauer finden Sie bei den Studiengängen, in denen das Modul verwendet wird.

Kompetenzen

Die Studierenden erlernen in den Vorlesungen und Übungen Kompetenzen bei der Durchführung von Data-Mining-Aufgaben bei sehr großen Datenmengen, die nicht im Hauptspeicher gespeichert werden können. Die Vorlesungen liefern die Schlüsselideen der Ähnlichkeitssuche unter Verwendung von Minhashing und lokalitätssensitivem Hashing, der Verarbeitung von Datenströmen, bei denen Daten so schnell ankommen, dass sie sofort verarbeitet werden müssen oder sonst verloren gehen, von Web-bezogenen Algorithmen wie dem Google PageRank, von Algorithmen um häufige Itemsets, Assoziationsregeln und häufige Teilgraphen zu finden, Algorithmen zur Analyse der Struktur von großen Graphen, wie z. B. von sozialen Netzwerkgraphen, und des MapReduce-Prinzips, um parallele Algorithmen zu entwerfen. Das Modul beinhaltet eine Klausur zu Semesterende.

Students learn in the lectures and are the exercise courses competencies in performing data mining tasks on very large amounts of data that cannot be stored in main memory. The lectures provide the key ideas of similarity search using minhashing and locality-sensitive hashing, of data stream processing where data arrives so fast that it has to be processed immediately or is otherwise lost, of Web-related algorithms such as Google's PageRank, of algorithms for mining frequent itemsets, association rules and frequent subgraphs, of algorithms to analyze the structure of large graphs such as social network graphs, and of the map-reduce principle to design parallel algorithms. The module includes an exam at the end of the term.

Lehrinhalte

Das Modul Big Data Analytics befasst sich mit Methoden und Algorithmen im Kontext der Analyse von Big Data. Insbesondere werden folgende Themen behandelt:

  1. Suchen von ähnlichen Objekten
  2. Analyse von Datenströmen
  3. PageRank
  4. MapReduce
  5. Suche nach häufigen Teilmengen
  6. Suche nach häufigen Teilgraphen
  7. Mining von sozialen Netzwerkgraphen
  8. Empfehlungssysteme

The module Big Data Analytics deals with methods and algorithms in the context of big data analytics. In particular, the following topics are addressed:

  1. Finding Similar Items
  2. Stream Data Analysis
  3. PageRank
  4. MapReduce
  5. Mining Frequent Itemsets
  6. Mining Frequent Subgraphs
  7. Mining Social Network Graphs
  8. Recommender Systems

Empfohlene Vorkenntnisse

Wissen über Datenbanken kann hilfreich sein.

Knowledge about databases can be helpful.

Notwendige Voraussetzungen

Erläuterung zu den Modulelementen

Modulstruktur: 1 bPr 1

Veranstaltungen

Big Data Analytics
Art Vorlesung
Turnus SoSe
Workload5 60 h (30 + 30)
LP 2 [Pr]
Big Data Analytics
Art Übung
Turnus SoSe
Workload5 60 h (30 + 30)
LP 2

Prüfungen

Portfolio mit Abschlussprüfung
Zuordnung Prüfende Lehrende der Veranstaltung Big Data Analytics (Vorlesung)
Gewichtung 1
Workload 30h
LP2 1

Portfolio aus Übungs- oder Programmieraufgaben, die veranstaltungsbegleitend und in der Regel wöchentlich gestellt werden, und Abschlussklausur (60 Minuten) oder mündlicher Abschlussprüfung (in der Regel 15 min). Die Übungsaufgaben ergänzen und vertiefen den Inhalt der Vorlesung.
Nachweis einer ausreichenden Zahl korrekt gelöster Übungsaufgaben (in der Regel 50% der im Semester für das Lösen der Aufgaben erzielbaren Punkte).
Die abschließende mündliche Prüfung bezieht sich auf den Stoff der Vorlesung und der Übungen.

Portfolio consisting of per default weekly exercises or programming tasks and final written exam (per default 60 minutes) or final oral exam (per default 15 minutes). The exercises are based on the content of the lecture and enable students to train and further investigate the topics. It is required that a sufficient percentage of the exercises are successfully completed (per default 50% of the total number of points which can be achieved during a semester). The final oral exam concerns both, the content of the lecture as well as the exercises.

Weitere Hinweise

Empfohlene Literatur / Recommended literature:

  • Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman, "Mining of Massive Datasets", 2nd Edition, Cambridge University Press, 2014.
  • Tom White, "Hadoop: The Definitive Guide Storage and Analysis at Internet Scale", 3rd edition, O'Reilly
  • Viktor Mayer-Schönberger, Kenneth Cukier, "Big Data: A Revolution That Will Transform How We Live, Work and Think", John Murray, 2013

Bisheriger Angebotsturnus war jedes Sommersemester.

In diesen Studiengängen wird das Modul verwendet:

Studiengang Profil Empf. Beginn 3 Dauer Bindung 4
Data Science / Master of Science [FsB vom 06.04.2018 mit Änderungen vom 01.07.2019, 02.03.2020 und 21.03.2023] Variante 1 2. ein Semes­ter Pflicht
Data Science / Master of Science [FsB vom 06.04.2018 mit Änderungen vom 01.07.2019, 02.03.2020 und 21.03.2023] Variante 2 2. ein Semes­ter Wahl­pflicht

Automatische Vollständigkeitsprüfung

In diesem Modul kann eine automatische Vollständigkeitsprüfung vom System durchgeführt werden.


Legende

1
Die Modulstruktur beschreibt die zur Erbringung des Moduls notwendigen Prüfungen und Studienleistungen.
2
LP ist die Abkürzung für Leistungspunkte.
3
Die Zahlen in dieser Spalte sind die Fachsemester, in denen der Beginn des Moduls empfohlen wird. Je nach individueller Studienplanung sind gänzlich andere Studienverläufe möglich und sinnvoll.
4
Erläuterungen zur Bindung: "Pflicht" bedeutet: Dieses Modul muss im Laufe des Studiums verpflichtend absolviert werden; "Wahlpflicht" bedeutet: Dieses Modul gehört einer Anzahl von Modulen an, aus denen unter bestimmten Bedingungen ausgewählt werden kann. Genaueres regeln die "Fächerspezifischen Bestimmungen" (siehe Navigation).
5
Workload (Kontaktzeit + Selbststudium)
SL
Studienleistung
Pr
Prüfung
bPr
Anzahl benotete Modul(teil)prüfungen
uPr
Anzahl unbenotete Modul(teil)prüfungen
Diese Leistung kann gemeldet und verbucht werden.