Modul 39-M-Inf-TMKD Text Mining and Knowledge Discovery

Fakultät

Modulverantwortliche*r

Turnus (Beginn)

Jedes Sommersemester

Leistungspunkte und Dauer

10 Leistungspunkte

Die Angaben zur Moduldauer finden Sie bei den Studiengängen, in denen das Modul verwendet wird.

Kompetenzen

In this module the students will acquire an understanding of and on-hands experience with advanced methods in the field of text mining and knowledge discovery. In the lecture, students will get an overview of state-of-the-art methods in the fields of text mining, statistical natural language processing, machine learning and knowledge discovery. In the project/seminar they will get the chance to deepen their understanding through applied projects and implementations.

The courses in this module are only offered in English.

In diesem Modul erhalten Studierende ein Verständnis sowie praktische Erfahrung mit Methoden im Bereich des Text Minings und der Wissensentdeckung. In der Vorlesung erhalten die Studierende einen Überblick über den Stand-der-Technik in den Gebieten: Text Mining, Statistische Verarbeitung natürlicher Sprache, Maschinelles Lernen sowie Wissensentdeckung. Im Projekt/Seminar bekommen sie die Chance ihr Verständnis der Methoden durch angewandte Projekte und Implementierungen zu vertiefen.

Die Veranstaltungen in diesem Modul werden ausschließlich in englischer Sprache angeboten!

Lehrinhalte

In the lecture, we will discuss the following topics:

  • Text Mining Methods
  • Text Classification and Clustering
  • Information Extraction, Open Information Extraction
  • Language Modeling
  • Language Identification
  • Part-of-speech tagging (Markov and Maxent models)
  • Tagging mit Conditional Random Fields
  • Statistical Parsing
  • Machine Translation
  • Knowledge Discovery Methods

In der Vorlesung werden folgende Inhalte behandelt:

  • Methoden des Text Minings
  • Textklassifikation und -clustering
  • Informationsextrakion, Open Information Extraction
  • Sprachmodelle
  • Sprachidentifikation
  • Part-of-speech tagging (Markov und Maximum Entropy Modelle)
  • Tagging witih Conditional Random Fields
  • Statistisches Parsing
  • Maschinelle Übersetzung
  • Methoden der Wissensentdeckung

Empfohlene Vorkenntnisse

Basic knowledge about data structures and algorithms
Programming skills in some higher programming language (Java, C++, etc.)
Grundkenntnisse in Algorithmen und Datenstrukturen
Grundkenntnisse der Programmierung in C, C++ oder Java

Notwendige Voraussetzungen

Erläuterung zu den Modulelementen

Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
The (partial) examination of the module can be performed as "ungraded" in some study programs at the students' choice. Before the examination a respective determination must be carried out, a later modification (graded - ungraded) is impossible. If the "ungraded" option is chosen, it is not possible to include this module in a study program where this module is deemed to enter the calculation of the overall grade.

Modulstruktur: 0-1 bPr, 0-1 uPr 1

Veranstaltungen

(Project-) Seminar Text Mining and Knowledge Discovery
Art Seminar
Turnus WiSe
Workload5 90 h (30 + 60)
Exercises for Text Mining and Knowledge Discovery
Art Übung
Turnus SoSe
Workload5 90 h (30 + 60)
LP 3
Text Mining and Knowledge Discovery
Art Vorlesung
Turnus SoSe
Workload5 60 h (30 + 30)
LP 2

Prüfungen

Referat mit Ausarbeitung
Zuordnung Prüfende Lehrende der Veranstaltung (Project-) Seminar Text Mining and Knowledge Discovery (Seminar)
Gewichtung unbenotet
Workload 60h
LP2 2

In einigen Studiengängen der Technischen Fakultät kann die Modulprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

Referat mit Ausarbeitung
Zuordnung Prüfende Lehrende der Veranstaltung (Project-) Seminar Text Mining and Knowledge Discovery (Seminar)
Gewichtung 1
Workload 60h
LP2 2

Final Presentation and written report on the outcomes of the practical project/Abschließende Präsentation (20-30 min.) mit Ausarbeitung (5-10 Seiten) über die Ergebnisse des Projektes

In diesen Studiengängen wird das Modul verwendet:

Studiengang Empf. Beginn 3 Dauer Bindung 4
Intelligente Systeme / Master of Science [FsB vom 27.07.2018 mit Änderung vom 04.06.2020] 2. zwei Semes­ter Wahl­pflicht
Intelligente Systeme / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und Berichtigung vom 17.11.2014] 2. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 2. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 2. zwei Semes­ter Wahl­pflicht

Automatische Vollständigkeitsprüfung

In diesem Modul kann eine automatische Vollständigkeitsprüfung vom System durchgeführt werden.


Legende

1
Die Modulstruktur beschreibt die zur Erbringung des Moduls notwendigen Prüfungen und Studienleistungen.
2
LP ist die Abkürzung für Leistungspunkte.
3
Die Zahlen in dieser Spalte sind die Fachsemester, in denen der Beginn des Moduls empfohlen wird. Je nach individueller Studienplanung sind gänzlich andere Studienverläufe möglich und sinnvoll.
4
Erläuterungen zur Bindung: "Pflicht" bedeutet: Dieses Modul muss im Laufe des Studiums verpflichtend absolviert werden; "Wahlpflicht" bedeutet: Dieses Modul gehört einer Anzahl von Modulen an, aus denen unter bestimmten Bedingungen ausgewählt werden kann. Genaueres regeln die "Fächerspezifischen Bestimmungen" (siehe Navigation).
5
Workload (Kontaktzeit + Selbststudium)
SL
Studienleistung
Pr
Prüfung
bPr
Anzahl benotete Modul(teil)prüfungen
uPr
Anzahl unbenotete Modul(teil)prüfungen
Diese Leistung kann gemeldet und verbucht werden.