Studieninformation
Hintergrundbild
Hintergrundbild
Hintergrundbild
Druckversion  Sprachumschaltung
 

Modul 39-M-Inf-TMKD Text Mining and Knowledge Discovery

Fakultät

Modulverantwortliche/r

Turnus (Beginn)

Jedes Sommersemester

Leistungspunkte und Dauer

10 Leistungspunkte

Die Angaben zur Moduldauer finden Sie bei den Studiengängen, in denen das Modul verwendet wird.

Kompetenzen

In this module the students will acquire an understanding of and on-hands experience with advanced methods in the field of text mining and knowledge discovery. In the lecture, students will get an overview of state-of-the-art methods in the fields of text mining, statistical natural language processing, machine learning and knowledge discovery. In the project/seminar they will get the chance to deepen their understanding through applied projects and implementations.

The courses in this module are only offered in English.

In diesem Modul erhalten Studierende ein Verständnis sowie praktische Erfahrung mit Methoden im Bereich des Text Minings und der Wissensentdeckung. In der Vorlesung erhalten die Studierende einen Überblick über den Stand-der-Technik in den Gebieten: Text Mining, Statistische Verarbeitung natürlicher Sprache, Maschinelles Lernen sowie Wissensentdeckung. Im Projekt/Seminar bekommen sie die Chance ihr Verständnis der Methoden durch angewandte Projekte und Implementierungen zu vertiefen.

Die Veranstaltungen in diesem Modul werden ausschließlich in englischer Sprache angeboten!

Lehrinhalte

In the lecture, we will discuss the following topics:

  • Text Mining Methods
  • Text Classification and Clustering
  • Information Extraction, Open Information Extraction
  • Language Modeling
  • Language Identification
  • Part-of-speech tagging (Markov and Maxent models)
  • Tagging mit Conditional Random Fields
  • Statistical Parsing
  • Machine Translation
  • Knowledge Discovery Methods

In der Vorlesung werden folgende Inhalte behandelt:

  • Methoden des Text Minings
  • Textklassifikation und -clustering
  • Informationsextrakion, Open Information Extraction
  • Sprachmodelle
  • Sprachidentifikation
  • Part-of-speech tagging (Markov und Maximum Entropy Modelle)
  • Tagging witih Conditional Random Fields
  • Statistisches Parsing
  • Maschinelle Übersetzung
  • Methoden der Wissensentdeckung

Empfohlene Vorkenntnisse

Basic knowledge about data structures and algorithms
Programming skills in some higher programming language (Java, C++, etc.)
Grundkenntnisse in Algorithmen und Datenstrukturen
Grundkenntnisse der Programmierung in C, C++ oder Java

Notwendige Voraussetzungen

Erläuterung zu den Modulelementen

Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
The (partial) examination of the module can be performed as "ungraded" in some study programs at the students' choice. Before the examination a respective determination must be carried out, a later modification (graded - ungraded) is impossible. If the "ungraded" option is chosen, it is not possible to include this module in a study program where this module is deemed to enter the calculation of the overall grade.

Modulstruktur: 0-1 bPr, 0-1 uPr 1

Veranstaltungen

Titel Art Turnus Workload (Kontaktzeit + Selbststudium) LP2
(Project-) Seminar Text Mining and Knowledge Discovery Seminar WiSe 90h (30 + 60) 3 [Pr] [Pr]
Exercises for Text Mining and Knowledge Discovery Übung SoSe 90h (30 + 60) 3
Text Mining and Knowledge Discovery Vorlesung SoSe 60h (30 + 30) 2

Prüfungen

Organisatorische Zuordnung Art Gewichtung Workload LP2
(Project-) Seminar Text Mining and Knowledge Discovery (Seminar)

In einigen Studiengängen der Technischen Fakultät kann die Modulprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

Referat mit Ausarbeitung unbenotet 60h 2
Diese Leistung kann gemeldet und verbucht werden.
(Project-) Seminar Text Mining and Knowledge Discovery (Seminar)

Final Presentation and written report on the outcomes of the practical project/Abschließende Präsentation (20-30 min.) mit Ausarbeitung (5-10 Seiten) über die Ergebnisse des Projektes

Referat mit Ausarbeitung 1 60h 2
Diese Leistung kann gemeldet und verbucht werden.

In diesen Studiengängen wird das Modul verwendet:

Automatische Vollständigkeitsprüfung

In diesem Modul kann eine automatische Vollständigkeitsprüfung vom System durchgeführt werden.

Legende

1
Die Modulstruktur beschreibt die zur Erbringung des Moduls notwendigen Prüfungen und Studienleistungen.
2
LP ist die Abkürzung für Leistungspunkte.
3
Die Zahlen in dieser Spalte sind die Fachsemester, in denen der Beginn des Moduls empfohlen wird. Je nach individueller Studienplanung sind gänzlich andere Studienverläufe möglich und sinnvoll.
4
Erläuterungen zur Bindung: "Pflicht" bedeutet: Dieses Modul muss im Laufe des Studiums verpflichtend absolviert werden; "Wahlpflicht" bedeutet: Dieses Modul gehört einer Anzahl von Modulen an, aus denen unter bestimmten Bedingungen ausgewählt werden kann. Genaueres regeln die "Fächerspezifischen Bestimmungen" (siehe rechtes Menü).
SL
Studienleistung
Pr
Prüfung
bPr
Anzahl benotete Modul(teil)prüfungen
uPr
Anzahl unbenotete Modul(teil)prüfungen
Diese Leistung kann gemeldet und verbucht werden.
Diese Leistung kann gemeldet und verbucht werden.