Das Auffinden relevanter Informationen stellt eine zentrale Aktivität in unserer modernen Wissensgesellschaft dar. Relevante Informationen sind zum großen Teil in unstrukturierten Dokumenten (insbesondere Textdokumente) zu finden. Das Gebiet des Information Retrieval (IR) beschäftigt sich mit der Erforschung, Entwicklung und Anwendung von Methoden für den effizienten Zugriff und Suche auf großen Mengen von unstrukturierten Daten, insbesondere Texte, Bilder und Videos. In der Vorlesung werden folgende Themen behandelt:
* Information Retrieval Modelle (insbesondere das Boolsche, das vektor-basierte und das probabilistische Modell)
* Methoden zur Gewichtung von Termen
* Techniken zur Indizierung
* Sprachmodelle für das Information Retrieval
* Relevance Feedback und Query Expansion für das Information Retrieval
* Latent Semantic Indexing
* Web Suche: Der Fall Google
* Multimedia Retrieval
Nach Abschluss des Moduls sollten die Studierenden:
* mit den wesentlichen Paradigmen sowie den gängigen Methoden und Modellen des Information Retrievals vertraut sein,
* Techniken beherrschen, um große Mengen an unstrukturierten Daten im Hinblick auf das effiziente Retrieval zu indizieren,
* ein Verständnis für fortgeschrittene Techniken wie die Verwendung von Sprachmodellen für das IR, relevance feedback sowie latent semantic indexing entwickelt haben,
* die Funktionsweise von Web-Suchmaschinen verstehen, sowie
* in der Lage sein, ein IR System selbstständig zu implementieren.
Kenntnisse in folgenden Gebieten werden empfohlen (stellen aber keine Voraussetzung dar): Algorithmen und Datenstrukturen, Grundkenntnisse Mathematik, Einführung in die Datenbanken und Modellierung
* "Search Engines: Information Retrieval in Practice", Bruce Croft, Donald Metzler, Trevor Strohman, Pearson/Addison-Wesley, 2009
* "Modern Information Retrieval", Baeza-Yates and Ribeiro-Neto, Addison-Wesley, 1999
Rhythmus | Tag | Uhrzeit | Format / Ort | Zeitraum |
---|
Studiengang/-angebot | Gültigkeit | Variante | Untergliederung | Status | Sem. | LP | |
---|---|---|---|---|---|---|---|
Bioinformatik und Genomforschung / Bachelor | (Einschreibung bis SoSe 2011) | Information Retrieval | Wahlpflicht | 6. | 2 | benotet | |
Informatik / Bachelor | (Einschreibung bis SoSe 2011) | Nebenfach | Information Retrieval | Wahlpflicht | 6. | 2 | benotet |
Intelligente Systeme / Master | (Einschreibung bis SoSe 2012) | Information Retrieval | Wahlpflicht | 2. | 2 | benotet | |
Kognitive Informatik / Bachelor | (Einschreibung bis SoSe 2011) | Information Retrieval | Wahlpflicht | 6. | 2 | benotet | |
Medieninformatik und Gestaltung / Bachelor | (Einschreibung bis SoSe 2011) | Information Retrieval | Wahlpflicht | 6. | 2 | benotet | |
Naturwissenschaftliche Informatik / Bachelor | (Einschreibung bis SoSe 2011) | Information Retrieval | Wahlpflicht | 6. | 2 | benotet | |
Naturwissenschaftliche Informatik / Diplom | (Einschreibung bis SoSe 2004) | allgem.HS | HS | ||||
Naturwissenschaftliche Informatik / Master | (Einschreibung bis SoSe 2012) | Information Retrieval | Wahlpflicht | 2. | 2 | benotet |
Bestehen der schriftlichen Klausur (2 LP) und erfolgreiche Bearbeitung der Übungsaufgaben (3,5 LP) sowie erfolgreiches Absolvieren des Praktikums (4,5 LP) ergeben insgesamt 10 LP.