Modul 39-Inf-IR Information Retrieval

Fakultät

Modulverantwortliche*r

Turnus (Beginn)

Jedes Wintersemester

Leistungspunkte und Dauer

10 Leistungspunkte

Die Angaben zur Moduldauer finden Sie bei den Studiengängen, in denen das Modul verwendet wird.

Kompetenzen

Nach Abschluss des Moduls sollten die Studierenden:

  • mit den wesentlichen Paradigmen sowie den gängigen Methoden und Modellen des Information Retrievals vertraut sein,
  • Techniken beherrschen, um große Mengen an unstrukturierten Daten im Hinblick auf das effiziente Retrieval zu indizieren,
  • ein Verständnis für fortgeschrittene Techniken wie die Verwendung von Sprachmodellen für das IR, relevance feedback sowie latent semantic indexing entwickelt haben,
  • die Funktionsweise von Web-Suchmaschinen verstehen, sowie
  • in der Lage sein, ein IR System selbstständig zu implementieren.

After completion of the module students should

  • be familiar with the basic paradigms as well as the current methods and models of information retrieval
  • know the techniques necessary for indexing large amounts of unstructured data for efficient retrieval
  • have developed an understanding of advanced techniques like the application of language models for IR, relevance feedback as well as latent semantic indexing
  • understand the functionality of search engines on the web
  • be capable to implement an IR system without assistance

Lehrinhalte

Das Auffinden relevanter Informationen stellt eine zentrale Aktivität in unserer modernen Wissensgesellschaft dar. Relevante Informationen sind zum großen Teil in unstrukturierten Dokumenten (insbesondere Textdokumente) zu finden. Das Gebiet des Information Retrieval (IR) beschäftigt sich mit der Erforschung, Entwicklung und Anwendung von Methoden für den effizienten Zugriff und Suche auf großen Mengen von unstrukturierten Daten, insbesondere Texte, Bilder und Videos. In der Vorlesung werden folgende Themen behandelt:

  • Information Retrieval Modelle (insbesondere das Boolsche, das vektor-basierte und das probabilistische Modell)
  • Methoden zur Gewichtung von Termen
  • Techniken zur Indizierung
  • Sprachmodelle für das Information Retrieval
  • Relevance Feedback und Query Expansion für das Information Retrieval
  • Latent Semantic Indexing
  • Web Suche: Der Fall Google
  • Multimedia Retrieval

Ziel des Praktikums ist es, eine eigene Suchmaschine für einen größeren Datensatz (den Reuters Datensatz) zu entwickeln.

Literatur:

  • "Introduction to Information Retrieval", Manning, Raghavan, Schütze, Cambridge University Press, 2008
  • "Search Engines: Information Retrieval in Practice", Bruce Croft, Donald Metzler, Trevor Strohman, Pearson/Addison-Wesley, 2009
  • "Modern Information Retrieval", Baeza-Yates and Ribeiro-Neto, Addison-Wesley, 1999

The retrieval of relevant information constitutes a central activity in our modern knowledge-based society. Relevant information is to a large extent found in unstructured documents (especially text documents). The area of Information Retrieval (IR) is concerned with the research, development and application of methods that allow large amounts of unstructured data, especially texts, pictures and videos, to be accessed and searched efficiently. The following topics will be disussed:

  • IR models (including Boolean, vector based and probabilistic)
  • term weighting methods
  • indexing techniques
  • language models for IR
  • relevance feedback and query expansion for IR
  • latent semantic indexing
  • Web search: the case of google
  • Multimedia retrieval

Aim of the practical is the development of a search engine for a dataset.

Empfohlene Vorkenntnisse

Algorithmen und Datenstrukturen, Grundkenntnisse Mathematik, Einführung in die Datenbanken und Modellierung

Algorithms and datastructure, fundamentals in mathematics, introduction to databases and modelling

Notwendige Voraussetzungen

Erläuterung zu den Modulelementen

Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.

The (partial) examination of the module can be performed as "ungraded" in some study programs at the students choice. Before the examination a respective determination must be carried out, a later modification (graded - ungraded) is impossible. If the "ungraded" option is chosen, it is not possible to include this module in a study program where this module is deemed to enter the calculation of the overall grade.

Modulstruktur: 0-1 bPr, 0-1 uPr 1

Veranstaltungen

Einführung in das Information Retrieval
Art Vorlesung
Turnus WiSe
Workload5 60 h (30 + 30)
Einführung in das Information Retrieval
Art Übung
Turnus WiSe
Workload5 60 h (30 + 30)
LP 2
Praktikum Information Retrieval
Art Praktikum
Turnus SoSe
Workload5 120 h (60 + 60)
LP 4

Prüfungen

Portfolio mit Abschlussprüfung
Zuordnung Prüfende Lehrende der Veranstaltung Einführung in das Information Retrieval (Vorlesung)
Gewichtung unbenotet
Workload 60h
LP2 2

In einigen Studiengängen der Technischen Fakultät kann die Modulprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

Portfolio mit Abschlussprüfung
Zuordnung Prüfende Lehrende der Veranstaltung Einführung in das Information Retrieval (Vorlesung)
Gewichtung 1
Workload 60h
LP2 2

Portfolio aus Übungsaufgaben, die veranstaltungsbezogen gestellt werden (Bestehensgrenze 60% der erzielbaren Punkte, individuelles Erläutern von Aufgaben) und Abschlussklausur (60-90 min). Die Übungsaufgaben im Rahmen des Portfolios werden in der Regel wöchentlich ausgegeben.
Abschlussklausur bezieht sich auf den Stoff der Vorlesung und der Übungen.

Exercises need to be completed on a weekly basis covering material from the lectures (pass mark of 60%, students have to be able to demonstrate how they arrived at the solution). Final written examination (60-90min) relating to material covered in both lectures and tutorials.

In diesen Studiengängen wird das Modul verwendet:

Studiengang Variante Profil Empf. Beginn 3 Dauer Bindung 4
Bioinformatik und Genomforschung / Bachelor of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021] 1-Fach (fw) 5. zwei Semes­ter Wahl­pflicht
Bioinformatik und Genomforschung / Bachelor of Science [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015] 1-Fach (fw) 5. zwei Semes­ter Wahl­pflicht
Bioinformatik und Genomforschung / Master of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. zwei Semes­ter Wahl­pflicht
Bioinformatik und Genomforschung / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigungen vom 17.11.2014 und 01.12.2015] 1. zwei Semes­ter Wahl­pflicht
Grundlagen Kognitiver Systeme / Bachelor [FsB vom 04.06.2020] Nebenfach (fw) 5. zwei Semes­ter Wahl­pflicht
Informatik / Bachelor [FsB vom 04.06.2020 mit Änderung vom 15.12.2021] Nebenfach (fw) Praktische Informatik 5. zwei Semes­ter Wahl­pflicht
Informatik / Bachelor [FsB vom 04.06.2020 mit Änderung vom 15.12.2021] Nebenfach (fw) Technische Informatik 5. zwei Semes­ter Wahl­pflicht
Informatik / Bachelor [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 15.11.2019 und 16.08.2021] Nebenfach (fw) Praktische Informatik 5. zwei Semes­ter Wahl­pflicht
Informatik / Bachelor [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 15.11.2019 und 16.08.2021] Nebenfach (fw) Technische Informatik 5. zwei Semes­ter Wahl­pflicht
Informatik / Bachelor [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015] Nebenfach (fw) 5. zwei Semes­ter Wahl­pflicht
Intelligente Systeme / Master of Science [FsB vom 27.07.2018 mit Änderung vom 04.06.2020] 1. zwei Semes­ter Wahl­pflicht
Intelligente Systeme / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und Berichtigung vom 17.11.2014] 1. zwei Semes­ter Wahl­pflicht
Kognitive Informatik / Bachelor of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021] 1-Fach (fw) 5. zwei Semes­ter Wahl­pflicht
Kognitive Informatik / Bachelor of Science [FsB vom 31.08.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigung vom 01.12.2015] 1-Fach (fw) 5. zwei Semes­ter Wahl­pflicht
Medieninformatik und Gestaltung / Bachelor of Arts | Bachelor of Science [FsB vom 31.08.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015] 1-Fach (fw) 3. o. 5. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 1. zwei Semes­ter Wahl­pflicht

Automatische Vollständigkeitsprüfung

In diesem Modul kann eine automatische Vollständigkeitsprüfung vom System durchgeführt werden.


Legende

1
Die Modulstruktur beschreibt die zur Erbringung des Moduls notwendigen Prüfungen und Studienleistungen.
2
LP ist die Abkürzung für Leistungspunkte.
3
Die Zahlen in dieser Spalte sind die Fachsemester, in denen der Beginn des Moduls empfohlen wird. Je nach individueller Studienplanung sind gänzlich andere Studienverläufe möglich und sinnvoll.
4
Erläuterungen zur Bindung: "Pflicht" bedeutet: Dieses Modul muss im Laufe des Studiums verpflichtend absolviert werden; "Wahlpflicht" bedeutet: Dieses Modul gehört einer Anzahl von Modulen an, aus denen unter bestimmten Bedingungen ausgewählt werden kann. Genaueres regeln die "Fächerspezifischen Bestimmungen" (siehe Navigation).
5
Workload (Kontaktzeit + Selbststudium)
SL
Studienleistung
Pr
Prüfung
bPr
Anzahl benotete Modul(teil)prüfungen
uPr
Anzahl unbenotete Modul(teil)prüfungen
Diese Leistung kann gemeldet und verbucht werden.

Seitenleiste

Lehrangebot im eKVV

Lehrangebot im eKVV

Modullisten zeigen

Bioinformatik und Genomforschung / Bachelor of Science: 1-Fach (fw) [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021]

Bioinformatik und Genomforschung / Bachelor of Science: 1-Fach (fw) [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015]

Bioinformatik und Genomforschung / Master of Science

Bioinformatik und Genomforschung / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigungen vom 17.11.2014 und 01.12.2015]

Grundlagen Kognitiver Systeme / Bachelor: Nebenfach (fw) [FsB vom 04.06.2020]

Informatik / Bachelor: Nebenfach (fw) // Praktische Informatik [FsB vom 04.06.2020 mit Änderung vom 15.12.2021]

Informatik / Bachelor: Nebenfach (fw) // Technische Informatik [FsB vom 04.06.2020 mit Änderung vom 15.12.2021]

Informatik / Bachelor: Nebenfach (fw) // Praktische Informatik [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 15.11.2019 und 16.08.2021]

Informatik / Bachelor: Nebenfach (fw) // Technische Informatik [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 15.11.2019 und 16.08.2021]

Informatik / Bachelor: Nebenfach (fw) [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015]

Intelligente Systeme / Master of Science [FsB vom 27.07.2018 mit Änderung vom 04.06.2020]

Intelligente Systeme / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und Berichtigung vom 17.11.2014]

Kognitive Informatik / Bachelor of Science: 1-Fach (fw) [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021]

Kognitive Informatik / Bachelor of Science: 1-Fach (fw) [FsB vom 31.08.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigung vom 01.12.2015]

Medieninformatik und Gestaltung / Bachelor of Arts | Bachelor of Science: 1-Fach (fw) [FsB vom 31.08.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015]

Naturwissenschaftliche Informatik / Master of Science

Naturwissenschaftliche Informatik / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017]