Module 39-Inf-IR Information Retrieval

Faculty

Person responsible for module

Regular cycle (beginning)

Every winter semester

Credit points and duration

10 Credit points

For information on the duration of the modul, refer to the courses of study in which the module is used.

Competencies

Nach Abschluss des Moduls sollten die Studierenden:

  • mit den wesentlichen Paradigmen sowie den gängigen Methoden und Modellen des Information Retrievals vertraut sein,
  • Techniken beherrschen, um große Mengen an unstrukturierten Daten im Hinblick auf das effiziente Retrieval zu indizieren,
  • ein Verständnis für fortgeschrittene Techniken wie die Verwendung von Sprachmodellen für das IR, relevance feedback sowie latent semantic indexing entwickelt haben,
  • die Funktionsweise von Web-Suchmaschinen verstehen, sowie
  • in der Lage sein, ein IR System selbstständig zu implementieren.

After completion of the module students should

  • be familiar with the basic paradigms as well as the current methods and models of information retrieval
  • know the techniques necessary for indexing large amounts of unstructured data for efficient retrieval
  • have developed an understanding of advanced techniques like the application of language models for IR, relevance feedback as well as latent semantic indexing
  • understand the functionality of search engines on the web
  • be capable to implement an IR system without assistance

Content of teaching

Das Auffinden relevanter Informationen stellt eine zentrale Aktivität in unserer modernen Wissensgesellschaft dar. Relevante Informationen sind zum großen Teil in unstrukturierten Dokumenten (insbesondere Textdokumente) zu finden. Das Gebiet des Information Retrieval (IR) beschäftigt sich mit der Erforschung, Entwicklung und Anwendung von Methoden für den effizienten Zugriff und Suche auf großen Mengen von unstrukturierten Daten, insbesondere Texte, Bilder und Videos. In der Vorlesung werden folgende Themen behandelt:

  • Information Retrieval Modelle (insbesondere das Boolsche, das vektor-basierte und das probabilistische Modell)
  • Methoden zur Gewichtung von Termen
  • Techniken zur Indizierung
  • Sprachmodelle für das Information Retrieval
  • Relevance Feedback und Query Expansion für das Information Retrieval
  • Latent Semantic Indexing
  • Web Suche: Der Fall Google
  • Multimedia Retrieval

Ziel des Praktikums ist es, eine eigene Suchmaschine für einen größeren Datensatz (den Reuters Datensatz) zu entwickeln.

Literatur:

  • "Introduction to Information Retrieval", Manning, Raghavan, Schütze, Cambridge University Press, 2008
  • "Search Engines: Information Retrieval in Practice", Bruce Croft, Donald Metzler, Trevor Strohman, Pearson/Addison-Wesley, 2009
  • "Modern Information Retrieval", Baeza-Yates and Ribeiro-Neto, Addison-Wesley, 1999

The retrieval of relevant information constitutes a central activity in our modern knowledge-based society. Relevant information is to a large extent found in unstructured documents (especially text documents). The area of Information Retrieval (IR) is concerned with the research, development and application of methods that allow large amounts of unstructured data, especially texts, pictures and videos, to be accessed and searched efficiently. The following topics will be disussed:

  • IR models (including Boolean, vector based and probabilistic)
  • term weighting methods
  • indexing techniques
  • language models for IR
  • relevance feedback and query expansion for IR
  • latent semantic indexing
  • Web search: the case of google
  • Multimedia retrieval

Aim of the practical is the development of a search engine for a dataset.

Recommended previous knowledge

Algorithmen und Datenstrukturen, Grundkenntnisse Mathematik, Einführung in die Datenbanken und Modellierung

Algorithms and datastructure, fundamentals in mathematics, introduction to databases and modelling

Necessary requirements

Explanation regarding the elements of the module

Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.

The (partial) examination of the module can be performed as "ungraded" in some study programs at the students choice. Before the examination a respective determination must be carried out, a later modification (graded - ungraded) is impossible. If the "ungraded" option is chosen, it is not possible to include this module in a study program where this module is deemed to enter the calculation of the overall grade.

Module structure: 0-1 bPr, 0-1 uPr 1

Courses

Einführung in das Information Retrieval
Type lecture
Regular cycle WiSe
Workload5 60 h (30 + 30)
Einführung in das Information Retrieval
Type tutorial (in connection with lecture/seminar)
Regular cycle WiSe
Workload5 60 h (30 + 30)
LP 2
Praktikum Information Retrieval
Type internship
Regular cycle SoSe
Workload5 120 h (60 + 60)
LP 4

Examinations

portfolio with final examination
Allocated examiner Teaching staff of the course Einführung in das Information Retrieval (lecture)
Weighting without grades
Workload 60h
LP2 2

In einigen Studiengängen der Technischen Fakultät kann die Modulprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

portfolio with final examination
Allocated examiner Teaching staff of the course Einführung in das Information Retrieval (lecture)
Weighting 1
Workload 60h
LP2 2

Portfolio aus Übungsaufgaben, die veranstaltungsbezogen gestellt werden (Bestehensgrenze 60% der erzielbaren Punkte, individuelles Erläutern von Aufgaben) und Abschlussklausur (60-90 min). Die Übungsaufgaben im Rahmen des Portfolios werden in der Regel wöchentlich ausgegeben.
Abschlussklausur bezieht sich auf den Stoff der Vorlesung und der Übungen.

Exercises need to be completed on a weekly basis covering material from the lectures (pass mark of 60%, students have to be able to demonstrate how they arrived at the solution). Final written examination (60-90min) relating to material covered in both lectures and tutorials.

The module is used in these degree programmes:

Degree programme Version Profile Recom­mended start 3 Duration Manda­tory option 4
Bioinformatics and Genome Research / Bachelor of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021] Bachelor with One Core Subject (Academic) 5. two semesters Compul­sory optional subject
Bioinformatics and Genome Research / Bachelor of Science [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015] Bachelor with One Core Subject (Academic) 5. two semesters Compul­sory optional subject
Bioinformatics and Genome Research / Master of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. two semesters Compul­sory optional subject
Bioinformatics and Genome Research / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigungen vom 17.11.2014 und 01.12.2015] 1. two semesters Compul­sory optional subject
Fundamentals of Cognitive Systems / Bachelor [FsB vom 04.06.2020] Minor Subject (Academic), 60 CPs 5. two semesters Compul­sory optional subject
Informatics / Bachelor [FsB vom 04.06.2020 mit Änderung vom 15.12.2021] Minor Subject (Academic), 60 CPs Practical Informatics 5. two semesters Compul­sory optional subject
Informatics / Bachelor [FsB vom 04.06.2020 mit Änderung vom 15.12.2021] Minor Subject (Academic), 60 CPs Technical Informatics 5. two semesters Compul­sory optional subject
Informatics / Bachelor [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 15.11.2019 und 16.08.2021] Minor Subject (Academic), 60 CPs Practical Informatics 5. two semesters Compul­sory optional subject
Informatics / Bachelor [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 15.11.2019 und 16.08.2021] Minor Subject (Academic), 60 CPs Technical Informatics 5. two semesters Compul­sory optional subject
Informatics / Bachelor [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015] Minor Subject (Academic), 60 CPs 5. two semesters Compul­sory optional subject
Intelligent Systems / Master of Science [FsB vom 27.07.2018 mit Änderung vom 04.06.2020] 1. two semesters Compul­sory optional subject
Intelligent Systems / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und Berichtigung vom 17.11.2014] 1. two semesters Compul­sory optional subject
Cognitive Informatics / Bachelor of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021] Bachelor with One Core Subject (Academic) 5. two semesters Compul­sory optional subject
Cognitive Informatics / Bachelor of Science [FsB vom 31.08.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigung vom 01.12.2015] Bachelor with One Core Subject (Academic) 5. two semesters Compul­sory optional subject
Media Informatics and Design / Bachelor of Arts | Bachelor of Science [FsB vom 31.08.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015] Bachelor with One Core Subject (Academic) 3. o. 5. two semesters Compul­sory optional subject
Informatics for the Natural Sciences / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. two semesters Compul­sory optional subject
Informatics for the Natural Sciences / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 1. two semesters Compul­sory optional subject

Automatic check for completeness

The system can perform an automatic check for completeness for this module.


Legend

1
The module structure displays the required number of study requirements and examinations.
2
LP is the short form for credit points.
3
The figures in this column are the specialist semesters in which it is recommended to start the module. Depending on the individual study schedule, entirely different courses of study are possible and advisable.
4
Explanations on mandatory option: "Obligation" means: This module is mandatory for the course of the studies; "Optional obligation" means: This module belongs to a number of modules available for selection under certain circumstances. This is more precisely regulated by the "Subject-related regulations" (see navigation).
5
Workload (contact time + self-study)
SL
Study requirement
Pr
Examination
bPr
Number of examinations with grades
uPr
Number of examinations without grades
Diese Leistung kann gemeldet und verbucht werden.

Sidebar

Elements of the module

Courses

Examinations

Programme of lectures (eKVV)

Programme of lectures (eKVV)

Show lists of modules

Bioinformatics and Genome Research / Bachelor of Science: Bachelor with One Core Subject (Academic) [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021]

Bioinformatics and Genome Research / Bachelor of Science: Bachelor with One Core Subject (Academic) [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015]

Bioinformatics and Genome Research / Master of Science

Bioinformatics and Genome Research / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigungen vom 17.11.2014 und 01.12.2015]

Fundamentals of Cognitive Systems / Bachelor: Minor Subject (Academic), 60 CPs [FsB vom 04.06.2020]

Informatics / Bachelor: Minor Subject (Academic), 60 CPs // Practical Informatics [FsB vom 04.06.2020 mit Änderung vom 15.12.2021]

Informatics / Bachelor: Minor Subject (Academic), 60 CPs // Technical Informatics [FsB vom 04.06.2020 mit Änderung vom 15.12.2021]

Informatics / Bachelor: Minor Subject (Academic), 60 CPs // Practical Informatics [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 15.11.2019 und 16.08.2021]

Informatics / Bachelor: Minor Subject (Academic), 60 CPs // Technical Informatics [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 15.11.2019 und 16.08.2021]

Informatics / Bachelor: Minor Subject (Academic), 60 CPs [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015]

Intelligent Systems / Master of Science [FsB vom 27.07.2018 mit Änderung vom 04.06.2020]

Intelligent Systems / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und Berichtigung vom 17.11.2014]

Cognitive Informatics / Bachelor of Science: Bachelor with One Core Subject (Academic) [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021]

Cognitive Informatics / Bachelor of Science: Bachelor with One Core Subject (Academic) [FsB vom 31.08.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigung vom 01.12.2015]

Media Informatics and Design / Bachelor of Arts | Bachelor of Science: Bachelor with One Core Subject (Academic) [FsB vom 31.08.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015]

Informatics for the Natural Sciences / Master of Science

Informatics for the Natural Sciences / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017]