Modul 39-Inf-ASB Algorithmische Stochastik in der (Bio-)Informatik

Fakultät

Modulverantwortliche*r

Turnus (Beginn)

Jedes Wintersemester

Leistungspunkte und Dauer

10 Leistungspunkte

Die Angaben zur Moduldauer finden Sie bei den Studiengängen, in denen das Modul verwendet wird.

Kompetenzen

Der Schwerpunkt der Vorlesung liegt auf der Vermittlung von verschiedenen Methoden und Techniken als "Werkzeuge" für ein breites Spektrum von Problemen aus der (Bio-)Informatik. Die Studierenden lernen, in Wahrscheinlichkeiten zu denken und mit Wahrscheinlichkeitsverteilungen und ihren numerischen Eigenschaften umzugehen. Als Vorbereitung auf die Abschluss-Arbeit wird insbesondere in den Übungen verlangt, besprochene Methoden auf neue Probleme zu übertragen. Die Übungen beinhalten deswegen auch Programmier- und Projektaufgaben, in denen die Verfahren aus der Vorlesung implementiert und angewendet werden. Eine Vielzahl von Anwendungen aus der aktueller Forschungsliteratur wird von den Studierenden im Seminar erarbeitet und vorgetragen.

The lecture course focusses on the various methods and techniques as `tools' for a wide spectrum of problems from bioinformatics and informatics in the sciences. The students learn to think in terms of probabilities and to deal with probability distributions and their numerical properties. In the assignments, they will be asked to apply the methods to new problems. The assignments also contain programming exercises, in which the methods presented in the lecture are to be implemented and applied. In the seminar, students deal with the interface to the current research literature.

Lehrinhalte

Viele komplexe Probleme der Bio- und allgemeiner der naturwissenschaftlichen Informatik (z.B. Alignment, Gene finding, Inferenz fuer Populationssequenzdaten) lassen sich nicht gleichzeitig effizient und optimal mit deterministischen Verfahren lösen; in diesem Fall nimmt man oft stochastische Methoden zur Hilfe. Aufbauend auf stochastischen Grundlagen aus der Wahrscheinlichkeitstheorie und Statistik legt dieses Modul die nötigen Grundlagen (Darstellung von Verteilungen im Computer; Rechnen mit sehr kleinen Wahrscheinlichkeiten; Effiziente Generierung von Zufallszahlen aus vorgegebenen Verteilungen; Testen der Qualität von Zufallszahlengeneratoren). Als ein wichtiges Hilfsmittel werden Markov Chain Monte Carlo Methoden (Metropolis-Hastings; Gibbs sampler) anhand von Anwendungsbeispielen vorgestellt, sowie Methoden des importance sampling und der Simulation seltener Ereignisse.

Literatur:

  • James E. Gentle. Random Number Generation and Monte Carlo Methods. Springer 1998.
  • Christian P. Robert und George Casella. Monte Carlo Statistical Methods. Springer 2002.
  • Donald E. Knuth. The Art of Computer Programming vol. 2. Addison-Wesley 1998.
  • Neil Madras, Lectures on Monte Carlo Methods, AMS 2002.
  • James Bucklew, Introduction to Rare Event Simulation, Springer 2004.

Many complex problems in bioinformatics and informatics in the sciences (like alignment, gene finding, inference from population sequence data) cannot be solved efficiently with deterministic algorithms; instead, one often resorts to stochastic methods. Starting from the basics of probability theory and statistics, this module lays the foundations of algorithmic stochastics (representation of distributions in the computer; computing with very small probabilities; random number generation; generation of random numbers from various distributions; testing the quality of random number generators). Furthermore, Markov chain Monte Carlo methods (Metropolis-Hastings; Gibbs sampler) will be presented, as well as methods of importance sampling and rare event
simulation.

Literature:

  • James E. Gentle. Random Number Generation and Monte Carlo Methods. Springer 1998.
  • Christian P. Robert and George Casella. Monte Carlo Statistical Methods. Springer 2002.
  • Donald E. Knuth. The Art of Computer Programming vol. 2. Addison-Wesley 1998.
  • Neil Madras, Lectures on Monte Carlo Methods, AMS 2002.
  • James Bucklew, Introduction to Rare Event Simulation,

Springer 2004.

Empfohlene Vorkenntnisse

Mathematik für Informatik I und II,
24-M-VTB oder 24-M-VTN

Knowledge as in the modules 24-M-INF1 Mathematik für Informatik I, 24-M-INF2 Mathematik für Informatik II, 24-M-VTB Vertiefung Mathematik für die Bioinformatik or 24-M-VTN Vertiefung Mathematik für die Naturwissenschaften

Notwendige Voraussetzungen

Erläuterung zu den Modulelementen

Unbenotete / benotete Modulprüfung:
Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.

Begründung der Notwendigkeit von zwei Modulteilprüfungen:
In der Vorlesung wird die theoretische Beherrschung des Stoffes überprüft, während im Seminar die selbstständige Aufbereitung und Präsentation von Fallstudien geprüft wird.

Ungraded / Graded Module Examination:
The (partial) examination of the module can be performed as "ungraded" in some study programs at the students choice. Before the examination a respective determination must be carried out, a later modification (graded - ungraded) is impossible. If the "ungraded" option is chosen, it is not possible to include this module in a study program where this module is deemed to enter the calculation of the overall grade.

Statement of Necessity for two Module Partial Examinations:
In the lecture course, the theoretical skills will be examined, whereas the seminar examines the independent preparation and presentation of case studies.

Modulstruktur: 0-1 bPr, 1-2 uPr 1

Veranstaltungen

Algorithmische Stochastik in der Bioinformatik
Art Vorlesung
Turnus WiSe
Workload5 60 h (30 + 30)
Algorithmische Stochastik in der Bioinformatik
Art Übung
Turnus WiSe
Workload5 60 h (30 + 30)
LP 2
Fallstudien zu Algorithmischer Stochastik in der Bioinformatik
Art Seminar
Turnus SoSe
Workload5 90 h (30 + 60)
LP 3 [Pr]

Prüfungen

Portfolio mit Abschlussprüfung
Zuordnung Prüfende Lehrende der Veranstaltung Algorithmische Stochastik in der Bioinformatik (Vorlesung)
Gewichtung unbenotet
Workload 90h
LP2 3

In einigen Studiengängen der Technischen Fakultät kann die Modulteilprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

Portfolio mit Abschlussprüfung
Zuordnung Prüfende Lehrende der Veranstaltung Algorithmische Stochastik in der Bioinformatik (Vorlesung)
Gewichtung 1
Workload 90h
LP2 3

Portfolio aus Übungsaufgaben, die veranstaltungsbegleitend und in der Regel wöchentlich gestellt werden, und Abschlussklausur (in der Regel 90 min) oder mündlicher Abschlussprüfung (in der Regel 30 min). Die Übungsaufgaben ergänzen und vertiefen den Inhalt der Vorlesung. Mitarbeit in den Übungsgruppen (Zweimaliges Vorrechnen von Übungsaufgaben nach Aufforderung). Die Veranstalterin/der Veranstalter kann einen Teil der Übungsaufgaben durch Präsenzübungen ersetzen. Nachweis einer ausreichenden Zahl korrekt gelöster
Übungsaufgaben (in der Regel 50% der im Semester für das Lösen der Aufgaben erzielbaren Punkte). Die Abschlussprüfung bezieht sich auf den Inhalt der
Vorlesung und der Übung und dient der Bewertung.

Portfolio of Exercises and final written (90 min. as a rule) or oral (30 min. as a rule) exam. The exercises broaden and deepen the contents of the lecture. Collaboration during the exercises ( two times demonstration of exercises after request). The lecturer can replace parts of the exercises with presence exercises. A sufficient number of exercises have to be solved correctly (as a rule, 50 % of the maximal score). The final exam is related to the contents of lecture and exercises and is used for the grading of the module.

Referat mit Ausarbeitung
Gewichtung unbenotet
Workload -
LP2 -

Referat (30-45 Minuten) mit Ausarbeitung (5-10 Seiten)

In diesen Studiengängen wird das Modul verwendet:

Studiengang Variante Profil Empf. Beginn 3 Dauer Bindung 4
Bioinformatik und Genomforschung / Bachelor of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021] 1-Fach (fw) 5. zwei Semes­ter Wahl­pflicht
Bioinformatik und Genomforschung / Bachelor of Science [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015] 1-Fach (fw) 5. zwei Semes­ter Wahl­pflicht
Bioinformatik und Genomforschung / Master of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. o. 3. zwei Semes­ter Wahl­pflicht
Bioinformatik und Genomforschung / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigungen vom 17.11.2014 und 01.12.2015] 1. o. 3. zwei Semes­ter Wahl­pflicht
Informatik / Bachelor of Science [FsB vom 04.06.2020 mit Änderung vom 15.12.2021] Kernfach (fw) Strukturierte Ergänzung des Profils Bioinformatik KF (fw) 5. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 1. zwei Semes­ter Wahl­pflicht

Automatische Vollständigkeitsprüfung

In diesem Modul kann eine automatische Vollständigkeitsprüfung vom System durchgeführt werden.


Legende

1
Die Modulstruktur beschreibt die zur Erbringung des Moduls notwendigen Prüfungen und Studienleistungen.
2
LP ist die Abkürzung für Leistungspunkte.
3
Die Zahlen in dieser Spalte sind die Fachsemester, in denen der Beginn des Moduls empfohlen wird. Je nach individueller Studienplanung sind gänzlich andere Studienverläufe möglich und sinnvoll.
4
Erläuterungen zur Bindung: "Pflicht" bedeutet: Dieses Modul muss im Laufe des Studiums verpflichtend absolviert werden; "Wahlpflicht" bedeutet: Dieses Modul gehört einer Anzahl von Modulen an, aus denen unter bestimmten Bedingungen ausgewählt werden kann. Genaueres regeln die "Fächerspezifischen Bestimmungen" (siehe Navigation).
5
Workload (Kontaktzeit + Selbststudium)
SL
Studienleistung
Pr
Prüfung
bPr
Anzahl benotete Modul(teil)prüfungen
uPr
Anzahl unbenotete Modul(teil)prüfungen
Diese Leistung kann gemeldet und verbucht werden.