Module 39-Inf-ASB Algorithmic stochastics in (bio)informatics

Faculty

Person responsible for module

Regular cycle (beginning)

Every winter semester

Credit points and duration

10 Credit points

For information on the duration of the modul, refer to the courses of study in which the module is used.

Competencies

Der Schwerpunkt der Vorlesung liegt auf der Vermittlung von verschiedenen Methoden und Techniken als "Werkzeuge" für ein breites Spektrum von Problemen aus der (Bio-)Informatik. Die Studierenden lernen, in Wahrscheinlichkeiten zu denken und mit Wahrscheinlichkeitsverteilungen und ihren numerischen Eigenschaften umzugehen. Als Vorbereitung auf die Abschluss-Arbeit wird insbesondere in den Übungen verlangt, besprochene Methoden auf neue Probleme zu übertragen. Die Übungen beinhalten deswegen auch Programmier- und Projektaufgaben, in denen die Verfahren aus der Vorlesung implementiert und angewendet werden. Eine Vielzahl von Anwendungen aus der aktueller Forschungsliteratur wird von den Studierenden im Seminar erarbeitet und vorgetragen.

The lecture course focusses on the various methods and techniques as `tools' for a wide spectrum of problems from bioinformatics and informatics in the sciences. The students learn to think in terms of probabilities and to deal with probability distributions and their numerical properties. In the assignments, they will be asked to apply the methods to new problems. The assignments also contain programming exercises, in which the methods presented in the lecture are to be implemented and applied. In the seminar, students deal with the interface to the current research literature.

Content of teaching

Viele komplexe Probleme der Bio- und allgemeiner der naturwissenschaftlichen Informatik (z.B. Alignment, Gene finding, Inferenz fuer Populationssequenzdaten) lassen sich nicht gleichzeitig effizient und optimal mit deterministischen Verfahren lösen; in diesem Fall nimmt man oft stochastische Methoden zur Hilfe. Aufbauend auf stochastischen Grundlagen aus der Wahrscheinlichkeitstheorie und Statistik legt dieses Modul die nötigen Grundlagen (Darstellung von Verteilungen im Computer; Rechnen mit sehr kleinen Wahrscheinlichkeiten; Effiziente Generierung von Zufallszahlen aus vorgegebenen Verteilungen; Testen der Qualität von Zufallszahlengeneratoren). Als ein wichtiges Hilfsmittel werden Markov Chain Monte Carlo Methoden (Metropolis-Hastings; Gibbs sampler) anhand von Anwendungsbeispielen vorgestellt, sowie Methoden des importance sampling und der Simulation seltener Ereignisse.

Literatur:

  • James E. Gentle. Random Number Generation and Monte Carlo Methods. Springer 1998.
  • Christian P. Robert und George Casella. Monte Carlo Statistical Methods. Springer 2002.
  • Donald E. Knuth. The Art of Computer Programming vol. 2. Addison-Wesley 1998.
  • Neil Madras, Lectures on Monte Carlo Methods, AMS 2002.
  • James Bucklew, Introduction to Rare Event Simulation, Springer 2004.

Many complex problems in bioinformatics and informatics in the sciences (like alignment, gene finding, inference from population sequence data) cannot be solved efficiently with deterministic algorithms; instead, one often resorts to stochastic methods. Starting from the basics of probability theory and statistics, this module lays the foundations of algorithmic stochastics (representation of distributions in the computer; computing with very small probabilities; random number generation; generation of random numbers from various distributions; testing the quality of random number generators). Furthermore, Markov chain Monte Carlo methods (Metropolis-Hastings; Gibbs sampler) will be presented, as well as methods of importance sampling and rare event
simulation.

Literature:

  • James E. Gentle. Random Number Generation and Monte Carlo Methods. Springer 1998.
  • Christian P. Robert and George Casella. Monte Carlo Statistical Methods. Springer 2002.
  • Donald E. Knuth. The Art of Computer Programming vol. 2. Addison-Wesley 1998.
  • Neil Madras, Lectures on Monte Carlo Methods, AMS 2002.
  • James Bucklew, Introduction to Rare Event Simulation,

Springer 2004.

Recommended previous knowledge

Mathematik für Informatik I und II,
24-M-VTB oder 24-M-VTN

Knowledge as in the modules 24-M-INF1 Mathematik für Informatik I, 24-M-INF2 Mathematik für Informatik II, 24-M-VTB Vertiefung Mathematik für die Bioinformatik or 24-M-VTN Vertiefung Mathematik für die Naturwissenschaften

Necessary requirements

Explanation regarding the elements of the module

Unbenotete / benotete Modulprüfung:
Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.

Begründung der Notwendigkeit von zwei Modulteilprüfungen:
In der Vorlesung wird die theoretische Beherrschung des Stoffes überprüft, während im Seminar die selbstständige Aufbereitung und Präsentation von Fallstudien geprüft wird.

Ungraded / Graded Module Examination:
The (partial) examination of the module can be performed as "ungraded" in some study programs at the students choice. Before the examination a respective determination must be carried out, a later modification (graded - ungraded) is impossible. If the "ungraded" option is chosen, it is not possible to include this module in a study program where this module is deemed to enter the calculation of the overall grade.

Statement of Necessity for two Module Partial Examinations:
In the lecture course, the theoretical skills will be examined, whereas the seminar examines the independent preparation and presentation of case studies.

Module structure: 0-1 bPr, 1-2 uPr 1

Courses

Algorithmische Stochastik in der Bioinformatik
Type lecture
Regular cycle WiSe
Workload5 60 h (30 + 30)
Algorithmische Stochastik in der Bioinformatik
Type tutorial (in connection with lecture/seminar)
Regular cycle WiSe
Workload5 60 h (30 + 30)
LP 2
Fallstudien zu Algorithmischer Stochastik in der Bioinformatik
Type seminar
Regular cycle SoSe
Workload5 90 h (30 + 60)
LP 3 [Pr]

Examinations

portfolio with final examination
Allocated examiner Teaching staff of the course Algorithmische Stochastik in der Bioinformatik (lecture)
Weighting without grades
Workload 90h
LP2 3

In einigen Studiengängen der Technischen Fakultät kann die Modulteilprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

portfolio with final examination
Allocated examiner Teaching staff of the course Algorithmische Stochastik in der Bioinformatik (lecture)
Weighting 1
Workload 90h
LP2 3

Portfolio aus Übungsaufgaben, die veranstaltungsbegleitend und in der Regel wöchentlich gestellt werden, und Abschlussklausur (in der Regel 90 min) oder mündlicher Abschlussprüfung (in der Regel 30 min). Die Übungsaufgaben ergänzen und vertiefen den Inhalt der Vorlesung. Mitarbeit in den Übungsgruppen (Zweimaliges Vorrechnen von Übungsaufgaben nach Aufforderung). Die Veranstalterin/der Veranstalter kann einen Teil der Übungsaufgaben durch Präsenzübungen ersetzen. Nachweis einer ausreichenden Zahl korrekt gelöster
Übungsaufgaben (in der Regel 50% der im Semester für das Lösen der Aufgaben erzielbaren Punkte). Die Abschlussprüfung bezieht sich auf den Inhalt der
Vorlesung und der Übung und dient der Bewertung.

Portfolio of Exercises and final written (90 min. as a rule) or oral (30 min. as a rule) exam. The exercises broaden and deepen the contents of the lecture. Collaboration during the exercises ( two times demonstration of exercises after request). The lecturer can replace parts of the exercises with presence exercises. A sufficient number of exercises have to be solved correctly (as a rule, 50 % of the maximal score). The final exam is related to the contents of lecture and exercises and is used for the grading of the module.

oral presentation with written exploration
Allocated examiner Teaching staff of the course Fallstudien zu Algorithmischer Stochastik in der Bioinformatik (seminar)
Weighting without grades
Workload -
LP2 -

Referat (30-45 Minuten) mit Ausarbeitung (5-10 Seiten)

The module is used in these degree programmes:

Degree programme Version Profile Recom­mended start 3 Duration Manda­tory option 4
Bioinformatics and Genome Research / Bachelor of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 01.07.2019 und 16.08.2021] Bachelor with One Core Subject (Academic) 5. two semesters Compul­sory optional subject
Bioinformatics and Genome Research / Bachelor of Science [FsB vom 31.08.2012 mit Berichtigung vom 04.11.2013 und Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und 01.12.2015] Bachelor with One Core Subject (Academic) 5. two semesters Compul­sory optional subject
Bioinformatics and Genome Research / Master of Science [FsB vom 30.09.2016 mit Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. o. 3. two semesters Compul­sory optional subject
Bioinformatics and Genome Research / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 15.10.2014, 02.03.2015, 17.08.2015 und Berichtigungen vom 17.11.2014 und 01.12.2015] 1. o. 3. two semesters Compul­sory optional subject
Informatics / Bachelor of Science [FsB vom 04.06.2020 mit Änderung vom 15.12.2021] Major Subject (Academic) Strukturierte Ergänzung des Profils Bioinformatik KF (fw) 5. two semesters Compul­sory optional subject
Informatics for the Natural Sciences / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. two semesters Compul­sory optional subject
Informatics for the Natural Sciences / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 1. two semesters Compul­sory optional subject

Automatic check for completeness

The system can perform an automatic check for completeness for this module.


Legend

1
The module structure displays the required number of study requirements and examinations.
2
LP is the short form for credit points.
3
The figures in this column are the specialist semesters in which it is recommended to start the module. Depending on the individual study schedule, entirely different courses of study are possible and advisable.
4
Explanations on mandatory option: "Obligation" means: This module is mandatory for the course of the studies; "Optional obligation" means: This module belongs to a number of modules available for selection under certain circumstances. This is more precisely regulated by the "Subject-related regulations" (see navigation).
5
Workload (contact time + self-study)
SL
Study requirement
Pr
Examination
bPr
Number of examinations with grades
uPr
Number of examinations without grades
Diese Leistung kann gemeldet und verbucht werden.