Module 39-M-Inf-IMD Computational Methods for Data Analysis in Metagenomics and Metatranscriptomics

Faculty

Person responsible for module

Regular cycle (beginning)

Every summer semester

Credit points and duration

10 Credit points

For information on the duration of the modul, refer to the courses of study in which the module is used.

Competencies

Die Studierenden werden an hochaktuelle Fragestellungen in der Bioinformatik herangeführt und erwerben tieferes Wissen über die aktuellen Trends in der Sequenziertechnologie im Bezug auf die sich daraus ergebenden Fragestellungen an die Bioinformatik. Darüber hinaus erwerben die Teilnehmer vertiefendes Wissen über einzelne Methoden der Datenanalytik (z.B. Visualisierung, Clustering, Data Mining, GPU Computing, High Performance Computing, ... ). Desweiteren gewinnen die Studierenden einen umfassenden und anwendungsnahen Erfahrungsschatz durch das Projekt, in dem zusammen mit Mitarbeitern der BRF anwendungs- und benutzerorientierte neue Tools entwickelt werden.

Content of teaching

Durch die Einführung der so genannten ultrafast sequencing Technologien (Roche/454, Illumina/Solexa, ABI/Solid u.a.) ist in den Lebenswissenschaften ein starker Bedarf nach neuen algorithmischen Lösungsansätzen für deren Verarbeitung und Analyse entstanden. Ziel dieses Moduls ist die Entwicklung von neuen Analysetools, welche der neuen Dimensionierung der Datensätze aus der Metagenomik oder Metatranskriptomik Rechnung tragen. Dabei sollen mehrere Ansätze in Kleingruppen von 2-3 Studierenden realisiert und untersucht werden:

  • Erhöhung des Datendurchsatzes durch Berechnungen auf der GPU
  • Neue dynamische Visualisierungskonzepte für Klassifikationergebnisse
  • Explorationswerkzeuge zur Analyse von Assemblierungsergebnissen
  • Visualisierungswerkzeuge zur komparativen Analyse von Datensätzen

Literatur: Im Rahmen des Seminars wird wissenschaftlich-technischer Hintergrund über Artikel / Publikationen / Vorträge vermittelt.

Recommended previous knowledge

Komptenzen, wie sie beispielsweise im Modul 39-Inf-1 Algorithmen und Datenstrukturen erworben werden können
Grundkenntnisse Mathematik

Necessary requirements

Explanation regarding the elements of the module

Unbenotete / benotete Modulprüfung:
Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.

Begründung der Notwendigkeit von zwei Modulteilprüfungen:
In diesem Modul sollen die Studierenden moderne Methoden aus der aktuellen Forschung der Informatik anwendungsorientiert einsetzen. Es sind deswegen zwei Kompetenzerwerbe zu prüfen: das tiefe theoretische Verständnis der Methodik in der Datenanalyse und die erfolgreiche Implementierung des Verfahrens als ausführbares und dokumentiertes Programm.

Module structure: 0-1 bPr, 1-2 uPr 1

Courses

Entwicklung von neuen Werkzeugen zur Analyse von großen Datensätzen aus der Metagenomik/-transkriptomik
Type project
Regular cycle SoSe
Workload5 210 h (60 + 150)
LP 7 [Pr]

Besprechungen, Vor- und Nachbereitung der Besprechungen, Entwurf Algorithmen, Projektmanagement/Dokumentation, Implementierung, Evaluation/Test

Neue Trends in der Omics-Datenanalyse
Type seminar
Regular cycle SoSe
Workload5 90 h (30 + 60)

Examinations

project with written assignment
Weighting without grades
Workload -
LP2 -

Die Implementierung eines neuen Verfahrens kann sowohl in Einzelarbeit als auch in Kleingruppen erfolgen. Ein ausgewählter Algorithmus wird von den Studierenden implementiert und mit echten Labordaten evaluiert. Abhängig von den Vorkenntnissen der Studierenden oder der algorithmischen Besonderheiten können/sollen die Studierenden selbstständig die technische Strategie der Umsetzung mitentscheiden (z. B. bei der Wahl der Programmiersprache: C++, Java, etc.), eventuelle externe Quellcodes (Libraries) suchen und einbinden und Evaluationskriterien entwickeln. Um das Modul erfolgreich abzuschließen, muss eine effizient arbeitende, wohl dokumentierte und evaluierte Version der Implementation vorliegen, zusammen mit einem Beispieldatensatz. Es wird erwartet, dass die Studierenden ihre Erfahrungen aus vorhergehenden Lehrveranstaltungen (Projektentwicklung u.ä.) effektiv nutzen. Die Umsetzung der Implementation sollte i.d.R. 70% des Aufwands des Moduls in Anspruch nehmen.

oral presentation
Allocated examiner Teaching staff of the course Neue Trends in der Omics-Datenanalyse (seminar)
Weighting without grades
Workload -
LP2 -

In einigen Studiengängen der Technischen Fakultät kann die Modulteilprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

oral presentation
Allocated examiner Teaching staff of the course Neue Trends in der Omics-Datenanalyse (seminar)
Weighting 1
Workload -
LP2 -

Referat (ca. 45-60 min.)

The module is used in these degree programmes:

Degree programme Recom­mended start 3 Duration Manda­tory option 4
Informatics for the Natural Sciences / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 2. one semester Compul­sory optional subject
Informatics for the Natural Sciences / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 2. one semester Compul­sory optional subject

Automatic check for completeness

The system can perform an automatic check for completeness for this module.


Legend

1
The module structure displays the required number of study requirements and examinations.
2
LP is the short form for credit points.
3
The figures in this column are the specialist semesters in which it is recommended to start the module. Depending on the individual study schedule, entirely different courses of study are possible and advisable.
4
Explanations on mandatory option: "Obligation" means: This module is mandatory for the course of the studies; "Optional obligation" means: This module belongs to a number of modules available for selection under certain circumstances. This is more precisely regulated by the "Subject-related regulations" (see navigation).
5
Workload (contact time + self-study)
SL
Study requirement
Pr
Examination
bPr
Number of examinations with grades
uPr
Number of examinations without grades
Diese Leistung kann gemeldet und verbucht werden.