Modul 39-M-Inf-IMD Informatische Methoden für die Datenanalyse in der Metagenomik und -transkriptomik

Fakultät

Modulverantwortliche*r

Turnus (Beginn)

Jedes Sommersemester

Leistungspunkte und Dauer

10 Leistungspunkte

Die Angaben zur Moduldauer finden Sie bei den Studiengängen, in denen das Modul verwendet wird.

Kompetenzen

Die Studierenden werden an hochaktuelle Fragestellungen in der Bioinformatik herangeführt und erwerben tieferes Wissen über die aktuellen Trends in der Sequenziertechnologie im Bezug auf die sich daraus ergebenden Fragestellungen an die Bioinformatik. Darüber hinaus erwerben die Teilnehmer vertiefendes Wissen über einzelne Methoden der Datenanalytik (z.B. Visualisierung, Clustering, Data Mining, GPU Computing, High Performance Computing, ... ). Desweiteren gewinnen die Studierenden einen umfassenden und anwendungsnahen Erfahrungsschatz durch das Projekt, in dem zusammen mit Mitarbeitern der BRF anwendungs- und benutzerorientierte neue Tools entwickelt werden.

Lehrinhalte

Durch die Einführung der so genannten ultrafast sequencing Technologien (Roche/454, Illumina/Solexa, ABI/Solid u.a.) ist in den Lebenswissenschaften ein starker Bedarf nach neuen algorithmischen Lösungsansätzen für deren Verarbeitung und Analyse entstanden. Ziel dieses Moduls ist die Entwicklung von neuen Analysetools, welche der neuen Dimensionierung der Datensätze aus der Metagenomik oder Metatranskriptomik Rechnung tragen. Dabei sollen mehrere Ansätze in Kleingruppen von 2-3 Studierenden realisiert und untersucht werden:

  • Erhöhung des Datendurchsatzes durch Berechnungen auf der GPU
  • Neue dynamische Visualisierungskonzepte für Klassifikationergebnisse
  • Explorationswerkzeuge zur Analyse von Assemblierungsergebnissen
  • Visualisierungswerkzeuge zur komparativen Analyse von Datensätzen

Literatur: Im Rahmen des Seminars wird wissenschaftlich-technischer Hintergrund über Artikel / Publikationen / Vorträge vermittelt.

Empfohlene Vorkenntnisse

Komptenzen, wie sie beispielsweise im Modul 39-Inf-1 Algorithmen und Datenstrukturen erworben werden können
Grundkenntnisse Mathematik

Notwendige Voraussetzungen

Erläuterung zu den Modulelementen

Unbenotete / benotete Modulprüfung:
Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.

Begründung der Notwendigkeit von zwei Modulteilprüfungen:
In diesem Modul sollen die Studierenden moderne Methoden aus der aktuellen Forschung der Informatik anwendungsorientiert einsetzen. Es sind deswegen zwei Kompetenzerwerbe zu prüfen: das tiefe theoretische Verständnis der Methodik in der Datenanalyse und die erfolgreiche Implementierung des Verfahrens als ausführbares und dokumentiertes Programm.

Modulstruktur: 0-1 bPr, 1-2 uPr 1

Veranstaltungen

Entwicklung von neuen Werkzeugen zur Analyse von großen Datensätzen aus der Metagenomik/-transkriptomik
Art Projekt
Turnus SoSe
Workload5 210 h (60 + 150)
LP 7 [Pr]

Besprechungen, Vor- und Nachbereitung der Besprechungen, Entwurf Algorithmen, Projektmanagement/Dokumentation, Implementierung, Evaluation/Test

Neue Trends in der Omics-Datenanalyse
Art Seminar
Turnus SoSe
Workload5 90 h (30 + 60)

Prüfungen

Projekt mit Ausarbeitung
Gewichtung unbenotet
Workload -
LP2 -

Die Implementierung eines neuen Verfahrens kann sowohl in Einzelarbeit als auch in Kleingruppen erfolgen. Ein ausgewählter Algorithmus wird von den Studierenden implementiert und mit echten Labordaten evaluiert. Abhängig von den Vorkenntnissen der Studierenden oder der algorithmischen Besonderheiten können/sollen die Studierenden selbstständig die technische Strategie der Umsetzung mitentscheiden (z. B. bei der Wahl der Programmiersprache: C++, Java, etc.), eventuelle externe Quellcodes (Libraries) suchen und einbinden und Evaluationskriterien entwickeln. Um das Modul erfolgreich abzuschließen, muss eine effizient arbeitende, wohl dokumentierte und evaluierte Version der Implementation vorliegen, zusammen mit einem Beispieldatensatz. Es wird erwartet, dass die Studierenden ihre Erfahrungen aus vorhergehenden Lehrveranstaltungen (Projektentwicklung u.ä.) effektiv nutzen. Die Umsetzung der Implementation sollte i.d.R. 70% des Aufwands des Moduls in Anspruch nehmen.

Referat
Zuordnung Prüfende Lehrende der Veranstaltung Neue Trends in der Omics-Datenanalyse (Seminar)
Gewichtung unbenotet
Workload -
LP2 -

In einigen Studiengängen der Technischen Fakultät kann die Modulteilprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

Referat
Zuordnung Prüfende Lehrende der Veranstaltung Neue Trends in der Omics-Datenanalyse (Seminar)
Gewichtung 1
Workload -
LP2 -

Referat (ca. 45-60 min.)

In diesen Studiengängen wird das Modul verwendet:

Studiengang Empf. Beginn 3 Dauer Bindung 4
Naturwissenschaftliche Informatik / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 2. ein Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 2. ein Semes­ter Wahl­pflicht

Automatische Vollständigkeitsprüfung

In diesem Modul kann eine automatische Vollständigkeitsprüfung vom System durchgeführt werden.


Legende

1
Die Modulstruktur beschreibt die zur Erbringung des Moduls notwendigen Prüfungen und Studienleistungen.
2
LP ist die Abkürzung für Leistungspunkte.
3
Die Zahlen in dieser Spalte sind die Fachsemester, in denen der Beginn des Moduls empfohlen wird. Je nach individueller Studienplanung sind gänzlich andere Studienverläufe möglich und sinnvoll.
4
Erläuterungen zur Bindung: "Pflicht" bedeutet: Dieses Modul muss im Laufe des Studiums verpflichtend absolviert werden; "Wahlpflicht" bedeutet: Dieses Modul gehört einer Anzahl von Modulen an, aus denen unter bestimmten Bedingungen ausgewählt werden kann. Genaueres regeln die "Fächerspezifischen Bestimmungen" (siehe Navigation).
5
Workload (Kontaktzeit + Selbststudium)
SL
Studienleistung
Pr
Prüfung
bPr
Anzahl benotete Modul(teil)prüfungen
uPr
Anzahl unbenotete Modul(teil)prüfungen
Diese Leistung kann gemeldet und verbucht werden.