In der AG Bioinformatik wurde ONDEX, ein System zur Indizierung von Texten, entwickelt, mit dem Begriffe einer Ontologie (elektronisches Wörterbuch) den Worten der Texte zugeordnet werden können. Damit ist es möglich, Fach- und andere Begriffe in Texten zu finden, obwohl sie dort in einer anderen grammatikalischen Form, als Synonym oder Homonym (Teekesselchen) verwendet werden. Dies spielt besonders in der Molekularbiologie eine bedeutende Rolle, denn oftmals hat ein und dasselbe Gen mehrere unterschiedliche Namen, und viele Begriffe haben je nach Kontext eine unterschiedliche Bedeutung.
In dem Projekt geht es darum, verschiedene Anwendungen für die Nutzung von ONDEX zu entwickeln: Beispiele hierfür sind Volltextsuche, die anwendungsspezifische Extraktion von biologischem Wissen, sowie das Clustern von ähnlichen Texten. Darüber hinaus können weitere Themen zur Verbesserung der Qualität und Performanz des Indiziervorgangs selbst bearbeitet werden.
Eine prototypische Implementierung von ONDEX entstand im Rahmen eines Projektseminars. Es geht jedoch nicht darum die Fehler des vorhergehenden Projektseminars auszumerzen (das machen derzeit die Betreuer des Projektes selbst), sondern darum, die Indiziertechnik für verschiedene Anwendungen einzusetzen. Eine Beispielanwendung ist die Extraktion von Informationen zu interzellulärer Kommunikation, um Netzwerke zwischen Organen oder Zelltypen aufzubauen. Ein Beispiel für ein solches Netzwerk ist in der Abbildung dargestellt.
Vorbesprechungstermin: Siehe Aushang zu Semesterbeginn.
| Rhythmus | Tag | Uhrzeit | Format / Ort | Zeitraum | |
|---|---|---|---|---|---|
| nach Vereinbarung | n.V. | D5-113 |
| Studiengang/-angebot | Gültigkeit | Variante | Untergliederung | Status | Sem. | LP | |
|---|---|---|---|---|---|---|---|
| Bioinformatik und Genomforschung / Bachelor | (Einschreibung bis SoSe 2011) | Modul 11 | Wahlpflicht | 5. | 6 | unbenotet | |
| Naturwissenschaftliche Informatik / Diplom | (Einschreibung bis SoSe 2004) | BioI; WBS; CM; DB | HS |