In der Veranstaltung sollen fortgeschrittene Techniken der automatischen Sprachverarbeitung theoretisch erarbeitet und in den Übungen in Kleingruppen implementiert und evaluiert werden. Als Basis dient die Entwicklungsumgebung ESMERALDA, deren Möglichkeiten zur Erstellung statistischer Signalanalysesysteme in der Vorlesung ausführlich vorgestellt werden.
Folgende Fragestellungen können im Rahmen der Veranstaltung bearbeitet werden, wobei eigene Themenvorschläge der Teilnehmer willkommen sind:
Sprecherlokalisation
Durch die Verwendung mehrerer Mikrophone in bekannter räumlicher Anordnung und die Auswertung der Laufzeitdifferenzen akustischer Signale soll die Position eines Sprechers im Raum näherungsweise bestimmt werden.
Sprecheridentifikation
Auf der Basis einfacher Mischverteilungsmodelle können verschiedene Sprecher ohne Kenntnis der konkreten Äußerung erkannt und identifiziert werden. Diese Fragestellung kann mit dem Problem der Lokalisation gekoppelt werden.
"Topic Spotting"
Statistische Sprachmodellierungstechniken können verwendet werden, um den thematischen Kontext einer Äußerung oder eines Textes zu bestimmen. Dies kann dazu verwendet werden, Web-Inhalte zu klassifizieren oder spezifischere Sprachmodelle für die Erkennung einzusetzen.
Sprachsteuerungssysteme
Gesprochene Sprache läßt sich gut zur Steuerung einfacher Geräte und Applikationen einsetzen. Mit Hilfe einer existierenden Entwicklungsumgebung soll ein Sprachsteuerungssystem für eine geeignete Anwendung (z.B. sprachliche Steuerung des Computer-Desktops o.Ä.) erstellt werden.
Vorherige Teilnahme an der Vorlesung `Spracherkennung' empfohlen.
Frequency | Weekday | Time | Format / Place | Period | |
---|---|---|---|---|---|
weekly | Do | 10-11 | Unpublished | 18.04.-18.07.2002 |
Degree programme/academic programme | Validity | Variant | Subdivision | Status | Semester | LP | |
---|---|---|---|---|---|---|---|
Naturwissenschaftliche Informatik / Diplom | (Enrollment until SoSe 2004) | Sprachverarbeitung; Robotik; ME; WBS | HS |