Studieninformation
Hintergrundbild
Hintergrundbild
Hintergrundbild
Druckversion  Sprachumschaltung
 

Modul 39-M-Inf-SSV Sprachsignalverarbeitung

Fakultät

Modulverantwortliche/r

Turnus (Beginn)

Jedes Wintersemester

Leistungspunkte und Dauer

10 Leistungspunkte

Die Angaben zur Moduldauer finden Sie bei den Studiengängen, in denen das Modul verwendet wird.

Kompetenzen

Es werden grundlegende Methoden der Spracherkennung vermittelt, wie sie aktuell nicht nur in Forschungsprototypen verwendet werden sondern auch in alltäglichen Anwendungen Einsatz finden. Die Studierenden sollen nach der Vorlesung in der Lage sein, die Leistungsfähigkeit von Spracherkennungssystemen einzuschätzen, aber auch selber ein Spracherkennungssystem mit einem vorhandenen Framework wie Esmeralda oder HTK zu trainieren und zu evaluieren.

In this lecture students will learn basic methods of automatic speech recognition (ASR) as they are used both in research prototypes as well as in off-the-shelf ASR systems. After this lecture students should be able to critically examine the performance of ASR systems and to train and evaluate an ASR system such as Esmeralda or HTK.

Lehrinhalte

Die Vorlesung "Spracherkennung" befasst sich mit Methoden zur automatischen Umsetzung von gesprochenen Äußerungen in eine möglichst exakte orthographische Repräsentation, wie sie z.B. in Diktiersystemen aber auch anderen Systemen zur sprachlichen Steuerung technischer Systeme zum Einsatz kommen. In der Veranstaltung werden zunächst speziell in der Spracherkennung eingesetzte Verfahren zur Signalverarbeitung sowie grundlegende Erkenntnisse aus der artikulatorischen und akustische Phonetik vorgestellt. Schwerpunktmäßig wird dann das nach dem gegenwärtigen Stand der Forschung vorherrschende Paradigma zur automatischen Spracherkennung behandelt - die sogenannten Hidden-Markov-Modelle (HMM). Die mathematischen Grundlagen dieser statistischen Modellierungstechnik für gesprochene Sprache werden eingeführt und Algorithmen zur Parameterschätzung sowie zum Einsatz für die Analyse von Sprachsignalen behandelt. Anhand existierender Spracherkennungssysteme werden mögliche Varianten der HMM-Technologie vorgestellt und diskutiert.

Die Vorlesung "Anwendungsorientierte Sprachverarbeitung" stellt die in einer konkreten Entwicklungsumgebung für statistische Signalanalysesysteme bereitgestellten Implementierungen der aus der Vorlesung "Spracherkennung" bekannten Verfahren vor. Im Rahmen der zugehörigen Übungen werden dann fortgeschrittene Techniken der automatischen Sprachverarbeitung theoretisch erarbeitet und in Gruppenprojekten implementiert und evaluiert.

Alternativ zur Vorlesung "Anwendungsorientierte Sprachverarbeitung" werden im Rahmen eines Seminars ausgewählte, spezialisierte Themen der automatischen Sprachsignalverarbeitung behandelt. Dabei wird ein Themenkomplex von jedem Teilnehmer aufbereitet und in einem Vortrag präsentiert. Zusätzlich wird eine Ausarbeitung zum jeweiligen Thema erstellt.

The lecture Speech Recognition focuses on methods to automatically derive an orthographic representation from spoken speech as used in automatic dictating machines or for the speech-based control of technical systems. We will start-off with an overview of the human articulatory system in order to better understand the components of the speech signal in terms of the source-filter model as well as phonetic phenomena such as coarticulation or reduction. This forms the basis for the signal processing methods where the different components of source and filter are decomposed. One important part of the lecture are Hidden-Markov-Models (HMMs) which still represent the paradigm of state-of-the-art ASR approaches. The mathematical basis of this statistical modeling approach will be discussed and algorithms for training and decoding of HMMs given a speech signal and an annotation for training will be presented in detail. Several variants of ASR systems will be discussed.

The lecture "Application oriented speech processing" will present concrete implementations of the algorithms discussed in the lecture "Speech Recognition". Within the exercises advanced ASR techniques will be derived at a theoretical level and will be implemented and evaluated in group projects.
Alternatively to this lecture selected topics of ASR will be discusse in a seminar. In the seminar participants are expected to prepare and give a presentation on a specific topic as well as provide a written summary.

Empfohlene Vorkenntnisse

Kompetenzen, wie sie beispielsweise im Modul 39-Inf-MK Musterklassifikation erworben werden können

Recommended Competences: Competences as they can be achieved with the Module 39-Inf-MK Pattern Recognition

Notwendige Voraussetzungen

Erläuterung zu den Modulelementen

Es ist entweder die Vorlesung und Übung Anwendungsorientierte Sprachverarbeitung oder das Seminar Sprachverarbeitung zu besuchen.

Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.

The (partial) examination of the module can be performed as "ungraded" in some study programs at the students choice. Before the examination a respective determination must be carried out, a later modification (graded - ungraded) is impossible. If the "ungraded" option is chosen, it is not possible to include this module in a study program where this module is deemed to enter the calculation of the overall grade.

Modulstruktur: 1 SL, 0-1 bPr, 0-1 uPr 1

Veranstaltungen

Titel Art Turnus Workload (Kontaktzeit + Selbststudium) LP2
Anwendungsorientierte Sprachverarbeitung

Alternativ zu Vorlesung und Übung Anwendungsorientierte Sprachverarbeitung kann auch ein Seminar Sprachverarbeitung besucht werden.

Alternatively to lecture and exercises a seminar language processing can be chosen.

Vorlesung SoSe 30h (15 + 15) 1
Anwendungsorientierte Sprachverarbeitung

Alternativ zu Vorlesung und Übung Anwendungsorientierte Sprachverarbeitung kann auch ein Seminar Sprachverarbeitung besucht werden.

Alternatively to lecture and exercises a seminar language processing can be chosen.

Übung SoSe 90h (45 + 45) 3 [SL]
Spracherkennung Übung WiSe 30h (15 + 15) 1
Spracherkennung Vorlesung WiSe 90h (45 + 45) 3 [Pr] [Pr]
Sprachverarbeitung

Alternativ zu einem Seminar Sprachverarbeitung kann die Vorlesung und Übung Anwendungsorientierte Sprachverarbeitung besucht werden.

Alternatively to lecture and exercises a seminar language processing can be chosen.

Seminar SoSe 120h (30 + 90) 4 [SL]

Studienleistungen

Veranstaltung Workload LP2
Anwendungsorientierte Sprachverarbeitung (Übung)

Referat (15-25 min.)

oral presentation (15-25 min.)

siehe oben siehe oben
Diese Leistung kann gemeldet und verbucht werden.
Sprachverarbeitung (Seminar)

Referat (15-25 min.)

siehe oben siehe oben
Diese Leistung kann gemeldet und verbucht werden.

Prüfungen

Organisatorische Zuordnung Art Gewichtung Workload LP2
Spracherkennung (Vorlesung)

In einigen Studiengängen der Technischen Fakultät kann die Modulprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

mündliche Prüfung unbenotet 60h 2
Diese Leistung kann gemeldet und verbucht werden.
Spracherkennung (Vorlesung)

Mündliche Prüfung (15-25 min.) über die Inhalte von Vorlesung und Übungen.

oral examination (15-25 min.) about the contents of lecture and exercises

mündliche Prüfung 1 60h 2
Diese Leistung kann gemeldet und verbucht werden.

In diesen Studiengängen wird das Modul verwendet:

Studiengang Profil Empf. Beginn 3 Dauer Bindung 4
Data Science / Master of Science [FsB vom 06.04.2018] Variante 1 3. zwei Semes­ter Wahl­pflicht
Data Science / Master of Science [FsB vom 06.04.2018] Variante 2 3. zwei Semes­ter Wahl­pflicht
Intelligente Systeme / Master of Science [FsB vom 27.07.2018] 1. zwei Semes­ter Wahl­pflicht
Intelligente Systeme / Master of Science [FsB vom 17.12.2012 Änderungen vom 15.04.2013, 01.04.2014,15.10.2014, 02.03.2015 und Berichtigung vom 17.11.2014] 1. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017 und 02.05.2018] 1. o. 3. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 1. o. 3. zwei Semes­ter Wahl­pflicht

Automatische Vollständigkeitsprüfung

In diesem Modul kann eine automatische Vollständigkeitsprüfung vom System durchgeführt werden.

Legende

1
Die Modulstruktur beschreibt die zur Erbringung des Moduls notwendigen Prüfungen und Studienleistungen.
2
LP ist die Abkürzung für Leistungspunkte.
3
Die Zahlen in dieser Spalte sind die Fachsemester, in denen der Beginn des Moduls empfohlen wird. Je nach individueller Studienplanung sind gänzlich andere Studienverläufe möglich und sinnvoll.
4
Erläuterungen zur Bindung: "Pflicht" bedeutet: Dieses Modul muss im Laufe des Studiums verpflichtend absolviert werden; "Wahlpflicht" bedeutet: Dieses Modul gehört einer Anzahl von Modulen an, aus denen unter bestimmten Bedingungen ausgewählt werden kann. Genaueres regeln die "Fächerspezifischen Bestimmungen" (siehe rechtes Menü).
SL
Studienleistung
Pr
Prüfung
bPr
Anzahl benotete Modul(teil)prüfungen
uPr
Anzahl unbenotete Modul(teil)prüfungen
Diese Leistung kann gemeldet und verbucht werden.
Diese Leistung kann gemeldet und verbucht werden.