Modul 39-M-Inf-SSV Sprachsignalverarbeitung

Fakultät

Modulverantwortliche*r

Turnus (Beginn)

Jedes Wintersemester

Leistungspunkte und Dauer

10 Leistungspunkte

Die Angaben zur Moduldauer finden Sie bei den Studiengängen, in denen das Modul verwendet wird.

Kompetenzen

Es werden grundlegende Methoden der Spracherkennung vermittelt, wie sie aktuell nicht nur in Forschungsprototypen verwendet werden sondern auch in alltäglichen Anwendungen Einsatz finden. Die Studierenden sollen nach der Vorlesung in der Lage sein, die Leistungsfähigkeit von Spracherkennungssystemen einzuschätzen, aber auch selber ein Spracherkennungssystem mit einem vorhandenen Framework wie Esmeralda oder HTK zu trainieren und zu evaluieren.

In this lecture students will learn basic methods of automatic speech recognition (ASR) as they are used both in research prototypes as well as in off-the-shelf ASR systems. After this lecture students should be able to critically examine the performance of ASR systems and to train and evaluate an ASR system such as Esmeralda or HTK.

Lehrinhalte

Die Vorlesung "Spracherkennung" befasst sich mit Methoden zur automatischen Umsetzung von gesprochenen Äußerungen in eine möglichst exakte orthographische Repräsentation, wie sie z.B. in Diktiersystemen aber auch anderen Systemen zur sprachlichen Steuerung technischer Systeme zum Einsatz kommen. In der Veranstaltung werden zunächst speziell in der Spracherkennung eingesetzte Verfahren zur Signalverarbeitung sowie grundlegende Erkenntnisse aus der artikulatorischen und akustische Phonetik vorgestellt. Schwerpunktmäßig wird dann das nach dem gegenwärtigen Stand der Forschung vorherrschende Paradigma zur automatischen Spracherkennung behandelt - die sogenannten Hidden-Markov-Modelle (HMM). Die mathematischen Grundlagen dieser statistischen Modellierungstechnik für gesprochene Sprache werden eingeführt und Algorithmen zur Parameterschätzung sowie zum Einsatz für die Analyse von Sprachsignalen behandelt. Anhand existierender Spracherkennungssysteme werden mögliche Varianten der HMM-Technologie vorgestellt und diskutiert.

Die Vorlesung "Anwendungsorientierte Sprachverarbeitung" stellt die in einer konkreten Entwicklungsumgebung für statistische Signalanalysesysteme bereitgestellten Implementierungen der aus der Vorlesung "Spracherkennung" bekannten Verfahren vor. Im Rahmen der zugehörigen Übungen werden dann fortgeschrittene Techniken der automatischen Sprachverarbeitung theoretisch erarbeitet und in Gruppenprojekten implementiert und evaluiert.

Alternativ zur Vorlesung "Anwendungsorientierte Sprachverarbeitung" werden im Rahmen eines Seminars ausgewählte, spezialisierte Themen der automatischen Sprachsignalverarbeitung behandelt. Dabei wird ein Themenkomplex von jedem Teilnehmer aufbereitet und in einem Vortrag präsentiert. Zusätzlich wird eine Ausarbeitung zum jeweiligen Thema erstellt.

The lecture Speech Recognition focuses on methods to automatically derive an orthographic representation from spoken speech as used in automatic dictating machines or for the speech-based control of technical systems. We will start-off with an overview of the human articulatory system in order to better understand the components of the speech signal in terms of the source-filter model as well as phonetic phenomena such as coarticulation or reduction. This forms the basis for the signal processing methods where the different components of source and filter are decomposed. One important part of the lecture are Hidden-Markov-Models (HMMs) which still represent the paradigm of state-of-the-art ASR approaches. The mathematical basis of this statistical modeling approach will be discussed and algorithms for training and decoding of HMMs given a speech signal and an annotation for training will be presented in detail. Several variants of ASR systems will be discussed.

The lecture "Application oriented speech processing" will present concrete implementations of the algorithms discussed in the lecture "Speech Recognition". Within the exercises advanced ASR techniques will be derived at a theoretical level and will be implemented and evaluated in group projects.
Alternatively to this lecture selected topics of ASR will be discusse in a seminar. In the seminar participants are expected to prepare and give a presentation on a specific topic as well as provide a written summary.

Empfohlene Vorkenntnisse

Kompetenzen, wie sie beispielsweise im Modul 39-Inf-MK Musterklassifikation erworben werden können

Recommended Competences: Competences as they can be achieved with the Module 39-Inf-MK Pattern Recognition

Notwendige Voraussetzungen

Erläuterung zu den Modulelementen

Hinweise zur Veranstaltungswahl:
Es ist entweder die Vorlesung und Übung Anwendungsorientierte Sprachverarbeitung oder das Seminar Sprachverarbeitung zu besuchen.

Unbenotete / benotete Modulprüfung:
Die Modul(teil)prüfung kann in einigen Studiengängen nach Wahl der Studierenden auch "unbenotet" erbracht werden. Vor Erbringung ist eine entsprechende Festlegung vorzunehmen, eine nachträgliche Änderung (benotet - unbenotet) ist ausgeschlossen. Wird diese Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.

Ungraded / Graded Module Examination:
The (partial) examination of the module can be performed as "ungraded" in some study programs at the students choice. Before the examination a respective determination must be carried out, a later modification (graded - ungraded) is impossible. If the "ungraded" option is chosen, it is not possible to include this module in a study program where this module is deemed to enter the calculation of the overall grade.

Modulstruktur: 1 SL, 0-1 bPr, 0-1 uPr 1

Veranstaltungen

Anwendungsorientierte Sprachverarbeitung
Art Vorlesung
Turnus SoSe
Workload5 30 h (15 + 15)
LP 1

Alternativ zu Vorlesung und Übung Anwendungsorientierte Sprachverarbeitung kann auch ein Seminar Sprachverarbeitung besucht werden.

Alternatively to lecture and exercises a seminar language processing can be chosen.

Anwendungsorientierte Sprachverarbeitung
Art Übung
Turnus SoSe
Workload5 90 h (45 + 45)
LP 3 [SL]

Alternativ zu Vorlesung und Übung Anwendungsorientierte Sprachverarbeitung kann auch ein Seminar Sprachverarbeitung besucht werden.

Alternatively to lecture and exercises a seminar language processing can be chosen.

Spracherkennung
Art Übung
Turnus WiSe
Workload5 30 h (15 + 15)
LP 1
Spracherkennung
Art Vorlesung
Turnus WiSe
Workload5 90 h (45 + 45)
Sprachverarbeitung
Art Seminar
Turnus SoSe
Workload5 120 h (30 + 90)
LP 4 [SL]

Alternativ zu einem Seminar Sprachverarbeitung kann die Vorlesung und Übung Anwendungsorientierte Sprachverarbeitung besucht werden.

Alternatively to lecture and exercises a seminar language processing can be chosen.


Studienleistungen

Zuordnung Prüfende Workload LP2
Lehrende der Veranstaltung Anwendungsorientierte Sprachverarbeitung (Übung)

Referat (15-25 min.)

oral presentation (15-25 min.)

siehe oben siehe oben
Lehrende der Veranstaltung Sprachverarbeitung (Seminar)

Referat (15-25 min.)

siehe oben siehe oben

Prüfungen

mündliche Prüfung
Zuordnung Prüfende Lehrende der Veranstaltung Spracherkennung (Vorlesung)
Gewichtung unbenotet
Workload 60h
LP2 2

In einigen Studiengängen der Technischen Fakultät kann die Modulprüfung nach Wahl der Studierenden auch "unbenotet" erbracht werden (s. Erläuterungen zu den Modulelementen und die jeweilige FsB). Wird die unbenotete Option gewählt, ist es nicht möglich, dieses Modul zu verwenden, um es in einen Studiengang einzubringen, in dem dieses Modul bei der Gesamtnotenberechnung berücksichtigt wird.
Erläuterungen zu dieser Prüfung siehe unten (benotete Prüfungsvariante).

mündliche Prüfung
Zuordnung Prüfende Lehrende der Veranstaltung Spracherkennung (Vorlesung)
Gewichtung 1
Workload 60h
LP2 2

Mündliche Prüfung (15-25 min.) über die Inhalte von Vorlesung und Übungen.

oral examination (15-25 min.) about the contents of lecture and exercises

In diesen Studiengängen wird das Modul verwendet:

Studiengang Profil Empf. Beginn 3 Dauer Bindung 4
Data Science / Master of Science [FsB vom 06.04.2018 mit Änderungen vom 01.07.2019, 02.03.2020 und 21.03.2023] Variante 1 3. zwei Semes­ter Wahl­pflicht
Data Science / Master of Science [FsB vom 06.04.2018 mit Änderungen vom 01.07.2019, 02.03.2020 und 21.03.2023] Variante 2 3. zwei Semes­ter Wahl­pflicht
Intelligente Systeme / Master of Science [FsB vom 27.07.2018 mit Änderung vom 04.06.2020] 1. zwei Semes­ter Wahl­pflicht
Intelligente Systeme / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015 und Berichtigung vom 17.11.2014] 1. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 30.09.2016 mit Berichtigung vom 10.01.2017 und Änderungen vom 15.09.2017, 02.05.2018, 04.06.2020 und 31.03.2023] 1. o. 3. zwei Semes­ter Wahl­pflicht
Naturwissenschaftliche Informatik / Master of Science [FsB vom 17.12.2012 mit Änderungen vom 15.04.2013, 01.04.2014, 15.10.2014, 02.03.2015, 01.12.2015 und Berichtigungen vom 01.04.2014, 17.11.2014 und 12.07.2017] 1. o. 3. zwei Semes­ter Wahl­pflicht

Automatische Vollständigkeitsprüfung

In diesem Modul kann eine automatische Vollständigkeitsprüfung vom System durchgeführt werden.


Legende

1
Die Modulstruktur beschreibt die zur Erbringung des Moduls notwendigen Prüfungen und Studienleistungen.
2
LP ist die Abkürzung für Leistungspunkte.
3
Die Zahlen in dieser Spalte sind die Fachsemester, in denen der Beginn des Moduls empfohlen wird. Je nach individueller Studienplanung sind gänzlich andere Studienverläufe möglich und sinnvoll.
4
Erläuterungen zur Bindung: "Pflicht" bedeutet: Dieses Modul muss im Laufe des Studiums verpflichtend absolviert werden; "Wahlpflicht" bedeutet: Dieses Modul gehört einer Anzahl von Modulen an, aus denen unter bestimmten Bedingungen ausgewählt werden kann. Genaueres regeln die "Fächerspezifischen Bestimmungen" (siehe Navigation).
5
Workload (Kontaktzeit + Selbststudium)
SL
Studienleistung
Pr
Prüfung
bPr
Anzahl benotete Modul(teil)prüfungen
uPr
Anzahl unbenotete Modul(teil)prüfungen
Diese Leistung kann gemeldet und verbucht werden.