Die automatische Verarbeitung von Texten und Dialogen ist für zahlreiche und sehr verschiedene Anwendungen relevant - von einfachen Rechtschreibkorrekturprogrammen und Chatbots bis hin zu Suchmaschinen, Übersetzungssystemen oder Dialogsystemen. Vielen dieser Anwendungen liegen heute sehr ähnliche, datengetriebene Verfahren und Maschinelles Lernen zu Grunde, da diese z.B. für die Auflösung von Ambiguitäten oder das Verarbeiten eines sehr großen Vokabulars geeignet sind. Zugleich haben sprachlichen Daten Eigenschaften, die für allgemeine Methoden des Maschinellen Lernens eher herausfordernd sind (Sparsity, lange Abhängigkeiten, etc.). Dieser Kurs führt in grundlegende statistische Methoden der Computerlinguistik wie die distributionelle Semantik, Textklassifikation mit Bag-of-Words-Modellen, Sprachmodelle und einfache neuronale Netze ein. Wir besprechen für welche Probleme und Anwendungen der Computerlinguistik diese Methoden geeignet sind und wie sie evaluiert werden können. Wir implementieren einige ausgewählte Aspekte und Anwendungen mit Python.
Für den Erhalt der Studienleistung müssen regelmäßig (wöchentlich) praktische Programmier- oder Datenanalyseaufgaben berarbeitet werden.
Hinweis: der Kurs ist auch als Ergänzung/grundlegende Einführung in statistische Verfahren der Computerlinguistik für Linguistikstudierende im Master geeignet.
Empfohlene Vorkenntnisse:
- Einführung in die Computerlinguistik
- Programmieren mit Python
- Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. draft). Aktuelle Draftversion unter https://web.stanford.edu/~jurafsky/slp3/
- Christopher Manning und Hinrich Schütze. 1999. Foundations of Statistical Natural Language Processing. MIT press
Rhythmus | Tag | Uhrzeit | Format / Ort | Zeitraum |
---|
Datum | Uhrzeit | Format / Raum | Kommentar zum Prüfungstermin |
---|---|---|---|
Dienstag, 16. September 2025 | 14-16 | B2-249 | 2. Termin |
Zeige vergangene Prüfungstermine >>
Modul | Veranstaltung | Leistungen | |
---|---|---|---|
23-CL-BaCL2.2 Methoden der angewandten Computerlinguistik | Methoden der angewandten Computerlinguistik | Studieninformation | |
- | benotete Prüfungsleistung | Studieninformation | |
39-M-Inf-INT-bas Basics of Interaction Technology | Basics of Interaction Technology: Seminar | Studieninformation | |
- | unbenotete Prüfungsleistung | Studieninformation |
Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.