230004 Methoden der angewandten Computerlinguistik (S) (SoSe 2024)

Inhalt, Kommentar

Die automatische Verarbeitung von Texten und Dialogen ist für zahlreiche und sehr verschiedene Anwendungen relevant - von einfachen Rechtschreibkorrekturprogrammen und Chatbots bis hin zu Suchmaschinen oder Übersetzungs- und Dialogsystemen. Vielen dieser Anwendungen liegen heute sehr ähnliche, datengetriebene Verfahren und Maschinelles Lernen zu Grunde, da diese z.B. für die Auflösung von Ambiguitäten oder das Verarbeiten eines sehr großen Vokabulars geeignet sind. Zugleich haben sprachlichen Daten Eigenschaften, die für allgemeine Methoden des Maschinellen Lernens eher herausfordernd sind (Sparsity, lange Abhängigkeiten, etc.).
Dieser Kurs führt in grundlegende statistische Methoden und Lernverfahren der Computerlinguistik ein -- z.B. distributionelle Semantik, Textklassifikation mit Bag-of-Words-Modellen oder Tagging mit Hidden-Markov-Modellen. Dabei besprechen wir, für welche Probleme und Anwendungen der Computerlinguistik diese Methoden geeignet sind und wie sie evaluiert werden können. Außerdem werfen wir gemeinsam einen Blick auf die Implementierung einiger ausgewählter Aspekte und Anwendungen in Python. In der dazugehörigen Übung wird ein vertiefter Fokus auf die praktische Umsetzung gelegt.

Teilnahmevoraussetzungen, notwendige Vorkenntnisse

Empfohlene Vorkenntnisse:

  • Einführung in die Computerlinguistik
  • Programmieren mit Python

Literaturangaben

- Steven Bird, Ewan Klein und Edward Loper. 2009. Natural Language Processing with Python. O’Reilly Media, Sebastopol, CA. Freie an Python 3 und NLK 3 angepasste Onlineversion von 2020 unter http://www.nltk.org/book
- Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. draft). Aktueller Draft verfügbar unter https://web.stanford.edu/~jurafsky/slp3/
- Christopher Manning und Hinrich Schütze. 1999. Foundations of Statistical Natural Language Processing. MIT press

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  
wöchentlich Di 14-16 E0-180 08.04.-19.07.2024

Fachzuordnungen

Modul Veranstaltung Leistungen  
23-CL-BaCL2.2 Methoden der angewandten Computerlinguistik Methoden der angewandten Computerlinguistik Studieninformation
- benotete Prüfungsleistung Studieninformation
23-TXT-BaCL5 Vertiefungsmodul Veranstaltung aus dem Vertiefungsbereich Studienleistung
Studieninformation
39-M-Inf-INT-bas Basics of Interaction Technology Basics of Interaction Technology: Seminar Studieninformation
- unbenotete Prüfungsleistung Studieninformation

Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.


Für den Erhalt der Studienleistung müssen regelmäßig, ergo wöchentlich, praktische Programmier- oder Datenanalyseaufgaben mit erkennbarem Bemühen berarbeitet werden.

Lernraum (E-Learning)

Zu dieser Veranstaltung existiert ein Lernraum im E-Learning System. Lehrende können dort Materialien zu dieser Lehrveranstaltung bereitstellen:

registrierte Anzahl: 21
Dies ist die Anzahl der Studierenden, die die Veranstaltung im Stundenplan gespeichert haben. In Klammern die Anzahl der über Gastaccounts angemeldeten Benutzer*innen.
Adresse:
SS2024_230004@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_443715388@ekvv.uni-bielefeld.de
Reichweite:
21 Studierende direkt per E-Mail erreichbar
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
Letzte Änderung Grunddaten/Lehrende:
Donnerstag, 19. Oktober 2023 
Letzte Änderung Zeiten:
Dienstag, 13. Februar 2024 
Letzte Änderung Räume:
Dienstag, 13. Februar 2024 
Art(en) / SWS
S / 2
Einrichtung
Fakultät für Linguistik und Literaturwissenschaft
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=443715388
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ID
443715388