Große Sprachmodelle wie GPT-3 oder GPT-4 sind DAS Thema der Stunde: sie dominieren derzeit nicht nur die computerlinguistische Forschung, sondern finden durch Anwendungen wie ChatGPT große Aufmerksamkeit in der Gesellschaft. Aber wie funktionieren große Sprachmodelle eigentlich und wie gut können sie sprachliches Wissen lernen? Wie nutzt man diese große Modellen in spezifischen computerlinguistischen Anwendungen? Wie kann man als Computerlinguist*in einen Blick "hinter die Kulissen" dieser so wichtigen Technologie werfen, wie kann man Sprachmodelle evaluieren und analysieren? Diese Fragen wollen wir in diesem Kurs anhand von einigen beispielhaften, computerlinguistischen Problemen betrachten.
Voraussetzung:
- Pythonkenntnisse
Dringend empfohlen ist außerdem der Kurs:
- Methoden der angewandten Computerlinguistik/Grundkenntnisse im Bereich des maschinellen Lernens in der CL
Rhythmus | Tag | Uhrzeit | Format / Ort | Zeitraum | |
---|---|---|---|---|---|
wöchentlich | Mo | 16-18 | 07.10.2024-31.01.2025 |
Modul | Veranstaltung | Leistungen | |
---|---|---|---|
23-CL-BaCL5 Vertiefungsmodul | Lehrveranstaltung 1 | Studienleistung
|
Studieninformation |
Lehrveranstaltung 2 | Studienleistung
|
Studieninformation | |
- | benotete Prüfungsleistung | Studieninformation | |
23-TXT-BaCL5 Vertiefungsmodul | Veranstaltung aus dem Vertiefungsbereich | Studienleistung
|
Studieninformation |
Die verbindlichen Modulbeschreibungen enthalten weitere Informationen, auch zu den "Leistungen" und ihren Anforderungen. Sind mehrere "Leistungsformen" möglich, entscheiden die jeweiligen Lehrenden darüber.