Große Sprachmodelle wie GPT-3 oder GPT-4 sind DAS Thema der Stunde: sie dominieren derzeit nicht nur die computerlinguistische Forschung, sondern finden durch Anwendungen wie ChatGPT große Aufmerksamkeit in der Gesellschaft. Aber wie funktionieren große Sprachmodelle eigentlich und wie gut können sie sprachliches Wissen lernen? Wie nutzt man diese große Modellen in spezifischen computerlinguistischen Anwendungen? Wie kann man als Computerlinguist*in einen Blick "hinter die Kulissen" dieser so wichtigen Technologie werfen, wie kann man Sprachmodelle evaluieren und analysieren? Diese Fragen wollen wir in diesem Kurs anhand von einigen beispielhaften, computerlinguistischen Problemen betrachten.
Voraussetzung:
- Pythonkenntnisse
Dringend empfohlen ist außerdem der Kurs:
- Methoden der angewandten Computerlinguistik/Grundkenntnisse im Bereich des maschinellen Lernens in der CL
Frequency | Weekday | Time | Format / Place | Period | |
---|---|---|---|---|---|
weekly | Mo | 16-18 | T2-228 | 07.10.2024-31.01.2025
not on: 12/23/24 / 12/30/24 |
Module | Course | Requirements | |
---|---|---|---|
23-CL-BaCL5 Vertiefungsmodul | Lehrveranstaltung 1 | Study requirement
|
Student information |
Lehrveranstaltung 2 | Study requirement
|
Student information | |
- | Graded examination | Student information | |
23-TXT-BaCL5 Vertiefungsmodul | Veranstaltung aus dem Vertiefungsbereich | Study requirement
|
Student information |
The binding module descriptions contain further information, including specifications on the "types of assignments" students need to complete. In cases where a module description mentions more than one kind of assignment, the respective member of the teaching staff will decide which task(s) they assign the students.