Der Kurs dient der Einführung in die multivariate Datenanalyse und -modellierung in R. R ist eine Programmiersprache und Arbeitsumgebung für statistische Analysen. R hat sich als Alternative zu SPSS in der Wissenschaft etabliert, da es (1) unentgeldlich zu erwerben ist und (2) ständig weiterentwickelt wird.
Die Teilnehmer des Kurses lernen unterschiedliche multivariate Auswertungsverfahren kennen und deren Anwendung in R. Schwerpunkte bilden die multifaktorielle ANOVA mit und ohne Messwiederholung und die Regressionsanalyse. Diese Prozeduren sind häufig verwendete statische Auswertungsmethoden in der Linguistik. Varianzanalysen (ANOVAs) sind das häufigste Auswertungsverfahren experimenteller Designs. Regressionsanalysen sind vor allem im Hinblick auf die Untersuchung von Zusammenhängen zwischen mehreren kontinuierlichen Variablen oder wenn es nicht möglich ist vollständige Versuchspläne zu erstellen (z.B. bei Korpusanalysen) relevant. Zudem setzen sich die Studierenden mit den Nachteilen und Problemen der herkömmlichen Statistik auseinander und lernen Bayesianische Alternativen kennen und anwenden.
Weiterhin vorgestellt werden:
• Mixed Models als ein Verfahren, das Eigenschaften der Regressionsanalyse und der Varianzanalyse kombiniert.
• Explorative Verfahren, wie die Hauptkomponentenanalyse oder Clusteranalyse. Diese dienen der Datenreduktion und werden bei Text Mining Techniken eingesetzt.
Vorausgesetzt werden die Inhalte des Kurses "Einführung in die Statistik mit R":
• Gute Grundkenntnisse in R: Umgang mit Daten, Erstellen von Grafiken, einfache Zusammenhangs- und Vergleichstests
• Statistische Kenntnisse: Konzepte deskriptiver Statistik, Zusammenhangs- und Unterschiedstests, Varianzanalyse
• Erfolgreiches Bearbeiten der Übungsblätter aus dem Kurs "Einführung in die Statistik mit R" (70% korrekt)
Statistik allgemein:
Bortz & Schuster (2010). Statistik für Human- und Sozialwissenschaftler. (http://link.springer.com/book/10.1007%2F978-3-642-12770-0)
Sichelschmidt (2014). Überblick: Elementare Statistik.
Statistik mit R:
Baayen (2008). Analyzing Linguistic Data. A Practical Introduction to Statistics Using R. (www.sfs.uni-tuebingen.de/~hbaayen/publications/baayenCUPstats.pdf)
Dalgaard (2008). Introductory Statistics with R.
Luhmann (2013). R für Einsteiger. (Die 2. Auflage von 2011 : https://content-select.com/portal/media/view/519cc145-5bc4-4f0c-97d7-253e5dbbeaba)
Rhythmus | Tag | Uhrzeit | Format / Ort | Zeitraum |
---|
Studiengang/-angebot | Gültigkeit | Variante | Untergliederung | Status | Sem. | LP | |
---|---|---|---|---|---|---|---|
Klinische Linguistik / Master | (Einschreibung bis SoSe 2025) | MKLI1; MKLI6 | 3 | ||||
Linguistik: Kommunikation, Kognition und Sprachtechnologie / Master | (Einschreibung bis WiSe 19/20) | 23-LIN-Ma2; 23-LIN-MaSK2 | 3 |
• Lösen von Übungsaufgaben