312062 BI - Projekt: Multivariate Analyse 2 (Pj) (SoSe 2003)

Kurzkommentar

Inhalt, Kommentar

Im Sommersemester 2003 biete ich zwei BI-Projekte an. Beide Projekte drehen sich um das Thema Multivariate Verfahren. Im ersten Projekt beschäftigen wir uns mit Verfahren, die in der Vorlesung behandelt wurden. Bei den Verfahren des zweiten Projektes betreten wir aus Sicht der Vorlesung Neuland. Jedes der beiden
Projekte besteht aus 5 Teilprojekten. Jedes der Teilprojekte wird von 3 Teilnehmern bearbeitet. Bei allen Teilprojekten sollen die interessierenden Verfahren so dargestellt werden, dass sie von einem interessierten Leser mit Vorbildung in Multivariaten Verfahren verstanden werden können. Somit sollte das Ziel des Verfahrens, die Vorgehensweise und natürlich auch der Output berücksichtigt werden. Beweise sind nicht nötig. Formeln werden aber sicher auftauchen. Außerdem soll an Hand von Datenbeispielen illustriert werden, wie man mit R die Verfahren anwenden kann. Ist ein Verfahren nicht in R implementiert sind, so sollte eine Funktion in R erstellt werden. Die Projektarbeiten müssen in LATEX erstellt werden. Mit LATEX und R werden zwei Programme benutzt, die kostenlos sind. In den ersten Veranstaltung am 25.4.2003 werden die Themen vergeben. Die Teilnehmer beider Projekte müssen an diesem Termin anwesend sein. In den nächsten Wochen beschäftigen wir uns dann zuerst mit R und mit LATEX. Wie bei jedem meiner Projekte gibt es eine Gemeinschaftsaufgabe, die von allen Projektgruppen bearbeitet werden muss. Diese Gemeinschaftsaufgabe ist eine Art Lockerungsübung, mit der man zeigen soll, dass man mit R und LATEX umgehen kann. Für die Gemeinschaftsaufgabe wird auch ein Papier erstellt. Dieses muss Mitte Juni abgegeben werden.

Gemeinschaftaufgabe

Viele Praktiker gehen im unverbundenen Zweistichprobenproblem mit stetigen Merkmalen folgendermaßen vor:
Zuerst überprüfen Sie, ob Normalverteilung unterstellt werden kann. Hierzu führen sie den K-S-Test auf Normalverteilung durch. Kann keine Normalverteilung unterstellt werden, so wenden sie den Wilcoxon-Rangsummentest an. Kann Normalverteilung unterstellt werden, so wird mit dem F-Test überprüft, ob die
Varianzen identisch sind. Lehnt der F-Test die Hypothese identischer Varianzen ab, so wird der Welch-Test durchgeführt. Ansonsten wird der t-Test durchgeführt.
Jede Gruppe der beiden Projekte soll in R eine Funktion zu schreiben, die diese Vorgehensweise automatisiert. Die Funktion erhält die beiden Datensätze als Input und führt alle Tests zum Niveau 0.05 durch. Sie liefert dem Benutzer Informationen über alle Tests, die angewendet wurden, und erzählt ihm natürlich auch, ob einUnterschied zwischen den beiden Gruppen besteht.
Die Funktion und alle statistischen Verfahren sollen in einem in LATEX erstellten Papier beschrieben werden. Außerdem soll die Funktion auf mindestens einen Datensatz angewendet werden. Der Fantasie sind natürlich keine Grenzen gesetzt. Man könnte also auch den vergleichenden Boxplot der beiden Stichproben erstellen. Ein Normal-Probality-Plot der standardisierten Merkmale ist auch bedenkenswert.

Teilprojekt 1: Robuste Schätzung der Varianz-Kovarianz-Matrix mit Anwendungen

Die empirische Varianz-Kovarianz-Matrix ist sehr ausreißerempfindlich. Es gibt eine Reihe von robusten Schätzern der Varianz-Kovarianz-Matrix, die in R in der Bibliothek lqs in den Funktionen cov.mcd, cov.mve und cov.rob zu finden sind. Die hinter diesen Funktionen stehenden Konzepte sollen beschrieben. Mit den
Funktionen sollen Datensätze, die Ausreißer enthalten, analysiert werden. Außerdem soll die Hauptkomponentenanalyse und lineare Diskriminanzanalyse auf Basis einer robusten Schätzung der Varianz-Kovarianz-Matrix in R implementiert werden und an Hand von Datensätzen in R angewendet werden.
Literatur:
P. J. Rousseeuw and A. M. Leroy (1987) Robust Regression and Outlier Detection.
P. J. Rousseeuw and K. van Driessen (1999) A fast algorithm for the minimum covariance determinant estimator. Technometrics 41, 212-223.

Teilprojekt 2: Klassische, robuste und nichtparametrische Regressionsanalyse

Die Regressionsanalyse wird detailliert in der Vorlesung "Einführung in die Ökonometrie" behandelt. Hier soll untersucht werden, welche Möglichkeiten die Funktionen lsfit und lm in R bieten.
Außerdem sollen robuste Schätzer beschrieben werden, die in R in der Bibliothek lqs in den Funktionen lmsreg, lqs und ltsreg zu finden sind.
Glätter bieten die Möglichkeit, einen nichtlinearen Zusammenhang zwischen den Variablen datengestützt zu entdecken. Für die Regression mit einer erklärenden Variablen sollen die Konzepte, die in den Funktionen aus der Bibliothek modreg berücksichtigt werden, beschrieben und in R auf Datensätze angewendet werden.
Literatur:
Chambers, J.M. (1992): Statistical models in S
Cleveland, W.S. (1991): Visualizing Data.
Draper, N.R., H. Smith (1998): Applied regression analysis
Rousseeuw, P.J., A. M. Leroy (1987) Robust Regression and Outlier Detection.

Teilprojekt 3: Loglineare Modelle

Mit Hilfe loglinearer Modelle kann man Abhängigkeitsstrukturen in hochdimensionalen Kontingenztabellen aufdecken. Anhand von Beispielen soll gezeigt werden, wie man loglineare Modelle mit der Funktion loglin in R analysiert. Es gibt unterschiedliche Verfahren zur Wahl eines geeigneten Modells. Von diesen sollen einige in R implementiert werden.
Literatur:
Christensen, R. (1997): Log linear models and logistic regression
Fahrmeir et al (1996) : Multivariate statistische Verfahren.

Teilprojekt 4: Korrespondenzanalyse

Mit Hilfe der Korrespondenzanalyse kann man die Abhängigkeitsstruktur einer zweidimensionalen Kontingenztabelle grafisch darstellen. Die Vorgehensweise der Korrespondenzanalyse soll dargestellt werden. Außerdem soll die Funktion corresp aus der Bibliothek MASS in R auf Kontingenztabellen angewendet werden.
Außerdem soll die multiple Korrespondenzanalyse dargestellt werden und in R mit der Funktion mca aus der Bibliothek MASS auf Datensätze angewendet werden.
Literatur:
Blasius, J. (2001): Korrespondenzanalyse
Everitt, B. (2002): A handbook of statistical analyses using S-Plus
Jobson, J.D.(1992): Applied multivariate data analysis. Categorical and multivariate methods .
http://www.statistik.tuwien.ac.at/oezstat/ausg983/papers/boehm.ps

Teilprojekt 5: Neuronale Netze

Neuronale Netze sind ein Verfahren der nichtlinearen Diskriminanzanalyse. Die Theorie der neuronalen Netze soll dargestellt werden. Außerdem sollen mit der Funktion nnet aus der Bibliothek nnet in R Daten mit Hilfe neuronaler Netze klassifiziert werden.
Literatur:
Ripley, B.D. (1996) : Pattern recognition and neural networks
Smith, M. (1993) : Neural networks for statistical modelling
Warner, B., M. Misra (1996): Understanding neural networks as statistical tools. American statistician, S. 284-293

Lehrende

Termine ( Kalendersicht )

Rhythmus Tag Uhrzeit Format / Ort Zeitraum  
wöchentlich Fr 14-17 W9-109 22.04.-31.07.2003

Verstecke vergangene Termine <<

Fachzuordnungen

Studiengang/-angebot Gültigkeit Variante Untergliederung Status Sem. LP  
Betriebswirtschaftslehre / Diplom (Einschreibung bis SoSe 2005) B4 Wahlpflicht 5 HS
Volkswirtschaftslehre / Diplom (Einschreibung bis SoSe 2005) WP03 Wahl 5 HS

Keine Konkretisierungen vorhanden
Kein E-Learningangebot vorhanden
registrierte Anzahl: 1
Dies ist die Anzahl der Studierenden, die die Veranstaltung im Stundenplan gespeichert haben. In Klammern die Anzahl der über Gastaccounts angemeldeten Benutzer*innen.
Adresse:
SS2003_312062@ekvv.uni-bielefeld.de
Lehrende, ihre Sekretariate sowie für die Pflege der Veranstaltungsdaten zuständige Personen können über diese Adresse E-Mails an die Veranstaltungsteilnehmer*innen verschicken. WICHTIG: Sie müssen verschickte E-Mails jeweils freischalten. Warten Sie die Freischaltungs-E-Mail ab und folgen Sie den darin enthaltenen Hinweisen.
Falls die Belegnummer mehrfach im Semester verwendet wird können Sie die folgende alternative Verteileradresse nutzen, um die Teilnehmer*innen genau dieser Veranstaltung zu erreichen: VST_1060086@ekvv.uni-bielefeld.de
Reichweite:
Keine Studierenden per E-Mail erreichbar
Hinweise:
Weitere Hinweise zu den E-Mailverteilern
Letzte Änderung Grunddaten/Lehrende:
Freitag, 11. Dezember 2015 
Letzte Änderung Zeiten:
Sonntag, 15. Dezember 2002 
Letzte Änderung Räume:
Sonntag, 15. Dezember 2002 
Art(en) / SWS
Projekt (Pj) / 3
Einrichtung
Fakultät für Wirtschaftswissenschaften
Fragen oder Korrekturen?
Fragen oder Korrekturwünsche zu dieser Veranstaltung?
Planungshilfen
Terminüberschneidungen für diese Veranstaltung
Link auf diese Veranstaltung
Wenn Sie diese Veranstaltungsseite verlinken wollen, so können Sie einen der folgenden Links verwenden. Verwenden Sie nicht den Link, der Ihnen in Ihrem Webbrowser angezeigt wird!
Der folgende Link verwendet die Veranstaltungs-ID und ist immer eindeutig:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=1060086
Seite zum Handy schicken
Klicken Sie hier, um den QR Code zu zeigen
Scannen Sie den QR-Code: QR-Code vergrößern
ECTS Punkte
5
(Siehe auch die LP-Angaben bei den Fachzuordnungen)
ID
1060086