312062 BI - Projekt: Multivariate Analyse 2 (Pj) (SoSe 2003)

Short comment

Contents, comment

Im Sommersemester 2003 biete ich zwei BI-Projekte an. Beide Projekte drehen sich um das Thema Multivariate Verfahren. Im ersten Projekt beschäftigen wir uns mit Verfahren, die in der Vorlesung behandelt wurden. Bei den Verfahren des zweiten Projektes betreten wir aus Sicht der Vorlesung Neuland. Jedes der beiden
Projekte besteht aus 5 Teilprojekten. Jedes der Teilprojekte wird von 3 Teilnehmern bearbeitet. Bei allen Teilprojekten sollen die interessierenden Verfahren so dargestellt werden, dass sie von einem interessierten Leser mit Vorbildung in Multivariaten Verfahren verstanden werden können. Somit sollte das Ziel des Verfahrens, die Vorgehensweise und natürlich auch der Output berücksichtigt werden. Beweise sind nicht nötig. Formeln werden aber sicher auftauchen. Außerdem soll an Hand von Datenbeispielen illustriert werden, wie man mit R die Verfahren anwenden kann. Ist ein Verfahren nicht in R implementiert sind, so sollte eine Funktion in R erstellt werden. Die Projektarbeiten müssen in LATEX erstellt werden. Mit LATEX und R werden zwei Programme benutzt, die kostenlos sind. In den ersten Veranstaltung am 25.4.2003 werden die Themen vergeben. Die Teilnehmer beider Projekte müssen an diesem Termin anwesend sein. In den nächsten Wochen beschäftigen wir uns dann zuerst mit R und mit LATEX. Wie bei jedem meiner Projekte gibt es eine Gemeinschaftsaufgabe, die von allen Projektgruppen bearbeitet werden muss. Diese Gemeinschaftsaufgabe ist eine Art Lockerungsübung, mit der man zeigen soll, dass man mit R und LATEX umgehen kann. Für die Gemeinschaftsaufgabe wird auch ein Papier erstellt. Dieses muss Mitte Juni abgegeben werden.

Gemeinschaftaufgabe

Viele Praktiker gehen im unverbundenen Zweistichprobenproblem mit stetigen Merkmalen folgendermaßen vor:
Zuerst überprüfen Sie, ob Normalverteilung unterstellt werden kann. Hierzu führen sie den K-S-Test auf Normalverteilung durch. Kann keine Normalverteilung unterstellt werden, so wenden sie den Wilcoxon-Rangsummentest an. Kann Normalverteilung unterstellt werden, so wird mit dem F-Test überprüft, ob die
Varianzen identisch sind. Lehnt der F-Test die Hypothese identischer Varianzen ab, so wird der Welch-Test durchgeführt. Ansonsten wird der t-Test durchgeführt.
Jede Gruppe der beiden Projekte soll in R eine Funktion zu schreiben, die diese Vorgehensweise automatisiert. Die Funktion erhält die beiden Datensätze als Input und führt alle Tests zum Niveau 0.05 durch. Sie liefert dem Benutzer Informationen über alle Tests, die angewendet wurden, und erzählt ihm natürlich auch, ob einUnterschied zwischen den beiden Gruppen besteht.
Die Funktion und alle statistischen Verfahren sollen in einem in LATEX erstellten Papier beschrieben werden. Außerdem soll die Funktion auf mindestens einen Datensatz angewendet werden. Der Fantasie sind natürlich keine Grenzen gesetzt. Man könnte also auch den vergleichenden Boxplot der beiden Stichproben erstellen. Ein Normal-Probality-Plot der standardisierten Merkmale ist auch bedenkenswert.

Teilprojekt 1: Robuste Schätzung der Varianz-Kovarianz-Matrix mit Anwendungen

Die empirische Varianz-Kovarianz-Matrix ist sehr ausreißerempfindlich. Es gibt eine Reihe von robusten Schätzern der Varianz-Kovarianz-Matrix, die in R in der Bibliothek lqs in den Funktionen cov.mcd, cov.mve und cov.rob zu finden sind. Die hinter diesen Funktionen stehenden Konzepte sollen beschrieben. Mit den
Funktionen sollen Datensätze, die Ausreißer enthalten, analysiert werden. Außerdem soll die Hauptkomponentenanalyse und lineare Diskriminanzanalyse auf Basis einer robusten Schätzung der Varianz-Kovarianz-Matrix in R implementiert werden und an Hand von Datensätzen in R angewendet werden.
Literatur:
P. J. Rousseeuw and A. M. Leroy (1987) Robust Regression and Outlier Detection.
P. J. Rousseeuw and K. van Driessen (1999) A fast algorithm for the minimum covariance determinant estimator. Technometrics 41, 212-223.

Teilprojekt 2: Klassische, robuste und nichtparametrische Regressionsanalyse

Die Regressionsanalyse wird detailliert in der Vorlesung "Einführung in die Ökonometrie" behandelt. Hier soll untersucht werden, welche Möglichkeiten die Funktionen lsfit und lm in R bieten.
Außerdem sollen robuste Schätzer beschrieben werden, die in R in der Bibliothek lqs in den Funktionen lmsreg, lqs und ltsreg zu finden sind.
Glätter bieten die Möglichkeit, einen nichtlinearen Zusammenhang zwischen den Variablen datengestützt zu entdecken. Für die Regression mit einer erklärenden Variablen sollen die Konzepte, die in den Funktionen aus der Bibliothek modreg berücksichtigt werden, beschrieben und in R auf Datensätze angewendet werden.
Literatur:
Chambers, J.M. (1992): Statistical models in S
Cleveland, W.S. (1991): Visualizing Data.
Draper, N.R., H. Smith (1998): Applied regression analysis
Rousseeuw, P.J., A. M. Leroy (1987) Robust Regression and Outlier Detection.

Teilprojekt 3: Loglineare Modelle

Mit Hilfe loglinearer Modelle kann man Abhängigkeitsstrukturen in hochdimensionalen Kontingenztabellen aufdecken. Anhand von Beispielen soll gezeigt werden, wie man loglineare Modelle mit der Funktion loglin in R analysiert. Es gibt unterschiedliche Verfahren zur Wahl eines geeigneten Modells. Von diesen sollen einige in R implementiert werden.
Literatur:
Christensen, R. (1997): Log linear models and logistic regression
Fahrmeir et al (1996) : Multivariate statistische Verfahren.

Teilprojekt 4: Korrespondenzanalyse

Mit Hilfe der Korrespondenzanalyse kann man die Abhängigkeitsstruktur einer zweidimensionalen Kontingenztabelle grafisch darstellen. Die Vorgehensweise der Korrespondenzanalyse soll dargestellt werden. Außerdem soll die Funktion corresp aus der Bibliothek MASS in R auf Kontingenztabellen angewendet werden.
Außerdem soll die multiple Korrespondenzanalyse dargestellt werden und in R mit der Funktion mca aus der Bibliothek MASS auf Datensätze angewendet werden.
Literatur:
Blasius, J. (2001): Korrespondenzanalyse
Everitt, B. (2002): A handbook of statistical analyses using S-Plus
Jobson, J.D.(1992): Applied multivariate data analysis. Categorical and multivariate methods .
http://www.statistik.tuwien.ac.at/oezstat/ausg983/papers/boehm.ps

Teilprojekt 5: Neuronale Netze

Neuronale Netze sind ein Verfahren der nichtlinearen Diskriminanzanalyse. Die Theorie der neuronalen Netze soll dargestellt werden. Außerdem sollen mit der Funktion nnet aus der Bibliothek nnet in R Daten mit Hilfe neuronaler Netze klassifiziert werden.
Literatur:
Ripley, B.D. (1996) : Pattern recognition and neural networks
Smith, M. (1993) : Neural networks for statistical modelling
Warner, B., M. Misra (1996): Understanding neural networks as statistical tools. American statistician, S. 284-293

Teaching staff

Dates ( Calendar view )

Frequency Weekday Time Format / Place Period  

Show passed dates >>

Subject assignments

Degree programme/academic programme Validity Variant Subdivision Status Semester LP  
Betriebswirtschaftslehre / Diplom (Enrollment until SoSe 2005) B4 Wahlpflicht 5 HS
Volkswirtschaftslehre / Diplom (Enrollment until SoSe 2005) WP03 Wahl 5 HS

No more requirements
No eLearning offering available
Registered number: 1
This is the number of students having stored the course in their timetable. In brackets, you see the number of users registered via guest accounts.
Address:
SS2003_312062@ekvv.uni-bielefeld.de
This address can be used by teaching staff, their secretary's offices as well as the individuals in charge of course data maintenance to send emails to the course participants. IMPORTANT: All sent emails must be activated. Wait for the activation email and follow the instructions given there.
If the reference number is used for several courses in the course of the semester, use the following alternative address to reach the participants of exactly this: VST_1060086@ekvv.uni-bielefeld.de
Coverage:
No students to be reached via email
Notes:
Additional notes on the electronic mailing lists
Last update basic details/teaching staff:
Friday, December 11, 2015 
Last update times:
Sunday, December 15, 2002 
Last update rooms:
Sunday, December 15, 2002 
Type(s) / SWS (hours per week per semester)
project (Pj) / 3
Department
Faculty of Business Administration and Economics
Questions or corrections?
Questions or correction requests for this course?
Planning support
Clashing dates for this course
Links to this course
If you want to set links to this course page, please use one of the following links. Do not use the link shown in your browser!
The following link includes the course ID and is always unique:
https://ekvv.uni-bielefeld.de/kvv_publ/publ/vd?id=1060086
Send page to mobile
Click to open QR code
Scan QR code: Enlarge QR code
ECTS points
5
(Also refer to the credit information in connection with the subject assignments)
ID
1060086