Data analysis is the process of systematically applying statistical and logical techniques to describe, summarize, visualize and compare data. It has become an important subject in many scientific branches and its correct usage is essential regarding the evaluation and presentation of scientific results. Multiscale or multiresolution analysis is a modern way to explore the information content of data provided and is particularly useful when combined with more conventional techniques for statistical data analysis. The lecture starts with a brief discussion of those elementary statistical concepts that provide the necessary foundations for more specialized expertise in any area of statistical data analysis. This contains the basic concepts for the calculus of probability theory, various distributions and simple concepts regarding multivariate statistics. Following explorative data analysis and introducing sophisticated concepts for plotting data, various techniques are discussed in more detail, including tests on covariance matrices, maximum likelihood estimation, method of least squares and other fitting procedures, discriminant analysis tools, hierarchical and metric methods, tools for pattern recognition, regression techniques, principal component analysis and finally deriving methods for time-series and incomplete data analysis. Applications and practical examples are provided in the framework of the MATLAB programming environment within the lecture and as possible exercises.
Deutsch:
Unter Datenanalyse versteht man allgemein die systematische Anwendung statistischer und numerischer Methoden um Daten zu beschreiben, zu visualisieren und zu vergleichen. Datenanalyse ist ein bedeutender Bestandteil unterschiedlicher wissenschaftlicher Fachrichtungen und die Auswahl geeigneter Methoden sowie ihre korrekte Umsetzung ist zur Auswertungen und Darstellung wissenschaftlicher Ergebnisse fundamental. Die Multiskalen-Analyse (multiresolution analysis) ist eine derzeit h ?aufig verwendete Methode um den Informationsgehalt von Daten zu untersuchen und ist gerade in Verbindung mit eher konventionellen Techniken zur statistischen Datenanalyse besonders geeignet. Die Vorlesung beginnt mit einer Einf ?uhrung in zun ?achst elementare Konzepte, welche die notwendige Voraussetzung f ?ur eine vertiefende Kenntnis in den verschiedenen Ausrichtungen der statistischen Datenanalyse darstellen. Dabei wird auf grundegende Begriffe wie Datenmatrizen, Zufallsvariablen, unterschiedliche Zufallsverteilungen und einfache Grundlagen der univariaten und multivariaten Statistik Bezug genommen. Ausgehend von der explorativen Datenanalyse und der Einf ?uhrung geeigneter Methoden zur Ausgabe und Darstellung von Daten, folgen detailierte Betrachtungen zu Kovarianzmatrizen, Hauptkomponentenanalyse, Diskriminanzanalyse und Maximum-Likelihood-Entscheidungsregel, lineare Regression und Kleinste-QuadrateMethode, Daten-Anpassung (fitting), hierarchische und metrische Verfahren, Werkzeuge f ?ur Mustererkennung und abschließend Methoden zur Analyse von Zeitserien und unvollst ?andiger Datens ?atze. Anwendungen und praktische Beispiele werden als ?Ubungsaufgaben auf dem Computer in der MATLAB oder S-Plus Umgebung bereitgestellt und entweder in der Vorlesung oder in Form betreuter ?Ubungen besprochen.
Grundlagen der Linearen Algebra und Analysis; Programmierkenntnisse sind nicht erforderlich, da diese in den Übungen vermittelt werden sollen.
Je nach Wunsch der Studierenden findet die Vorlesung in Englisch oder Deutsch statt.
Audience and requirements:
This course will provide an introduction to the concepts of multiscale and statistical data analysis with special emphasis on applications and practical implementations of the various techniques discussed. The lecture is designed to be accessible by higher level undergraduate students and graduate students who are familiar with some basic mathematical formula, such as taught in computer science, biology and physics. In particular, the course is devoted to students of computer science regarding the subjects Bioinformatics and Naturwissenschaftliche Informatik. The students are invited to contribute with seminars on selected topics.
For more information, including a comprehensive list of suggested literature, please visit the webpage of the lecture:
Frequency | Weekday | Time | Format / Place | Period |
---|
Degree programme/academic programme | Validity | Variant | Subdivision | Status | Semester | LP | |
---|---|---|---|---|---|---|---|
Bioinformatik und Genomforschung / Master | (Enrollment until SoSe 2012) | Wahl | 2. | scheinfähig Benotet/unbenotet | |||
Graduate School in Bioinformatics and Genome Research / Promotion | scheinfähig Benotet/unbenotet | ||||||
Molekulare Biotechnologie / Diplom | (Enrollment until SoSe 2004) | scheinfähig HS | |||||
Naturwissenschaftliche Informatik / Diplom | (Enrollment until SoSe 2004) | scheinfähig HS | |||||
Naturwissenschaftliche Informatik / Diplom | (Enrollment until SoSe 2004) | Physik | Teilleistung mündliche Prüfung möglich HS |