Navigation

Data Science: Datenauswertung

Informationen zur Auswirkungen der Corona-Epidemie

Wegen der coronabdingten Einschränkungen werden Vorlesung und R-Übung für dieses Modul im Wintersemester 2020/21 leider nur online angeboten. Für aktuelle Informationen bitte ab Mitte Oktober unbedingt die Kommunikation auf StudOn beachten!

Überblick

Statistik und Wahrscheinlichkeitsrechnung verfolgen uns tagtäglich. Hilft ein bestimmtes Medikament gegen Kopfschmerzen? Wie lange warte ich im Schnitt auf die U-Bahn? Können Frauen besser Autofahren als Männer? Und natürlich sind statistische Verfahren auch nicht aus der Welt der BWL, VWL oder Soziologie wegzudenken. Wie hoch ist das durchschnittliche Haushaltseinkommen in Deutschland? In welchem Land sind die Einkommen besonders ungleich verteilt? Dauert es im Schnitt weniger als X Monate bis ein(e) Arbeitslose(r) wieder einen Job gefunden hat?

Dieser Kurs gibt eine Einführung in statistische Methoden, die im Bereich Data Science dazu gebraucht werden, um i) Daten zu beschreiben, und v) große Datensätze mittels Maschinellen Lernens zu analysieren.

Da mehr und mehr Berufsbilder in Wirtschaft und Forschung das praktische Arbeiten mit Datensätzen beinhalten, umfasst der Kurs auch eine Einführung in die praktische Umsetzung der Datenauswertung mittels der Statistiksoftware R.

Studierende, die den Kurs erfolgreich abschließen, können i) Datensätze mittels geeigneter Maßzahlen beschreiben, ii) geeignete Formen zur Visualisierung von Daten auswählen,  iii) die Funktionsweise ausgewählter Verfahren des Maschinellen Lernens erklären und iv) die behandelten Methoden praktisch in der Statistiksoftware R implementieren.

Kursorganisation

Das Modul hat einen Umfang von 5 ECTS und wird jeweils in der ersten Hälfte des Wintersemesters unterrichtet.Kurssprache ist Deutsch.

Bitte beachten: Im Wintersemester 2020/21 ist das Modul nur für Studierende im ersten Fachsemester des BA Wirtschaftswissenschaften sowie Studierende im BA Sozialökonomik, die das Vorgängermodul „Statistik“ noch nicht belegt haben, relevant. Studierenden des BA Sozialökonomik, die für das alte Modul „Statistik“ einen Rücktritt (RT), ein Versäumnis mit Grund (VM) oder eine Annullierung (AN) im Erstversuch erhalten haben, müssen ab sofort dieses neue Modul (und das Modul „Data Science: Statistik“) belegen. Auch wenn Studierende des BA Sozialökonomik bei der Prüfung für das alte Modul „Statistik“ im vergangenen Semester im Erstversuch mitgeschrieben und nicht bestanden haben, müssen sie ab dem WS 20/21 die beiden neuen Prüfungen ablegen, da der Erstversuch wegen der Corona-Regelung annulliert wird. Nur wenn Studierende des BA Sozialökonomik bereits in der Wiederholungsphase für das alte Modul „Statistik“ waren, also im Zweit- oder Drittversuch, müssen sie weiterhin das begonnene, alte Modul absolvieren.

Der Kurs läuft über die Hälfte des Semesters und besteht in dieser Zeit aus zwei Vorlesungen pro Woche (2 SWS), einer Übung (1 SWS), einer R-Übung (1 SWS), sowie einem Tutorium (fakultativ, 1 SWS).

Im Wintersemester 2020/21 werden Teile des Moduls online unterrichtet – bitte die Informationen im Syllabus und auf StudOn beachten. Alle Veranstaltungen beginnen in der ersten Semesterwoche ab dem 2. November 2020.

Hinweise zur Klausur

Das Modul wird mit einer schriftlichen Klausur (60 Minuten) im Single-Choice-Format geprüft, die auch Fragen zur praktischen Umsetzung statistischer Analysen in R beinhaltet. Die erste Prüfung findet in der Mitte des Wintersemesters im Dezember statt. Eine Möglichkeit zum Wiederholen der Prüfung gibt es in der regulären Prüfungsperiode am Ende des Wintersemesters.

Als Hilfsmittel bei der Klausur sind zugelassen:

  • die vom Lehrstuhl herausgegebene Formelsammlung (farbliche Hinterlegung von Textpassagen und/oder Formeln oder Post-Its ohne Beschriftung sind gestattet, andere Einträge nicht)
  • ein nicht-programmierbarer Taschenrechner

Zur Orientierung können Sie sich alte Klausuren des Vorgängermoduls „Statistik“ anschauen. Wir stellen eine Auswahl auf dieser Seite zum Download zur Verfügung. Bitte beachten Sie, dass das Format der Klausuren anders ist (vor dem Wintersemester 2019/20 nur Freitextaufgaben, danach ein Mix aus Freitext- und Single-Choice-Aufgaben) und auch ein breiteres Spektrum an Inhalten abgedeckt wird.

Hinweise zur Literatur

Die Vorlesung orientiert sich an folgendem Lehrbuch, das für Sie in der FAU-Bibliothek online verfügbar ist:

  • Schlittgen, Rainer (2012), Einführung in die Statistik – Analyse und Modellierung von Daten (12. Auflage), Oldenbourg Wissenschaftsverlag GmbH, München.

Für den Themenbereich „Maschinelles Lernen“ ist außerdem das folgende Lehrbuch relevant:

  • James, Gareth, Daniela Witten, Trevor Hastie und Robert Tibsirani (2013), An Introduction to Statistical Learning, Springer, Heidelberg.

Darüber hinaus empfehlen wir für Studierende, die nach weiterer Literatur über die Grundlagen der Statistik suchen, die beiden folgenden Lehrbücher:

  • Mosler, Karl und Friedrich Schmid (2006), Beschreibende Statistik und Wirtschaftsstatistik, 3. Ausgabe, Springer, Heidelberg.
  • Mosler, Karl und Friedrich Schmid (2006), Wahrscheinlichkeitsrechnung und schließende Statistik, 2. Ausgabe, Springer, Heidelberg.

Syllabus

Detaillierte Informationen über den Kurs finden Sie zusammengefasst auch im aktuellen Syllabus.

Mathematikgrundlagen

Die naturwissenschaftliche Faktultät der FAU bietet auf StudOn eine Seite an, mit Hilfe derer Sie den Mathematikstoff aus der Mittelstufe und Oberstufe wiederholen können. Wir empfehlen, dass Sie diese Seite nutzen, um für sich zu kontrollieren, ob Sie diese Grundlagen beherrschen. Falls nicht bietet die Seite auch Übungsaufgaben an, mit denen Sie Ihr Wissen auffrischen können.