Digicampus
Seminar: Projektseminar Data Mining - Details
Sie sind nicht in Stud.IP angemeldet.
Lehrveranstaltung wird online/digital abgehalten.

Allgemeine Informationen

Veranstaltungsname Seminar: Projektseminar Data Mining
Semester WS 2018/19
Aktuelle Anzahl der Teilnehmenden 0
erwartete Teilnehmendenanzahl 30
Heimat-Einrichtung Prof. Dr. Yarema Okhrin - Statistik
Veranstaltungstyp Seminar in der Kategorie Lehre
Erster Termin Donnerstag, 20.12.2018 08:00 - 16:00, Ort: (Geb J, Seminarraum 2102)
Voraussetzungen Voraussetzung für eine erfolgreiche Teilnahme sind solide statistische Kenntnisse, welche in den Veranstaltungen Statistik I und II vermittelt werden. Der Besuch der Data Mining Veranstaltung im Sommersemester 2018 wäre wünschenswert. Zudem werden Grundkenntnisse in der Statistiksprache R verlangt, so wie sie bspw. in den Veranstaltungen Statistik I/II vermittelt werden und die Bereitschaft, sich in die Statistiksprache R tiefergehend einzuarbeiten.
Leistungsnachweis Das Projektseminar Data Mining schließt mit einer computergestützten Präsentation (~60 min. zzgl. 15 Min. Diskussionszeit je Gruppe) sowie einer schriftlichen Ausfertigung, mit welcher wesentliche methodische und empirische Erkenntnisse zusammengefasst werden sollen (~5-7 Seiten je TeilnehmerIn).
Online/Digitale Veranstaltung Veranstaltung wird online/digital abgehalten.
Hauptunterrichtssprache deutsch
Weitere Unterrichtssprache(n) englisch
Literaturhinweise - Breiman, Friedman, Olshen, Stone, (1998): Classification and Regression Trees, Chapman & Hall.
- Fahrmeir, Kneib, Lang (2007): Regression - Modelle, Methoden und Anwendungen, Springer.
- James, Witten, Hastie, Tibshirani (2013): An Introduction to Statistical Learning - with Applications in R, Springer.
- Hastie, Tibshirani, Friedman (2009): The Elements of Statistical Learning – Data Mining, Inference and Prediction, Springer.
- Hothorn, Everitt: A Handbook of Statistical Analyses using R, Chapman and Hall/CRC; 3 edition, 2014.
- Rousseeuw, Kaufman (2005): Finding Groups in Data – An Introduction to Cluster Analysis, John Wiley & Sons Inc.
- Wollschläger: Grundlagen der Datenanalyse mit R - Eine anwendungsorientierte Einführung , Springer, 2017.
- u.v.w. themenbezogene Fachliteratur
Sonstiges Die Bewerbung um einen Seminarplatz erfolgt vom 04.10.2018 bis zum 18.10.2018 per E-Mail an Anett Wins (anett.wins@wiwi.uni-augsburg.de) unter Beachtung der auf der Homepage angegeben Anmeldeformalitäten.
Die Themen werden in kleinen Gruppen zu 2-3 StudentInnen bearbeitet. Die Präsentationen erfolgen geblockt am 20./21. Dezember 2018.

Räume und Zeiten

(Geb J, Seminarraum 2102)
Donnerstag, 20.12.2018 - Freitag, 21.12.2018 08:00 - 16:00

Kommentar/Beschreibung

Es werden verschiedene Data Mining Verfahren angeboten, die von den Seminarteilnehmern in kleinen Gruppen methodisch ausgearbeitet und empirisch umgesetzt werden:

1. Data Preprocessing und Visualisierung (R-Vorkenntnisse erforderlich!)
2. Logistische Regressionsanalyse – das Logit -Modell
3. ANOVA: ein- und mehrfaktorielle Varianzanalyse
4. Clusteranalyse I – hierarchische Clusteranalyse
5. Clusteranalyse II – partitionierende Clusteranalyse (k-Means, PAM)
6. Hauptkomponentenanalyse (PCA)
7. Zeitreihenanalyse – Analyse von Longitudinaldaten
8. Künstliche Neuronale Netze – überwachtes Lernen in vorwärts gerichteten Netzen
9. Entscheidungsbäume – rekursive Partitionierung mittels CART-Algorithmus
10. Frequent Pattern Mining – eine Warenkorbanalyse
11. Textmining mit R (R-Vorkenntnisse erforderlich!)