Spezialvorlesung Wissensentdeckung in Datenbanken
Veranstaltung |
Wochentag |
Termin |
Ort |
042519 |
Dienstag |
10.15 - 12.00 |
HGII, HS4 |
042519 |
Donnerstag |
14.15 - 16.00 |
HGII, HS4 |
Inhalt:
Die Vorlesung gibt einen Überblick über die Datenanalyse in großen Datenbanken. Der Prozess der
Datenanalyse wird anhand des CRISP-Modells vorgestellt, eine Unterstützung der Vorverarbeitungs- und
Lernschritte bietet das System Rapid Miner. Für die einzelnen Schritte des Datenanalyseprozesses werden
jeweils typische Verfahren vermittelt. Die wichtigsten Verfahren der komplexen Datenanalyseverfahren aus
Statistik oder Maschinellem Lernen werden vorgestellt. Als besonders wichtige Data Mining Methoden werden
Klassifikations- und Clustering-Verfahren eingeführt, darunter die k-means-Methode, das Bestimmen von
Entscheidungsbäumen, Assoziationsregeln und die Stützvektormethode. Einen Schwerpunkt bildet auch die
Abschätzung der Glaubwürdigkeit der Ergebnisse mit Hilfe von geeigneten Testdesigns wie z.B.
Kreuzvalidierung oder Bootstrapping. In den Übungen wird die Datenanalyse anhand von Daten aus der
Praxis eingeübt. Interdisziplinäre Veranstaltung Diese Veranstaltung finden im interdisziplinären
Rahmen zusammen mit dem Fachbereich Statistik statt.
Literatur:
Empfohlene Literatur wird in der Vorlesung bekannt gegeben,
U.a.:
-
- Hastie, T., Tibshirani, R., Friedman, J. (2001). The Elements of Statistical Learning. Springer.
- Hand, D., Mannila, H., Smyth, P. (2001). Principles of Data Mining. MIT Press.
- Witten, I.H., Frank, E. (2001): Data Mining ? Praktische Werkzeuge und Techniken für das maschinelle Lernen.
- Mitchell, Tom (1997): Machine Learning, McGraw Hill, 1997
- Skript: Ja (teilweise als Folien)
Bemerkung:
Erwünschte Mitarbeit der Studierenden:
- - Zu jeder Vorlesungsstunde kommen und zuhören!
- - Nachbereiten, indem Materialien gelesen und Fragen in der Gruppe diskutiert werden.
Lernziele:
- - Verstehen der verschiedenen Fachsprachen
- - Kennen der wichtigsten Verfahren
- - Überblick über den gesamten Prozess der Wissensentdeckung
- - Handhabung verschiedener Werkzeuge
Voraussetzungen:
Erforderliche Kenntnisse:
Vordiplom Informatik, Bachelor Informatik
Leistungsnachweis:
Sinnvolles Bearbeiten der Übungsaufgaben
Folien & Übungen:
Die Folien zur Vorlesung, sowie
Informationen zu den Übungen, die Übungsbätter, usw. finden sich
auf der Übungsseite.