Information Mining
Formalia
- Zielgruppe
- Angewandte Informatik Master
- Komedia Master
- ISE Master
- BWL Master mit 2+1 Wochenstunden und 4 Kreditpunkten : nur Data-Mining-Teil
Termine
Vorlesung
Tag | Zeit | Beginn | Ort |
Dienstag | 10:15 - 12:40 | LC/137 |
Übungen
Tag | Zeit | Beginn | Ort | Betreuer |
Dienstag | 12:45 - 13:30 | LC/137 | Dr.-Ing. Dipl.-Inform. Vu Tran |
Prüfungstermine
Mündliche Prüfung
Zeitraum | Ort |
---|---|
14.09.2015 - 18.09.2015 | LF/135 |
Die Einzeltermine werden nach Ablauf der Rücktrittsfrist
(1 Woche) hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert
sein, senden Sie bitte eine Mail an unsere Sekretärin Fr. Ufermann. Dabei beachten Sie bitte folgende Hinweise:
- Melden Sie sich bitte frühestens 4 Wochen vorher (sonst melden sich viele, die die Prüfung dann doch nicht machen) und spätestens am 30.8.
- Da voraussichtlich die Prüfungen nur von Dienstag-Donnerstag stattfinden, können Wünsche für Montag oder Freitag nicht berücksichtigt werden.
- Sie sollten an mindestens einem dieser 3 Tage ganztägig verfügbar sein. Wenn Sie nur an einem halben Tag können, werden wir uns bemühen, können aber nichts versprechen.
- Wenn Sie zu 2 Prüfungen angemeldet sind, werden diese immer an einem Termin abgehandelt.
- Wenn Sie in diesem Zeitraum gar nicht können, werden wir einen Sondertermin ausmachen. Nur in diesem Fall senden Sie bitte eine Email direkt an Prof. Fuhr, aber nicht vor dem 1.7.
Beschreibung
Information Mining beschäftigt sich mit dem Extrahieren von impliziten, noch unbekannten Informationen aus Rohdaten (Data Mining), Texten (Text Mining), Graphen (Graph Mining) oder Prozessen (Process Mining). Dazu sollen Computer in die Lage versetzt werden, Datenbestände automatisch nach Gesetzmäßigkeiten und Mustern zu durchsuchen und einen Abstraktionsprozess durchzuführen, der als Ergebnis aussagekräftige Informationen liefert. Das maschinelle Lernen stellt dafür die Werkzeuge und Techniken zur Verfügung.
Anwendungen finden sich heute vor allem im Bereich 'Business Intelligence', der systematischen Datenanalyse mit dem Ziel, vorhandene Geschäftsprozesse zu optimieren oder neue Produkte und Dienstleistungen zu konzipieren. Aktuell spielt zudem das Thema 'Big Data' eine Rolle, wo es um die Auswertung von Massendaten aus Wirtschaft, Wissenschaft und Verwaltung geht (die z.B. auch mit Sensor-Netzwerken gesammelt werden).
Vorlesungsmaterial
- Der Data-Mining-Teil basiert auf dem Lehrbuch 'Data Mining' von Ian Witten und Eibe Frank. Die Buchkapitel sind aus dem Universitätsnetz online als PDF abrufbar .
- Clustering-Tutorial und Demo
- Video Lecture: Learning with Probabilities
- Roberto Zicari: Big Data
-
Weiterführende Literatur:
- Thomas A. Runkler; Data Mining. Vieweg+Teubner 2009
- Trevor Hastie, Robert Tibshirani, Jerome Friedman: The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2009 Series in Statistics
Folien
Einige Folienkapitel sind aus Copyright-Gründen nur innerhalb der UDE erreichbar!
-
Data Mining
- Kapitel 1: Einführung odp pdf
- Kapitel 2: Eingabe: Konzepte, Instanzen, Attribute odp pdf
- Kapitel 3: Ausgabe: Wissensrepräsentation odp pdf
- Kapitel 4: Algorithmen: Die grundlegenden Methoden odp pdf
- Kapitel 5: Glaubwürdigkeit: Auswertung des Gelernten odp pdf
- Kapitel 6: Implementierung: Maschinelles Lernen in der Praxis odp pdf
- Kapitel 7: Transformationen: Aufbereitung der Ein- und Ausgabe odp pdf
- Kapitel 8: Ensemble-Lernen odp pdf
- Random Forests (nicht prüfungsrelevant): pdf
- Data Warehouse: odp pdf
- Big Data (prüfungsrelevant bis S. 68): (Lokal) (Slideshare)
- Zeitreihen
- Process Mining
- Graph Mining
- Deep
Learning
- FHNW Tutorial on deep learning ppt pdf (local)
Übungen
- Übungsblatt 1
- Übungsblatt 2
- Übungsblatt 3
- Übungsblatt 4
- Übungsblatt 5
- Übungsblatt 6
- Übungsblatt 7
- Übungsblatt 8
- Übungsblatt 9
- Übungsblatt 10
- Übungsblatt 11
- Übungsblatt 12
Hilfreiche Links zu RapidMiner
- RapidMiner-Download bei Sourceforge
- RapidMiner-Dokumentation
- Pressemeldung: Datamining: RapidMiner liegt vorn