Information Mining
Lehrpersonen
- Dozent(in)
- Übungsleiter(innen)
Formalia
- Zielgruppe
- Angewandte Informatik Master mit 6 Kreditpunkten
- Komedia Master mit 6 Kreditpunkten
- ISE Master mit 6 Kreditpunkten
- BWL Master mit 2+1 Wochenstunden und 4 Kreditpunkten : nur Data-Mining-Teil
Termine
Vorlesung
Tag | Zeit | Beginn | Ort |
Dienstag | 12:30 - 14:55 | LB/131 |
Übungen
Tag | Zeit | Beginn | Ort | Betreuer |
Dienstag | 15:00 - 15:45 | LB/131 | Michael Rist, M.Sc. |
Prüfungstermine
Mündliche Prüfung
Zeitraum | Ort |
---|---|
7.03.2016 - 10.03.2016 | LE/313 |
Die Einzeltermine werden nach Ablauf der Rücktrittsfrist
am 1. 3. hier auf der Webseite bekanntgegeben.
Falls (und nur dann!!!) Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert
sein sollten, senden Sie bitte eine Mail an unsere Sekretärin Fr. Ufermann. Dabei beachten Sie bitte folgende Hinweise:
- Melden Sie sich bitte frühestens 4 Wochen vorher (sonst melden sich viele, die die Prüfung dann doch nicht machen) und spätestens am 22.2.
- Da voraussichtlich die Prüfungen nur von Dienstag-Donnerstag stattfinden, können Wünsche für Montag oder Freitag nicht berücksichtigt werden.
- Sie sollten an mindestens einem dieser 3 Tage ganztägig verfügbar sein. Wenn Sie nur an einem halben Tag können, werden wir uns bemühen, können aber nichts versprechen.
- Wenn Sie zu 2 Prüfungen angemeldet sind, werden diese immer an einem Termin abgehandelt.
- Wenn Sie in diesem Zeitraum gar nicht können, werden wir einen Sondertermin ausmachen. Nur in diesem Fall senden Sie bitte eine Email direkt an Prof. Fuhr, aber nicht vor dem 15.1.
Beispiel-Prüfungsfragen: deutsch englisch
Beschreibung
Information Mining beschäftigt sich mit dem Extrahieren von impliziten, noch unbekannten Informationen aus Rohdaten (Data Mining), Texten (Text Mining), Graphen (Graph Mining) oder Prozessen (Process Mining). Dazu sollen Computer in die Lage versetzt werden, Datenbestände automatisch nach Gesetzmäßigkeiten und Mustern zu durchsuchen und einen Abstraktionsprozess durchzuführen, der als Ergebnis aussagekräftige Informationen liefert. Das maschinelle Lernen stellt dafür die Werkzeuge und Techniken zur Verfügung.
Anwendungen finden sich heute vor allem im Bereich 'Business Intelligence', der systematischen Datenanalyse mit dem Ziel, vorhandene Geschäftsprozesse zu optimieren oder neue Produkte und Dienstleistungen zu konzipieren. Aktuell spielt zudem das Thema 'Big Data' eine Rolle, wo es um die Auswertung von Massendaten aus Wirtschaft, Wissenschaft und Verwaltung geht (die z.B. auch mit Sensor-Netzwerken gesammelt werden).
Vorlesungsmaterial
- The Data Mining part is based on the book 'Data Mining' by Ian Witten and Eibe Frank. The book chapters can be accessed/downloaded from the university network as PDF files. .
-
Clustering Tutorial
Clustering Demo - Video Lecture: Learning with Probabilities
- Roberto Zicari: Big Data
- Pieters: Deep Learning for NLP (Talk slides)
- Deep learning Demos:
-
Further reading:
- Pedro Domingos: A few useful things to know about machine learning
- On Big Data and Data Science. Interview with James Kobielus, IBM Big Data Evangelist.
- Thomas A. Runkler; Data Mining. Vieweg+Teubner 2009
- Trevor Hastie, Robert Tibshirani, Jerome Friedman: The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2009 Series in Statistics
- Shai Shalev-Shwartz, Shai Ben-David: Understanding Machine Learning: From Theory to Algorithms
Folien
For copyright reasons, some chapters are accessible from the university network only!
Introduction to IM: pdf
-
Data Mining
- Chapter 1: Introduction odp pdf
- Chapter 2: Imput: Concepts, Instances, Attributes odp pdf
- Chapter 3: Output: Knowledge Representation odp pdf
- Chapter 4: Algoriths: The Basic Methods odp pdf
- Chapter 5: Credibility: Evaluating what's been learned odp pdf
- Chapter 6: Implementation: Real machine learning schemes odp pdf
- Chapter 7: Data transformations odp pdf
- Chapter 8: Ensemble learning odp pdf
- Random Forests (not relevant for exam) pdf
- Data Warehouse: (not relevant for exam) odp pdf
- Big Data: (Lokal) (Slideshare)
- Wiederholung
- Mining Time Series and Sequences
- Process Mining
- Graph Mining
- Deep learning (not relevant for exam) pdf
Übungen
- Exercise sheet 1
- Exercise sheet 2
- Exercise sheet 3
- Exercise sheet 4
- Exercise sheet 5
- Exercise sheet 6
- Exercise sheet 7
- Exercise sheet 8
- Exercise sheet 9
- Exercise sheet 10
- Exercise sheet 11
- Exercise sheet 12
- Exercise sheet 13
Hilfreiche Links zu RapidMiner
- RapidMiner-Download bei Rapidminer.com
- RapidMiner-Dokumentation
- Pressemeldung:Datamining: RapidMiner liegt vorn