Information Mining
Formalia
- Zielgruppe
- Angewandte Informatik Master mit 6 Kreditpunkten
- Komedia Master mit 6 Kreditpunkten
- ISE Master mit 6 Kreditpunkten
- BWL Master mit 2+1 Wochenstunden und 4 Kreditpunkten : nur Data Mining Kap. 1-7
Termine
Vorlesung
Tag | Zeit | Beginn | Ort |
Tuesday | 12:30 - 14:55 | LB/131 |
Übungen
Tag | Zeit | Beginn | Ort | Betreuer |
Tuesday | 15:00 - 15:45 | LB/131 | Dr. Ahmet Aker |
Prüfungstermine
Mündliche Prüfung
Zeitraum | Ort |
---|---|
27.03.2017 - 31.03.2017 | LE/313 |
As usual, you have to register at the Prüfungsamt for the exams. Normally, you have to do nothing else!
We will schedule your exam during the period specified above. The personal appointments for the oral exams will be announced at our Web site on the last Tuesday before the exam week
Only if (and only then!!!) you are not available on single days of the examination period, please send an email to our secretary Fr. Ufermann. Please observe the following guidelines:
- Do not mail us earlier than 4 weeks before, and no later than 2 weeks before the exam period.
- Most likely, exams will only take place from Monday-Thursday, so requests for Friday cannot be considered.
- You should be available full-day on at least one of these days - in case you are available for a half day only, we will try our best.
- In case you registered for 2 exams, both will be held together.
- In case you are not at all available in the above period, we will try to find a separate exam date for you. Only in this case, send an email directly to Prof. Fuhr, but not before July 1.
Emails not following the rules from above will not be answered (like those saying 'Please give me an appointment for my exam in ...', or emails not originating from an uni-due.de mail account)
Beschreibung
Information Mining beschäftigt sich mit dem Extrahieren von impliziten, noch unbekannten Informationen aus Rohdaten (Data Mining), Texten (Text Mining), Graphen (Graph Mining) oder Prozessen (Process Mining). Dazu sollen Computer in die Lage versetzt werden, Datenbestände automatisch nach Gesetzmäßigkeiten und Mustern zu durchsuchen und einen Abstraktionsprozess durchzuführen, der als Ergebnis aussagekräftige Informationen liefert. Das maschinelle Lernen stellt dafür die Werkzeuge und Techniken zur Verfügung.
Anwendungen finden sich heute vor allem im Bereich 'Business Intelligence', der systematischen Datenanalyse mit dem Ziel, vorhandene Geschäftsprozesse zu optimieren oder neue Produkte und Dienstleistungen zu konzipieren. Aktuell spielt zudem das Thema 'Big Data' eine Rolle, wo es um die Auswertung von Massendaten aus Wirtschaft, Wissenschaft und Verwaltung geht (die z.B. auch mit Sensor-Netzwerken gesammelt werden).
Die Vorlesung wird auf Englisch gehalten!
Vorlesungsmaterial
Die Folien zur Vorlesung sowie die Übungsblätter können über ILIAS heruntergeladen werden. Dafür bitte folgende Schritte verfolgen:
- Shibboleth Login -> Anmeldung mit Uni-Kennung
- Klicke: Magazin -> Information Systems -> Information Mining
- Button "Beitreten" anklicken
Vorlesungsmaterial
-
The Data Mining part is based on the book
'Data Mining' by Ian Witten and Eibe Frank.
The book chapters can be
accessed/downloaded from
within the university network
as PDF files.
.
READ THIS BOOK!
(The 2017 edition can be found here.) -
Clustering Tutorial
Clustering Demo - Video Lecture: Learning with Probabilities
- Roberto Zicari: Big Data
- Pieters: Deep Learning for NLP (Talk slides)
- Deep learning Demos:
-
Further reading:
- SZ article on Data Analytics (in German): Das Erwachen, SZ vom 1.11.16
- Pedro Domingos: A few useful things to know about machine learning
- On Big Data and Data Science. Interview with James Kobielus, IBM Big Data Evangelist.
- Jürgen Cleve, Uwe Lämmel: Data Mining. De Gruyter, 2016 (easy read, covers a subset of the Witten/Frank book).
- Thomas A. Runkler; Data Mining. Vieweg+Teubner 2009
- Trevor Hastie, Robert Tibshirani, Jerome Friedman: The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2009 Series in Statistics
- Shai Shalev-Shwartz, Shai Ben-David: Understanding Machine Learning: From Theory to Algorithms
- Mohammed J. Zaki, Wagner Meira: Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
Course structure
Introduction to IM:
-
Data Mining
- Chapter 1: Introduction
- Chapter 2: Imput: Concepts, Instances, Attributes
- Chapter 3: Output: Knowledge Representation
- Chapter 4: Algoriths: The Basic Methods
- Chapter 5: Credibility: Evaluating what's been learned
- Chapter 6: Implementation: Real machine learning schemes
- Chapter 7: Data transformations
- Chapter 8: Ensemble learning
- Deep learning
- Big Data
- Mining Sequential Patterns:
- Graph Mining
- Process Mining