Information Mining
Formalia
- Zielgruppe
- Angewandte Informatik Master mit 6 Kreditpunkten
- Komedia Master mit 6 Kreditpunkten
- ISE Master mit 6 Kreditpunkten
- BWL Master mit 2+1 Wochenstunden und 4 Kreditpunkten : nur Data Mining
- Medizintechnik Master mit 6 Kreditpunkten
Termine
Vorlesung
Tag | Zeit | Ort |
2. 11. 20 | - | Online/Moodle |
Übungen
Tag | Zeit | Beginn | Ort | Betreuer |
Tuesday | 15:00 - 15:45 | Online/Moodle | Dr. Ahmet Aker |
Prüfungstermine
Klausur
Tag | Zeit | Ort |
8. 3. 2021 | 15:00 - 17:00 |
Beschreibung
Information Mining beschäftigt sich mit dem Extrahieren von impliziten, noch unbekannten Informationen aus Rohdaten (Data Mining), Texten (Text Mining), Graphen (Graph Mining) oder Prozessen (Process Mining). Dazu sollen Computer in die Lage versetzt werden, Datenbestände automatisch nach Gesetzmäßigkeiten und Mustern zu durchsuchen und einen Abstraktionsprozess durchzuführen, der als Ergebnis aussagekräftige Informationen liefert. Das maschinelle Lernen stellt dafür die Werkzeuge und Techniken zur Verfügung.
Anwendungen finden sich heute vor allem im Bereich 'Business Intelligence', der systematischen Datenanalyse mit dem Ziel, vorhandene Geschäftsprozesse zu optimieren oder neue Produkte und Dienstleistungen zu konzipieren. Aktuell spielt zudem das Thema 'Big Data' eine Rolle, wo es um die Auswertung von Massendaten aus Wirtschaft, Wissenschaft und Verwaltung geht (die z.B. auch mit Sensor-Netzwerken gesammelt werden).
Die Vorlesung wird auf Englisch gehalten!
Vorlesungsmaterial
-
The major part of the course
is based on the book
'Data Mining' by Ian
Witten et al..
(There is also 4th edition, but the course presents the new material in a different way).
READ THIS BOOK! - Other books:
-
Charu C. Aggarwal: Data Mining: The Textbook, Springer, May 2015
(PDF)
(extensive treatment of advanced application like spatial and graph data, sequences, Web, social media, and privacy issues) - Jürgen Cleve, Uwe Lämmel: Data Mining. De Gruyter, 2016 (easy read, covers a subset of the Witten et al. book).
- Shai Shalev-Shwartz, Shai Ben-David: Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press, 2014.
- Mohammed J. Zaki, Wagner Meira: Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
-
Charu C. Aggarwal: Data Mining: The Textbook, Springer, May 2015
(PDF)
Vorlesungsmaterial
- Lehrangebot des Fachgebiets
-
Clustering Tutorial
Clustering Demo - Roberto Zicari: Big Data
- Pieters: Deep Learning for NLP (Talk slides)
- Deep learning Demos:
-
Further reading:
- François Chollet: On the Measure of Intelligence
- Daniel Tunkelang: 10 Things Everyone Should Know About Machine Learning
- SZ article on Data Analytics (in German): Das Erwachen, SZ vom 1.11.16
- Pedro Domingos: A few useful things to know about machine learning
- On Big Data and Data Science. Interview with James Kobielus, IBM Big Data Evangelist.
Übungen
Exercise sheets can be found in the Moodle course.
The exercises will begin on 10th of November 2020 at 3pm. The exercises will happen weekly through BigBlueButton (access through Moddle). You can use this link to participate. There are no solution submissions. However, instead during the exercise session you can present your solution and collect bonus points. To collect your bonus point you have to present at least 3 times successfully. A bonus point help to improve your exam results by 0.3, i.e. if you have 1.3 in your exam the bonus point make it to 1.0. Since we will be using the online system BigBlueButton for presentation it is advised you prepare your solution as power point and use PDF version while presenting. During the exercise I will read the question. You can raise your interest to present your solution. If there are more than one student interested in presenting there will be a selection through a number guess. The selected student can then upload his/her solution for presentation. The first exercise sheet will be uploaded on the 3rd of November and discussed on the 10th of November 2020.