Information Mining
Formalia
- Zielgruppe
- Angewandte Informatik Master
- DAI Hauptstudium mit 8 Kreditpunkten : Bereich "D"
- Komedia Master
- Kommedia Master
- ISE Master
Termine
Vorlesung
Tag | Zeit | Ort |
Mittwoch | 12:30 - 15:00 | LC/137 |
Übungen
Tag | Zeit | Ort | Betreuer |
Mittwoch | 15:05 - 15:50 | LC/137 | Dipl.-Inform. Thomas Beckers |
Prüfungstermine
Mündliche Prüfung
Zeitraum | Ort |
---|---|
27.02.2012 - 01.03.2012 | LF/135 |
Die Einzeltermine werden nach Ablauf der Rücktrittsfrist hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert sein, senden Sie bitte spätestens 10 Tage vorher eine Mail an norbert.fuhr@uni-due.de
Beschreibung
Information Mining beschäftigt sich mit dem Extrahieren von impliziten, noch unbekannten Informationen aus Rohdaten (Data Mining) bzw. Texten (Text Mining). Dazu sollen Computer in die Lage versetzt werden, Datenbasen automatisch nach Gesetzmäßigkeiten und Mustern zu durchsuchen und einen Abstraktionsprozess durchzuführen, der als Ergebnis aussagekräftige Informationen liefert. Das maschinelle Lernen stellt dafür die Werkzeuge und Techniken zur Verfügung.
Anwendungen finden sich insbesondere im Dienstleistungssektor, z.B. bei der Preisgestaltung von Billigflügen, der Kalkulation von Versicherungsbeiträgen, Kreditentscheidungen und im Marketing.
Vorlesungsmaterial
- Der Data-Minig-Teil basiert auf dem Lehrbuch 'Data Mining' von Ian Witten und Eibe Frank.
- Der Text-Mining-Teil basiert auf den Kapiteln 13-17 des Buches Introduction to Information Retrieval von D. Manning, Prabhakar Raghavan und Hinrich Schütze.
- Das Optimum Clustering Framework ist beschrieben in Norbert Fuhr; Marc Lechtenfeld; Benno Stein; Tim Gollub (2011). The Optimum Clustering Framework: Implementing the Cluster Hypothesis. Information Retrieval 14
- Clustering-Tutorial und Demo
-
Weiterführende Literatur:
- Thomas A. Runkler; Data Mining. Vieweg+Teubner 2009
- Trevor Hastie, Robert Tibshirani, Jerome Friedman: The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2009 Series in Statistics
Gliederung der Vorlesung
-
Data Mining
- Einführung
- Eingabe: Konzepte, Instanzen, Attribute
- Ausgabe: Wissensrepräsentation
- Algorithmen: Die grundlegenden Methoden
- Glaubwürdigkeit: Auswertung des Gelernten
- Implementierung: Maschinelles Lernen in der Praxis
- Transformationen: Aufbereitung der Ein- und Ausgabe
- Zeitreihen
-
Text Mining
- Text-Repräsentation
- Text-Clustering
- Text-Klassifikation
Folien
Einige Folienkapitel sind aus Copyright-Gründen nur innerhalb der UDE erreichbar!
- Data Mining
- Text Mining
Mitschriften
- demnächst
Weitere Übungsaufgaben und Prüfungsfragen
- Beispiel-Übungsaufgaben
-
Beispiel-Fragen
für die mündliche Prüfung
(beachten Sie hierzu auch die Wiederholungs-Folien )