Information Mining
Formalia
- Targeted audience
- Angewandte Informatik Master
- DAI Hauptstudium with 8 credit points : Bereich "D"
- Komedia Master
- Kommedia Master
- ISE Master
Dates
Lectures
Date | Time | Place |
Mittwoch | 12:30 - 15:00 | LC/137 |
Tutorials
Date | Time | Place | Tutor |
Mittwoch | 15:05 - 15:50 | LC/137 | Dipl.-Inform. Thomas Beckers |
Examination Dates
Oral Exam
Period | Place |
---|---|
27.02.2012 - 01.03.2012 | LF/135 |
Die Einzeltermine werden nach Ablauf der Rücktrittsfrist hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert sein, senden Sie bitte spätestens 10 Tage vorher eine Mail an norbert.fuhr@uni-due.de
Description
Information Mining deals with the extraction on implicit information from raw data (Data Mining) or text (Text Mining). The goal is the development of methods for analyzing databases and discovering useful information by means of abstraction. For this pupose, machine learning methods are applied.
Lecture material
- Der Data-Minig-Teil basiert auf dem Lehrbuch 'Data Mining' von Ian Witten und Eibe Frank.
- Der Text-Mining-Teil basiert auf den Kapiteln 13-17 des Buches Introduction to Information Retrieval von D. Manning, Prabhakar Raghavan und Hinrich Schütze.
- Das Optimum Clustering Framework ist beschrieben in Norbert Fuhr; Marc Lechtenfeld; Benno Stein; Tim Gollub (2011). The Optimum Clustering Framework: Implementing the Cluster Hypothesis. Information Retrieval 14
- Clustering-Tutorial und Demo
-
Weiterführende Literatur:
- Thomas A. Runkler; Data Mining. Vieweg+Teubner 2009
- Trevor Hastie, Robert Tibshirani, Jerome Friedman: The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2009 Series in Statistics
Gliederung der Vorlesung
-
Data Mining
- Einführung
- Eingabe: Konzepte, Instanzen, Attribute
- Ausgabe: Wissensrepräsentation
- Algorithmen: Die grundlegenden Methoden
- Glaubwürdigkeit: Auswertung des Gelernten
- Implementierung: Maschinelles Lernen in der Praxis
- Transformationen: Aufbereitung der Ein- und Ausgabe
- Zeitreihen
-
Text Mining
- Text-Repräsentation
- Text-Clustering
- Text-Klassifikation
Folien
Einige Folienkapitel sind aus Copyright-Gründen nur innerhalb der UDE erreichbar!
- Data Mining
- Text Mining
Mitschriften
- demnächst
Weitere Übungsaufgaben und Prüfungsfragen
- Beispiel-Übungsaufgaben
-
Beispiel-Fragen
für die mündliche Prüfung
(beachten Sie hierzu auch die Wiederholungs-Folien )