Information Mining
Formalia
- Zielgruppe
- DAI Hauptstudium mit 8 Kreditpunkten : Bereich "D"
- ISE Master mit 8 Kreditpunkten
Termine
Vorlesung
Tag | Zeit | Ort |
Mittwoch | 10:00 - 12:30 | LC/137 |
Übungen
Tag | Zeit | Ort | Betreuer |
Mittwoch | 13:00 - 14:00 | LC/137 | Dr. rer. nat. Ingo Frommholz |
Beschreibung
Information Mining beschäftigt sich mit dem Extrahieren von impliziten, noch unbekannten Informationen aus Rohdaten (Data Mining) bzw. Texten (Text Mining). Dazu sollen Computer in die Lage versetzt werden, Datenbasen automatisch nach Gesetzmäßigkeiten und Mustern zu durchsuchen und einen Abstraktionsprozess durchzuführen, der als Ergebnis aussagekräftige Informationen liefert. Das maschinelle Lernen stellt dafür die Werkzeuge und Techniken zur Verfügung.
Vorlesungsmaterial
- Der Data-Minig-Teil basiert auf dem Lehrbuch `Data Mining' von Ian Witten und Eibe Frank.
- Der Text-Mining-Teil basiert auf den Kapiteln 13-17 des Buches Introduction to Information Retrieval von D. Manning, Prabhakar Raghavan und Hinrich Schütze.
- Clustering-Tutorial und Demo
Gliederung der Vorlesung
- Data Mining
- Einführung
- Eingabe: Konzepte, Instanzen, Attribute
- Ausgabe: Wissensrepräsentation
- Algorithmen: Die grundlegenden Methoden
- Glaubwürdigkeit: Auswertung des Gelernten
- Implementierung: Maschinelles Lernen in der Praxis
- Transformmationen: Aufbereitung der Ein- und Ausgabe
- Text Mining
- Text-Repräsentation
- Text-Clustering
- Text-Klassifikation
Folien
- Data Mining
- Text Mining
Übungsaufgaben und Prüfungsfragen
- Blatt 1
- Blatt 2
- Blatt 3
- Blatt 4
- Blatt 5
- Blatt 6
- Beispiel-Übungsaufgaben finden sich hier.
- Beispiel-Fragen
für die mündliche Prüfung
(beachten Sie hierzu auch die Wiederholungs-Folien)