Information Mining

Lehrpersonen


Dozent(in)
Übungsleiter(innen)

Formalia


Zielgruppe
  • Angewandte Informatik Master
  • Komedia Master
  • ISE Master
  • BWL Master mit 2+1 Wochenstunden und 4 Kreditpunkten : ohne den Text-Mining-Teil

Termine


Vorlesung

Tag

Zeit

Beginn

Ort

Dienstag 10:15 - 12:4016.10.LC/137

Übungen

Tag

Zeit

Beginn

Ort

Betreuer

Dienstag 13:15 - 14:00 23.10. LC/137Dipl.-Inform. Marc Lechtenfeld

Prüfungstermine


Mündliche Prüfung

ZeitraumOrt
04.03.2013 - 06.03.2013LF/135

Die Einzeltermine werden nach Ablauf der Rücktrittsfrist hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert sein, senden Sie bitte spätestens 10 Tage vorher eine Mail an norbert.fuhr@uni-due.de.

 

Beschreibung


Information Mining beschäftigt sich mit dem Extrahieren von impliziten, noch unbekannten Informationen aus Rohdaten (Data Mining) bzw. Texten (Text Mining). Dazu sollen Computer in die Lage versetzt werden, Datenbasen automatisch nach Gesetzmäßigkeiten und Mustern zu durchsuchen und einen Abstraktionsprozess durchzuführen, der als Ergebnis aussagekräftige Informationen liefert. Das maschinelle Lernen stellt dafür die Werkzeuge und Techniken zur Verfügung.

Anwendungen finden sich heute vor allem im Bereich 'Business Intelligence', der systematischen Datenanalyse mit dem Ziel, vorhandene Geschäftsprozesse zu optimieren oder neue Produkte und Dienstleistungen zu konzipieren. Aktuell spielt zudem das Thema 'Big Data' eine Rolle, wo es um die Auswertung von Massendaten aus Wirtschaft, Wissenschaft und Verwaltung geht (die z.B. auch mit Sensor-Netzwerken gesammelt werden).

Vorlesungsmaterial


Gliederung der Vorlesung


  • Data Mining
    1. Einführung
    2. Eingabe: Konzepte, Instanzen, Attribute
    3. Ausgabe: Wissensrepräsentation
    4. Algorithmen: Die grundlegenden Methoden
    5. Glaubwürdigkeit: Auswertung des Gelernten
    6. Implementierung: Maschinelles Lernen in der Praxis
    7. Transformationen: Aufbereitung der Ein- und Ausgabe
    8. Multivariate Statistik
    9. Data Warehouses
    10. Zeitreihen
  • Text Mining
    1. Flaches Clustering
    2. Hierarchisches Clustering
    3. Optimales Clustering

Folien


Einige Folienkapitel sind aus Copyright-Gründen nur innerhalb der UDE erreichbar!

Einführung: odp pdf

Mitschriften


Weitere Übungsaufgaben