Information Retrieval
Termine
Vorlesung
Tag | Zeit | Ort |
Montag | 12:15 - 13:45 | LB/335 |
Dienstag | 14:15 - 15:45 | LD/102 |
Beschreibung
Information Retrieval (IR) beschäftigt sich mit der Informationssuche in wenig strukturierten Datenbeständen wie z.B. Texten oder multimedialen Datenbasen. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.
Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten notwendig.
Im Rahmen dieser Vorlesung sollen die grundlegenden IR-Konzepte eingeführt werden und anhand spezieller Anwendungsbereiche illustriert werden.
Inhalt:
- A) Basiskonzepte (Informationskreislauf, Evaluierung)
- B) Repräsentation von Inhalten (Freitextsuche, Dokumentationssprachen, spezielle Logiken)
- C) Modelle (Klassische Modelle, Modelle für Multimedia)
- D) Implementierung von IR-Systemen (Schichtenmodell, Visualisierung, Zugriffspfade, Algorithmen)
- E) IR-Aufgaben (Retrieval, Filterung, Kategorisierung, topic detection tracking, Text mining, message understanding, summarization)
- F) Anwendungsbereiche (WWW-Suchmaschinen, Multimedia, Digitale Bibliotheken, Netzwerk-Informationssysteme, IR und Datenbanken)
Vorlesungsmaterial
Außer den Folienkopien wird auch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
-
R.
Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval.
Addison Wesley.
(Das Kapitel zu Benutzungsschnittstellen und Visualisierung ist online.) - R. Belew: Finding Out About. A Cognitive Perspective on Search Engine Technology and the WWW. Cambridge University Press.
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag . (Vorläuferversion)
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
Skriptum
(Das Skriptum deckt den Vorlesungsstoff nicht komplett ab! Einige Teile sind nur als Folien verfügbar.)
- Skript
- M. Hearst: User Interfaces and Visualization
- Appelt/Israel: Introduction to Information Extraction Technology
Folien
- Kapitel 1+2
- Kapitel 3
- Kapitel 4
- Kapitel 5
- Kapitel 6
- Kapitel 7
- Kapitel 8
- Kapitel 9
- Kapitel 10
- Visualisierung
- Informationsextraktion
- XML-Retrieval
- Digitale Bibliotheken
- Multimedia-Indexierung