Information Retrieval
Lehrpersonen
- Dozent(in)
- Übungsleiter(innen)
Formalia
- Zielgruppe
- DAI Hauptstudium mit 12 Kreditpunkten : Informatik der Systeme; "Bereich "D"
- Kommedia Bachelor
Termine
Vorlesung
Tag | Zeit | Ort |
Montag | 10:15 - 11:45 | LF/052 |
Dienstag | 16:00 - 17:30 | LB/131 |
Übungen
Tag | Zeit | Ort | Betreuer |
Montag | 12:15 - 13:45 | LF/052 | Dr.-Ing. Dipl.-Inform. Sascha Kriewel |
Beschreibung
Information Retrieval (IR) beschäftigt sich mit der Informationssuche in wenig strukturierten Datenbeständen wie z.B. Texten oder multimedialen Datenbasen. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.
Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten notwendig.
Im Rahmen dieser Vorlesung sollen die grundlegenden IR-Konzepte eingeführt werden und anhand spezieller Anwendungsbereiche illustriert werden.
Inhalt:
- A) Basiskonzepte (Informationskreislauf, Evaluierung)
- B) Repräsentation von Inhalten (Freitextsuche, Dokumentationssprachen, spezielle Logiken)
- C) Modelle (Klassische Modelle, Modelle für Multimedia)
- D) Implementierung von IR-Systemen (Schichtenmodell, Visualisierung, Zugriffspfade, Algorithmen)
- E) IR-Aufgaben (Retrieval, Filterung, Kategorisierung, topic detection tracking, Text mining, message understanding, summarization)
- F) Anwendungsbereiche (WWW-Suchmaschinen, Multimedia, Digitale Bibliotheken, Netzwerk-Informationssysteme, IR und Datenbanken)
Vorlesungsmaterial
Außer den Folienkopien wird auch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
-
R.
Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval.
Addison Wesley.
(Das Kapitel zu Benutzungsschnittstellen und Visualisierung ist online.) - R. Belew: Finding Out About. A Cognitive Perspective on Search Engine Technology and the WWW. Cambridge University Press.
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag.
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
Skriptum
(Das Skriptum deckt den Vorlesungsstoff nicht komplett ab! Einige Teile sind nur als Folien verfügbar.)
- Skript
- M. Hearst: User Interfaces and Visualization
- Appelt/Israel: Introduction to Information Extraction Technology
- Gianni Amati, Cornelis Joost Van Rijsbergen Probabilistic models of information retrieval based on measuring the divergence from randomness ACM Transactions on Information Systems (TOIS) 20, (4), 2002, pp. 357-389
- Norbert Fuhr:A Decision-Theoretic Approach to Database Selection in Networked IR. ACM Transactions on Information Systems
Folien
- Einführung: pdf ppt. Demos(nicht prüfungsrelevant)
- 1./2. Einführung, IR-Konzepte
- 3. Evaluierung
- 4. Repräsentation von Textinhalten
- 5. Nicht-probabilistische Modelle
- 6. Probabilistische Modelle (nur bis 6.5.1 prüfungsrelevant)
- Retrieval as divergence from randomness
- 8. Prädikatenlogische Modelle
- 9. IR-Systeme
- 10. Implementierung von IR-Systemen (nur bis 10.4.3)
- Vom Suchen und Finden: Google und andere Ansätze
- Visualisierung
- Informationsextraktion
- XML-Retrieval
- Farbähnlichkeitssuche
- Wiederholung