Information Retrieval
Formalia
- Zielgruppe
- DAI Hauptstudium mit 12 Kreditpunkten : Bereich "D"
- Kommedia Bachelor: Erste Hälfte der Vorlesung, mit Übungen
Die mündlichen Prüfungen finden in der Woche vom 8.-12.9.08 statt.
Termine
Vorlesung
Tag | Zeit | Ort |
Montag | 16:00 - 17:30 | LE/105 |
Donnerstag | 12:00 - 13:30 | LB/134 |
Übungen
Tag | Zeit | Ort | Betreuer |
Mittwoch | 16:00 - 17:30 | LB/134 | Dr. rer. nat. Ingo Frommholz |
Beschreibung
Information Retrieval (IR) beschäftigt sich mit der Informationssuche in wenig strukturierten Datenbeständen wie z.B. Texten oder multimedialen Datenbasen. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.
Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten notwendig.
Im Rahmen dieser Vorlesung sollen die grundlegendenyes IR-Konzepte eingeführt werden und anhand spezieller Anwendungsbereiche illustriert werden.
Inhalt:
- A) Basiskonzepte (Informationskreislauf, Evaluierung)
- B) Repräsentation von Inhalten (Freitextsuche, Dokumentationssprachen, spezielle Logiken)
- C) Modelle (Klassische Modelle, Modelle für Multimedia)
- D) Implementierung von IR-Systemen (Schichtenmodell, Visualisierung, Zugriffspfade, Algorithmen)
- E) IR-Aufgaben (Retrieval, Filterung, Kategorisierung, cross language retrieval, summarization)
- F) Anwendungsbereiche (WWW-Suchmaschinen, Multimedia, Digitale Bibliotheken, IR und Datenbanken)
Vorlesungsmaterial
Außer den Folienkopien wird auch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval. Cambridge University Press, 2008.
-
R.
Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval.
Addison Wesley.
(Das Kapitel zu Benutzungsschnittstellen und Visualisierung ist online.) - R. Belew: Finding Out About. A Cognitive Perspective on Search Engine Technology and the WWW. Cambridge University Press.
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag.
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
- Einige weitere IR-Büpcher und -Skripte sind hier verlinkt
Skriptum
(Das Skriptum deckt den Vorlesungsstoff nicht komplett ab! Einige Teile sind nur als Folien verfügbar.)
- Skript
- M. Hearst: User Interfaces and Visualization
- Appelt/Israel: Introduction to Information Extraction Technology
- Gianni Amati, Cornelis Joost Van Rijsbergen Probabilistic models of information retrieval based on measuring the divergence from randomness ACM Transactions on Information Systems (TOIS) 20, (4), 2002, pp. 357-389
Folien
- Einführung: pdf ppt. Demos(nicht prüfungsrelevant)
- 1./2. Einführung, IR-Konzepte
- 3. Evaluierung
- 4. Repräsentation von Textinhalten
- 5. Nicht-probabilistische Modelle
- 6. Probabilistische Modelle
- Visualisierung
- Interaktives Retrieval
- 10. Implementierung von IR-Systemen
- Link-Analyse für die Web-Suche: Folien Handout
- XML Standards und Anfragesprachen
- XML IR: odp pdf
- Wiederholung