Information Retrieval
Lehrpersonen
- Dozent(in)
- Übungsleiter(innen)
Formalia
- Zielgruppe
- DAI Hauptstudium mit 12 Kreditpunkten : Bereich "D"
- Kommedia Bachelor:
Skript Kapitel 1-6.2.5.1,
9.1, 9.2;
Folien zu Web-Suche und Summarization,
(alte PO: ohne Übungen; neue PO: mit Übungen)
Termine
Vorlesung
Tag | Zeit | Ort |
Montag | 14:15 - 15:45 | LB/131 |
Donnerstag | 12:00 - 13:30 | LB/134 |
Übungen
Tag | Zeit | Ort | Betreuer |
Donnerstag | 14:15 - 15:45 | LF/230 | Dr.-Ing. Dipl.-Inform. Sascha Kriewel |
Beschreibung
Information Retrieval (IR) beschäftigt sich mit der Informationssuche in wenig strukturierten Datenbeständen wie z.B. Texten oder multimedialen Datenbasen. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.
Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten notwendig.
Im Rahmen dieser Vorlesung sollen die grundlegenden IR-Konzepte eingeführt werden und anhand spezieller Anwendungsbereiche illustriert werden.
Inhalt:
- A) Basiskonzepte (Informationskreislauf, Evaluierung)
- B) Repräsentation von Inhalten (Freitextsuche, Dokumentationssprachen, spezielle Logiken)
- C) Modelle (Klassische Modelle, Modelle für Multimedia)
- D) Implementierung von IR-Systemen (Schichtenmodell, Visualisierung, Zugriffspfade, Algorithmen)
- E) IR-Aufgaben (Retrieval, Filterung, Kategorisierung, cross language retrieval, summarization)
- F) Anwendungsbereiche (WWW-Suchmaschinen, Multimedia, Digitale Bibliotheken, IR und Datenbanken)
Vorlesungsmaterial
Außer den Folienkopien wird auch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
-
R.
Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval.
Addison Wesley.
(Das Kapitel zu Benutzungsschnittstellen und Visualisierung ist online.) - R. Belew: Finding Out About. A Cognitive Perspective on Search Engine Technology and the WWW. Cambridge University Press.
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag.
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
Skriptum
(Das Skriptum deckt den Vorlesungsstoff nicht komplett ab! Einige Teile sind nur als Folien verfügbar.)
- Skript
- M. Hearst: User Interfaces and Visualization
- Appelt/Israel: Introduction to Information Extraction Technology
- Gianni Amati, Cornelis Joost Van Rijsbergen Probabilistic models of information retrieval based on measuring the divergence from randomness ACM Transactions on Information Systems (TOIS) 20, (4), 2002, pp. 357-389
Folien
(einige Links zeigen noch ins Leere)
- Einführung: pdf ppt. Demos(nicht prüfungsrelevant)
- 1./2. Einführung, IR-Konzepte
- 3. Evaluierung
- 4. Repräsentation von Textinhalten
- 5. Nicht-probabilistische Modelle
- 6. Probabilistische Modelle
- Clustering
- 9. IR-Systeme
- 10. Implementierung von IR-Systemen
- Vom Suchen und Finden: Google und andere Ansätze
- Visualisierung
- Summarization
- XML Standards und Anfragesprachen
- XML IR und INEX: ppt pdf
- Wiederholung
Notizen
Prüfungsfragen: Beispiele
Links
Material zu den Übungen
Zur Vorlesung existiert ein Wiki, in dem von den Übungsteilnehmern Informationen, Übungsnotizen und Lösungen gesammelt werden können. Zugangsdaten zum Editieren des Wikis werden in der Übung bekanntgegeben. Ausserdem kann man sich hier auf eine Mailingliste zur Übung eintragen, die zum Diskutieren der Aufgaben oder für Nachfragen genutzt werden soll.
Übungsaufgaben
- Aufgabenblatt 1 (PDF)
- Aufgabenblatt 2 (PDF)
- Aufgabenblatt 3 (PDF)
- Aufgabenblatt 4 (PDF)
- Aufgabenblatt 5 (PDF)
- Aufgabenblatt 6 (PDF)
- Aufgabenblatt 7 (PDF)
- Aufgabenblatt 8 (PDF)
- Aufgabenblatt 9 (PDF), Zusatzmaterial (PDF)
- Aufgabenblatt 10 (PDF)
- Aufgabenblatt 11 (PDF)
- Aufgabenblatt 12 (PDF)
- Aufgabenblatt 13 (PDF)