Einführung in Information Retrieval
Teaching personnel
Formalia
- Targeted audience
- Angewandte Informatik Bachelor: Schwerpunkt Medieninformatik
Dates
Lectures
Date | Time | Place |
Thursday | 12:00 - 13:30 | LF/261 |
Tutorials
Date | Time | Place | Tutor |
Monday | 12:15 - 13:00 | LF/261 | Dr.-Ing. Dipl.-Inform. Matthias Jordan |
Labs
Date | Time | Place | Tutor |
- | LF/230 | Dr.-Ing. Dipl.-Inform. Matthias Jordan |
Examination Dates
Oral Exam
Period | Place |
---|---|
27.02.2012 - 01.03.2012 | LF/135 |
Die Einzeltermine werden nach Ablauf der Rücktrittsfrist hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert sein, senden Sie bitte spätestens 10 Tage vorher eine Mail an norbert.fuhr@uni-due.de
Description
Information Retrieval (IR) deals with information search in purely structured data like e.g. fulltexts or multimedia databases. Popular applications are web search engines, digital libraries and multimedia archives (e.g. for images).
Due to the vagueness of the information need and the uncertain representation of the content of the stored objects, standard database techniques are not appropriate. Instead, the concepts have to be extended to deal with vagueness and uncertainty. As the major focus is on content-oriented search, special techniques for representing the content of text and multimedia objects are required.
This lecture introduces the underyling concepts of IR and illustrates them based on special application areas.
Content:
- Basic concepts (information cycle, evaluation)
- Representation of content (free text search, documentation languages, special logics)
- Models (classic models, models for multimedia documents)
- Interactive IR systems (layer model, cognitive models, user interfaces)
Lecture material
Außer den Folienkopien wird noch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
- Empfohlene IR-Bücher aus unserer LibraryThing-Sammlung
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval. Cambridge University Press, 2008.
- Bruce Croft, Donald Metzler, Trevor Strohman: Search Engines: Information Retrieval in Practice. Addison-Wesley, 2009.
- R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval: The Concepts and Technology Behind Search. ACM Press Books.
- Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack: Information Retrieval: Implementing and Evaluating Search Engines. MIT Press, 2010
- Marti A. Hearst: Search User Interfaces. Cambridge University Press. (2009)
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag.
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
- Einige weitere IR-Bücher und -Skripte sind hier verlinkt
Skriptum
(Das Skriptum deckt den Vorlesungsstoff mit
Ausnahme des letzten Kapitels ab, das
nur als Folien verfügbar ist.)
Skript
Kapitel 1-6
Folien
- Einführung: pdf ppt . Demos (nicht prüfungsrelevant)
- Einführung, IR-Konzepte: (animiert) (print)
- Evaluierung (animiert) (print)
- Repräsentation von Textinhalten (animiert) (print)
- Nicht-probabilistische Modelle (animiert) (print)
- Probabilistische Modelle (animiert) (print)
- Interaktives Retrieval (animiert) (print)
- Benutzeroberflächen (animiert) (print)
- Web-IR (animiert) (print)
Prüfungsfragen: Beispiele
Notizen
Links
Material for the tutorials
Arbeitsblätter
An dieser Stelle werden wöchentlich die Übungsaufgaben zum Download bereitgestellt.
Um Übungsblätter abgeben zu können, ist eine Anmeldung zur Übung erforderlich.
- Übungsblatt 1 – IR im Alltag
- Übungsblatt 2 – IR und Evaluierungsmaße
- Übungsblatt 3 – Wissensrepräsentation
- Übungsblatt 4 – Dokumentationssprachen
- Übungsblatt 5 – Nicht-probabilistische Modelle 1
- Übungsblatt 6 – Wiederholung, BIR-Modell
- Übungsblatt 7 – Wissensrepräsentation, Sprachmodelle
- Übungsblatt 8 – Vergleich Sprachmodelle und BIR-Modell
- Übungsblatt 9 – Interaktives Retrieval 1
- Übungsblatt 10 – Interaktives Retrieval 2
- Übungsblatt 11 – Benutzeroberflächen
Abgabeformular für die Übungszettel.
Praktikum
Das Bestehen des IR-Praktikums ist verpflichtend für die Teilnahme an der mündlichen Prüfung.
Die Anmeldung zum Praktikum ist eröffnet. Alle Studierenden, die am Praktikum teilnehmen wollen/müssen, müssen sich im Anmeldeformular anmelden. Dies betrifft insbesondere die Bachelor-Studierenden.
Weitere Informationen zum Praktikum werden in den kommenden Tagen hier veröffentlicht.
Allgemeine Informationen
- Einleitung
- Bibilotheken, die verwendet werden dürfen:
Block 1
Ladet das Aufgabenblatt herunter und nach dem Lesen die weiteren benötigten Dateien. Nicht alle der untigen Dateien sind notwendig.
- Aufgabenblatt
- Eclipse-Projekt (zip, 960 KB)
Block 2
Ladet das Aufgabenblatt herunter und nach dem Lesen die weiteren benötigten Dateien.
- Aufgabenblatt
- Einführung in GATE
- Test-File zum Taggen von Adressen (wird in der GATE-Einführung benötigt)
Block 3
Ladet das Aufgabenblatt herunter und nach dem Lesen die weiteren benötigten Dateien.
- Aufgabenblatt
- OpenThesaurus (Textversion) (zip, 468 KB)
Materialien für alle Blöcke
- Topics und Bewertungen (Auszug) (zip, 3 KB) – Zum Testen der Indexierung
- Kollektion (Auszug) (zip, 10 KB) – Zum Testen des Indexierens
- Kollektion (komplett) (tar/bzip2, 176 MB) – Von der Kollektion ist nur eine Datei notwendig - die Inhalte sind in den drei Dateien dieselben.
- Kollektion (komplett) (tar/gzip, 249 MB)
- Kollektion (komplett) (zip, 349 MB)