Einführung in Information Retrieval

Formalia


Zielgruppe
  • DAI Hauptstudium mit 6 Kreditpunkten : Bereich "D"
  • Kommedia Bachelor: Modul: Anwendungsorientierte Technologien & Methoden (P)

Termine


Vorlesung

Tag

Zeit

Ort

Donnerstag10:15 - 11:45LF/052

Übungen

Tag

Zeit

Ort

Betreuer

Montag10:15 - 11:00LF/230Dr.-Ing. Dipl.-Inform. Sascha Kriewel

Beschreibung


Information Retrieval (IR) beschäftigt sich mit der Informationssuche in wenig strukturierten Datenbeständen wie z.B. Texten oder multimedialen Datenbasen. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.

Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten notwendig.

Im Rahmen dieser Vorlesung sollen die grundlegenden IR-Konzepte eingeführt werden und anhand spezieller Anwendungsbereiche illustriert werden.

Inhalt:

  • A) Basiskonzepte (Informationskreislauf, Evaluierung)
  • B) Repräsentation von Inhalten (Freitextsuche, Dokumentationssprachen, spezielle Logiken)
  • C) Modelle (Klassische Modelle, Modelle für Multimedia)
  • D) n IR-Systeme (Schichtenmodell, Visualisierung)
  • E) IR-Aufgaben (Summarization)
  • F) Anwendungsbereiche (WWW-Suchmaschinen)

Vorlesungsmaterial


Außer den Folienkopien wird auch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:

Skriptum

(Das Skriptum deckt den Vorlesungsstoff nicht komplett ab! Einige Teile sind nur als Folien verfügbar.)

Folien

(einige Links zeigen noch ins Leere)

Notizen

Prüfungsfragen: Beispiele

Links

Hausarbeit


Durch die Bearbeitung der Hausarbeit können Bonuspunkte für die Klausur erworben werden. Die Hinweise auf dem Aufgabenblatt sind hierzu bitte zu beachten. Abgabe der Hausarbeit ist bis spätestens 10.1.2007.

Für CountWords.jar wird Java 5 benötigt. Der Aufruf erfolgt beispielsweise mit java -jar CountWords.jar -de -f datei.txt, um eine Datei mit deutschem Text zu bearbeiten, oder mit java -jar CountWords.jar -en -d dir/, um ein Verzeichnis mit englischsprachigen Dateien zu bearbeiten.