Betreuer

Bearbeiter

Abgabetermin

1998-12

Aufgabenstellung

Klassisches Information Retrieval betrachtet Dokumente als Sammlung von Termen. Dokumente besitzen jedoch meist eine logische Struktur. Man versucht daher, diese zusätzliche Information für das Retrieval zu nutzen.

Versuche sollen zeigen, ob sich die Retrievalqualität durch Berücksichtigung der Dokumentstruktur verbessern läßt. Dabei stellt sich insbesondere die Frage, ob es in Dokumenten Teile gibt, deren Informationsgehalt höher zu bewerten ist. Bei praktischen Untersuchungen ergibt sich das Problem, daß es schwierig ist, eine Kollektion strukturierter Dokumente zu bekommen, für die es Relevanzurteile sowohl zu den Teilen, als auch zu dem Gesamtdokument gibt.

Wenn man sich eine Kollektion von einfachen unstrukturierten Dokumenten mit dazugehörigen Relevanzurteilen nimmt, könnte man sich hieraus eine Kollektion strukturierter Dokumente zusammenstellen, für deren Elementardokumente Relevanzurteile vorliegen. Zu klären ist dann die Frage, ob sich aus den Relevanzurteilen der gegebenen Kollektion, Relevanzurteile zu den kombinierten Dokumenten generieren lassen.

Aufgabe ist es, verschiedene Möglichkeiten der Relevanzvergabe auszuprobieren und sie auf ihre Anwendbarkeit zu untersuchen.