Implementation und Evaluierung von Dokument-Surrogaten mit Word-Cloud-Darstellung

Status


Abgeschlossene Bachelorarbeit

Bearbeiter


  • Christian Kisters

Abgabetermin


2013 - 03

Formalia


Zielgruppe
  • AI Bachelor
Voraussetzungen
  • Java-Kenntnisse
  • Fähigkeit im Lesen und Verstehen englischer wissenschaftlicher Publikationen
  • Fähigkeit und Interesse, sich in neue theoretische und praktische Aspekte einzuarbeiten
  • Vorlesungen "Information Retrieval" (wünschenswert)

Aufgabenstellung


Bei der offenen Suche nach Dokumenten ist ein wichtiger, und häufig wiederholter, Schritt die Beurteilung eines Dokuments hinsichtlich seiner Relevanz. Dazu dienen in erster Linie die Dokument-Zusammenfassungen, die in der Ergebnisliste angezeigt werden. Tombros und Kollegen konnten zeigen, dass Zusammenfassungen, die sich an den Termen der Suchanfrage orientieren (query-biased summaries), besser für die Relevanzbeurteilung geeignet sind, als solche, die z.B. die ersten 5 Zeilen des Dokuments anzeigen.

Um die Relevanzbeurteilung noch erfolgreicher zu machen, sollen weitere Verfahren umgesetzt und evaluiert werden. Dazu zählen die Zusammenfassungen auf Basis von Word Clouds. Verglichen werden sollen Word-Cloud-basierte Zusammenfassungen in alphabetischer Sortierung mit Word-Cloud-Zusammenfassungen in der Reihenfolge im Text und query-biased summaries als Baseline.

Die Bachelorarbeit umfasst folgende Schritte:

  • Aufarbeitung der Literatur zur Bestimmung erfolgversprechender Unterstützungsfunktionen
  • Umsetzung der Zusammenfassungen in ezDL
  • Durchführung und Auswertung eines Experiments zum Vergleich der Unterstützungsfunktionen

Literatur