Information Retrieval im Semantic Web
Status
Abgeschlossene Diplomarbeit
Bearbeiter
- Peter Hüsken
Abgabetermin
2006
-
Formalia
- Voraussetzungen
-
- Vorlesungen Datenbanken/Informationssysteme oder Information Retrieval (sinnvoll)
- Erfahrung in der Programmierung mit Java (notwendig)
Aufgabenstellung
Mit Semantic Web wird die aktuelle Vision eines Netzwerks aus computerlesbaren Informationen (mit Semantik) anstelle des heutigen HTML- und damit menschenorientierten WWWs bezeichnet. Informationen werden in der Beschreibungssprache OWL abgelegt.
Im Rahmen dieser Diplomarbeit sollen Information-Retrieval-Ansätze für das Semantic Web entwickelt werden. Die allermeisten bisherigen Arbeiten unterstützen weder die Unsicherheit der Informationsrepräsentation noch die Vagheit des Informationsbedürfnisses, die beiden Hauptcharakteristika des Information Retrieval. Auf Basis von pOWL [Nottelmann/Fuhr:05] , einer probabilistischen Erweiterung von OWL, besteht diese Arbeit aus zwei Komponenten:
- Zunächst sind die vorhandenen OWL-Anfragesprachen, vor allem OWL-QL [Fikes/etal:03] , zu untersuchen und in Richtung IR zu erweitern (alternativ kann auch eine neue IR-orientierte Anfragesprache entwickelt werden).
- Die vorhandene IR-Engine PIRE [Nottelmann:05] ist zu erweitern, so daß sie pOWL-Daten indexieren und dem Retrieval über die entwickelte Anfragesprache zugänglich macht.
Diese Diplomarbeit umfaßt damit folgende Schritte:
- Aufarbeitung der Literatur
- Entwicklung einer IR-orientierten Anfragesprache für OWL
- Einarbeitung in die bestehende Software PIRE
- Prototypische Erweiterung von PIRE um Indexierung/Retrieval von OWL
- Evaluierung der Effektivität und Effizienz
Literatur
-
- H. Nottelmann; N. Fuhr (2006).
- Adding Probabilities and Rules to OWL Lite Subsets based on Probabilistic Datalog. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems 14(1)
-
- Richard Fikes; Pat Hayes; Ian Horrocks (2003).
- OWL-QL: A Language for Deductive Query Answering on the Semantic Web. Technischer BerichtKSL 03-14, Stanford University, Stanford, CA
-
- H. Nottelmann (2005).
- PIRE: An extensible IR engine based on probabilistic Datalog. In 27th European Conference on Information Retrieval Research (ECIR 2005)