IR im P2P-Netz JXTA

Status


Abgeschlossene Diplomarbeit

Bearbeiter


  • Alexej Titarenko

Verwandte Projekte


  • Pepper
    Peer-to-Peer-Architekturen für die föderierte Suche in komplexen digitalen Bibliotheken

Abgabetermin


2005 - 03

Formalia


Voraussetzungen
  • Vorlesungen Datenbanken/Informationssysteme oder Information Retrieval (notwendig)
  • Gute Programmierfähigkeiten (notwendig)
  • Gute Kenntnisse der Programmiersprache Java (notwendig)

Aufgabenstellung


Das Projekt PEPPER entwickelt Methoden für das Information Retrieval in Peer-to-Peer-Netzen. Peer-to-Peer-Netze (P2P) sind spontane Verbindungen von Clients, denen eine zentrale Instanz (ein zentraler Server) fehlt. Beispiele für P2P-Netze, die dem Filesharing dienen, sind Napster (hier gibt es allerdings einen zentralen Index), Gnutella und KaZaa. Die meisten P2P-Netze suchen lediglich auf gleiche oder ähnliche Dateinamen oder Suche in Metadaten, echtes Information Retrieval wird kaum geboten. Das Routing der Anfrage im Netzwerk wird unterschiedlich gehandhabt: Gnutella [Ritter:01] überflutet das gesamte Netzwerk, während bei KaZaa einige ausgewählte Supernodes entscheiden, wohin eine Suchanfrage weitergeleitet wird (mit Information Retrieval hat aber auch das wenig zu tun).

Für unser Projekt PEPPER fehlt eine Basisarchitektur für Resource Selection im Peer-to-Peer-Netzwerk. Hierzu ist das P2P-Framework JXTA zu verwenden. Die Topology wird ähnlich wie das mittlerweile tote JXTA-Projekt JXTA Search [Waterhouse:01] aus Hubs und Service Provider Peers bestehen. Es werden XML-Dateien verwendet, die Anfrage in XIRQL [Fuhr/Grossjohann:02] beschrieben. Für die Resource Selection wird derzeit der Ansatz in [Nottelmann/Fuhr:03a] für die dezentrale Auswahl in P2P-Netzen erweitert.

Die Diplomarbeit entwickelt eine solche Basisarchitektur unter Verwendung von:

  • JXTA,
  • vorhandenem Code für das Indexieren und Retrieval von (XML-)Dateien,
  • von uns entwickelten Verfahren für die Resource Selection in P2P-Netzen,
  • Programmcode für die Resource Selection bei zentraler Auswahl, der angepaßt werden muß, und
  • bereits vorhandener Datenquellen (TREC, Open Archives).

Diese Diplomarbeit umfaßt damit folgende Schritte:

  • Aufarbeitung der Literatur (JXTA, Gnutella, JXTA Search, unser Resource-Selection-Ansatz)
  • Entwicklung einer Basisarchitektur (grundlegender Klassen für Hubs und Suchservices, Kommunikation, Messageformat etc.),
  • Integration der Resource Selection in diese Basisarchitektur,
  • Implementierung im Rahmen von JXTA

Fertiger Text


  • Alexej Titarenko (2005).
    Information Retrieval im P2P-Netz JXTA. Diplomarbeit
  • Literatur