Pepper

Peer-to-Peer-Architekturen für die föderierte Suche in komplexen digitalen Bibliotheken
Allgemeine Informationen
- Guy Bertrand Noutsa Tsemo
- Andre Lingemann
- Ghita Mezzour (CMU)
- DFG
- NSF
- DFG: BIB47 DOuv 02-01
- UDE: 15311523 (ka00043c)
Beschreibung
Die Anzahl Digitaler Bibliotheken (Digital Libraries, DL) und Services im Web wächst sowohl in absoluten Zahlen als auch in Sachen Vielfältigkeit. Aus Benutzersicht sollte es eine eine einzige virtuelle Bibliothek geben (``one stop shop''), die alle relevanten Quellen zur Befriedigung des Informationsbedürfnisses beinhaltet. Peer-to-Peer Architekturen haben sich als effektiv zur Integration zahlreicher sehr einfacher DLs, z.B. für das Filesharing, erwiesen. Dieses Projekt wird zeigen, daß sich Peer-to-Peer-Architekturen auch für die föderierte Suche in sehr vielen, komplexen und nur lose gekoppelten Digitalen Bibliotheken eignet
Das Projekt basiert auf der Annahme, daß es weder möglich noch erstrebenswert ist, Homogenität in eine sehr größe Föderation komplexer DLs durchzusetzen. Bibliotheken unterscheiden sich in Bezug auf das Schema, das ihre Dokumente verwenden, die Qualität der Daten und den Grad der Kooperativität. Wir werden Methoden zur Übersetzung von Anfragen und Dokumente von einem Schema in ein anderes entwickeln, die die inhärente Unsicherheit und Vagheit solcher Mappings berücksichtigt. Hierfür müssen Mehtoden zur Beschreibung von Schemata und den Abbildungen zwischen ihnen entwickelt werden.
Eine wachsende Anzahl von Web-Services kann zur Verbesserung der Retrievalqualität verwenden werden: Mapping-Services helfen, die Heterogenität zu überwinden, und andere Services liefern weitere relevante Dokumente. Wir werden Methoden zur Beschreibung und dynamischen Auswahl solcher Services entwickeln.
Große Peer-to-Peer-Netze erfordern Services, die das Weiterleiten von Anfragen im Netz effizient regeln. Wir werden Methoden für inhaltsbezogene Routing-Services (für Beschreibungen von DLs, Resource Selection und Data Fusion) in Peer-to-Peer-Netzen bereitstellen. Diese Services werfen eine Reihe neuer Fragen auf, z.B. wie partielle Beschreibungen der DLs verwendet werden können, oder die komplexere Aufgabenstellung ob eine Frage lokal behandelt werden kann oder zu einem anderen Knoten weitergeleitet werden soll.
Um unsere Methoden und die Implementierungen derselben für andere Wissenschaftler und Entwickler verfügbar zu machen, werden wir unser Methoden mit Hilfe von JXTA implementieren, das derzeit in zahlreichen weiteren Projekten verwendet wird.
Publikationen
- Henrik Nottelmann; Gudrun Fischer (2007).
- Search and browse services for heterogeneous collections with the peer-to-peer network Pepper. Information Processing & Managementt 43
- Nottelmann, Henrik; Fuhr, Norbert (2007).
- A Decision-Theoretic Model for Decentralised Query Routing in Hierarchical Peer-To-Peer Networks. In 29th European Conference on Information Retrieval Research (ECIR 2007)
- Nottelmann, Henrik; Aberer, Karl; Callan, Jamie; Nejdl, Wolfgang (2006).
- The CIKM 2005 Workshop on Information Retrieval in Peer-to-Peer Networks. SIGIR Forum 40(1)
- H. Nottelmann; N. Fuhr (2006).
- Adding Probabilities and Rules to OWL Lite Subsets based on Probabilistic Datalog. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems 14(1)
- Nottelmann, Henrik; Fuhr, Norbert (2006).
- Comparing different architectures for query routing in peer-to-peer networks. In 28th European Conference on Information Retrieval Research (ECIR 2006)
- Nottelmann, Henrik; Straccia, Umberto (2006).
- A Probabilistic, Logic-based Framework for Automated Web Directory Alignment. In: Zongmin Ma (Hrsg.):
- Henrik Nottelmann; Umberto Straccia (2006).
- Information retrieval and machine learning for probabilistic schema matching. Information Processing and Management 43
- Gudrun Fischer; André Nurzenski (2005).
- Towards Scatter/Gather Browsing in a Hierarchical Peer-to-Peer Network. In Proceedings of the 2005 ACM Workshop on Information Retrieval in Peer-to-Peer Networks (P2PIR 2005), Bremen, Germany, November 4, 2005
- H. Nottelmann (2005).
- PIRE: An extensible IR engine based on probabilistic Datalog. In 27th European Conference on Information Retrieval Research (ECIR 2005)
- Henrik Nottelmann (2005).
- Inside PIRE: An extensible, open-source IR engine based on probabilistic logics. Technischer Bericht, University of Duisburg-Essen
- Henrik Nottelmann; Gudrun Fischer; Alexej Titarenko; André Nurzenski (2005).
- An integrated approach for searching and browsing in heterogeneous peer-to-peer networks. In Proc. Heterogeneous and Distributed Information Retrieval
- H. Nottelmann; U. Straccia (2005).
- sPLMap: A probabilistic approach to schema matching. In 27th European Conference on Information Retrieval Research (ECIR 2005)
- Henrik Nottelmann; Umberto Straccia (2005).
- Information retrieval and machine learning for probabilistic schema matching (poster). In Proceedings of the 14th International Conference on Information and Knowledge Management
- Henrik Nottelmann; Karl Aberer; Jamie Callan; Wolfgang Nejdl (Hrsg.) (2005).
- Proceedings of the 2005 ACM Workshop on Information Retrieval in Peer-to-Peer Networks (P2PIR 2005), Bremen, Germany, November 4, 2005.
- H. Nottelmann; N. Fuhr (2004).
- Combining CORI and the decision-theoretic approach for advanced resource selection. In 26th European Conference on Information Retrieval Research (ECIR 2004)
- Henrik Nottelmann; Norbert Fuhr (2004).
- pDAML+OIL: A probabilistic extension to DAML+OIL based on probabilistic Datalog. In Proceedings Information Processing and Management of Uncertainty in Knowledge-Based Systems
- H. Nottelmann; N. Fuhr (2004).
- A logic-based approach for computing service executions plans in peer-to-peer networks. In SIGIR Workshop on Peer-to-Peer Information Retrieval
- N. Fuhr; C.-P. Klas (2001).
- Combining RDF and Agent-Based Architectures for Semantic Interoperability in Digital Libraries. In Proceedings of the DELOS-Workshop on Interoperability in Digital Libraries
Vorträge
- Norbert Fuhr (2007).
- A Decision-Theoretic Model for Decentralised Query Routing in Hierarchical Peer-To-Peer Networks. Talk at the European Conference on Information Retrieval Research, Rome, Italy
- Norbert Fuhr (2006).
- Comparing different architectures for query routing in peer-to-peer networks. Talk at the Max-Planck-Institute of Informatics (Saarbrücken, Germany)
- Henrik Nottelmann (2005).
- Pepper - Information Retrieval in hierarchical Peer-to-Peer networks with heterogeneous services. Talk at the 'P2PIR in Germany' workshop (Leipzig)
- Henrik Nottelmann (2005).
- Decision-theoretic resource selection in hierarchical peer-to-peer networks. Talk at the CMU LTI group meeting
- Henrik Nottelmann; Gudrun Fischer; Alexej Titarenko; André Nurzenski (2005).
- An integrated approach for searching and browsing in heterogeneous peer-to-peer. Talk at the HDIR 2005 workshop (co-located with SIGIR)
- Henrik Nottelmann (2003).
- Probabilistic logics for defining and using P2P service descriptions. Workshop on Metadata Management in Grid and Peer-to-Peer Systems (MMGPS), London
- Henrik Nottelmann (2003).
- Probabilistic logics for defining and using P2P service descriptions. QMIR Seminar, London
Diplom-, Master- und Bachelorarbeiten
- Information Retrieval im Semantic Web
- Abgeschlossene Diplomarbeit
- Service-Beschreibungen in Peer-to-Peer-Netzen
- Abgeschlossene Masterarbeit
- Cluster-basiertes Browsing in Peer-to-Peer-Netzen
- Abgeschlossene Diplomarbeit
- IR im P2P-Netz JXTA
- Abgeschlossene Diplomarbeit
Projektreffen
-
- 21./22. November 2004, Pittsburgh:
- Technisches Treffen
-
- 25. Juli 2004, Sheffield:
- Technisches Treffen
-
- 8./9. März 2004, Duisburg:
- Technisches Treffen
-
- 10./11. November 2003, Pittsburgh:
- Kick-off-Treffen
Testdaten
-
- DTF in P2P-Netzwerken:
- Benutzt im ECIR-2006-Paper (300 KB)
-
- Schema-Mapping:
- BIBDB, OAI (3 MB) (down)