Vage Text- und Faktenbedingungen für die Objektsuche


Projektzeitraum:
Vom 1. 12. 2018 bis zum 30. 11. 2021
Beteiligte Personen:
Gesponsert von:
  • DFG

Bei der Suche nach Objekten wie Produkten oder Forschungsdatensätzen spezifizieren Nutzende oft eine Reihe von gewünschten Eigenschaften, von denen einige vage oder unscharf formuliert sind (z.B. Preis bis 100 Euro, lange Batterielaufzeit, hohe Leistung, Veröffentlicht innerhalb des letzten Jahres). Einige dieser Formulierungen spezifizieren faktische Bedingungen für bestimmte Attributwerte. Aktuelle Systeme unterstützen bei solchen Fakten aber nur boolesche Bedingungen, was zu Problemen führen kann, wenn die Bedingungen prinzipiell in Konflikt zueinander stehen (z.B. niedriger Preis vs. hohe Leistung) oder wenn Objekte mit knapp verfehlten Bedingungen einfach aus der Treffermenge eliminiert werden. Textuelle Bedingungen sind zudem vom Vokabularproblem betroffen, da die oftmals kurzen Beschreibungen der relevanten Objekten die Suchterme nicht enthalten.Im Rahmen dieses Vorhabens sollen neue Methoden zur Behandlung vager Text- und Faktenbedingungen entwickelt werden. Für textuelle Vagheit sollen verschiedene Methoden eingesetzt werden, um verwandte Terme aus Textkorpora der Anwendungsdomäne zu generieren. Diese Terme werden dann als Anfrageerweiterung dem Nutzenden vorgeschlagen und in der Ergebnismenge mit unterschiedlichen Gewichtungen berücksichtigt. Vage Faktenbedingungen werden als Fuzzy-Prädikate interpretiert, d.h. dass Treffer mit knapp verfehlten Bedingungen mit einer geringeren Gewichtung ebenfalls in die Ergebnismenge aufgenommen werden. Darüber hinaus können somit generelle Präferenzen wie niedriger Preis modelliert werden. Ferner sollen Methoden zur Abbildung von typischen Textphrasen auf Faktenbedingungen entwickelt werden (z.B. kürzlich veröffentlicht wird abgebildet auf Veröffentlichungsdatum möglichst groß). Anfragebedingungen können entweder notwendig oder optional sein. Es sollen verschiedene Gewichtungsfunktionen für die einzelnen Arten von Bedingungen untersucht werden, ebenso wie die Retrievalfunktion zur Gesamtgewichtung der Antwortobjekte. Nutzende sollen die Möglichkeit haben, diese Funktionen auf verschiedene Arten zu beeinflussen (z.B. durch klassisches Relevance Feedback, oder durch die Manipulation der Gewichtungsfaktoren). Hierzu müssen geeignete grafische Nutzeroberflächen entwickelt werden. Die entwickelten Verfahren sollen für zwei Anwendungsfälle benutzerorientiert entwickelt und evaluiert werden und, zwar zum einen für die Produktsuche in einem Onlineshop, und zum anderen für die Suche nach sozialwissenschaftlichen Umfragedaten.