Analyse von Ereignislogs einer Digitalen Bibliothek zur Benutzerunterstützung

Status


Finished diploma thesis

Student


  • Claudia Bodnariu

Related projects


  • DAFFODIL
    Distributed Agents for User-Friendly Access of Digital Libraries

Finished


2009 - 03

Formalia


Targeted audience
  • DAI Hauptstudium : Bereich "D"
Preconditions
  • Fähigkeit im Lesen und Verstehen englischer wissenschaftlicher Publikationen
  • Fähigkeit und Interesse, sich in neue theoretische und praktische Aspekte einzuarbeiten
  • Vorlesung Data Mining oder Information Retrieval
  • Erfahrung in der Programmierung mit Java

Task description


Im Rahmen des DFG-Projektes Daffodil ist ein agentenbasiertes, nutzerorientiertes Zugangssystem für verteilte, heterogene Digitale Bibliotheken entwickelt worden. In der Diplomarbeit "Evaluation von Digitalen Bibliotheken: Ein Evaluationsframework auf Basis von Daffodil" [Werseck:06] wurde ein einheitliches XML-Loggingschema für alle Nutzer- und Systemaktionen in Daffodil entwickelt, sowie einige einfache statistische Analysen durchgeführt. [Klas/etal:06] [Klas/etal:06a] Die Logdaten werden in einer MySQL-Datenbank gehalten, die derzeit über 450.000 einzelne Logereignisse und 45.000 Logsitzungen umfasst.

In dieser Diplomarbeit sollen auf den vorhandenen Logdaten weiterreichende Analysen durchgeführt werden, mit dem Ziel, diese zur Unterstützung von Daffodil-Anwendern bei der Informationssuche zu nutzen. Vielversprechende Ansätze sollen dann beispielhaft implementiert und in das System Daffodil integriert werden. Im Einzelnen sollen folgende Problemkreise bearbeitet werden:

  • Die rohen Logdaten enthalten viele Testsitzungen von Entwicklern. Diese sollten erkannt und aus der Menge der zur Analyse benutzten Logdaten entfernt werden.
  • Aus den zeitlichen Abfolgen von Logereignissen innerhalb einer Session lassen sich z.B. Pfade (Folgen) konstruieren; dabei kann man verschiedene Abstraktionsebenen des Logschemas betrachten und untersuchen. Die Pfade können auf häufige Muster hin untersucht werden. Innerhalb Daffodils könnten diese etwa im Vorschlagswerkzeugs [Kriewel/Fuhr:07] genutzt werden als (a) weitere Parameter, oder (b) mögliche Vorschläge.
  • Die geloggten Anfragen und Resultate könnte man nutzen, um einem Suchenden zu einer neuen Anfrage entweder zusätzliche Ergebnisse anzubieten, oder alternative Anfragen vorzuschlagen.
  • Weitere Ideen sollten entwickelt und auf ihre Anwendbarkeit hin untersucht werden, ausgehend von existierenden Arbeiten zur Analyse von Anfrage- und Ereignislogs in Suchsystemen.

Literature