Analyse von Ereignislogs einer Digitalen Bibliothek zur Benutzerunterstützung
Status
Abgeschlossene Diplomarbeit
Bearbeiter
- Claudia Bodnariu
Abgabetermin
2009
-
Formalia
- Zielgruppe
-
- DAI Hauptstudium : Bereich "D"
- Voraussetzungen
-
- Fähigkeit im Lesen und Verstehen englischer wissenschaftlicher Publikationen
- Fähigkeit und Interesse, sich in neue theoretische und praktische Aspekte einzuarbeiten
- Vorlesung Data Mining oder Information Retrieval
- Erfahrung in der Programmierung mit Java
Aufgabenstellung
Im Rahmen des DFG-Projektes Daffodil ist ein agentenbasiertes, nutzerorientiertes Zugangssystem für verteilte, heterogene Digitale Bibliotheken entwickelt worden. In der Diplomarbeit "Evaluation von Digitalen Bibliotheken: Ein Evaluationsframework auf Basis von Daffodil" [Werseck:06] wurde ein einheitliches XML-Loggingschema für alle Nutzer- und Systemaktionen in Daffodil entwickelt, sowie einige einfache statistische Analysen durchgeführt. [Klas/etal:06] [Klas/etal:06a] Die Logdaten werden in einer MySQL-Datenbank gehalten, die derzeit über 450.000 einzelne Logereignisse und 45.000 Logsitzungen umfasst.
In dieser Diplomarbeit sollen auf den vorhandenen Logdaten weiterreichende Analysen durchgeführt werden, mit dem Ziel, diese zur Unterstützung von Daffodil-Anwendern bei der Informationssuche zu nutzen. Vielversprechende Ansätze sollen dann beispielhaft implementiert und in das System Daffodil integriert werden. Im Einzelnen sollen folgende Problemkreise bearbeitet werden:
- Die rohen Logdaten enthalten viele Testsitzungen von Entwicklern. Diese sollten erkannt und aus der Menge der zur Analyse benutzten Logdaten entfernt werden.
- Aus den zeitlichen Abfolgen von Logereignissen innerhalb einer Session lassen sich z.B. Pfade (Folgen) konstruieren; dabei kann man verschiedene Abstraktionsebenen des Logschemas betrachten und untersuchen. Die Pfade können auf häufige Muster hin untersucht werden. Innerhalb Daffodils könnten diese etwa im Vorschlagswerkzeugs [Kriewel/Fuhr:07] genutzt werden als (a) weitere Parameter, oder (b) mögliche Vorschläge.
- Die geloggten Anfragen und Resultate könnte man nutzen, um einem Suchenden zu einer neuen Anfrage entweder zusätzliche Ergebnisse anzubieten, oder alternative Anfragen vorzuschlagen.
- Weitere Ideen sollten entwickelt und auf ihre Anwendbarkeit hin untersucht werden, ausgehend von existierenden Arbeiten zur Analyse von Anfrage- und Ereignislogs in Suchsystemen.
Literatur
-
- Christian Werseck (2006).
- Evaluation von Digitalen Bibliotheken. Diplomarbeit
-
- Claus-Peter Klas; Norbert Fuhr; Sascha Kriewel; Hanne Albrechtsen; Giannis Tsakonas; Sarantos Kapidakis; Christos Papatheodorou; Preben Hansen; Laszlo Kovacs; Andras Micsik; Elin Jacob (2006).
- An experimental framework for comparative digital library evaluation: the logging scheme. In: JCDL '06: Proceedings of the 6th ACM/IEEE-CS joint conference on Digital libraries. ACM Press, New York, NY, USA.
-
- Claus-Peter Klas; Hanne Albrechtsen; Norbert Fuhr; Preben Hansen; Sarantos Kapidakis; László Kovács; Sascha Kriewel; András Micsik; Christos Papatheodorou; Giannis Tsakonas; Elin Jacob (2006).
- A Logging Scheme for Comparative Digital Library Evaluation.. In Research and Advanced Technology for Digital Libraries. Proc. of the 10th European Conference on Digital Libraries (ECDL 2006)
-
- Sascha Kriewel; Norbert Fuhr (2007).
- Adaptive Search Suggestions for Digital Libraries. In: Asian Digital Libraries: Looking Back 10 Years and Forging New Frontiers (ICADL 2007)