Entwurf und Realisierung einer Daten-Definitions-Sprache für Retrieval von XML-Dokumenten

Status


Abgeschlossene Diplomarbeit

Bearbeiter


  • Faisal Amir

Abgabetermin


2000 - 05

Aufgabenstellung


In unserer Arbeitsgruppe wird zur Zeit ein neues Information-Retrieval-System (IRS) entwickelt, das insbesondere auch multimediale und strukturierte Dokumente unterstützen soll. Als Standard-Datenformat ist dabei XML vorgesehen. Um solche Dokumente verwalten zu können und insbesondere auch effizient suchen zu können, muss die Möglichkeit zur Definition entsprechender Schemata mit Hilfe einer Datendefinitionssprache (DDL) geschaffen werden. Neben der document type definition (DTD) der Dokumente müssen folgende Arten von zusätzlichen Angaben im Rahmen der DDL festgelegt werden:

  • Spezifikation des Datentyps (einschließlich darauf anzuwendender Suchprädikate) einzelner XML-Felder
  • Strukturierung von Mengen von Dokumenten mit unterschiedlichen DTDs, i.e. als Klassen von Dokumenten
  • logische Abbildungen zwischen verschiedenen Dokumentklassen (um einfachere Sichten auf Dokumente zu realisieren oder um Dokumentklassen gemeinsam betrachten zu können)
  • Festlegung der (physischen) Zugriffsstrukturen

Mit Hilfe dieser Sprache kann dann das Schema eines IRS definiert werden.

Zusätzlich sollen noch entsprechende Eingaberoutinen automatisch generiert werden, um Mengen von Dokumenten in das IRS einbringen zu können.