Internet-Suchmaschinen

Formalia


Zielgruppe
  • Angewandte Informatik Bachelor: Schwerpunkt Medieninformatik (ursprünglicher Name: "Einführung in Information Retrieval")

Termine


Vorlesung

Tag

Zeit

Ort

Montag12:00 - 14:00LE/105

Übungen

Tag

Zeit

Ort

Betreuer

Donnerstag12:15 - 13:00LE/120Dr.-Ing. Dipl.-Inform. Matthias Jordan

Praktikum

Tag

Zeit

Ort

Betreuer

- LF/136 Dr.-Ing. Dipl.-Inform. Matthias Jordan

Prüfungstermine


Klausur

Tag

Zeit

Ort

11. 03. 201310:00 - 12:00LF/035
 

Beschreibung


Internet-Suchmaschinen sind heute die zentrale Anlaufstelle für viele tägliche Informationsbedürfnisse. Eine kompetente Nutzung setzt allerdings Kenntnisse über die Möglichkeiten und Grenzen dieser Systeme voraus, über die aber nur wenige Nutzer verfügen ("Suchkompetenz"). Zudem sind diese Suchmaschinen die bekanntesten Vertreter von Information-Retrieval-Systemen, die auch in vielen anderen Anwendungen (wie z.B. Internet-Shops, Digitale Bibliotheken, Hilfesysteme, Enterprise Search, Wissensmanagement) eingesetzt werden.

In dieser Vorlesung werden Modelle und Methoden für die inhaltsorientierte Suche im Web und anderen Textbeständen vorgestellt. In der Übung werden die theoretischen Konzepte anhand von Beispielen vertieft und kleine praktische Aufgaben am Rechner durchgeführt. Das Praktikum beschäftigt sich mit der Konfiguration, Anwendung und Evaluierung von Suchmaschinen.

Inhalt:

  • Basiskonzepte (Informationskompetenz, Vagheit und Unsicherheit, Daten-Information-Wissen)
  • Repräsentation von Textinhalten (Freitextsuche, Klassifikationen, Ontologien)
  • Modelle (Boolesches und Fuzzy-Retrieval, Vektorraummodell, Probabilistisches Retrieval, Web-spezifische Modelle)
  • Evaluierung (Effektivität; Relevanz; Metriken für Booleschem Retrieval; Evaluierung von linearen Rangordnungen)
  • Interaktives Retrieval (Information Seeking Behavior; Information Search; Systemfunktionalität; Benutzeroberflächen)

Vorlesungsmaterial


Außer den Folienkopien wird noch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:

Skriptum

(Das Skriptum deckt den Vorlesungsstoff mit Ausnahme der letzten Kapitel ab, die nur als Folien verfügbar sind.)
Skript Kapitel 1-7 (draft)

'Link-Analyse' ist in Kapitel 21 des Buches Introduction to Information Retrieval beschrieben

Folien

Links

Material zu den Übungen


Arbeitsblätter

An dieser Stelle werden wöchentlich die Übungsaufgaben zum Download bereitgestellt.

Um Übungsblätter abgeben zu können, ist eine Anmeldung zur Übung erforderlich.

Abgabeformular für die Übungszettel.

Punkteabfrage

Praktikum


  • Das Bestehen des Praktikums ist Voraussetzung für die Klausur.
  • Die Bearbeitung der Praktikums-Aufgaben kann in Einzelarbeit oder in Zweiergruppen erfolgen.
  • Den Abschluss des Praktikums bildet eine Abnahme in der 9. KW 2013. Dazu muss frühzeitig ein Termin vereinbart werden. Die Abnahmen finden in Raum LF 136 statt.

Aufgaben

Aufgabenblatt

Materialien

Das Format der Datei qrels_EN ist wie folgt: [Topic-Nummer] [i] [docid] [rel]. Das Feld i kann ignoriert werden. Docid ist die Dokument-ID, rel ist 1, wenn das Dokument relevant ist, sonst 0.