Internet-Suchmaschinen

Formalia


Targeted audience
  • Angewandte Informatik Bachelor: Schwerpunkt Medieninformatik (ursprünglicher Name: "Einführung in Information Retrieval")
  • Komedia Bachelor

Dates


Lectures

Date

Time

Place

Tuesday12:00 - 13:30LF/035

Tutorials

Date

Time

Start

Place

Tutor

Friday10:15 - 11:0025.4.LE/120Dr.-Ing. Dipl.-Inform. Matthias Jordan

Labs

Date

Time

Place

Tutor

- LF/230 Dipl.-Inform. Thomas Beckers

Examination Dates


Oral Exam

PeriodPlace
23.03.2015 - 27.03.2015LF/135

Die Einzeltermine werden nach Ablauf der Rücktrittsfrist (1 Woche) hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert sein, senden Sie bitte eine Mail an unsere Sekretärin Fr. Ufermann. Dabei beachten Sie bitte folgende Hiweise:

  • Melden Sie sich bitte frühestens 4 Wochen vorher (sonst melden sich viele, die die Prüfung dann doch nicht machen) und spätestens am 15.3.
  • Da voraussichtlich die Prüfungen nur von Dienstag-Donnerstag stattfinden, können Wünsche für Montag oder Freitag nicht berücksichtigt werden.
  • Sie sollten an mindestens einem dieser 3 Tage ganztägig verfügbar sein. Wenn Sie nur an einem halben Tag können, werden wir uns bemühen, können aber nichts versprechen.
  • Wenn Sie in diesem Zeitraum gar nicht können, werden wir einen Sondertermin ausmachen
  • Wenn Sie zu 2 Prüfungen angemeldet sind, werden diese immer an einem Termin abgehandelt.
 

Description


Internet search engines are the central startting point for satisfying today's information needs. These engines are representatives of the broader class of informaiton retrieval systems, which are applied in many other environments (like e.g. internet shops, digital libraries, help systems, enterprise search).

This course will introduce the basic models and concepts for content-oriented search in the Web and other text collections. collections of text documents. of this area. In the exercises, examples will deepen the understanding of the theoretical concepts, and small practical exercises will be carried out. In the lab part, students will wokr on th configuration, application and evaluation of search engines.

Content:

  • Basic concepts (information literacy, vagueness and uncertainty, data, information and knowledge)
  • Representation of text content (free text search, classifications, ontologies)
  • Models (boolean, fuzzy, vector space, probabilistic retrieval, Web retrieval) . Evaluation (effectiveness vs efficiency, relevance, metrics for boolean retrieval, evaluation of linear rankings)
  • Interactive Retrieval (information seeking behavior; information search; system functions, user interfaces)

Lecture material


Außer den Folienkopien wird noch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:

Skriptum

(Das Skriptum deckt den Vorlesungsstoff mit Ausnahme der letzten Kapitel ab, die nur als Folien verfügbar sind.)
Skript Kapitel 1-7

'Link-Analyse' ist in Kapitel 21 des Buches Introduction to Information Retrieval beschrieben

Folien

Prüfungsfragen: Beispiele

Links

Übungen


An dieser Stelle werden wöchentlich die Übungsaufgaben zum Download bereitgestellt.

Um Übungsblätter abgeben zu können, ist eine Anmeldung zur Übung erforderlich.

Abgabeformular für die Übungszettel.

Punkteabfrage

Praktikum


  • Das Bestehen des Praktikums ist Voraussetzung für die Klausur.
  • Die Bearbeitung der Praktikums-Aufgaben kann in Einzelarbeit oder in Zweiergruppen erfolgen.
  • Den Abschluss des Praktikums bildet eine Abnahme vom 21.7. bis 22.7. Dazu muss frühzeitig per E-Mail an tbeckers@is.inf.uni-due.de ein Termin vereinbart werden.

Aufgaben

Aufgabenblatt

Materialien

  • CLEF-Kollektion – Teil der CLEF-Kollektion für Aufgaben 1 und 2
  • Die Topics (Aufgaben) – Teil der CLEF-Kollektion für Aufgaben 1 und 2
  • Relevanzurteile – Teil der CLEF-Kollektion für Aufgaben 1 und 2
  • TRECEval – Tool für Aufgabe 2 (Original-Version in C)
  • MiniTRECEval – Tool für Aufgabe 2 (Version in Java 1.7+ – Aufruf: java -jar eval-tools.jar)