Internet-Suchmaschinen
Teaching personnel
- Lecturer
- Tutor(s)
- Lab Tutor(s)
- Corrector(s)
Formalia
- Targeted audience
- Angewandte Informatik Bachelor: Schwerpunkt Medieninformatik (ursprünglicher Name: "Einführung in Information Retrieval")
Dates
Lectures
Date | Time | Place |
Tuesday | 12:00 - 13:30 | LF/035 |
Tutorials
Date | Time | Place | Tutor |
Friday | 10:15 - 11:00 | LC/137 | Dr.-Ing. Dipl.-Inform. Matthias Jordan |
Labs
Date | Time | Place | Tutor |
- | LF/230 | Dipl.-Inform. Thomas Beckers |
Examination Dates
Exam
Date | Time | Place |
19. 08. 2013 | 10:00 - 12:00 | LD/102 |
Oral Exam
Period | Place |
---|---|
16.09.2013 - 19.09.2013 | LF/135 |
Die Einzeltermine werden nach Ablauf der Rücktrittsfrist hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert sein, senden Sie bitte spätestens 10 Tage vorher eine Mail an norbert.fuhr@uni-due.de.
Description
Internet search engines are the central startting point for satisfying today's information needs. These engines are representatives of the broader class of informaiton retrieval systems, which are applied in many other environments (like e.g. internet shops, digital libraries, help systems, enterprise search).
This course will introduce the basic models and concepts for content-oriented search in the Web and other text collections. collections of text documents. of this area. In the exercises, examples will deepen the understanding of the theoretical concepts, and small practical exercises will be carried out. In the lab part, students will wokr on th configuration, application and evaluation of search engines.
Content:
- Basic concepts (information literacy, vagueness and uncertainty, data, information and knowledge)
- Representation of text content (free text search, classifications, ontologies)
- Models (boolean, fuzzy, vector space, probabilistic retrieval, Web retrieval) . Evaluation (effectiveness vs efficiency, relevance, metrics for boolean retrieval, evaluation of linear rankings)
- Interactive Retrieval (information seeking behavior; information search; system functions, user interfaces)
Lecture material
Außer den Folienkopien wird noch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
- Empfohlene IR-Bücher aus unserer LibraryThing-Sammlung
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval. Cambridge University Press, 2008.
- Bruce Croft, Donald Metzler, Trevor Strohman: Search Engines: Information Retrieval in Practice. Addison-Wesley, 2009.
- R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval: The Concepts and Technology Behind Search. ACM Press Books.
- Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack: Information Retrieval: Implementing and Evaluating Search Engines. MIT Press, 2010
- Marti A. Hearst: Search User Interfaces. Cambridge University Press. (2009)
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag .
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
- Einige weitere IR-Bücher und -Skripte sind hier verlinkt
Skriptum
(Das Skriptum deckt den Vorlesungsstoff mit
Ausnahme der letzten
Kapitel ab, die
nur als Folien verfügbar sind.)
Skript
Kapitel 1-7
'Link-Analyse' ist in Kapitel 21 des Buches Introduction to Information Retrieval beschrieben
Folien
- Einführung Folien Handout
- Repräsentation von Textinhalten Folien Handout
- Nicht-probabilistische Modelle Folien Handout
- Probabilistische Modelle Folien Handout
- Evaluierung Folien Handout
- Neuere probabilistische Modelle (im WS 12/13 ohne Diversity) Folien Handout
- Link-Analyse für die Web-Suche: Folien (lokale Kopie) Handout
- Interaktives Retrieval Folien Handout
- Benutzeroberflächen Folien Handout
Prüfungsfragen: Beispiele
Links
Material for the tutorials
Arbeitsblätter
An dieser Stelle werden wöchentlich die Übungsaufgaben zum Download bereitgestellt.
Um Übungsblätter abgeben zu können, ist eine Anmeldung zur Übung erforderlich.
Abgabeformular für die Übungszettel.
Praktikum
- Das Bestehen des Praktikums ist Voraussetzung für die Klausur.
- Die Bearbeitung der Praktikums-Aufgaben kann in Einzelarbeit oder in Zweiergruppen erfolgen.
- Den Abschluss des Praktikums bildet eine Abnahme vom 22.7 bis 26.7. Dazu muss frühzeitig per E-Mail ein Termin vereinbart werden.
Aufgaben
Materialien
- CLEF-Kollektion – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- Die Topics (Aufgaben) – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- Relevanzurteile – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- TRECEval – Tool für Aufgabe 2 (Original-Version in C)
- MiniTRECEval
– Tool für Aufgabe 2 (Version in Java 1.7 – Aufruf:
java -jar eval-tools-1.0.1.jar
)