Internet-Suchmaschinen
Teaching personnel
- Lecturer
- Tutor(s)
- Lab Tutor(s)
- Corrector(s)
Formalia
- Targeted audience
- Angewandte Informatik Bachelor: Schwerpunkt Medieninformatik (ursprünglicher Name: "Einführung in Information Retrieval")
- Komedia Bachelor
Dates
Lectures
Date | Time | Place |
Tuesday | 12:00 - 13:30 | LF/035 |
Tutorials
Date | Time | Start | Place | Tutor |
Friday | 10:15 - 11:00 | LE/120 | Dr.-Ing. Dipl.-Inform. Matthias Jordan |
Labs
Date | Time | Place | Tutor |
- | LF/230 | Dipl.-Inform. Thomas Beckers |
Examination Dates
Oral Exam
Period | Place |
---|---|
23.03.2015 - 27.03.2015 | LF/135 |
Die Einzeltermine werden nach Ablauf der Rücktrittsfrist
(1 Woche) hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert
sein, senden Sie bitte eine Mail an unsere Sekretärin Fr. Ufermann. Dabei beachten Sie bitte folgende Hiweise:
- Melden Sie sich bitte frühestens 4 Wochen vorher (sonst melden sich viele, die die Prüfung dann doch nicht machen) und spätestens am 15.3.
- Da voraussichtlich die Prüfungen nur von Dienstag-Donnerstag stattfinden, können Wünsche für Montag oder Freitag nicht berücksichtigt werden.
- Sie sollten an mindestens einem dieser 3 Tage ganztägig verfügbar sein. Wenn Sie nur an einem halben Tag können, werden wir uns bemühen, können aber nichts versprechen.
- Wenn Sie in diesem Zeitraum gar nicht können, werden wir einen Sondertermin ausmachen
- Wenn Sie zu 2 Prüfungen angemeldet sind, werden diese immer an einem Termin abgehandelt.
Description
Internet search engines are the central startting point for satisfying today's information needs. These engines are representatives of the broader class of informaiton retrieval systems, which are applied in many other environments (like e.g. internet shops, digital libraries, help systems, enterprise search).
This course will introduce the basic models and concepts for content-oriented search in the Web and other text collections. collections of text documents. of this area. In the exercises, examples will deepen the understanding of the theoretical concepts, and small practical exercises will be carried out. In the lab part, students will wokr on th configuration, application and evaluation of search engines.
Content:
- Basic concepts (information literacy, vagueness and uncertainty, data, information and knowledge)
- Representation of text content (free text search, classifications, ontologies)
- Models (boolean, fuzzy, vector space, probabilistic retrieval, Web retrieval) . Evaluation (effectiveness vs efficiency, relevance, metrics for boolean retrieval, evaluation of linear rankings)
- Interactive Retrieval (information seeking behavior; information search; system functions, user interfaces)
Lecture material
Außer den Folienkopien wird noch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
- Empfohlene IR-Bücher aus unserer LibraryThing-Sammlung
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval. Cambridge University Press, 2008.
- Bruce Croft, Donald Metzler, Trevor Strohman: Search Engines: Information Retrieval in Practice. Addison-Wesley, 2009.
- R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval: The Concepts and Technology Behind Search. ACM Press Books.
- Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack: Information Retrieval: Implementing and Evaluating Search Engines. MIT Press, 2010
- Marti A. Hearst: Search User Interfaces. Cambridge University Press. (2009)
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag .
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
- Einige weitere IR-Bücher und -Skripte sind hier verlinkt
Skriptum
(Das Skriptum deckt den Vorlesungsstoff mit
Ausnahme der letzten
Kapitel ab, die
nur als Folien verfügbar sind.)
Skript
Kapitel 1-7
'Link-Analyse' ist in Kapitel 21 des Buches Introduction to Information Retrieval beschrieben
Folien
- Überblick über das Lehrangebot des Fachgebiets
- Einführung Folien Handout
- Repräsentation von Textinhalten Folien Handout
- Nicht-probabilistische Modelle Folien Handout
- Probabilistische Modelle Folien Handout
- Evaluierung Folien Handout
- Neuere probabilistische Modelle (im WS 12/13 ohne Diversity) Folien Handout
- Link-Analyse für die Web-Suche: lokale Kopie der Folien von Hinrich Schütze
- Interaktives Retrieval Folien Handout
- Benutzeroberflächen Folien Handout
Prüfungsfragen: Beispiele
Links
Übungen
An dieser Stelle werden wöchentlich die Übungsaufgaben zum Download bereitgestellt.
Um Übungsblätter abgeben zu können, ist eine Anmeldung zur Übung erforderlich.
- Übungsblatt 1 – IR im Alltag
- Übungsblatt 2 – Wissensrepräsentation 1
- Übungsblatt 3 – Nicht-probabilistische Modelle 1
- Übungsblatt 4 – Nicht-probabilistische Modelle 2 und BIR-Modell
- Übungsblatt 5 – Probabilistische Modelle 2
- Übungsblatt 6 – Evaluierung 1
- Übungsblatt 7 – Evaluierung 2
- Übungsblatt 8 – Neuere probabilistische Modelle
- Übungsblatt 9 – Link-Analyse
- Übungsblatt 10 – Interaktives IR, Websuche
- Übungsblatt 11 – Interaktives IR 2
Abgabeformular für die Übungszettel.
Praktikum
- Das Bestehen des Praktikums ist Voraussetzung für die Klausur.
- Die Bearbeitung der Praktikums-Aufgaben kann in Einzelarbeit oder in Zweiergruppen erfolgen.
- Den Abschluss des Praktikums bildet eine Abnahme vom 21.7. bis 22.7. Dazu muss frühzeitig per E-Mail an tbeckers@is.inf.uni-due.de ein Termin vereinbart werden.
Aufgaben
Materialien
- CLEF-Kollektion – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- Die Topics (Aufgaben) – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- Relevanzurteile – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- TRECEval – Tool für Aufgabe 2 (Original-Version in C)
- MiniTRECEval
– Tool für Aufgabe 2 (Version in Java 1.7+ – Aufruf:
java -jar eval-tools.jar
)