Internet-Suchmaschinen
Lehrpersonen
- Dozent(in)
- Übungsleiter(innen)
- Praktikumsleiter(innen)
- Korrekteur(e)
Formalia
- Zielgruppe
- Angewandte Informatik Bachelor: Schwerpunkt Medieninformatik (ursprünglicher Name: "Einführung in Information Retrieval")
Termine
Vorlesung
Tag | Zeit | Ort |
Dienstag | 12:00 - 13:30 | LF/035 |
Übungen
Tag | Zeit | Ort | Betreuer |
Freitag | 10:15 - 11:00 | LC/137 | Dr.-Ing. Dipl.-Inform. Matthias Jordan |
Praktikum
Tag | Zeit | Ort | Betreuer |
- | LF/230 | Dipl.-Inform. Thomas Beckers |
Prüfungstermine
Klausur
Tag | Zeit | Ort |
19. 08. 2013 | 10:00 - 12:00 | LD/102 |
Mündliche Prüfung
Zeitraum | Ort |
---|---|
16.09.2013 - 19.09.2013 | LF/135 |
Die Einzeltermine werden nach Ablauf der Rücktrittsfrist hier auf der Webseite bekanntgegeben.
Sollten Sie an einzelnen Tagen des o.g. Prüfungszeitraums verhindert sein, senden Sie bitte spätestens 10 Tage vorher eine Mail an norbert.fuhr@uni-due.de.
Beschreibung
Internet-Suchmaschinen sind heute die zentrale Anlaufstelle für viele tägliche Informationsbedürfnisse. Eine kompetente Nutzung setzt allerdings Kenntnisse über die Möglichkeiten und Grenzen dieser Systeme voraus, über die aber nur wenige Nutzer verfügen ("Suchkompetenz"). Zudem sind diese Suchmaschinen die bekanntesten Vertreter von Information-Retrieval-Systemen, die auch in vielen anderen Anwendungen (wie z.B. Internet-Shops, Digitale Bibliotheken, Hilfesysteme, Enterprise Search, Wissensmanagement) eingesetzt werden.
In dieser Vorlesung werden Modelle und Methoden für die inhaltsorientierte Suche im Web und anderen Textbeständen vorgestellt. In der Übung werden die theoretischen Konzepte anhand von Beispielen vertieft und kleine praktische Aufgaben am Rechner durchgeführt. Das Praktikum beschäftigt sich mit der Konfiguration, Anwendung und Evaluierung von Suchmaschinen.
Inhalt:
- Basiskonzepte (Informationskompetenz, Vagheit und Unsicherheit, Daten-Information-Wissen)
- Repräsentation von Textinhalten (Freitextsuche, Klassifikationen, Ontologien)
- Modelle (Boolesches und Fuzzy-Retrieval, Vektorraummodell, Probabilistisches Retrieval, Web-spezifische Modelle)
- Evaluierung (Effektivität; Relevanz; Metriken für Booleschem Retrieval; Evaluierung von linearen Rangordnungen)
- Interaktives Retrieval (Information Seeking Behavior; Information Search; Systemfunktionalität; Benutzeroberflächen)
Vorlesungsmaterial
Außer den Folienkopien wird noch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
- Empfohlene IR-Bücher aus unserer LibraryThing-Sammlung
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval. Cambridge University Press, 2008.
- Bruce Croft, Donald Metzler, Trevor Strohman: Search Engines: Information Retrieval in Practice. Addison-Wesley, 2009.
- R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval: The Concepts and Technology Behind Search. ACM Press Books.
- Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack: Information Retrieval: Implementing and Evaluating Search Engines. MIT Press, 2010
- Marti A. Hearst: Search User Interfaces. Cambridge University Press. (2009)
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag .
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
- Einige weitere IR-Bücher und -Skripte sind hier verlinkt
Skriptum
(Das Skriptum deckt den Vorlesungsstoff mit
Ausnahme der letzten
Kapitel ab, die
nur als Folien verfügbar sind.)
Skript
Kapitel 1-7
'Link-Analyse' ist in Kapitel 21 des Buches Introduction to Information Retrieval beschrieben
Folien
- Einführung Folien Handout
- Repräsentation von Textinhalten Folien Handout
- Nicht-probabilistische Modelle Folien Handout
- Probabilistische Modelle Folien Handout
- Evaluierung Folien Handout
- Neuere probabilistische Modelle (im WS 12/13 ohne Diversity) Folien Handout
- Link-Analyse für die Web-Suche: Folien (lokale Kopie) Handout
- Interaktives Retrieval Folien Handout
- Benutzeroberflächen Folien Handout
Prüfungsfragen: Beispiele
Links
Material zu den Übungen
Arbeitsblätter
An dieser Stelle werden wöchentlich die Übungsaufgaben zum Download bereitgestellt.
Um Übungsblätter abgeben zu können, ist eine Anmeldung zur Übung erforderlich.
Abgabeformular für die Übungszettel.
Praktikum
- Das Bestehen des Praktikums ist Voraussetzung für die Klausur.
- Die Bearbeitung der Praktikums-Aufgaben kann in Einzelarbeit oder in Zweiergruppen erfolgen.
- Den Abschluss des Praktikums bildet eine Abnahme vom 22.7 bis 26.7. Dazu muss frühzeitig per E-Mail ein Termin vereinbart werden.
Aufgaben
Materialien
- CLEF-Kollektion – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- Die Topics (Aufgaben) – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- Relevanzurteile – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- TRECEval – Tool für Aufgabe 2 (Original-Version in C)
- MiniTRECEval
– Tool für Aufgabe 2 (Version in Java 1.7 – Aufruf:
java -jar eval-tools-1.0.1.jar
)