Internet-Suchmaschinen
Formalia
- Zielgruppe
- Angewandte Informatik Bachelor: Schwerpunkt Medieninformatik (ursprünglicher Name: "Einführung in Information Retrieval")
- Komedia Bachelor
Termine
Vorlesung
Tag | Zeit | Ort |
Dienstag | 16:00 - 17:30 | LB/131 |
Übungen
Tag | Zeit | Ort | Betreuer |
Freitag | 10:15 - 11:00 | LE/120 | Dr. Ahmet Aker |
Prüfungstermine
Mündliche Prüfung
Zeitraum | Ort |
---|---|
31.08.2020 - 02.09.2020 | LF/135 |
Sie müssen sich wie üblich beim Prüfungsamt für die Prüfung anmelden. Normalerweise brauchen Sie nichts weiter zu tun.
Ihr individueller Prüfungstermin wird dann innerhalb der o.g. Zeitspanne festgelegt und am Dienstag vor der Prüfungswoche (Tag nach Ende der Rücktrittsfrist) auf unserer Webseite bekannt geben.
Falls (und nur dann!!!) Sie nicht an allen Tagen des Prüfungszeitraums verfügbar sind, senden Sie bttte eine Email an Prof. Fuhr Bitte beachten Sie dabei folgende Regeln
- Senden Sie diese Email nicht früher als 4 Wochen und nicht später als 2 Wochen vor der Prüfung
- Wahrscheinlich finden die Prüfungen nur dienstags und mittwochs statt., Wünsche für Montag können daher nicht berücksichtigt werden.
- Sie sollten an mindestens einem der beiden Tage ganztägig verfügbar sein - falls Sie nur an einem halben Tag können, versuchen wir unser Bestes.
Emails, die sich nicht an dise Regeln halten, werden ignoriert (wie z.B. die Anfrage 'Ich hätte gerne einen Prüfungstermin', oder Emails, die nicht von einem uni-due.de Mail-Account abgesendet wurden.)
Beschreibung
Internet-Suchmaschinen sind heute die zentrale Anlaufstelle für viele tägliche Informationsbedürfnisse. Neben den generellen Web-Suchmaschinen (z.B. Google, Bing, Yahoo!, Yandex) gibt es auch zahlreiche spezialisierte Suchmaschinen für bestimmte Objekte (z.B. News, Bilder, Videos, Personen, Firmen, Shopping, wiss Publikationen, Bücher). Ferner kommt heute kaum ein Online-Angebot ohne Suchmaschine aus - seien es Online-Shops, News Sites, Medienangebote, Firmenauftritte oder soziale Medien. In kleinerem Maßstab sind solche Systeme als Bestandteil von Hilfesystemen, im Wissensmanagement oder für die unternehmensinterne Suche (Enterprise Search) unverzichtbar.
In dieser Vorlesung werden Modelle und Methoden für die inhaltsorientierte Suche im Web und anderen Dokumentenbeständen vorgestellt. In der Übung werden die theoretischen Konzepte anhand von Beispielen vertieft und kleine praktische Aufgaben am Rechner durchgeführt. Das Praktikum beschäftigt sich mit der Konfiguration, Anwendung und Evaluierung von Suchmaschinen.
Inhalt:
- Basiskonzepte (Informationskompetenz, Vagheit und Unsicherheit, Daten-Information-Wissen)
- Repräsentation von Textinhalten (Freitextsuche, Klassifikationen, Ontologien)
- Modelle (Boolesches und Fuzzy-Retrieval, Vektorraummodell, Probabilistisches Retrieval, Web-spezifische Modelle)
- Evaluierung (Effektivität; Relevanz; Metriken für Booleschem Retrieval; Evaluierung von linearen Rangordnungen)
- Interaktives Retrieval (Information Seeking Behavior; Information Search; Systemfunktionalität; Benutzeroberflächen)
Vorlesungsmaterial
Außer den Folienkopien wird noch ein Skriptum herausgegeben. Daneben sind folgende Bücher/Skripten empfehlenswert:
- Empfohlene IR-Bücher aus unserer LibraryThing-Sammlung
- Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval. Cambridge University Press, 2008.
- Bruce Croft, Donald Metzler, Trevor Strohman: Search Engines: Information Retrieval in Practice. Addison-Wesley, 2009.
- R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval: The Concepts and Technology Behind Search. ACM Press Books.
- Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack: Information Retrieval: Implementing and Evaluating Search Engines. MIT Press, 2010
- Marti A. Hearst: Search User Interfaces. Cambridge University Press. (2009)
- Reginald Ferber: Data Mining und Information Retrieval. dpunkt Verlag .
- C. J. van Rijsbergen: Information Retrieval (HTML-Version des Buches von 1979, aber immer noch lesenswert)
- Einige weitere IR-Bücher und -Skripte sind hier verlinkt
Skriptum
(Das Skriptum (siehe ILIAS) deckt den Vorlesungsstoff mit
Ausnahme der letzten beiden
Kapitel ab, die
nur als Folien verfügbar sind.)
'Link-Analyse' ist in Kapitel 21 des Buches Introduction to Information Retrieval beschrieben
Folien
Überblick über das Lehrangebot des Fachgebiets
Die Folien zur Vorlesung sowie die Übungsblätter können über ILIAS aus Notabene heruntergeladen werden. Dafür bitte folgende Schritte ausführen:
- Shibboleth Login -> Anmeldung mit Uni-Kennung
- Klicke: Magazin -> Information Systems -> 2017 SS Internet-Suchmaschinen
- Button "Beitreten" anklicken
- "Folien/Slides" auswählen
Links
Übungen
Ziel der Übungen ist es, dass Studierenden lernen, die in der Vorlesung behandelten Konzepte auf konkrete Beispiele anzuwenden.
Die Übungen finden jede Woche statt. Die genauen Termine werden auf der Webseite angekündigt.
Übungsblätter
Die Übungsblätter können über ILIAS heruntergeladen werden.
Praktikum
- Das Bestehen des Praktikums ist Voraussetzung für die Prüfung.
- Die Bearbeitung der Praktikums-Aufgaben kann in Einzelarbeit oder in Zweiergruppen erfolgen.
- Den Abschluss des Praktikums bildet eine Abnahme am 10/11.07.2017. Dazu muss frühzeitig per E-Mail an a.aker@is.inf.uni-due.de ein genauer Termin vereinbart werden.
Aufgaben
Check this at ILIAS
Tutorial
- Das 1. Tutorial zum Praktikum findet am 19.05.17 um 11:15 Uhr im Raum LF 156 statt. Bitte das Aufgabenblatt vorher durchlesen und die nötigen Materialien bzw. Software vorher herunterladen.
- Das 2. Tutorial zum Praktikum findet am 26.05.17 um 11:15 Uhr im Raum LF 156 statt.
- Das 3. Tutorial zum Praktikum findet am 02.06.17 um 11:15 Uhr im Raum LF 156 statt.
Materialien
- CLEF-Kollektion – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- Die Topics (Aufgaben) – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- Relevanzurteile – Teil der CLEF-Kollektion für Aufgaben 1 und 2
- MiniTRECEval
– Tool für Aufgabe 2 (Version in Java 1.7+ – Aufruf:
java -jar eval-tools.jar
) - Indexierte CLEF-Kollektion
- Hilfszettel– Wichtige Befehle und Programme für das Praktikum