Modulinformationssystem Informatik

 

Information Retrieval URL PDF XML

Modulcode: infIR-01a
Englische Bezeichnung: Information Retrieval
Modulverantwortliche(r): Prof. Dr. Ralf Krestel
Turnus: unregelmäßig (WS21/22 WS23/24 SS25)
Präsenzzeiten: 4V 1Ü 1PÜ
ECTS: 8
Workload: 60 Std. Vorlesung, 15 Std. Präsenzübung, 15 Std. praktische Übung, 150 Std. Selbststudium
Dauer: ein Semester
Modulkategorien: BSc-Inf-WP (BSc Inf (21)) WI (BSc Inf (15)) MSc-Inf-WP (MSc Inf (21)) 2F-MEd-Inf-WP (MEd-Hdl Inf (21)) 2F-MA-Inf-WP (2F-MA Inf (21)) MSc-WInf-WP-WInf (MSc WInf (21)) WI (MSc Inf (15)) 2F-MA Inf WP (2F-MA Inf) WWi (MSc WInf (15))
Lehrsprache: Deutsch
Voraussetzungen: Info infDB-01a

Kurzfassung:

Das Finden von Informationen ist die Kernkomponente vieler Anwendungen: von klassischen Internet-Suchmaschinen, über Online-Shops bis hin zur Diagnose von Krebszellen. Den Ursprung hat "Information Retrieval" in den Bibliothekswissenschaften. Seit der Erfindung von Computern und dem Internet rückte jedoch die Textsuche im Web in den Vordergrund der Anwendung und Forschung.

In dieser Vorlesung werfen wir im ersten Teil einen Blick auf die grundlegenden Konzepte des Information Retrievals: Crawling, Indexierung, Suchmodelle, Anfrageverarbeitung, Benutzerschnittstellen und Evaluation. Im zweiten Teil lernen wir Ansätze des maschinellen Lernens zur Verbesserung der Suchergebnisse kennen. Und im letzten Teil geben wir einen Einblick in aktuelle Anwendungsfelder, wie z.B. Web IR und Multimedia IR, sowie damit verbundene betriebswirtschaftliche Überlegungen, wie z.B. Geschäftsmodelle, Urheberrechte, Datenschutz. Die Veranstaltung hat einen großen praktischen Anteil ("learning by doing") und die theoretischen Konzepte werden anhand von Anwendungen und Beispielen veranschaulicht.

Lernziele:

Studierende können...

  • die Geschichte des IR skizzieren
  • Grundlegende Begriffe des IR erläutern
  • beliebige Textsammlungen technisch erschließen
  • eigene Textsammlungen erstellen (crawling)
  • einen einfachen Index erstellen
  • unterschiedliche Retrieval-Modelle erklären und anpassen
  • Benutzerschnittstellen für IR bewerten
  • verschiedene Suchalgorithmen qualitativ und quantitativ vergleichen
  • Methoden des maschinellen Lernens auf IR anwenden
  • die besonderen Schwierigkeiten der Websuche erläutern
  • Geschäftsmodelle für Suchmaschinen bewerten
  • PageRank und HITS berechnen
  • Grundlagen der Multimediasuche und der personalisierten Suche erläutern
  • Eine Volltext-Suchmaschine entwerfen, implementieren und evaluieren

Lehrinhalte:

  • Grundlagen
  • Textaquise und -transformation
  • Indexerstellung
  • Retrieval-Modelle
  • Benutzerinteraktion
  • Evaluation
  • Dokumentorganisation
  • Learning-To-Rank
  • Topic Modelle
  • Verteilte Repräsentationen
  • Deep Learning Lösungen für IR
  • Websuche und Performance
  • Geschäftsmodelle für Suchmaschinen
  • Linkanalyse
  • Question Answering und Knowledge Graphen
  • Personalisierung und Soziale Suche
  • Multimediasuche

Weitere Voraussetzungen:

Für den praktischen Teil der Übungsaufgaben verwenden wir Python. Studierende können aber für ihre Einreichungen auch Java verwenden. D.h., entweder Python oder Java sollte ausreichend beherrscht werden.

Prüfungsleistung:

  • Schriftliche Klausur am Ende des Semesters.
  • Teilnahmevoraussetzung für die Klausur ist das erfolgreiche Bearbeiten der Übungsblätter

Lehr- und Lernmethoden:

Es werden in der Vorlesung grundlegende Konzepte des IR eingeführt, welche anhand von Beispielen und Anwendungen vertieft werden. In der Übung entwickeln die Studierenden über das Semester eine eigene Volltext-Suchmaschine in Kleingruppen angeleitet durch wöchentlichen Übungsblätter.

Verwendbarkeit:

Literatur:

  • Search Engines: Information Retrieval in Practice by W. Bruce Croft, Donald Metzler, and Trevor Strohman
  • Information Retrieval: Implementing and Evaluating Search Engines by Stefan Büttcher, Charles L. A. Clarke, and Gordon V. Cormack
  • An Introduction to Information Retrieval by Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze

Verweise:

Kommentar: