Modulinformationssystem Informatik

 

Intelligent Information Systems URL PDF XML

Modulcode: MS0503
Englische Bezeichnung: Intelligent Information Systems
Modulverantwortliche(r): Prof. Dr. Bernhard Thalheim
Turnus: unregelmäßig (WS06/07 WS08/09 WS10/11)
Präsenzzeiten: 4V 2Ü
ECTS: 8
Workload: 240 Std.
Dauer: ein Semester
Modulkategorien: IG (MSc Inf)
Lehrsprache: Deutsch
Voraussetzungen: Info

Kurzfassung:

Intelligente Informationssysteme sind Erweiterungen von Informationssysteme um Analysesysteme (Data mining), Aufbereitungssysteme (OLAP und data warehousing) und Benutzungsräume.

Data Mining beschäftigt sich mit dem maschinellen Auffinden von Klassifikationsfunktionen, Regeln und anderen formalisierbaren Zusammenhängen innerhalb von großen Datenmengen. Typische Daten sind z.B. die Kaufaktivitäten von Kunden, Worthäufigkeiten in Spam-Emails oder die Logs von Webserverzugriffen. Beispielhafte Anwendungen umfassen Aussortieren von Spam-Emails, Aufspüren von Insiderhandel auf den Börsen, Klassifizieren von Zielpersonen einer Marketingkampagne, oder das Erkennen von Anomalien im Betrieb von Computersystemen.

Aufbereitungssysteme stellen einem Benutzer anhand seiner gewünschten Inhalte Daten in der erforderlichen Form, Breite, Detailiertheit und Qualität zur Verfügung. Typische Beispiele solcher Systeme sind OLAP- und Data-Warehouse-Systeme. Logisitk-Systeme sind eine andere Kategorie von Systemen, die sich durch eine adäquate Lieferung von Daten zur richtigen Zeit für den richtigen Benutzer in der richtigen Qualität auszeichnen.

Benutzungsräume gehen über die einfache Sitzungsunterstützung hinaus. Nicht nur Sicherheits- und inbesondere Privatheitsaspekte sind hier besonders zu unterstützen, sondern auch ein aufgabenbezogene Bereitstellung von entsprechenden erweiterten Systemen, mit denen ein Benutzer für seine Aufgaben eine entsprechende Unterstützung erhalten kann. Es werden dem Benutzer darüber hinaus Werkzeuge bereitsgestellt werden müssen, mit dem eine plug-in/play-out-Benutzung innerhalb seiner Arbeitsräume unterstützt wird.

Lernziele:

Die Studenten sollen die Möglichkeiten intelligenter Systeme anhand dreier spezieller Erweiterungen von Informationssystemen kennenlernen, so dass diese Systeme um Intelligenzkomponenten erweitert werden können.

I. Wir möchten uns in dieser Vorlesung zum ersten mit den algorithmischen Grundlagen des Data Mining, der Datenbereitstellung und der Benutzungsschnittstellen beschäftigen, jedoch diese im Kontext der Anwendungen kennen lernen. Zu den Algorithmen gehören u.a. diverse Klassifikationstechniken, Assoziationsregeln, das Clustering, und Methoden der Zeitreihenanalyse. Weitere wichtige Themen umfassen Datenaufbereitung, Selektion signifikanter Attribute, und die Bewertung der Klassifikationsgüte.

II. Aufbereitungssysteme sollen einem Benutzer die Daten in der Form bereitstellen, die er zur Erfüllung seiner Aufgaben benötigt. Diese Systeme integrieren zum einem die Generierung von Makrodaten aus den vorhandenen Daten, die Vorhaltung und Bereitstellung entsprechender Daten, sowie die Adaption an die spezifischen Anforderungen. Hierzu werden neben der klassischen Datenbanktechnologie insbesondere Algorithmen der Künstlichen Intelligenz eingesetzt.

Lehrinhalte:

I. Data mining und Datenaufbereitung

I.1. Mathematische GL

I.2. Klassifikation

I.3. Assoziationen

I.4. Modellierung

I.5. Cluster-Analyse

I.6. Anomalien

II. Datenbereitstellung

II.1. Data warehousing

II.2. OLAP-Anwendungen

II.3. Logistiksysteme

III. Benutzungsplätze und Benutzungsarbeitsräume

III.1. Benutzungsprofile und -portfolio, Informationsbedarf

III.2. Benutzungsplatz

III.3. Benutzungsräume

Weitere Voraussetzungen:

Grundkenntnisse der Wahrscheinlichkeitsrechnung, Statistik und Logik, Datenbanken I, Informatik I - IV

Prüfungsleistung:

Klausur

Lehr- und Lernmethoden:

Verwendbarkeit:

Literatur:

Daniel T. Larose: Discovering Knowledge in Data, Wiley-Interscience, 2005

Tom Mitchell, Machine Learning, McGraw Hill, 1997

Jiawei Han, Micheline Kamber: Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001

Ian H. Witten, Elbe Frank: Data Mining. Morgan Kaufmann Publishers, 1999 (auch als deutsche Ausgabe verfügbar),

oder 2005 (2nd edition). Nong Ye (editor), The Handbook of data mining, Lawrence Erlbaum Associates Publishers, 2003

Nada Lavrac, Saso Dzeroski, Inductive Logic Programming: Techniques and Applications. Ellis Horwood, 1994, (freier Download)

Verweise:

Tools: KXen (in den Labs und students editions)

Weka 3.4 Software, http://www.cs.waikato.ac.nz/ml/weka/

OLAP-Werkzeuge

HCI-Systeme

Kommentar: