Modulinformationssystem Informatik

 

Information Mining and Knowledge Discovery URL PDF XML

Modulcode: WInf-InfMinKD
Englische Bezeichnung: Information Mining and Knowledge Discovery
Modulverantwortliche(r): Prof. Dr. Bernhard Thalheim
Turnus: unregelmäßig (WS10/11 WS12/13 SS14)
Präsenzzeiten: 2Ü 1PÜ
ECTS: 4
Workload: 30 Std. Vorlesung mit integrierter Übung, 15 Std. betreute Rechnerübungen,75 Std. Selbststudium
Dauer: ein Semester
Modulkategorien: WI (MEd Inf) IG (TA) (MSc Inf (2-Fach)) IG (SA) (MSc Inf (2-Fach)) AM-IDWM (MSc WInf)
Lehrsprache: Englisch
Voraussetzungen: Info

Kurzfassung:

Data Mining beschäftigt sich mit dem maschinellen Auffinden von Klassifikationsfunktionen, Regeln und anderen formalisierbaren Zusammenhängen innerhalb von großen Datenmengen. Typische Daten sind z.B. die Kaufaktivitäten von Kunden, Worthäufigkeiten in Spam-Emails oder die Logs von Webserverzugriffen. Beispielhafte Anwendungen umfassen Aussortieren von Spam-Emails, Aufspüren von Insiderhandel auf den Börsen, Klassifizieren von Zielpersonen einer Marketingkampagne, oder das Erkennen von Anomalien im Betrieb von Computersystemen.

Lernziele:

Students know main algorithms for data mining, information visualisation and modelling, and knowledge discovery. They are able to apply them under consideration of data material on hand and of information demand. They know how to derive a data and information mining plan and how to prepare the data for this process. A successful attendance of the course will enable the student to solve practical machine learning and data mining problems by state-of-the-art methods, to analyze and evaluate the results from a theoretical point of view, and to develop new, specialized approaches for particular problems whenever needed.

Lehrinhalte:

The course surveys main data and information mining methods and knowledge discovery processes. In recent years, machine learning has become one of the core disciplines in artificial intelligence research and related areas. This course is devoted to advanced methods and techniques of machine learning that go beyond the topics that are typically covered by introductory courses in the field.

Data mining and information mining aim at discovery of unknown associations within data sets and their visualisation and systematic consideration. Data mining is the process of computing a set of pattern for a search space of all pattern based on a data set and restricted by constraints that specify which pattern are of interest. Information mining is based on data mining. It considers the information demand by adaptation and combination of data mining algorithms to the needs of the user. It provides mechanism for pattern visualisation and graphical reasoning. It is restricted by security and privacy concerns. It results in models for new information. Learning and validating pattern from data results in knowledge extraction. It provides a basis for understanding the pattern and explaining the result. It allows to systematically integrate new pattern into already existing concepts.

Übersicht zu den einzelnen Teilmodulen des Data Mining:

  1. Mathematische Grundlagen der Konzept- und Hypothesenentwicklung, -weiterentwicklung, -validierung und -ablehnung sowie adäquate Datenräume
  2. Verfahren zur Klassifikation von Daten, Grenzen und Nichtanwendbarkeit dieser Verfahren
  3. Verfahren zur Assoziationen von Daten, Grenzen und Nichtanwendbarkeit dieser Verfahren
  4. Modellierung von Daten, ihren Zusammenhängen, der Bewertung der Modellierung
  5. Verfahren zur Cluster-Analyse, Grenzen und Nichtanwendbarkeit dieser Verfahren
  6. Anomalien in Daten, Behandlung von riesigen und zu kleinen Datenmassiven, Qualität von Analyseverfahren, Beprobung mit kleinen und ungewichtigen Stichproben
  7. Systematische Erhebung von Daten, systematisches Aufsetzen von Erhebungsexperimenten und systematische Auswertung und Anpassung von Experimenten

Übersicht zu den weiteren Teilkapiteln der intelligenten Systeme (Kombination mit Intelligente Systeme):

I. Datenbereitstellung

I.1. Data warehousing

I.2. OLAP-Anwendungen

I.3. Logistiksysteme

II. Intelligente Systeme

II.1 Heuristische Suche

II.2. Agenten

II.3. Nichtmonotones Schliessen

III. Benutzungsplätze und Benutzungsarbeitsräume

III.1. Benutzungsprofile und -portfolio, Informationsbedarf

III.2. Benutzungsplatz

III.3. Benutzungsräume

Weitere Voraussetzungen:

Basic knowledge in probability theory, statistics and logics; Information Systems; Programming; Algorithms and Data Structures

Prüfungsleistung:

Data mining project and project defense

Lehr- und Lernmethoden:

Lectures on basis issues, studies of algorithms, exploration of the information mining space, interactive concept and knowledge development

Verwendbarkeit:

Accent course within the specialisation Information, data and knowledge management''

Literatur:

Jiawei Han, Micheline Kamber: Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001

sowie Literatur, die aktuell zur Verfügung gestellt wird ( siehe http://www.is.informatik.uni-kiel.de/~thalheim/vorlesungen )

Verweise:

Kommentar: