Modulcode: | WInf-InfMinKD |
Englische Bezeichnung: | Information Mining and Knowledge Discovery |
Modulverantwortliche(r): | Prof. Dr. Bernhard Thalheim |
Turnus: | unregelmäßig (WS10/11 WS12/13 SS14) |
Präsenzzeiten: | 2Ü 1PÜ |
ECTS: | 4 |
Workload: | 30 Std. Vorlesung mit integrierter Übung, 15 Std. betreute Rechnerübungen,75 Std. Selbststudium |
Dauer: | ein Semester |
Modulkategorien: | WI (MEd Inf) IG (TA) (MSc Inf (2-Fach)) IG (SA) (MSc Inf (2-Fach)) AM-IDWM (MSc WInf) |
Lehrsprache: | Englisch |
Voraussetzungen: |
Data Mining beschäftigt sich mit dem maschinellen Auffinden von Klassifikationsfunktionen, Regeln und anderen formalisierbaren Zusammenhängen innerhalb von großen Datenmengen. Typische Daten sind z.B. die Kaufaktivitäten von Kunden, Worthäufigkeiten in Spam-Emails oder die Logs von Webserverzugriffen. Beispielhafte Anwendungen umfassen Aussortieren von Spam-Emails, Aufspüren von Insiderhandel auf den Börsen, Klassifizieren von Zielpersonen einer Marketingkampagne, oder das Erkennen von Anomalien im Betrieb von Computersystemen.
Students know main algorithms for data mining, information visualisation and modelling, and knowledge discovery. They are able to apply them under consideration of data material on hand and of information demand. They know how to derive a data and information mining plan and how to prepare the data for this process. A successful attendance of the course will enable the student to solve practical machine learning and data mining problems by state-of-the-art methods, to analyze and evaluate the results from a theoretical point of view, and to develop new, specialized approaches for particular problems whenever needed.
The course surveys main data and information mining methods and knowledge discovery processes. In recent years, machine learning has become one of the core disciplines in artificial intelligence research and related areas. This course is devoted to advanced methods and techniques of machine learning that go beyond the topics that are typically covered by introductory courses in the field.
Data mining and information mining aim at discovery of unknown associations within data sets and their visualisation and systematic consideration. Data mining is the process of computing a set of pattern for a search space of all pattern based on a data set and restricted by constraints that specify which pattern are of interest. Information mining is based on data mining. It considers the information demand by adaptation and combination of data mining algorithms to the needs of the user. It provides mechanism for pattern visualisation and graphical reasoning. It is restricted by security and privacy concerns. It results in models for new information. Learning and validating pattern from data results in knowledge extraction. It provides a basis for understanding the pattern and explaining the result. It allows to systematically integrate new pattern into already existing concepts.
Übersicht zu den einzelnen Teilmodulen des Data Mining:
Übersicht zu den weiteren Teilkapiteln der intelligenten Systeme (Kombination mit Intelligente Systeme):
I. Datenbereitstellung
I.1. Data warehousing
I.2. OLAP-Anwendungen
I.3. Logistiksysteme
II. Intelligente Systeme
II.1 Heuristische Suche
II.2. Agenten
II.3. Nichtmonotones Schliessen
III. Benutzungsplätze und Benutzungsarbeitsräume
III.1. Benutzungsprofile und -portfolio, Informationsbedarf
III.2. Benutzungsplatz
III.3. Benutzungsräume
Basic knowledge in probability theory, statistics and logics; Information Systems; Programming; Algorithms and Data Structures
Data mining project and project defense
Lectures on basis issues, studies of algorithms, exploration of the information mining space, interactive concept and knowledge development
Accent course within the specialisation Information, data and knowledge management''
Jiawei Han, Micheline Kamber: Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001
sowie Literatur, die aktuell zur Verfügung gestellt wird ( siehe http://www.is.informatik.uni-kiel.de/~thalheim/vorlesungen )