Modulinformationssystem Informatik

 

Master-Projekt - Knowledge Discovery in sehr großen Daten- und Dokumentenmengen URL PDF XML

Modulcode: Inf-MPKD
Englische Bezeichnung: Master-Project - Knowledge Discovery in very large document corpora and data sets
Modulverantwortliche(r): Prof. Dr. Ansgar Scherp
Turnus: unregelmäßig (WS17/18 SS18)
Präsenzzeiten: 1Ü 5PÜ
ECTS: 10
Workload: 60 Std. betreute Übung bzw. Praktikum, 140 Std. eigenständige Projektarbeit
Dauer: ein Semester
Modulkategorien: Proj (MSc Inf (15))
Lehrsprache: Englisch
Voraussetzungen: Info

Kurzfassung:

In diesem Projekt werden verschiedene Themen aus dem Bereich Knowledge Discovery behandelt. Diese sind beispielsweise die Analyse, Vernetzung und Anreicherung von multimedialen Dokumenten und die Analyse und Verarbeitung strukturierter Daten. Es werden verschiedene innovative und angewandte Fragestellungen in kleinen Gruppen bearbeitet und praktische Implementationen vorgenommen und bewertet. Darüber hinaus werden auch Fragestellungen der Forschung identifiziert und untersucht.

Lernziele:

Die Studierenden lernen eigenständiges Arbeiten im Team. Sie erlangen praktische Erfahrungen im Umgang mit Methoden des Knowledge Discovery und ihre Anwendung auf beispielsweise multimedialen Dokumenten und strukturierten Daten. Darüber hinaus erlernen die Studierenden die Lösung wissenschaftlicher Fragestellungen.

Lehrinhalte:

Knowledge Discovery beschäftigt sich mit der inhaltsgetriebenen Erkennung und Auffindung von digitalen Objekten, wie beispielsweise von semi-strukturierten Daten im Web, Dokumenten, Profilen oder Communities, und mit der Erkennung und Analyse der Beziehungen zwischen diesen. Lehrinhalt der Projektgruppe ist das Kennenlernen von Methoden und Algorithmen des Knowledge Discovery und deren Anwendung auf umfangreichen Daten- und Dokumentenkorpora unterschiedlicher Herkunft und Qualität. Von besonderem Interesse sind die Analyse, Vernetzung und Anreicherung von multimedialen Dokumenten und die Analyse und Verarbeitung vernetzter, offener Daten (engl. Linked Open Data) im Web. Linked Open Data ist ein technologischer Ansatz bei dem Daten unterschiedlicher Qualität und Zweck aus verschiedenen Quellen im Internet veröffentlicht und verknüpft werden. Dieser seit 2007 sehr stark wachsende Ansatz hat semantischen Technologien und dem Semantic Web zum Durchbruch verholfen. Er wird weltweit nicht nur von Universitäten, Forschungsinstituten sowie öffentlichen Einrichtungen - wie insbesondere auch Bibliotheken - eingesetzt, sondern hat seinen Einzug auch in kommerzielle Unternehmen gefunden, wie beispielsweise der Medienindustrie und Suchmaschinen.

Die Studierenden werden im Projektpraktikum dazu angeleitet selbstständig ein Projekt für reale oder fiktive Partner aus Industrie oder Forschung durchzuführen. Neben der praktischen Umsetzung des Projektes wird auch Wert auf die Innovationshöhe der entwickelten Lösung sowie eine gute Analyse und Dokumentation der Ergebnisse gelegt. Dies beinhaltet eine kontinuierliche Evaluation der Zwischenergebnisse und aktive Teilnahme der Studierenden in der inhaltlichen Ausgestaltung der Projektgruppe. Insbesondere werden die Studierenden angeregt. sich mit eigenen Ideen zur Verbesserung der Resultate und Methoden einzubringen. Darüber hinaus werden in der Projektgruppe auch Fragestellungen der Forschung identifiziert und nach wissenschaftlichen Maßstäben untersucht.

Weitere Voraussetzungen:

Erfahrung mit objekt-orientierter Programmierung, Kenntnisse über Methoden des Knowledge Discovery und Technologien des Semantic Web sind von Vorteil.

Prüfungsleistung:

Zwischen- und Abschlusspräsentationen der Arbeitsergebnisse. Dokumentation der Projektergebnisse und ggf. mündliche Prüfung.

Lehr- und Lernmethoden:

Verwendbarkeit:

Literatur:

Verweise:

Kommentar: