Modulinformationssystem Informatik

 

Bachelorprojekt - Automatische Erkennung von Hasskommentaren URL PDF XML

Modulcode: infBPAEH-01a
Englische Bezeichnung: Bachelor project - hate speech detection
Modulverantwortliche(r): Prof. Dr. Ralf Krestel
Turnus: unregelmäßig (WS22/23 WS24/25)
Präsenzzeiten: 3P 1S
ECTS: 6
Workload: 45 Std. betreutet Projektarbeit, 120 Std. einenständige Projektarbeit, 15 Std. Projektpräsentationen
Dauer: ein Semester
Modulkategorien: BSc-WInf-Proj (BSc WInf (21)) Proj (BSc WInf (15))
Lehrsprache: Deutsch
Voraussetzungen: Info Inf-Math-A Inf-Math-B infEInf-01a

Kurzfassung:

Soziale Netzwerke, wie Twitter oder Facebook, aber auch Nachrichtenseiten, erlauben das Kommentieren von Beiträgen. Diese Foren dienen dem Austausch von Meinungen und ermöglichen Bürgen sich an aktuellen Diskussionen zu beteiligen. Sie stellen daher ein wichtiges Werkzeuge im demokratischen Miteinander dar. Leider wird die Möglichkeit der freien Meinungsäußerung von Einzelnen missbraucht, um Andere zu Beleidigen, Diffamieren, Bedrohen, usw. Aufgrund der großen Menge an Kommentaren im Netz, ist eine manuelle Moderation der Diskussionen nicht machbar. Hier kommen Methoden des maschinellen Lernens zum Einsatz, welche mit Hilfe von Natural Language Processing (NLP) toxische Kommentare erkennen und rausfiltern können.

Lernziele:

Die Studierenden können:

  • Textdaten verarbeiten
  • Statistische Auswertungen vornehmen
  • Textklassifikatoren konfigurieren und trainieren
  • Experimente aufsetzen
  • Geeignete Metriken zur Evaluation einsetzen

Lehrinhalte:

Am Beispiel der Erkennung von Hasskommentaren werden Klassifikationsmethoden vorgestellt und von den Studierenden auf ein Datensatz mit Kommentaren angewendet. Dabei werden alle Phasen eines Machine-Learning-Projekts, von der Datenaquise bis zur Evaluation, durchschritten.

Weitere Voraussetzungen:

  • Grundlagenveranstaltungen der Informatik
  • Programmiererfahrung mit Python von Vorteil; kann aber auch während des Projekts erarbeitet werden

Prüfungsleistung:

  • Einzelpräsentation
  • Abschlussbericht der Kleingruppe

Lehr- und Lernmethoden:

Zu Beginn der Veranstaltung erfolgt eine Einführung in die Themenstellungen. Es folgen drei Phasen, in denen in Kleingruppen verschiedene Themen bearbeitet und im Plenum vorgestellt werden sollen. In der ersten Phase werden Datensätze analysiert und aufbereitet. In der zweiten Phase unterschiedliche Methoden des maschinellen Lernens erarbeitet. In der dritten Phase wird die Kleingruppe mit den besten Ergebnissen zur Erkennung von Hasskommentaren in einer Challenge gekürt und die Endergebnisse vorgestellt. Während des Semesters erfolgen regelmäßige Besprechungen mit den Betreuenden.

Verwendbarkeit:

Erfahrung im Umgang mit (Text-) Daten ist in vielen Bereichen hilfreich. Auch bereitet das Projekt sehr gut auf eine Abschlussarbeit im Bereich Text Mining / Information Retrieval und maschinelles Lernen im Allgemeinen vor.

Literatur:

Wird während des Semesters zu den einzelnen Themen bekanntgegeben

Verweise:

Kommentar: