Wie gegen Hass im Netz vorgehen?
Wie erklärbare KI das Internet sicherer gestalten kann (02.12.2022)
Förderjahr 2022 / Stipendien Call #17 / ProjektID: 6300 / Projekt: Neural Networks for Countering German Online-Hate

Wie Gegenrede das Internet sicherer gestaltet und wieso erklärbare KI wichtig ist

Soziale Medien werden immer häufiger zu Austragungsstätten gewaltsamer Inhalte. Die User-generierte Gegenrede oder auch "Couter speech" gilt als effizientes Mittel um nachhaltig gegen Hasspostings im Internet vorzugehen. Methoden des Machine Learning können eingesetzt werden, um solche Beiträge zu erkennen um anschließend Maßnahmen zu implementieren, die Personen dazu auffordern Gegenrede im Internet zu betreiben und somit Hasspostings die Stirn zu bieten. Weshalb solche Modelle bestimmte Entscheidungen treffen ist jedoch für den Menschen oft nicht nachvollziehbar. 

Im Zuge meines Blocks möchte ich einen Einblick in die Themen der Hassrede sowie der dazu passenden Gegenrede geben. In meinen kommenten Blog-Beiträgen werden Erkenntnisse und Fortschritte meiner Forschung zur Entwicklung eines solchen erklärbaren Modelles thematisiert. 

 

Zu Beginn ein leichter Einstieg

Das Problem von Hass im Netz

Gerade in sozialen Netzwerken wie Twitter, Facebook und Co nimmt Hassrede einen besonderen Stellenwert ein. Die Täter:innen haben auf solchen Plattformen die Möglichkeit, schnell, einfach und unkompliziert hasserfüllte Beiträge und Kommentare zu erstellen. Dabei genießen sie oftmals den Schutz einer gewissen Anonymität was dazu führt, dass solche Beiträge noch häufiger und leichtsinniger gepostet werden.

Wie Gegenrede gegen Hass hilft 

Auf Sozial Media werden oft Personen dafür eingesetzt, solche Postings manuell zu moderieren. Das Moderieren hasserfüllter Beiträge durch Personen ist jedoch enorm zeitaufwändig und psychisch fordernd. Die User-generierte Gegenrede kann hier Abhilfe schaffen, denn hier werden Nutzer:innen selbst zu Moderator:innen. Strategien die Nutzer:innen anwenden können um gegen Hass vorzugehen sind beispielsweise das Aufzeigen logischer Zusammenhänge und Ungereimtheiten von Postings. Aber auch das Hervorheben demokratischer Werte, gesellschaftlichen Normen und gegebenenfalls Konsequenzen sind gute Möglichkeiten für Gegenrede.  Das Ziel der Gegenrede ist nicht unbedingt, das Gegenüber umzustimmen, sondern viel mehr darum, Mitlesende zum Nachdenken zu bewegen.

Wie KI helfen kann

Methoden des Machine Learning werden seit Jahren dazu eingesetzt Texte bezüglich verschiedenster Kriterien zu klassifizieren. Vor allem vektorbasierte Algorithmen und Verfahren wie Random Forest, Support Vector Machines, CatBoost, Glove aber auch das Anwednen Neuronaler Netze wie das Multi-Layer Perceptron oder das Long Short-Term Memory wurden in vergangener Literatur häufig verwendet. Der aktuelle Stand der Technik beinhaltet das Arbeiten mit sogenannten Transformer – Modelle wie BERT oder GPT3 von Google. Obwohl solche Transformer vor allem im Englischen erfolgreich für verschiedenste Klassifizierungsverfahren verwendet werden können gibt es momentan keine Methode die es ermöglicht, deutsche Gegenrede im Netz zu erkennen. Eine KI die es schafft Gegenrede im Internet automatisch zu erkennen könnte ein Meilenstein in der Forschung sein, da damit das moderieren von Hasspostings viel effizienter als herkömmliche, manuelle Verfahren gestaltet werden kann.  

Warum Erklärbarkeit wichtig ist

Es ist oftmals für den Menschen nicht einfach ist zu erkennen, ab wann ein Kommentar als eine bestimmte Kategorie (Hassrede / Gegenrede) eingestuft werden kann. Gerade Modelle wie Transformer sind sehr intransparent was die Entscheidungsfindung betrifft. Hier wird deswegen auch von "Black-Box" Modellen gesprochen. Es ist also oft nicht klar und nachvollziehbar, weshalb ein Algorithmus eine Entscheidung getroffen hat. Gerade bei sehr kontroversen Themen ist es besonders relevant diese Entscheidungen für den Menschen verständlich zu machen. Beispielsweise würde ein einfaches Löschen eines Kommentars der von der KI falsch als Hass erkannt wurde ein ethisches Problem darstellen. Hier würde auch bis zu einem gewissen Grad die Meinungsfreiheit von Personen eingeschränkt werden. 

Tags:

Algorithmen; Dynamic Pricing; Personal Pricing; KI; AI; Künstliche Intelligenz Künstliche Intelligenz Machine Learning Natural Language Processing

Jaqu Böck

Profile picture for user Jaqu Böck
Drohungen, Beleidigungen, Hetze und hasserfüllte Postings – sie zählen zu den größten
Problemen welche die voranschreitende Digitalisierung mit sich bring. Die „User-generierte
Gegenrede“ (Counterspeech) durch Nutzer:innen zeigt großes Potential, um gegen Hass im
Internet zu agieren. Im Rahmen meiner Masterarbeit soll eine Methode basierend auf Algorithmen des
Machine Learning verwendet werden, die es schafft deutsche Hasspostings sowie deren
Gegenrede zu detektieren und die dahinter stehenden Verfasser:innen der Gegenrede aktiv zu
unterstützten.
Die Klassifikations-Entscheidungen solcher Algorithmen sind für den Menschen
oftmals nicht erklärbar und/oder nachvollziehbar. Auf Grund dessen ist es Ziel der Arbeit, einen
Detektor für deutsche Gegenrede zu entwickeln der nicht nur die Gegenrede selbst im Netz
findet, sondern auch für den Menschen verständlich aufzeigt, welche Aspekte des Beitrags den
verwendeten Algorithmus dazu bewegen einen Beitrag als Gegenrede zu klassifizieren

Skills:

Programming
,
Python
,
Data Science
,
Natural Language Processing
,
Social Media
,
AI | KI
,
Machine Learning
,
Design
,
Web-Design
CAPTCHA
Diese Frage dient der Überprüfung, ob Sie ein menschlicher Besucher sind und um automatisierten SPAM zu verhindern.
    Datenschutzinformation
    Der datenschutzrechtliche Verantwortliche (Internet Privatstiftung Austria - Internet Foundation Austria, Österreich) würde gerne mit folgenden Diensten Ihre personenbezogenen Daten verarbeiten. Zur Personalisierung können Technologien wie Cookies, LocalStorage usw. verwendet werden. Dies ist für die Nutzung der Website nicht notwendig, ermöglicht aber eine noch engere Interaktion mit Ihnen. Falls gewünscht, treffen Sie bitte eine Auswahl: