6

Haben wir bald Zensuralgorithmen?

‚Keyboard‘, by „Toshiyuki IMAI“ (flickr.com)
(CC BY-SA 2.0)

 

Diese Meldung lässt Gutmenschen Jubeln und Nazis vor Angst erstarren. Forscher der Unis Hildesheim und Antwerpen haben einen Algorithmus kreiert, der Hass im Netz mit einer Genauigkeit von 80% erkennen kann.

Die Hildesheimer Medienlinguistin Sylvia Jaki und der Antwerpener Sprachtechnologe Tom De Smedt haben – sofern man der Pressemeldung Glauben schenken darf – einen Algorithmus entwickelt, der sogenannte Hate Speech auf Twitter mit einer Sicherheit von 80% als solchen identifizieren kann.

Diese Genauigkeit ist aus zwei Gründen beeindruckend. Denn wenn man sich folgende Aussage von De Smedt anschaut, könnte man ins Grübeln kommen, was Hate Speech genau ist.


Die EU verfügt über keine rechtsgültige Definition, was genau unter Hate Speech zu verstehen ist.

Und auch wenn Deutschland über eine umfassende Rechtsliteratur verfügt, fehlt auch in unseren Gesetzbüchern ein Paragraph der festlegt, was Hate Speech eigentlich sein soll. Wir haben bereits eine ausreichende Zahl an Gesetzen, die sich mit Volksverhetzung, Beleidigung und Bedrohung beschäftigen. Diese Gesetze gelten auch im Netz. Es wäre also ein leichtes, bestehende Gesetze im Internet durchzusetzen. Obwohl, so leicht wäre es auch wieder nicht, denn um Gesetze anzuwenden bedarf es für Gewöhnlich der Entscheidung eines Richters. Sowas kostet Zeit und bringt selbstverständlich keine Sympathiepunkte in der Bevölkerung.

Da kommt es ganz recht, dass aus den USA der Trend nach Deutschland schwappte, unliebsame Meinungen als Hate Speech zu diskreditieren und damit eine Antwort auf besagte Meinungen zu haben, ohne sich Argumentativ mit ihnen auseinandersetzen zu müssen.

Aufgegriffen wurde die neue Hysterie gegen Hass dann Anfang des Jahres im frisch in Kraft getretenen Netzwerkdurchsetzungsgesetz (umgangssprachlich auch Bundeszensurgesetz), das soziale Netzwerke auffordert, Strafbare Inhalte im Netz zu löschen. Das Gesetz dürfte mittlerweile zu Genüge bekannt sein, deshalb möchte ich hier nur auf eine kleine Besonderheit beim Melden von rechtswidrigen Inhalten hinweisen.

Diese Optionen stehen mir zur Verfügung, sollte ich einen Twitter-Beitrag im Rahmen des NetzDG melden wollen. Besonders gefällt mir hierbei die Vermischung von Inhalten die Hass schüren und gegen den Paragraphen der Volksverhetzung verstoßen. Bei der exakten Bestimmung gegen welches Gesetz nun verstoßen wurde, findet sich leider kein Hinweis mehr auf die Verbreitung von Hass. Vielleicht, weil es dagegen kein Gesetz gibt?

 

Zu 80% korrekt? Die Statistik sieht das anders

Aber in Zukunft wird diese Einordnung, was Hass und Hate Speech genau sein sollen, auch nicht mehr benötigt. Immerhin haben die beiden Forscher ja einen Algorithmus entwickelt, der mit einer Sicherheit von 80% Hass im Netz erkennt. Dies sogar noch in Echtzeit. Man könnte also den Algorithmus anwenden, um Hassbotschaften noch vor der Veröffentlichung zu erkennen und direkt zu unterbinden. Die 20% falsch gelöschten Meldungen sind ja nicht der Rede wert.

Aber Moment… 80% der Meldungen werden korrekt erkannt? Lassen wir mal kurz beiseite, dass Hate Speech und Hass nicht gegen Gesetze verstoßen und begeben uns in ein kleines Gedankenspiel, in dessen Verlauf wir uns mit dem sogenannten Satz von Bayes beschäftigen werden. Sagen wir, 1000 Meldungen werden von diesem Algorithmus durchsucht. Sagen wir, 1%, also 10 dieser Meldungen, sind strafrechtlich relevant. Das würde bedeuten, das Programm erkennt 8 dieser 10 Meldungen. Um gleich einfacher rechnen zu können, tun wir so, als hätte das Programm einen exzellenten Tag und erkennt sogar 10 von 10 Meldungen korrekt als Hass im Netz. Das heißt, es bleiben noch 990 Meldungen übrig, die zwar überprüft werden, aber eigentlich harmlos sind. Davon werden trotzdem noch 20% fälschlicherweise als Hass identifiziert. Das macht genau 198 – oder sagen wir, 200 – Meldungen, die kein Hass sind, aber als solcher bezeichnet werden. Rechnen wir also alle Meldungen zusammen, die als Hass identifiziert wurden, kommen wir auf 210 Meldungen. Das Verhältnis von tatsächlichem Hass zu ungerechtfertigt eingestuftem Hass liegt also bei 10:200, das macht eine Zuverlässigkeit des Programms von 0.05%.

Oder, um es anders zu formulieren: Bei  99.95% aller überprüften Meldungen, entscheidet das Programm falsch.

Respekt.

Das Ergebnis, welches erstmal der Intuition widerspricht, wird bei genauerem Hinsehen ziemlich einleuchtend. Selbst eine relativ hohe Trefferquote – in diesem Fall 80% – produziert aufgrund der schieren Menge an harmlosen Nachrichten sehr viele falsch-positive Ergebnisse. Umgekehrt sorgt selbst eine hohe Trefferquote bei vergleichsweise wenigen Hass-Botschaften für eine sehr kleine Zahl an korrekt erkannten Botschaften.

Soziale Medien sind keine Foren

Nun könnte man meinen, dass die Entwickler angesichts der enormen Fehleranfälligkeit ihres Programms eher vorsichtig damit wären, über den Einsatz ihres Programms nachzudenken. Allerdings sieht De Smedt bereits weitreichende Anwendungsmöglichkeiten für seine Entwicklung:

Wir könnten uns gut vorstellen, mit den deutschen Behörden zusammen zu arbeiten, aber wir müssen gleichzeitig auch vorsichtig sein, wie wir als Gesellschaft solche Technologien nutzen.

Ich kann mir genau vorstellen, wie dieser Algorithmus eingesetzt wird. Nämlich wie ich oben bereits beschrieb, im Vorfeld, um Hass und Hate Speech zu unterdrücken. Denn, wie wir alle wissen, ist die Debattenkultur im Netz tot. Es gibt nur noch Gutmenschen und Nazi und dazwischen gibt es noch einige Menschen, die beides gleichzeitig sind.

Dementsprechend fällt es mir nicht schwer zu glauben, dass man das Recht auf freie Meinungsäußerung im Kampf gegen Rechts gerne aufgibt. Wenn es nämlich eine Sache gibt, die wir als Gesellschaft noch nicht vollumfänglich erfasst haben, dann sind es die Auswirkungen, die soziale Netzwerke auf unsere Gesellschaft haben.

Solche Netzwerke sind keine gewöhnlichen Internetforen, in denen sich ein paar hundert gleichgesinnte austauschen. Facebook alleine hat mittlerweile über zwei Milliarden Nutzer und vernetzt damit eine Gesellschaft auf eine bisher nie dagewesene Art und Weise.
Diese Netzwerke dienen insbesondere in den USA und Europa sowohl als Informationsquelle, als auch als Anlaufpunkt zum Meinungsaustausch. Von großen Medienhäusern, über öffentliche Institutionen und Unternehmen, bis hin zu alten Freunden aus der Grundschule versammelt sich in diesen Netzwerken eine ungeheure, multikulturelle und multinationale Masse an verschiedenen Akteuren der Gesellschaft zum direkten Austausch miteinander, der ohne diese Netzwerke in diesem Ausmaß undenkbar wäre.

Innerhalb von großen sozialen Netzwerken muss es also oberstes Gebot sein, den Nutzern weitestgehend uneingeschränkten Zugang zu diesem Netzwerk zu ermöglichen und ihre Meinung unzensiert zu veröffentlichen, solange sie sich an geltendes Recht des Staates halten – unabhängig davon, was die AGBs von Facebook und Konsorten sagen. Und nein, insbesondere in großen sozialen Netzwerken wie Facebook und Twitter sollte nicht allein das Hausrecht bestimmen dürfen, wer dort kommunizieren darf und wer nicht. Denn das Hausrecht stand noch nie über den Bundesgesetzen.

Auch die wissenschaftliche Praxis leidet

Übrigens: Publiziert wurden die Ergebnisse natürlich noch nicht, aber die spektakuläre Pressemeldung der Universität wird selbstverständlich im Voraus veröffentlicht. Damit folgt man einer zutiefst kritikwürdigen Praxis, nach der man die institutseigene Forschung möglichst schnell und möglichst medienwirksam an die Öffentlichkeit bringt. Denn mit solchen Publikationen ist natürlich bares Geld verbunden, das der Uni nicht entgehen darf. Den wissenschaftlichen Usus, die Forschung erst von Kollegen im Rahmen einer wissenschaftlichen Veröffentlichung prüfen zu lassen, umgeht man hierbei natürlich.

Es wäre nicht überraschend, wenn die Publikation der beiden Forscher nach der Veröffentlichung einiges an Kritik erfährt.

RuhrBarone-Logo

6 Kommentare zu “Haben wir bald Zensuralgorithmen?

  • #1
    Gerd

    Wo wir beim Thema sind: Das von der SPD angestoßene Zensurgesetz geht wohl nicht weit genug.

    "SPD-Staatssekretär warnt Medien vor “völkischer” Themenwahl

    Da gibt es also Massenmedien, die sich herausnehmen, nicht nur über das zu schreiben, was Herrn Kelber genehm ist, über die Bereiche also, in denen er glaubt, für sich und seine Partei Sympathiepunkte sammeln zu können. Das stört ihn sehr. Kann man verstehen, ist schließlich gegenwärtig kein Zuckerschlecken, SPD-Politiker zu sein. Als absolut verwerflich aber sieht er an, wenn stattdessen die Themen hervorgehoben werden, die den Menschen in diesem Land wirklich unter den Nägeln brennen, und in denen die Sozialdemokraten derzeit keine gute Figur abgeben."

    http://www.achgut.com/artikel/spdstaatssekretaer_warnt_medien_vor_voelkischer_themenwahl

  • #2
    ke

    Werden die Medien in den großen sozialen Netzwerken nicht schon lange algorithmisch überprüft?

    Offen ist dann noch, in wie vielen Fällen Algorithmen mit deutlich höherer Wahrscheinlichkeit eine Entscheidung treffen können. Es wird Grauzonen geben, in denen die Sicherheit des Algorithmus unscharf ist.

    Offen ist dann noch, ob Menschen besser sind. Die Gerichte zeigen auf dem Weg durch die Instanzen doch auch wunderbar, wie eine Situation unterschiedlich eingeschätzt werden kann. Nur gilt in diesen Fällen, dass die höhere Instanz die untere korrigiert. Das bedeutet nicht, das diese Instanz richtig ist.

  • #3
    Michael

    Was echauffieren Sie sich so? Der Algorithmus stammt von der in Niedersachsen weltberühmten – nun ja – Universität Hildesheim. Mehr muss man weder schreiben noch wissen.

  • #4
    Helmut Junge

    Daß die Unis auch in Deutscland mittlerweile vor den wissenschadftlichen Veröffentlichungungen Pressekonferenzen abhalten, ist so unwissenschaftlich, wie Vieles, was dann evtl. sogar veröffentlicht wird. Aber ich habe noch die Fernsehsondershow der Universität Utha 1989 vor Augen, als Fleischmann und Pons, mit dem Rektor der dortigen UNI von der kalten Kernfusion faselten und wochenlang gab es unter Naturwissenschaftlern kein anderes Thema. Diese Universität im Mormonenstaat war schlagartig weltberühmt. Dann war es ein Flop und alle lachten. Hört man heute noch etwas von dieser Uni?
    Du hast es richtig herausgearbeitet. 80% behauptete Treffergenauigkeit allein über eine Wortanalyse sind erstens fragwürdig und zweitens sogar noch viel zu wenig. Das reicht nicht und gehört noch deutlich verbessert. Es wird sich zeigen, daß es zu diesem Thema bereits deutlich bessere Programme gibt. Literaturrecherche hat man sicherlich nicht gemacht. Mei Tipp ist, daß die mal im Internet nach diesbezüglichen Patentanmeldungen suchen sollten.
    Die sollten sich alle ein Beispiel an Bednorz und Müller nehmen, die ihre Veröffentlichung sogar bewußt in einer weniger bekannten Zeitschrift veröffentlicht hatten, weil den dortigen Gutachtern mehr Objektivität, vielleicht auch Ehrlichkeit zutrauten.

  • #5
    Wolfram Obermanns

    Die Erfinder werden wissen, warum sie ihr Produkt Vater Staat und nicht den Plattformbetreibern andienen, für die das schließlich auch ein hilfreiches Tool für die tägliche Arbeit sein könnte.
    Als Mitarbeiter des Innenministeriums wäre ich beleidigt, für wie blöd man von den Hildesheimern gehalten wird.

    Was schlampiges Wissenschaften und leichtfertige Veröffetnlichung angeht, möchte ich den Blick mal in eine völlig andere Richtung lenken.
    Dem einen oder anderen wird die Karriere des Neandertalers in den Medien aufgefallen sein. Erst war er garantiert kein gemeinsamer Vorfahr und primitiv, seit etwa 2011 ist er ein Vorfahr des Homo sapiens und hat ganz tolle Gene eingebracht und konnte auch richtig was. Diese tollen Gene teilen fast alle Menschen, nur Schwarze nicht.
    Daran ist mehrerlei wüste Spekulation.
    Einmal bewegt sich der Neanertaler ohnehin in der Bandbreite genetischer Variabilität des homo sapiens und es wurde nachweislich über Zehntausende Jahre hinweg hin und her gebumst. Andererseits sind singuläre Zuschreibungen von Verhaltenseigenschaften zu bestimmten Genen Kokolores. Worum also geht es bei dieser fragwürdigen Wissenschaft?

  • #6

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.