3

Mathematik in der Coronapandemie – Eine kleine Einführung in die Wahrscheinlichkeitstheorie

Schild an einem Haus in Thomas Bayes lebte Foto: Simon Harriyott Lizenz: CC BY 2.0

50 % Geimpfte auf der Intensivstation, 78 % Wirksamkeit und doch krank geworden, zahllose Meldungen zu Impfdurchbrüchen bei Facebook – wie kann das alles sein? Wann werden Wahrscheinlichkeiten addiert, wann multipliziert und wann überhaupt nicht betrachtet? Wie kann man Aussagen schätzen und dennoch Sicherheit schaffen?

Zugegeben, die Masse an Zahlen und Angaben, die derzeit durch Social Media und die Presse gehen, können ohne ausreichende mathematische Grundbildung verwirren.
Diese kurze, komprimierte Einführung ist für alle, die verstehen wollen, wie Corona-Zahlen interpretiert werden müssen. Und auch für alle, die Zweifel an den publizierten Zahlen haben.

Ernstgemeintes Angebot: Mathematische Fragen unter dem Artikel stellen oder bei Facebook in den Kommentaren, ich werde versuchen alle zu beantworten.

Wollen wir Streichhölzer ziehen?

Ziel dieses Abschnittes ist es zu erklären, wie wichtig die Beobachtung und Analyse der Grundgesamtheit für die Beurteilung statistischer Zahlen ist.
Es ist eine der wohl ältesten Methoden, um einen „Freiwilligen“ zu finden. Es werden nacheinander Streichhölzer gezogen. Es gibt genauso viele Streichhölzer wie Teilnehmer, eines der Hölzer ist gekürzt. Wer das gekürzte Holz zieht, verliert.

Streichholz ziehen – das Onlinespiel. Probieren Sie es aus.

Und nun folgendes Beispiel:

Wir haben 10 Teilnehmer. Wie hoch ist das Risiko jedes Teilnehmers, am Ende der Verlierer zu sein?

Richtig: 10 %. Das bezeichnen wir als A-Priori-Wahrscheinlichkeit.

Nun werden der Reihe nach Streichhölzer gezogen. Das unten stehende Tableau zeigt die Eintrittswahrscheinlichkeit für jeden Teilnehmer „den Kürzeren“ zu ziehen, verbunden mit der Gegenwahrscheinlichkeit, nicht zu verlieren. Wir erkennen, die 10 % sind tatsächlich nur für den ersten Teilnehmer relevant oder anders ausgedrückt: 10 % gibt die Wahrscheinlichkeit jedes Teilnehmers zu verlieren vor Beginn des Experiments an.Bisher dürfte das jeden Leser langweilen. Aber jetzt stellen Sie sich einmal vor, ein externer Beobachter schaut zu, aber erst nach dem 4ten Teilnehmer. Welchen Effekt hat es auf den Beobachter, wenn Teilnehmer 1 bis 4 (Fall 1) weiterhin bei der Gruppe stehen oder aber (Fall 2) sich von der Gruppe entfernt haben? Für Fall 1 käme der Beobachter zu dem Schluss: 4 Leute haben bereits gezogen, sie gehören zur Grundgesamtheit. Für Fall 2 wäre genau das Gegenteil der Fall, der Beobachter ginge in der Annahme, dass es lediglich 6 Teilnehmer gibt. Ohne es zu bemerken unterliefe dem Beobachter ein Beobachtungsfehler.

Unterhalten sich Teilnehmer 7 und der Beobachter nach dem Spiel, gibt es drei Perspektiven. Teilnehmer 7 würde argumentieren, dass sein Risiko zu verlieren bei 10 % lag. Im konkreten Fall lag sein Risiko aber bereits bei 25 %. Für den Beobachter jedoch ist klar: Sein Gesamtrisiko lag bei 16,67 %. Aus dem jeweiligen Blickwinkel ist jede der Aussagen korrekt, bezogen auf die Ausgangswahrscheinlichkeit (und nur um die ging es bei dem Spiel) aber ist nur ein Wert korrekt: 10 %.

Bedingte Wahrscheinlichkeiten & der Satz von Bayes

Nachdem die Problematik der richtigen Beobachtung hoffentlich deutlich wurde, kommen wir nun zum zentralen Thema der medialen Berichterstattung seit 2 Jahren, den bedingten Wahrscheinlichkeiten und vor allem dem Unterschied zwischen dem Additionssatz und dem Multiplikationssatz.

Eine bedingte Wahrscheinlichkeit ist der Eintritt von irgendetwas unter einer Nebenbedingung. Bei voneinander unabhängigen Ereignissen (stochastische Unabhängigkeit) können Wahrscheinlichkeiten multipliziert werden, dies wird als Multiplikationssatz der Wahrscheinlichkeit bezeichnet. Wenn eine Wahrscheinlichkeit X bei 50 % liegt und eine weitere Wahrscheinlichkeit bei 40 %, dann liegt die Wahrscheinlichkeit, dass beide Fälle zusammen eintreten, bei (0,5 * 0,4) * 100 % = 20 %.

Logischerweise ist die Gegenwahrscheinlichkeit 80 %. Denken sie einen Moment nach, was diese 80 % umfassen.

Die Wahrscheinlichkeit,
dass WEDER X noch Y eintreten (0,5 * 0,6) * 100 % = 30 %;
dass X eintritt, aber Y nicht (0,5 * 0,6) * 100 % = 30 %;
dass X nicht eintritt, dafür aber Y (0,5 * 0,4) * 100 % = 20 %.

Errechnet wird dies über den Additionssatz für Wahrscheinlichkeiten: 30 % + 30 % + 20 %.

Ohne zu tief ins Detail zu gehen: Das bekannteste Theorem zur Berechnung bedingter Wahrscheinlichkeiten ist der Satz von Bayes, manchmal ist deshalb auch von Bayes-Wahrscheinlichkeiten die Rede.

Wissen Sie, wie wenig 99,99 % sein können? Nehmen wir einmal an, Ihre Chance den Tag zu überleben läge bei 99,99 %. Hätten Sie Angst vor dem Tod? Vermutlich nicht, 99,99 % sind ziemlich gut. Aber was wäre, wenn dies an jedem einzelnen Tag der Fall wäre, für den Rest Ihres Lebens? Ihre Überlebenswahrscheinlichkeit (ÜW) errechnet sich für n Tage wie folgt:Nach 365 Tagen, einem Jahr, liegt ihre Überlebenswahrscheinlichkeit bei 96,4 %, nach drei Jahren bei 89,6 % und nach 10 Jahren noch bei 69,4 %. Ist 99,99 % jetzt viel oder wenig? Das ist eine Frage der Verkettung.

Ob ein Infektionsschutz von 90 % gut oder schlecht ist hängt sehr stark davon ab, wie oft Ihre Antikörper Viren besiegen müssen, also wie häufig Sie mit dem Virus in Kontakt kommen.

Und was hat das mit Corona zu tun?!

Sie wissen nun was Bayes-Wahrscheinlichkeiten sind, Gegenwahrscheinlichkeiten sowie Grundgesamtheiten. Die nachfolgenden Zahlen dienen als Beispiel und basieren nicht zwingend auf realen Studienergebnissen.

Nehmen wir einen Pool von 100.000 hochaltrigen Menschen mit einer Impfquote von 90 %. Angenommen wird, dass das Infektionsrisiko im Falle der Exposition bei 100 % liegt. Eine Impfung kann das Risiko um 90 % reduzieren (CDC). 20 % der Infizierten kommen ins Krankenhaus. Käme nun jeder dieser 100.000 Menschen innerhalb von 7 Tagen genau ein einziges Mal mit dem Coronavirus in Kontakt (dies wird als Exposition bezeichnet), dann könnten wir relativ simpel errechnen: 90.000 Menschen sind geimpft und 10.000 Menschen nicht.

Von den 10.000 Ungeimpften infizieren sich alle (Infektion, unter der Bedingung NICHT geimpft).

Von den 90.000 Geimpften infizieren sich 90.000 * 0,1 = 9.000 Menschen (Infektion, unter der Bedingung geimpft). Wichtig ist aber bereits hier im Hinterkopf zu behalten: 81.000 Menschen haben sich nicht infiziert.

Die Inzidenz läge in diesem Fall für die gesamte Gruppe (das kumulative (oder absolute) Risiko) über 7 Tage bei 19.000.

Frage: Was ist die betrachtete Grundgesamtheit im Beispiel?

Ein Kontakt mit dem Virus wird als Expositionsereignis bezeichnet. Ohne es explizit zu erwähnen, habe ich eine zweite Grundgesamtheit in die Betrachtung aufgenommen, die der Viruskontakte, also der Expositionsereignisse. Im vorliegenden Fall betrachten wir nicht nur die Grundgesamtheit der Personen, sondern auch die der Infektionsmöglichkeiten. Zur Vereinfachung habe ich einen Kontakt pro Person, also 100.000, angenommen. Und genau hier wartet eine weitere Fehlerquelle in der Kette an Denkfehlern vieler Menschen.

Wie vielen Menschen hatten Sie in den vergangenen sechs Monaten Kontakt unter 1,5 Metern?

Ich weiß es schlicht nicht. Einkaufen, ein Besuch auf dem Weihnachtsmarkt, eine Flugreise, ich könnte nicht mal sagen, ob es eher 500 oder 5.000 waren.

Und genau das ist das Problem – wir wissen nicht, zu vielen Expositionsereignissen es gekommen ist und genau das macht die Analyse der Impfwirksamkeit schwierig, es erlaubt aber sie zu schätzen. Was wir aber wissen, ist die Grundgesamtheit an Menschen und die Anzahl an verimpften Dosen.

Erinnern Sie sich an das Streichholzziehen. Wenn wir erst im Krankenhaus die Anzahl an Patienten als Maß nähmen, also unser Beobachter ins Spiel kommt, so hätten wir:
10.000 * 0,2 =2.000 Ungeimpfte und 9.000 * 0,2 =1.800 Geimpfte. Fast die Hälfte der Patienten im Krankenhaus sind also geimpft, aber das ist überhaupt nicht die relevante Poolgröße. Der wesentlich größere Anteil hat das lange Streichholz gezogen und hat es nicht einmal bemerkt. Die Richtige Aussage lautet: Von der Gruppe der Ungeimpften infizierten sich alle, hiervon landen 2.000 aim Krankenhaus. Da die Gruppe der Geimpften jedoch viel größer ist, infizierten sich nahezu ebenso viele Geimpfte. Logischerweise landen ähnlich viele Geimpfte im Krankenhaus.
Zum Vergleich: Im Falle einer 100 % Impfquote gäbe es lediglich 1.000 Infizierte, im Falle von 0 % Impfquote 100.000 Infizierte.

Genau diese Fehlannahme zur Betrachtungsgröße innerhalb der statistischen Grundgesamtheit nennen wir Prävalenzfehler.

Der Fisch war SOOOO groß – relative Risiken

„Das Risiko, Ungeimpft ins Krankenhaus zu kommen, ist 10x so hoch, wie als Geimpfter ins Krankenhaus zu kommen.“

Die Aussage haben Sie so oder anders zuletzt sicherlich häufig gelesen. Aber was sagt das eigentlich aus und wie wird das berechnet? In der Statistik nennen wir derartige Aussagen relative Risiken oder relative Eintrittswahrscheinlichkeiten.

Wir nehmen unsere Gruppe von 100.000 Menschen.
Das relative Risiko einer Infektion in der Grundgesamtheit mit dem Coronavirus ist 10-mal so hoch.

Und wie schätzen wir das jetzt ein?

Ein wichtigstes Mittel in der Statistik ist die Nutzung von Schätzern. Hierzu werden Annahmen getroffen, die möglichst sauber argumentativ belegt werden können, um hieraus Aussagen über die beobachteten Zahlen treffen zu können. Betrachtet wird, wie zuvor bereits beschrieben, immer eine Eintrittswahrscheinlichkeit gegenüber der Gegenwahrscheinlichkeit. Die beschreibende Statistik ist damit ein Stück weit die mathematische Umsetzung der hegelschen Dialektik, These vs. Antithese. Eine Schätzung muss hierbei keine konkrete Zahl sein, es ist auch hinreichend anzunehmen, dass Betrachtungsgruppen „gleich groß“ sind.

Eine solche Annahme wäre beispielsweise, dass Geimpfte und Ungeimpfte, als Einzelpersonen, im Schnitt die gleiche Anzahl an Kontakten und somit die gleiche Infektionsgefahr haben.

  • These (Aussage A): Geimpfte und Ungeimpfte haben das gleiche Expositionsrisiko.
  • Gegenthese (Aussagen B): Geimpfte und Ungeimpfte haben nicht das gleiche Expositionsrisiko.

Wie schätzen Sie die Situation ein? Ich persönlich bin mir sicher, dass es gerade seit der Impfkampagne keine signifikanten Unterschiede im Sozialverhalten Geimpfter und Ungeimpfter gibt. Wir könnten die These weiter konkretisieren: Wir schätzen Sie die Situation bei Jugendlichen und jungen Erwachsenen ein? Ich argumentiere: Es gibt keinen Unterschied. Aber es ist eine Schätzung.

Impfgegner und Querdenker argumentieren nun, dass die Impfungen keinerlei oder einen schädlichen Effekt hätten. Wäre dies so, dann müssten die Inzidenzen (Anzahl an Neuinfektionen über 7 Tage pro 100.000 Einwohner), also die Infektionsraten, unter Berücksichtigung von These A (der Bedingung) für beide Gruppen nahezu identisch sein. Sie schlussfolgern richtig: Wir reden über eine Bayes-Wahrscheinlichkeit. Eine unbekannte Grundgesamtheit an Expositionen unter den Bedingungen, dass die Person geimpft ist oder nicht.

Und genau das ist eben nicht der Fall.

Derartige Studien finden Sie aktuell in beliebiger Häufigkeit, anbei ein paar aktuelle Arbeiten:

Wahrnehmungsverzerrung

Eine der häufigsten Fragen im Bereich der Statistik ist, wieso Dinge zwar mathematisch belegbar sind, aber völlig anders wahrgenommen werden. Die Antwort lautet Wahrnehmungsverzerrung und Bias. Ich hatte zuletzt deshalb bereits in einem anderen Artikel ausgeführt, weshalb der richtigen Darstellung von Zahlen so große Bedeutung zukommt.

Spielen Sie Lotto? Sicherlich haben Sie einmal Lottogewinner im Fernsehen gesehen und das Geld ist ja auch reizvoll. Aber haben Sie auch schon Nicht-Gewinner gesehen? Menschen, die sich geäußert haben, wie viel Geld sie nicht gewonnen haben? Sie wollen gewinnen, sie wollen das große Geld und sind bereit dafür außer Acht zu lassen, dass ein großer Gewinn nahezu ausgeschlossen ist. Sie sind befangen, biased. Und sie lassen die Grundgesamtheit außer Acht, von der etwa 99,99999 % nicht groß gewinnen.

Bei Facebook und auf anderen Social Media-Kanälen überschlagen sich die Berichte geimpfter Coronakranker. Logisch, niemand würde einem Kommentar Beachtung schenken in dem „ich bin geimpft und habe Corona nicht!“ steht.

Das wird als Wahrnehmungsverzerrung bezeichnet. Wissen Sie denn, wie viele Coronakontakte Sie wirklich hatten? Wie viele von uns froh sein können, eben nicht infiziert zu sein, obwohl ein reales Risiko bestand?

Nach der gleichen Logik funktionieren Terrorattentate, wahrgenommen werden die erfolgreichen Anschläge, bei denen Menschen sterben – nicht die verhinderten Anschläge. In der öffentlichen Wahrnehmung nehmen die Millionen an Flüchtlingen, die keine Anschläge begehen, keinen Raum ein. Den Raum nimmt ein Anis Amri ein, der in Berlin auf dem Weihnachtsmarkt 13 Menschen ermordete.

Ich möchte an dieser Stelle weder das Gefühl von Angst noch die Sorge vor Nebenwirkungen oder ähnlichem wegdiskutieren. Ich hoffe Ihnen das Handwerkszeug gegeben zu haben, um bei der nächsten Statistik, der nächsten Quote und der nächsten Risikoangabe wenigstens etwas verstehen zu können, was die Zahlen aussagen und vor allem, was die dahinterstehenden Grundgesamtheiten sind.

Und falls Sie sich noch nicht haben impfen lassen hoffe ich, dass Sie es tun.

Impfungen wirken, dies belegen sämtliche Studien und Zahlen.

RuhrBarone-Logo

3 Kommentare zu “Mathematik in der Coronapandemie – Eine kleine Einführung in die Wahrscheinlichkeitstheorie

  • #1
    Stefan

    Schöner Artikel und gut erklärt, danke! Leider ist es wohl so, dass man solche im Grunde (wenn auch nicht im Detail) offensichtlichen Zusammenhänge immer wieder erklären muss.

    P.S.: Ein kleiner Vertipper ist mir aufgefallen. Im folgenden Satz muss die erste "10.000" eine "100.000" sein:

    "Käme nun jeder dieser 10.000 Menschen innerhalb von 7 Tagen genau ein einziges Mal mit dem Coronavirus in Kontakt (dies wird als Exposition bezeichnet), dann könnten wir relativ simpel errechnen: 90.000 Menschen sind geimpft und 10.000 Menschen nicht."

    Und die Formulierung "dann könnten wir…" könnte so missverstanden werden, dass die Tatsache der Exposition notwendig ist, um zu errechnen, dass 90.000 geimpft und 10.000 nicht geimpft sind. Letzteres ist natürlich unabhängig von der Exposition.

  • #2
  • #3

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.