Wie wahrscheinlich ist es eigentlich, sich mit Corona anzustecken?

Diese Frage wurde mir gestellt, und die Frage ist so natürlich extrem schwer zu beantworten. Ich möchte aber mal eine Muster-Überlegung aufmachen, damit man sieht, warum, und welche Vermutungen man wo einfließen lassen muss.

Zunächst: Ich bin zwar Mathematiker, aber kein Statistiker oder Epidemologe. Ich kenne nicht alle Studien zum Thema, ich kenne auch kein Spezialwissen zur Modellierung von Epidemien. Ich benutze hier nur öffentlich zugängliches Material aus seriösen Quellen nutzen und kein Mathematikwissen benutzen, das über Schulwissen hinausgeht. Die Benutzung anderer Quellen kann andere Zahlen liefern, die zu anderen Ergebnissen führen würde.

Ich werde alle Vermutungen, die ich anstelle, begründen und versuchen, darzustellen, welche Schwankungsbreiten ich für realistisch halte.

Zunächst müssen wir uns überlegen, wie viele potentielle Überträger es in der Bevölkerung gibt.

Als Beispiel für meine Rechnung nehme ich das Nürnberger Land. Im Landkreis sind aktuell (01. Mai) laut RKI 87 aktive Infektionen aktenkundig. Die sind aber für unsere Rechnung nicht interessant, da sie in der Regel in Quarantäne sitzen und niemanden mehr anstecken.

Man wird in der Regel davon ausgehen können, dass man von jemandem angesteckt wird, der nicht davon weiß, dass er ansteckend ist, entweder, weil die Symptome bei ihm noch nicht ausgebrochen sind, oder aber, weil die Erkrankung asymptomatisch verläuft und er sich daher nicht testen lässt.

Um also zu wissen, wie viele Erkrankte in unserem Landkreis potentielle Verbreiter sind, müssen wir abschätzen, wie viele Virusträger es im Landkreis gibt, die nicht davon wissen, dass sie Virusträger sind.

Studien aus China schätzen, dass nur ca. jeder zehnte Krankheitsfall erfasst wird. Als könnten wir von 870 aktiv Infizierten im Landkreis ausgehen.

Andere Studien sagen, dass jede zweite Infektion symptomfrei verläuft, wir dürften also davon ausgehen, dass es auch ca. 90 Infizierte im Landkreis gibt, die nichts davon wissen.

Wir dürfen aber auch davon ausgehen, dass es durchaus symptomatische Menschen gibt, die trotzdem nicht zum Arzt gehen, um zum Beispiel eine Quarantäne und damit ggf. Verdienstausfall zu vermeiden.

Aktuell gibt es kaum Bewegungen bei den Corona-Zahlen, pro Tag kommen ca. 2 Neuinfektionen im Landkreis dazu (Die Maßnahmen wirken!). Daher können wir von unter 10 Menschen, die eine symptomatische Erkrankung in den nächsten Tagen entwickeln werden, aber schon ansteckend sind, ausgehen.

Daher denke ich, dass die Wahrheit hier irgendwo dazwischen liegen wird. Gehen wir mal von 200 Infizierten aus, die die Krankheit aktuell aktiv verbreiten könnten.

Der Landkreis hat aktuell ca. 170 000 Einwohner (Quelle: nuernberger-land.de, aktuellste Zahlen vom 30.06.2019). In unserer Modellrechnung können wir also von einem Anteil aktiv infizierter von ca. p = 0,11% ausgehen. Je nachdem, welche Zahl zwischen 90 und 800 wir benutzt hätten, hätten wir hier Anteile zwischen 0,05% und 0,4% erhalten.

So weit, so gut.

Wie vielen zufällig ausgewählten Bürgern des Landkreises muss ich begegnen, um mit 50% Wahrscheinlichkeit mit einem Infizierten zusammen zu sein?

Gehen wir davon aus, dass ein zufällig ausgewählter Bürger mit der hier abgeschätzten Wahrscheinlichkeit p Überträger ist. Dann ist die Wahrscheinlichkeit dafür, unter k Bürgern mindestens einen Infizierten zu haben, 1-(1-p)^k.

Wir tabellieren die Funktion für variables k und sehen: Bei k = 630 übersteigen wir die 50%.

Das heißt: Aktuell lohnt es sich in Hersbruck ab einer Veranstaltungsgröße von 630 Menschen, darauf zu wetten, dass mindestens ein Corona-Überträger anwesend ist.

Mit diesem Ansatz kann man übrigens noch ein paar weitere spannende Fragen beantworten, zum Beispiel:

Wie viele Menschen dürfen zu einer Veranstaltung zusammen kommen, damit mit 99% Wahrscheinlichkeit kein Corona-Überträger dabei ist? Wie viele bei 95%?

Man tabelliert hierzu die obige Funktion für variables k und liest ab:

99%: 9 Teilnehmer

95%: 46 Teilnehmer.

In einem Supermarkt in Hersbruck halten sich 100 Bürger des Nürnberger Landes auf. Wie wahrscheinlich ist es, dass sich mindestens ein potentieller Corona-Überträger darunter befindet?

Hierfür brauchen wir ein wenig Schul-Stochastik, Stichwort Binomialverteilung.

Die Wahrscheinlichkeit dafür, dass ein Mensch potentieller Corona-Überträger ist, bezeichnen wir mit p.

Wir betrachten 100 Menschen. Die Wahrscheinlichkeit, dass von diesen 100 keiner infiziert ist, beträgt .

Die Wahrscheinlichkeit, dass mindestens einer infiziert ist, beträgt damit

pMindestens ein infizierter anwesend
0,05%4,8%
0,11%10,4%
0,2%18,1%
0,3%25,9%
0,4%33,0%

Für unsere eingangs angenommene Zahl von 200 Verbreitern im Landkreis ergibt sich also eine Wahrscheinlichkeit von immerhin 10%, dass sich mindestens einer davon in unserem Supermarkt befindet.

Ist es denn sehr wahrscheinlich, dass sich mehrere Überträger in diesem Markt befinden?

Mit Hilfe der Binomialverteilung berechnen wir die Wahrscheinlichkeit für „k Überträger im Markt“:

 k=0123
p=0,05%95,1%5,8%0,11%0,0012%
0,1%90,5%9,1%0,45%0,015%
0,2%81,9%16,4%1,6%0,11%
0,3%74,0%22,3%3,3%0,33%
0,4%67,0%26,9%5,3%0,7%

Die Zahlen kommen aus der entsprechenden Binomialverteilung mit n=100, p, k.

Der Fehler, wenn wir davon ausgehen, dass sich 0 oder 1 Infizierter im Supermarkt aufhält, ist also für p<0,2%  unter 10% , selbst für p=0,4%  sind es „nur“ 20%. Für unser „Hauptbeispiel“ p =0,1% ergibt sich ein relativer Fehler von gerade einmal 5%, den wir für die mathematische Vereinfachung gerne in Kauf nehmen.

Es ist also sinnvoll, davon auszugehen, dass sich in einem Supermarkt in Hersbruck höchstens ein Corona-Überträger befindet.

Wie wahrscheinlich ist es, dass ich mich beim Besuch dieses Supermarktes anstecke?

Dazu habe ich eine Studie gefunden, die die Übertragungswahrscheinlichkeit bei einem „engen Sozialkontakt“ mit ca. 29% angibt, bei einem „sonstigen Kontakt“ mit ca. 0,5%.

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3563064

Wir können also für unseren Anwendungsfall die Wahrscheinlichkeit einer Ansteckung bei einem sonstigen Kontakt vernachlässigen.

Als „enge“ Kontakte werden dabei Kontakte mit wenig Abstand und über längere Zeit (also nicht nur „aneinander vorbeilaufen“) betrachtet. Natürlich sind die Menschen hierbei auch nicht geschützt, also keine Mund-Nasen-Bedeckungen oder ähnliches.

Wie viele enge Kontakte haben wir bei unserem Supermarktbesuch? Das kommt natürlich auch darauf an, wie gut man sich an die Abstandsregeln hält.

Wir machen mal eine Matrix auf, nach rechts tragen wir die Anzahl der engen Kontakte auf, nach unten die Größe , den Anteil der Infizierten. Im Kreuzungspunkt rechnen wir dann aus, wie wahrscheinlich wir uns bei dieser Anzahl an engen Kontakten im Supermarkt infiziert haben.

 1234
0,05%0,017%0,034%0,051%0,068%
0,1%0,03%0,06%0,09%0,12%
0,2%0,05%0,1%0,15%0,2%
0,3%0,06%0,12%0,18%0,24%
0,4%0,08%0,16%0,24%0,32%

Beispielrechnung: Bei einem engen Kontakt handelt es sich mit 1% Wahrscheinlichkeit um den einen Infizierten im Markt. Der steckt mich dabei mit 29% Wahrscheinlichkeit an. Also falls es ihn gibt, wofür bei p=0,1%  die Wahrscheinlichkeit 9,1%  beträgt.

Damit: 0,01 * 0,29 * 0,091 = 0,03%

Okay, die Zahl ist relativ klein. Wie hätte das in einem Corona-Hotspot ausgesehen?

Zu Beginn der Corona-Krise hatten wir im Landkreis Tirschenreuth auf 70 000 Einwohner ca. 1100 aktive Corona-Infektionen.

Wir sind oben davon ausgegangen, dass ca. doppelt so viele potentielle Überträger in der Bevölkerung vorhanden sind. Wir gehen daher nun von 2400 Überträgern aus.

Damit lag dort die Wahrscheinlichkeit, dass ein willkürlich ausgewählter, nicht in Quarantäne sitzender Bürger Überträger ist, bei ca. 3,5%.

Die Wahrscheinlichkeit, dass sich in unserem Supermarkt mehr als ein potentieller Überträger befindet, beträgt nun gigantische 97,2%. Auch die Annahme, dass sich höchstens in Überträger im Markt befindet, ist nun nicht mehr haltbar. Wir müssen hier (Erwartungswert) mit  potentiellen 3,5 Überträgern im Markt rechnen, für die Rechnung runden wir auf 4 auf.

Betrachten wir nun folgende Parameter: Wir besuchen einen Supermarkt mit 100 Besuchern, von denen 4 potentielle Überträger sind. Wir gehen von 2 kritischen Kontakten aus, den Personen vor und hinter uns in der Kassenschlange.

Die Wahrscheinlichkeit, dass mindestens einer der beiden Menschen in der Kassenschlange Überträger ist, liegt nun immerhin schon bei 15%.

Bei diesem Supermarktbesuch hätten wir uns also mit einer Wahrscheinlichkeit von ca. 4,4% infiziert!

Nach 16 solchen Supermarktbesuchen wären wir mit mehr als 50% Wahrscheinlichkeit krank.

Nach wie vielen „kritischen Kontakten“ mit einem Überträger bin ich mit mehr als 50% Wahrscheinlichkeit infiziert?

Legen wir die 29% Übertragungswarscheinlichkeit oben genannter Studie zu Grunde, so ergibt sich:

Anzahl Kontakte mit ÜberträgerWahrscheinlichkeit für Infektion
129%
249%
364%
475%
582%
687%
791%

Das heißt: Bereits nach drei engen Kontakten mit einer infizierten Person kann man nicht mehr davon ausgehen, noch gesund zu sein.

Nach wie vielen „sonstigen Kontakten“ mit einem Überträger bin ich mit mehr als 50% Wahrscheinlichkeit infiziert?

Hier erspare ich uns die Tabelle, die Antwort ist 139.

Nachwort: Alle Daten, die ich nicht explizit anders kennzeichne, stammen aus der öffentlich einsehbaren RKI-Statistik und aus dem RKI-Steckbrief zum Coronavirus https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Steckbrief.html?fbclid=IwAR2P5eOg37iPRHLCrDPuylHvHgsRpUf8nMckukAu_0VqY_vt0exmMbsAuVc#doc13776792bodyText19.

Ich bin zwar Mathematiker, aber weder ein besonderer Experte für Statistik noch Epidemologe.

Alle Rechnungen benutzen höchstens Abitur-Mathewissen und kommen ohne darüber hinaus gehende Kenntnisse aus.

PDF-Download hier: