Abschätzung der täglichen Anzahl von neu erkrankten Corona-Fällen (Nowcasting) und der effektiven zeitvariierenden Reproduktionszahl R(t) für Bayern und München



Die täglich neu gemeldeten Corona-Fallzahlen entsprechen nicht der tatsächlichen Zahl der neuen Fälle mit Krankheitsbeginn an diesem Tag. Aufgrund von Verzögerungen bei der Meldung können die Zahl der neu gemeldeten Fälle und die tatsächliche Zahl der neuen Fälle erheblich voneinander abweichen. Zur Beurteilung der aktuellen Lage, für die Bewertung der Wirksamkeit von Maßnahmen und zur Prognose ist aber die tatsächliche Anzahl an Neuerkrankungen besser geeignet.

Daher haben wir gemeinsam mit der Universität Stockholm und dem Bayerischen Landesamt für Gesundheit und Lebensmittelsicherheit (LGL) ein statistisches Verfahren entwickelt um aus den aktuellen Meldedaten die tatsächlichen neuen Fallzahlen zu schätzen. Dies ist möglich, da man bei den gemeldeten Fällen auch den Beginn der Symptome mit erhebt. Diese Information wird genutzt, um die Verteilung der Verzögerung der Meldung (Zeitraum zwischen Krankheitsbeginn und Meldung beim LGL) zu schätzen. Daraus kann man dann die Anzahl der tatsächlichen Fälle bis zu zwei Tage vor dem aktuellen Datum schätzen. Es handelt sich dabei nicht um eine Vorhersage (forecast) sondern um eine Schätzung zum aktuellen Zeitpunkt (nowcast).

Weiter kann man aus den Daten die in der Öffentlichkeit viel diskutierte zeitabhängige Reproduktionszahl R(t) schätzen. Diese Zahl ist definiert als die durchschnittliche Anzahl von Personen, die von einer Person mit Krankheitsbeginn zum Zeitpunkt t angesteckt wurden. Sie kann basierend auf den aktuellen Zahlen aus unserem statistischen Modell nur mit einer Verzögerung von 10 Tagen geschätzt werden.


Update 13.07.2020: Im Rahmen einer retrospektiven Evaluation wurde das statistische Nowcast-Modell überarbeitet und optimiert. Die Ergebnisse werden nun basierend auf dem neuen Modell berichtet. Details zur weiterentwickelten Methodik und den Ergebnissen der Evaluation werden in Kürze in einer überarbeiteten Version des Manuskripts zur Verfügung gestellt.


Details zum statistischen Verfahren:

Felix Günther, Andreas Bender, Katharina Katz, Helmut Küchenhoff, Michael Höhle: Nowcasting the COVID-19 Pandemic in Bavaria


Manuskript zum Verlauf in Bayern:



Aktuelle Schätzungen:



Weitere Auswertungen von Daten aus Bayern und München:




Schätzung der täglichen Neuerkrankungen





Grüne Kurve: Geschätzte epidemische Kurve (Anzahl der Personen mit Erkrankungsbeginn an dem entsprechenden Tag) mit 95%-Prognoseintervallen.

Die blauen Balken entsprechen der Anzahl der Personen mit Erkrankungsbeginn an dem entsprechenden Tag (offiziell berichtet). Die grauen Balken entsprechen der Anzahl an gemeldeten Fällen mit unbekanntem Erkrankungsbeginn, deren Krankheitsbeginn auf die entsprechenden Tage imputiert wurde.

Berechnung an Hand von Daten des LGL, Kooperation zwischen StaBLab/LMU und der Universität Stockholm.

Nicht berücksichtigt sind nie entdeckte Erkrankungen. Dies bedeutet, dass die Gesamtzahl der Erkrankten deutlich höher sein kann.



Vergleich Geschätzte Neuerkrankungen und gemeldete Neuerkrankungen





Grüne Kurve: Geschätzte Anzahl der Fälle mit Krankheitsbeginn an dem entsprechenden Tag.

Rote Kurve: Anzahl der täglich neu gemeldeten Fälle, schwarze Kurve: Anzahl der gemeldeten und imputierten Fälle mit Krankheitsbeginn pro Tag.



Ergebnistabelle Nowcasting

Hier können die Ergebnisse des Nowcastings in tabellarischer Form heruntergeladen werden. Details zur Nowcast Methode können in der begleitenden Veröffentlichung gefunden werden. Die Spalten des Datensatzes sind:

reported: Anzahl an gemeldeten Fällen mit Krankheitsbeginn pro Tag

nowcast: Nowcast für neue Fälle pro Tag

nowcast_lwr/nowcast_upr: Zugehöriges 95%-Prädiktionsintervall

Download

Geschätzter Verlauf der zeitvariierenden Reproduktionszahl





R(t) bezeichnet die geschätzte zeitvariierende effektive Reproduktionszahl. Sie gibt an, wie viele Personen durchschnittlich von einer Person mit Krankheitsbeginn am Tag t angesteckt wurden. Der Zeitraum von Symptombeginn einer Person bis Symptombeginn bei einer durch Sie angesteckten Person ist prinzipiell variabel. In Orientierung an die vorhandene Literatur zu COVID-19 nehmen wir an, dass die meisten 'Reproduktionen' innerhalb von 10 Tagen stattfinden. Daher beschreibt R(t) das Infektionsgeschehen in einem Zeitraum von 10 Tagen nach dem Zeitpunkt t. Daher zeichnen wir zur Orientierung eine zweite Zeitachse mit dem Endzeitpunkt t+10 in Grafik ein. R(t) kann daher auch nur bis zu einem Zeitpunkt von vor ca. zwei Wochen geschätzt werden: Mit dem Nowcast können wir Aussagen zur Fallzahl bis vor 2 Tagen treffen, zur Schätzung von R(t) muss ein zusätzlicher Puffer von 10 Tagen hinzugefügt werden um die durchschnittliche Anzahl an Ansteckungen im relevanten Zeitraum schätzen zu können. Der letzte veröffentlichte Wert von R(t) beschreibt damit aber dennoch das aktuelle Infektionsgeschehen und stützt sich dabei auf das aktuelle Meldegeschehen.