Abschätzung der täglichen Anzahl von neu erkrankten Corona-Fällen (Nowcasting) und der effektiven zeitvariierenden Reproduktionszahl R(t) für Bayern und München



Die täglich neu gemeldeten Corona-Fallzahlen entsprechen nicht der tatsächlichen Zahl der neuen Fälle an diesem Tag. Aufgrund von Verzögerungen bei der Meldung können die Zahl der neu gemeldeten Fälle und die tatsächliche Zahl der neuen Fälle erheblich voneinander abweichen. Zur Beurteilung der aktuellen Lage, für die Bewertung der Wirksamkeit von Maßnahmen und zur Prognose ist aber die tatsächliche Anzahl an Neuerkrankungen besser geeignet.

Daher haben wir gemeinsam mit der Universität Stockholm und dem Bayerischen Landesamt für Gesundheit und Lebensmittelsicherheit (LGL) ein statistisches Verfahren entwickelt, das aus den aktuellen Meldedaten die tatsächlichen neuen Fallzahlen schätzt. Dies ist möglich, da man bei den gemeldeten Fällen auch den Beginn der Symptome mit erhebt. Diese Information wird genutzt, um die Verteilung der Verzögerung der Meldung (Zeitraum zwischen Krankheitsbeginn und Meldung beim LGL) zu schätzen. Daraus kann man dann die Anzahl der tatsächlichen Fälle bis zu zwei Tage vor dem Meldedatum schätzen. Es handelt sich dabei nicht um eine Vorhersage (forecast) sondern um eine Schätzung zum aktuellen Zeitpunkt (nowcast).

Weiter kann man aus den Daten die in der Öffentlichkeit viel diskutierte zeitabhängige Reproduktionszahl R(t) schätzen. Diese Zahl ist definiert als die durchschnittliche Anzahl von Personen, die von einer Person mit Krankheitsbeginn zum Zeitpunkt t angesteckt wurden. Sie kann basierend auf den aktuellen Zahlen aus unserem statistischen Modell nur mit einer Verzögerung von 10 Tagen geschätzt werden.


Details zum statistischen Verfahren:

Felix Günther, Andreas Bender, Katharina Katz, Helmut Küchenhoff, Michael Höhle: Nowcasting the COVID-19 Pandemic in Bavaria


Manuskript zum Verlauf in Bayern:



Aktuelle Schätzungen:




Schätzung der täglichen Neuerkrankungen





Grüne Kurve: Geschätzte epidemische Kurve (Anzahl der Personen mit Erkrankungsbeginn an dem entsprechenden Tag) mit 95%-Prognoseintervallen.

Die blauen Balken entsprechen der Anzahl der Personen mit Erkrankungsbeginn an dem entsprechenden Tag (offiziell berichtet). Die grauen Balken entsprechen der Anzahl an gemeldeten Fällen mit unbekanntem Erkrankungsbeginn, deren Krankheitsbeginn auf die entsprechenden Tage imputiert wurde.

Berechnung an Hand von Daten des LGL, Kooperation zwischen StaBLab/LMU und der Universität Stockholm.

Nicht berücksichtigt sind nie entdeckte Erkrankungen. Dies bedeutet, dass die Gesamtzahl der Erkrankten deutlich höher sein kann.



Vergleich Geschätzte Neuerkrankungen und gemeldete Neuerkrankungen





Grüne und braune Kurve: Geschätzte Anzahl der Fälle mit Krankheitsbeginn an dem entsprechenden Tag nach zwei verschiedenen Nowcast-Modellen.

Rote Kurve: Anzahl der neu gemeldeten Fälle, schwarze Kurve: Anzahl der gemeldeten und imputierten Fälle mit Krankheitsbeginn an dem entsprechenden Tag.



Ergebnistabelle Nowcasting

Hier können die Ergebnisse des Nowcastings in tabellarischer Form heruntergeladen werden. Details zur Nowcast Methode können in der begleitenden Veröffentlichung gefunden werden. Die Spalten des Datensatzes sind:

reported: Anzahl an neu gemeldeten Fällen pro Tag

nc_tps: Nowcast für neue Fälle pro Tag basierend auf Modell mit TP-Spline Prior für epidemische Kurve

nc_tp_lwr/nc_tps_upr: Zugehöriges 95%-Prädiktionsintervall

nc_iidLogGa: Nowcast für neue Fälle pro Tag basierend auf Modell mit nicht-parametrischer Prior für epidemische Kurve

nc_iidLogGa_lwr/nc_iidLogGa_upr: Zugehöriges 95%-Prädiktionsintervall

Download

Geschätzter Verlauf der zeitvariierenden Reproduktionszahl





R(t) bezeichnet die geschätzte zeitvariierende effektive Reproduktionszahl. Sie gibt an, wie viele Personen durchschnittlich von einer Person mit Krankheitsbeginn am Tag t angesteckt wurden. Der Zeitraum von Symptombeginn einer Person bis Symptombeginn bei einer durch Sie angesteckten Person ist prinzipiell variabel. In Orientierung an die vorhandene Literatur zu COVID-19 nehmen wir an, dass die meisten 'Reproduktionen' innerhalb von 10 Tagen stattfinden. Daher beschreibt R(t) das Infektionsgeschehen in einem Zeitraum von 10 Tagen nach dem Zeitpunkt t. Daher zeichnen wir zur Orientierung eine zweite Zeitachse mit dem Endzeitpunkt t+10 in Grafik ein. R(t) kann daher auch nur bis zu einem Zeitpunkt von vor ca. zwei Wochen geschätzt werden: Mit dem Nowcast können wir Aussagen zur Fallzahl bis vor 2 Tagen treffen, zur Schätzung von R(t) muss ein zusätzlicher Puffer von 10 Tagen hinzugefügt werden um die durchschnittliche Anzahl an Ansteckungen im relevanten Zeitraum schätzen zu können. Der letzte veröffentlichte Wert von R(t) beschreibt damit aber dennoch das aktuelle Infektionsgeschehen und stützt sich dabei auf das aktuelle Meldegeschehen.