Abschätzung der täglichen Anzahl von neu erkrankten Corona-Fällen (Nowcasting) und der effektiven zeitvariierenden Reproduktionszahl R(t) für Bayern und München



Die täglich neu gemeldeten Corona-Fallzahlen entsprechen nicht der tatsächlichen Zahl der neuen Fälle mit Krankheitsbeginn an diesem Tag. Aufgrund von Verzögerungen bei der Meldung können die Zahl der neu gemeldeten Fälle und die tatsächliche Zahl der neuen Fälle erheblich voneinander abweichen. Zur Beurteilung der aktuellen Lage, für die Bewertung der Wirksamkeit von Maßnahmen und zur Prognose ist aber die tatsächliche Anzahl an Neuerkrankungen besser geeignet.

Daher haben wir gemeinsam mit der Universität Stockholm und dem Bayerischen Landesamt für Gesundheit und Lebensmittelsicherheit (LGL) ein statistisches Verfahren entwickelt um aus den aktuellen Meldedaten die tatsächlichen neuen Fallzahlen mit Krankheitsbeginn an einem bestimmten Tag zu schätzen. Dies ist möglich, da man bei den gemeldeten Fällen auch den Beginn der Symptome mit erhebt. Diese Information wird genutzt, um die Verteilung der Verzögerung der Meldung (Zeitraum zwischen Krankheitsbeginn und Meldung beim LGL) zu schätzen. Daraus kann man dann die Anzahl der tatsächlichen Fälle bis zu zwei Tage vor dem aktuellen Datum schätzen. Es handelt sich dabei nicht um eine Vorhersage (forecast) sondern um eine Schätzung zum aktuellen Zeitpunkt (nowcast). Der Verlauf der Anzahl an Neuerkrankungen pro Tag wird auch epidemische Kurve bezeichnet.

Weiter kann man aus den Daten die in der Öffentlichkeit viel diskutierte zeitabhängige Reproduktionszahl R(t) schätzen. Diese Zahl ist definiert als die durchschnittliche Anzahl von Personen, die von einer Person mit Krankheitsbeginn zum Zeitpunkt t angesteckt wurden. Sie kann basierend auf den aktuellen Zahlen aus unserem statistischen Modell nur mit einer Verzögerung von 10 Tagen geschätzt werden.

Zusätzliche Analysen:

Das Ergebnis der Schätzung der epidemischen Kurve kann durch Fehler bei der Erhebung der Fälle sytematisch verzerrt sein. Es können sowohl falsch positive (Personen mit positivem Test, die nicht infiziert sind) als auch falsch negative (Personen mit negativem Test, die in Wirklichkeit infiziert sind) Fälle auftreten. Mit Annahmen zur Spezifität (Wahrscheinlichkeit für negatives Testergebnis, wenn jemand nicht infiziert ist) von (0.995, 0.997,0.999, 1) und zur Sensitivität (Wahrscheinlichkeit für positives Ergebnis bei vorhandener Infektion, Bereich 0.5-1) können die Kurven entsprechend adjustiert werden. Wir berechnen diese adjustierten Kurven einmal pro Woche. Weitere Informationen zur entwickelten Methodik und den getätigten Annahmen, sowie eine ausführliche Diskussion der Ergebnisse können in der verlinkten Publikation gefunden werden.


Details zum statistischen Verfahren (aktualisiert am 31.08.2020):

Felix Günther, Andreas Bender, Katharina Katz, Helmut Küchenhoff, Michael Höhle: Nowcasting the COVID-19 pandemic in Bavaria


Adjustierung für Fehler in der Erhebung der Fälle (30.09.2020):

Felix Günther, Andreas Bender, Michael Höhle, Manfred Wildner, Helmut Küchenhoff: Analysis of the COVID-19 pandemic in Bavaria: adjusting for misclassification

Erläuterung und Interpretation: Link (pdf, deutsch)

Manuskript zum Verlauf in Bayern in der ersten Pandemiephase:



Aktuelle Schätzungen:



Weitere Auswertungen von Daten aus Bayern und München:




Schätzung der täglichen Neuerkrankungen





Grüne Kurve: Geschätzte epidemische Kurve (Anzahl der Personen mit Erkrankungsbeginn an dem entsprechenden Tag) mit 95%-Prognoseintervallen.

Die blauen Balken entsprechen der Anzahl der Personen mit Erkrankungsbeginn an dem entsprechenden Tag (offiziell berichtet). Die grauen Balken entsprechen der Anzahl an gemeldeten Fällen mit unbekanntem Erkrankungsbeginn, deren Krankheitsbeginn auf die entsprechenden Tage imputiert wurde.

Berechnung an Hand von Daten des LGL, Kooperation zwischen StaBLab/LMU und der Universität Stockholm.

Nicht berücksichtigt sind nie entdeckte Erkrankungen. Dies bedeutet, dass die Gesamtzahl der Erkrankten deutlich höher sein kann.



Vergleich Geschätzte Neuerkrankungen und gemeldete Neuerkrankungen





Grüne Kurve: Geschätzte Anzahl der Fälle mit Krankheitsbeginn an dem entsprechenden Tag.

Rote Kurve: Anzahl der täglich neu gemeldeten Fälle, schwarze Kurve: Anzahl der gemeldeten und imputierten Fälle mit Krankheitsbeginn pro Tag.



Ergebnistabelle Nowcasting

Hier können die Ergebnisse des Nowcastings in tabellarischer Form heruntergeladen werden. Details zur Nowcast Methode können in der begleitenden Veröffentlichung gefunden werden. Die Spalten des Datensatzes sind:

reported: Anzahl an gemeldeten Fällen mit Krankheitsbeginn pro Tag

nowcast: Nowcast für neue Fälle pro Tag

nowcast_lwr/nowcast_upr: Zugehöriges 95%-Prädiktionsintervall

Download

Geschätzter Verlauf der zeitvariierenden Reproduktionszahl





R(t) bezeichnet die geschätzte zeitvariierende effektive Reproduktionszahl. Sie gibt an, wie viele Personen durchschnittlich von einer Person mit Krankheitsbeginn am Tag t angesteckt wurden. Der Zeitraum von Symptombeginn einer Person bis Symptombeginn bei einer durch Sie angesteckten Person ist prinzipiell variabel. In Orientierung an die vorhandene Literatur zu COVID-19 nehmen wir an, dass die meisten 'Reproduktionen' innerhalb von 10 Tagen stattfinden. Daher beschreibt R(t) das Infektionsgeschehen in einem Zeitraum von 10 Tagen nach dem Zeitpunkt t. Daher zeichnen wir zur Orientierung eine zweite Zeitachse mit dem Endzeitpunkt t+10 in Grafik ein. R(t) kann daher auch nur bis zu einem Zeitpunkt von vor ca. zwei Wochen geschätzt werden: Mit dem Nowcast können wir Aussagen zur Fallzahl bis vor 2 Tagen treffen, zur Schätzung von R(t) muss ein zusätzlicher Puffer von 10 Tagen hinzugefügt werden um die durchschnittliche Anzahl an Ansteckungen im relevanten Zeitraum schätzen zu können. Der letzte veröffentlichte Wert von R(t) beschreibt damit aber dennoch das aktuelle Infektionsgeschehen und stützt sich dabei auf das aktuelle Meldegeschehen.

Adjustierung für Fehlklassifikation (Bayerische Daten)

Auf dieser Seite kann die Schätzung der epidemischen Kurve aus dem Nowcast interaktiv für verschiedene Annahmen zur Genauigkeit der diagnostischen Testprozedur bei der Bestimmung von Fällen adjustiert werden. Auf der linken Seite kann die gewünschte Spezifität und Sensitivität für die Adjustierung festgelegt werden. Die Spezifität entspricht der Wahrscheinlich für eine negative Diagnostik (d.h. Testergebnis 'die Person ist nicht infiziert') bei einer Person die tatsächlich nicht mit COVID-19 infiziert ist. Die Sensitivität entspricht der Wahrscheinlichkeit für eine positive Diagnostik (Testergebnis 'die Person ist infiziert') für eine Person die tatsächlich infiziert ist. Details zur Methodik und zu plausiblen Annahmen können in der zugehörigen Publikation gefunden werden: Analysis of the COVID-19 pandemic in Bavaria: adjusting for misclassification

Annahmen



Die schwarze Kurve entspricht der unadjustierten epidemische Kurve, die basierend auf den original Meldedaten geschätzt wird. Die grüne Kurve entspricht der adjustierten Schätzung basierend auf den oben festgelegten Annahmen zur Sensitivität und Spezifität.