cd rki
Spender:innen
neu seit gestern
gespendete Daten
(Stand: )

Fieberhaft Reloaded

Seit einigen Wochen aktualisieren wir täglich unseren Fiebermonitor für Deutschland, basierend auf den Fitness-Trackerdaten von mehr als 520.000 Spender:innen.

Vielen von euch ist aufgefallen, dass sich die Fieberkurve vor ein paar Tagen verändert hat. Es sind nicht nur wie gewohnt neue Daten hinzugekommen, sondern die gesamte Kurve sieht etwas anders aus. Der Grund ist, dass wir nun eine neue Version unseres Detektionsalgorithmus für den Monitor verwenden.

Wir haben die vergangenen Wochen unter Hochdruck an unserem Algorithmus gearbeitet und ihn verbessert. Ein wichtiges Ziel der Optimierung war es, die Einflüsse von Klima und Wetter auf die Ruhepuls- und Aktivitätsprofile herauszurechnen.

Da unsere Detektionskurven nach diesem Update die COVID-19-Fallzahlen deutlich besser spiegeln, möchten wir Euch gerne die Einzelheiten hinter unserer Verbesserung erläutern.

Detektionskurven und Fallzahlen

Hier sind zunächst einmal die Ergebnisse, die mit Hilfe des neuen Algorithmus berechnet worden sind, für Deutschland und die einzelnen Bundesländer.

Die nationale Fieberkurve und Fallzahlen in Deutschland und den Bundesländern: Für jeden Tag haben wir die Anzahl der Detektionen mit Hilfe des verbesserten Algorithmus gemessen.

Wir können in diesen Kurven erkennen, dass die Detektionskurven aus der Datenspende den Kurvenverlauf der Fallzahlen in Deutschland gut widerspiegeln. Wir können auch sehen, dass das Abklingen der “ersten Welle” und auch der Anstieg der Fallzahlen im Herbst gut von der Fieberdetektionskurve vorhergesagt werden.

Zwar funktioniert das auch für die einzelnen Bundesländer, aber nicht genauso präzise, denn die Detektionshäufigkeit ist gerade in den Sommermonaten so gering, dass die statistischen Schwankungen in den Daten die Kurve dominieren.

Was haben wir an unserem Algorithmus geändert?

Wir arbeiten seit einigen Monaten an der Weiterentwicklung unserer Berechnungsmethode. Unsere Ergebnisse überprüfen wir ständig anhand diverser Qualitäts-Kriterien, z.B. durch den Vergleich mit Referenzwerten. Dazu gehören die Zahlen der ILI/ARE Erkrankungen, Wetterdaten und natürlich auch die COVID-19-Fallzahlen.

1. Saisonale Effekte

Dass das Wetter und die Temperaturen sich auf den Ruhepuls auswirken können, haben wir bereits im Post Schönes Wetter lässt Herzen höher schlagen beschrieben.

Unser Verfahren baut auf einer Reihe von Publikationen auf, die sich mit der Detektion von Grippewellen beschäftigt haben. Einer der großen Unterschiede unseres Monitors zu diesen Studien ist, dass wir viel mehr Daten verarbeiten. Uns steht jetzt bereits einen Zeitraum von gut 5 Monaten zur Fieber-Detektion zur Verfügung. So ein langer Zeitraum führt unweigerlich zu saisonalen Effekten auf die Detektionkurven. Die Stärke dieses Einflusses konnten wir in den ersten Wochen des Projekts, also im Frühling 2020, noch nicht quantitativ einschätzen, weil das bisher noch nicht systematisch untersucht wurde.

In unserem neuen Verfahren betrachten wir die Vitaldaten eine:r Spender:in nicht mehr als Absolutwert sondern relativ zu den Vitaldaten aller Spender:innen des Tages. Diese Werte vergleichen wir mit den Durchschnittswerten des Spenders (der sogenannten Baseline). Dadurch passt sich unser Algorithmus jederzeit den Veränderungen an, die alle Spender:innen betreffen. Saisonale Effekte werden so reduziert.

2. Berechnung der Baseline

Wir berechnen die Baseline nun anders als in der ersten Version des Detektionsalgorithmus. Dort wurde die Baseline für jeden Tag aus den letzten 28 Tagen berechnet. Das sollte ursprünglich für eine bessere Anpassung an Saisonalität sorgen, da man für Sommertage nur Werte aus dem späten Frühling und Sommer verwendet und keine aus dem Herbst. Allerdings führte dieser Ansatz zu Problemen bei schnellen Wetterumbrüchen. Im neuen Verfahren schöpfen wir unsere stetig wachsende Datenmenge voll aus und verwenden für die Berechnung der Baseline alle zur Verfügung stehenden Werte einer Zeitreihe.