...Werde Fan von Starker Rücken bei Facebook Bandscheiben auf Twitter


Grippewelle: Wissenschaft vs. Suchmaschine

1. Januar 2009 von Christoph Weigand  
Abgelegt unter: Internet, Medizin

In den letzten Tagen häufen sich die Influenza- bzw. Grippewarnungen in den Newstickern und da wir in Deutschland über kein suchmaschinentechnisches Instrument wie die Grippe Trends verfügen, orientieren wir (insbesondere die Nachrichtenportale) uns an den Daten der Arbeitsgemeinschaft Influenza des Robert Koch-Instituts (RKI) in Berlin, um eine Einschätzung der aktuellen Situation vorzunehmen.

Die optisch aufbereiteten Daten dieses Instituts ermöglichen einen recht einfach nachvollziehbaren (wenn auch völlig unwissenschaftlichen ;-) ) Vergleich von Wissenschaft und Suchmaschinen hinsichtlich der “Frühwarntauglichkeit”, die in den USA bekanntlich für die Suchmaschine Google propagiert wird:

We’ve found that certain search terms are good indicators of flu activity. Google Flu Trends uses aggregated Google search data to estimate flu activity in your state up to two weeks faster than traditional systems.

Die AGI stellt auf ihren Seiten Deutschlandkarten zur Verfügung, die durch farbliche Kennzeichnung die Aktivität der akuten respiratorischen Erkrankungen (respiratorisch=die Atmung betreffend) veranschaulicht (ein Kartenarchiv bis 2002 ist übrigens auch einsehbar).
Diese Karten lassen sich leicht mit den Daten/Karten bei Insights for Search vergleichen. Ruft man man beispielsweise das Suchvolumen für die Suchbegriffe Husten, Schnupfen, Grippe und Fieber (willkürliche Auswahl meinerseits, da ich denke, daß solche Wörter gesucht werden) für die letzten 30 Tage ab, erhält man folgende Grafik:

Grippewelle Deutschland 2

Übertragen auf die Deutschlandkarte mit regionalen Suchabfragen:

Deutschlandkarte mit Gripeindikatoren

Abbildungen: Insights for Search

Insbesondere für die letzten 30 Tage läßt sich dann ein ganz guter Vergleich mit aktuellen Karten des RKI ziehen (30 Tage deshalb, weil bei der Jahres- und 90 Tage-Betrachtung die farbliche Kennzeichnung auf den betreffenden Zeitraum “umgelegt” wird und damit nicht mehr gut vergleichbar ist).

Aber es wird noch interessanter:
Nach Klick auf die jeweiligen Bundesländer bei den Karten des RKI (Beispiel NRW) wird der Praxisindex (siehe Erläuterungen a.a.O.) zu akuten respiratorischen Erkrankungen im Kurvenverlauf dargestellt. Diese wiederum lassen sich ganz exakt mit den regionalen Suchabfragen für das Bundesland bei Google vergleichen (Beispiel NRW 90 Tage-Betrachtung). Der Peak bei den “einschlägigen” Suchabfragen wurde bei Google am 20. Dezember erreicht, der erste deutliche Ausschlag war am 12. Dezember zu verzeichnen.
Beim RKI kam es rückblickend in KW 49 zu einem deutlichen Anstieg bei den respiratorischen Erkrankungen, also irgendwann zwischen 1. und 7. Dezember. Ein informativer Vorsprung für das RKI? Nicht ganz, denn es handelt sich, wie gesagt, um historische Daten, die erst mit einer gewissen zeitlichen Verzögerung zur Verfügung stehen. Aktuell liegt der beim RKI der Bericht für die 51. KW vor und somit Daten bis zum 21. Dezember. Der neue Index wir dann in der 2. KW 2009 für KW 52 2008 veröffentlicht. Es handelt sich also eine “Latenzzeit” von ca. 4 Wochen.
In dieser Latenzzeit werden jedoch mit lediglich zweitägiger Verzögerung Suchvolumina von Google für die Öffentlichkeit bereitgestellt (intern liegen die Daten mit Sicherheit noch aktueller vor). Ungewöhnliche Veränderungen bezüglich der Häufigkeiten für bestimmte Suchbegriffe wären also sehr viel schneller zu registrieren und eröffnen Möglichkeiten für statistische Deutungen. Btw kommt es derzeit zu einem deutlichen Abfall der Suchabfragen bei Google.

Ich will Euch an dieser Stelle lieber nicht weiter langweilen, da ich wahrscheinlich ohnehin der Einizige bin, den diese statistischen Spielereien interessieren, aber ihr könnt gerne selbst ein wenig “in den Daten surfen”. Und selbstverständlich darf auch der Hinweis nicht fehlen, daß das RKI neben den Häufigkeiten der respiratorischen Erkrankungen auch Positivenraten (Erklärung siehe hier) des NRZ (Nationalen Referenzzentrums für Grippe) in die Berechnungen einfließen läßt und diese Test einfach nicht in Echtzeit verarbeitet werden können.

Hier kannst Du kommentieren:

Teil mir Deine Meinung zu diesem Artikel mit:

Vielleicht von Interesse für Dich: