Mit Big-Data Grippewellen vorhersagen

© Lars Zahner/ Fotolia.de Bei Grippe wird gegoogelt? © Lars Zahner (Fotolia)

Der Internet-Suchgigant Google will festgestellt haben, dass die Häufigkeit bestimmter Suchbegriffe Anhaltspunkt für die Häufigkeit von Grippefällen sein kann. Für die Google Grippe-Trends werden anonymisierte Daten der Google-Suche gesammelt und ausgewertet. In 29 Ländern analysiert Google inzwischen die Sucheingaben, um für die Öffentlichkeit ein möglichst akkurates Bild von der Grippeverbreitung zu zeichnen. Google sammelt Suchbegriffe wie „Grippe“, „Erkältung“ oder auch Anfragen nach Symptomen wie etwa „laufende Nase“ – und wertete diese dann nach Häufigkeit aus. Auf Grundlage der Ergebnisse wird anschließend die Häufigkeit von Grippefällen und die mögliche Entwicklung von Grippe-Epidemien geschätzt. Eine Karte zeigt in vier Hauptstufen (minimal, niedrig, mittel und hoch) und zahlreichen Unterstufen die aktuelle Grippeverbreitung.

Dummerweise scheint die Rechnung bislang nicht wirklich aufzugehen, wie unlängst ein Forscherteam der Northeastern University in Boston in Science (Bd. 343, S.1203, 2014) festgestellt hat. So wurde die nichtsaisonale H1N1-Pandemie des Jahres 2009 vom ursprünglichen GFT schlicht übersehen. Danach hat ein verbessertes GFT das Ausmaß der saisonalen Epidemien 2011/2012 und 2012/2013 um mehr als 50 Prozent überschätzt. Und auch im Zeitraum von August 2011 bis September 2013 lieferte das Analyse-Tool an 100 von 108 Wochen überhöhte Prognosen. Da Google bislang weder die verwendeten Suchbegriffe noch den Algorithmus offenlegt, fällt eine forscherübergreifende Suche nach den Gründen für diese Fehlprognosen schwer.

Bisland ist der Google Flu-Trends Monitor also nur reine „Big-Data-Hybris“. Angesichts der Menge der Daten scheinen sich die Google-Analysten offenbar nicht ausreichend um deren Validität und Reliabilität zu kümmern. Mal sehen ob Google daraus gelernt hat und die Prognose in der nun folgenden Grippe-Saison besser wird.

Zu meinem Vortrag: 42. Das Algorithmen-Abracadabra
Google Grippe-Trends