Forscher an der Northeastern nutzen die Google Cloud Platform, um ein Modell der Ausbreitung des Zika-Virus zu entwickeln

Das Modeling of Biological and Socio-technical Systems (MoBS)-Labor der Northeastern University brauchte eine Möglichkeit, um schnell ein Modell für das Zika-Virus zu entwickeln. Mit der GCE und VMs auf Abruf hat das MoBS über 10 Millionen Simulationen durchgeführt und die für die Datenanalyse benötigte Zeit drastisch reduziert.

Im Jahr 2015, als das von Stechmücken übertragene Zika-Virus in Amerika grassierte, gab es Reisesperren und Quarantänen. Sogar Forderungen nach einer Absage der Olympischen Spiele 2016 in Brasilien wurden laut. Als die Weltgesundheitsorganisation einen internationalen Public-Health-Notfall ausrief, brauchten die Behörden in den betroffenen Ländern eine Möglichkeit, um die Geschwindigkeit und die Orte, an denen neue Infektionen auftraten, korrekt vorherzusagen. Da nur 20 % der Zika-Fälle symptomatisch verlaufen, waren Prognosen bei diesem Virus besonders schwierig.

Im Januar 2016 rief das Team im MoBS-Labor der Northeastern University mit Unterstützung des Center for Inference and Dynamics of Infectious Diseases ein Modellierungsprojekt für das Zika-Virus ins Leben. Ziel war es, Behörden und Wissenschaftlern dabei zu helfen, die Evolution und Verbreitung des Virus besser zu verstehen.

"Durch die Nutzung von Big Data und eine beträchtliche Rechenleistung hoffen wir, Wissenschaftlern und Public-Health-Experten helfen zu können."

Matteo Chinazzi, Associate Research Scientist, Northeastern University

GCP: Grundlegende Tools für Prognosen und Analysen

Auf Basis einer mathematischen und rechnerischen Methode und der Google Cloud Platform (GCP) hat das Team unterschiedliche Szenarien für die Ausbreitung des Zika-Virus untersucht und die Auswirkungen auf die betroffene Bevölkerung prognostiziert. Das Modell basiert auf der tatsächlichen Ausdehnung von Zika in Brasilien, wo der Virus 2015 ausgebrochen ist. Die Forscher können jetzt die Folgen neuer Infektionen in anderen Regionen vorhersagen, indem sie zusätzliche Datenebenen wie Temperatur, Anzahl der Stechmücken, Bevölkerungsdichte und das Reiseverhalten der Menschen betrachten.

Mit der GCP kann das Team mehrere parallele Simulationen ausführen und die Terabytes von Daten analysieren, die von den modellierten Szenarios generiert werden. "Wir nutzen mehrere GCP-Produkte", erläutert Matteo Chinazzi, Associate Research Scientist an der Northeastern University. "In Google Cloud Storage werden alle unsere Modellierungsdaten gespeichert und die Website gehostet. Auf Google Compute Engine (GCE) und den VMs auf Abruf werden Simulationen zur Ausbreitung von Krankheiten ausgeführt. Mit Google BigQuery werden die simulierten Szenarien untersucht. Jedes umfasst verschiedene Variablen wie Datumsangaben und Anzahl der Infizierten. Bisher haben wir eine unglaubliche Datenmenge verarbeitet – insgesamt Hunderte von Terabytes. Und alles ist in Google Cloud Storage gespeichert."

Schnell reagieren

Mit der GCE und VMs auf Abruf hat das MoBS über 10 Millionen Simulationen durchgeführt und die für die Analyse von Daten benötigte Zeit drastisch reduziert. Beide Prozesse dauern jetzt anstatt mehrerer Wochen nur noch einige Stunden. "Wir haben die Flexibilität, mehrere tausend unabhängige virtuelle Instanzen parallel zu skalieren, sodass wir an einem Tag die komplette Analyse eines Epidemieszenarios – bis zu 250 unabhängige Simulationen – generieren können."

Doch dieses Modell ermöglicht Experten nicht nur, die Verbreitung von Zika besser zu verstehen, sondern könnte auch als Basis für die Analyse anderer Epidemien dienen, wie dem Dengue-Fieber. Obwohl das Zika-Virus laut Weltgesundheitsorganisation keine internationale Bedrohung mehr darstellt, wird weiterhin daran gearbeitet, in Zukunft Ausbrüche von Krankheiten zu verhindern, die durch Stechmücken übertragen werden. Mithilfe von Big Data und endloser Rechenleistung hofft das Team am MoBS, Wissenschaftler und Public-Health-Experten bei dieser Herausforderung unterstützen zu können.

"Beim Ausbruch von Krankheiten ist die Zeit ein entscheidender Faktor", so Chinazzi. "Und mit der GCP haben wir die nötigen Tools, um schnell und umfassend zu reagieren."

Mehr über die Zika-Forschung und -Analysen des MoBS Lab erfahren Sie im Artikel "Spread of Zika virus in the Americas" (Ausbreitung des Zika-Virus in Amerika; auf Englisch), veröffentlicht von Proceedings of the National Academy of Sciences of the United States of America.

"Wir sind flexibel genug, um mehrere tausend unabhängige virtuelle Instanzen parallel zu skalieren. So können wir innerhalb weniger Stunden eine komplette Analyse eines Epidemieszenarios mit bis zu 250.000 unabhängigen Simulationen generieren."

Matteo Chinazzi, Associate Research Scientist, Northeastern University

Vielen Dank für Ihre Registrierung!

Erzählen Sie uns mehr über Ihre Interessen.