Dong Enseng, a Johns Hopkins Egyetem mérnöki karának betegségepidemiológiával foglalkozó elsőéves mesterszakos hallgatója, tavaly decemberben még a kanyaró újbóli feltűnését és terjedését tanulmányozta. Januárban, amikor egyre több aggasztó hír kezdett érkezni egy új tüdőgyulladásos járványról, amely a kínai Vuhanban ütötte fel a fejét, Dong átállt ennek az új betegségnek a követésére.

Január 22-én, alig néhány óra alatt néhány kollégájával összerakott egy weboldalt, és azon egy információs felületet, amelyen térképes formában, illetve grafikonok és folyamatosan frissülő adatsorok segítségével lehet figyelni, hogy a Covid-19-járvány hogyan terjed a világban. Ma ez a weboldal az internet egyik leglátogatottabb site-ja, a legtöbben rutinszerűen kattintanak rá, ha aktuális adatokhoz szeretnének jutni a járvány trendjeiről.

Több mint egymilliárd látogató keresi fel naponta.

Néhány ezer látogatóra tervezve

A Lauren Gardner vezette kutatócsoport egyébként azzal foglalkozik, hogy a betegségek jelentette kockázatra hogyan hat a populációs szintű viselkedés, így az emberek mozgása, a találkozásaik és így tovább. E faktorok alapján alkotnak modelleket, amelyek szimulálják a járványok terjedését, és előrejelzéseket képesek tenni a jövőbeli történésekről, kialakuló gócpontokról.

Bár érzéketlen dolog ezt kijelenteni, de a kutatók felismerték, hogy olyan lehetőséget jelent számukra a koronavírus-járvány, amellyel még senki sem találkozott a modern adattudomány korában. Így azonnal hozzáláttak, hogy egy azonnal frissülő adatbázist építsenek föl, és ezt az adatbázist a világ minden modellezőjének rendelkezésére bocsássák.

Gardner elmondta a Nature-nek, hogy eredetileg a kutatói közösségnek, főleg más epidemiológusoknak és betegségmodellezőknek szánták a felületet, ezért nem is fordítottak túl sok figyelmet a kinézetére. Inkább a funkcionalitás volt a fő szempont.

Csakhogy az egész világ rákattant, főként a térképes megjelenítési módra. Az adatbázisban bányászók, illetve kizárólag a térképet nézegetők együttes száma meghaladja a napi egymilliárdot. Pedig a kutatócsoport eredetileg úgy tervezte meg a rendszert, hogy a napi látogatók száma százas, legfeljebb ezres nagyságrendű lehet. Az általános érdeklődés teljesen megdöbbentette őket.

A döbbenetből azonban gyorsan fel kellett ocsúdniuk,

hiszen egyetlen, néhány ezer látogatóra méretezett webes szolgáltatás sem bír ki egymilliárd kattintást. Az információs felület létrehozása azért volt viszonylag egyszerű, mert a kutatócsoport korábban már épített hasonló alkalmazást a kanyarógócpontok feltérképezésére, az ArcGIS térinformatikai rendszer segítségével.

Gyorsabb a valóságnál

A felületen elérhető adatok a világ számos egészségügyi szervezetétől és hatóságaitól származnak. Élőben érkeznek a statisztikák az Egészségügyi Világszervezettől, az amerikai Betegségellenőrző és -megelőző Központtól (CDC), ennek európai megfelelőjétől (ECDC), a kínai közegészségügyi hivataltól és sok más nemzeti hatóságtól, illetve sajtóorgánumtól.

Az adatokat összegyűjtik, rendszerezik, összesítik, majd közzéteszik a Githubon is. Kezdetben ez az adatközlés kézzel történt. Először Dong egyedül töltögette az adatokat, amikor még csak Kínából érkeztek a hírek a járvány terjedéséről. Később más hallgatók is bekapcsolódtak, és napi 24 órában, váltott műszakokban folyt az oldal frissítése. Ez azonban

a pandémia elszabadulásával gyorsan fenntarthatatlanná vált.

Ma már a megjelenő adatok nagy részét adatgyűjtő algoritmusok szedik össze a legkülönfélébb forrásokból. Az egyetem scriptjei olyan sűrűn ellenőrzik a források adatbázisait, hogy a frissítés gyakorlatilag valós idejűnek számít. Sokszor előfordult, hogy egy-egy ország első azonosított fertőzöttjei korábban megjelentek az oldalon, mint hogy a nemzeti hatóságok erről hivatalos bejelentést tettek.

Geopolitikai támadások

Az adatbázist a Githubon tárolják, eddig majdnem 1700 módosítási javaslat, illetve hibajelentés érkezett a kódra. Az érdeklődés és a megkeresések mára kezelhetetlenné sokasodtak. Kezdetben csak hárman csinálták a weboldalt, ez a szám mára a két tucatot közelíti, hiszen beszálltak a Johns Hopkins más tanszékeinek hallgatói is. A munka nagy részét mégis az alapítók végzik, akik saját bevallásuk szerint gyakorlatilag nem is alszanak. Időközben bevonták a ArcGIS mögött álló kaliforniai Esri céget is, hogy működőképes állapotban tudják tartani az oldalt.

Az oldal csodálatos módon eddig hosszabb időre soha nem halt még le, ehhez többször is át kellett tervezni az architektúrát, és fejleszteni kellett a szerverkapacitást mögötte. Folyamatosan érkeznek hozzájuk panaszok amiatt is, hogy a térképen, illetve az adattömbben a vitatott hovatartozású és elnevezésű területek, illetve független vagy kevésbé független országok

nem pont úgy szerepelnek, ahogy azt a különféle politikai felek szeretnék.

A kutatók szerint ezek a viták, támadások egy csomó idejüket és erőforrásukat lekötik, pedig azért lenne jobb dolguk is. Végül úgy határoztak, hogy a földrajzi nevekben követik az amerikai külügyminisztérium ajánlásait.

A kutatócsoport persze a szolgáltatás miatt a figyelem középpontjába került. Máris kaptak kutatási támogatást a NASA-tól, hogy a járvány szezonalitását, illetve az éghajlat hatását vizsgálják.

Magyarul azt igyekeznek kibányászni az adatokból, hogy a koronavírus terjedésére hatnak-e az évszakos időjárási változások, illetve az éghajlati különbségek. Eddig azonban nem volt erre idejük, hiszen tíz hete éjjel-nappal csak azon dolgoznak, hogy az adatokat folyamatosan elérhetővé tegyék. A számok analízisére már nem sok erőforrásuk nem maradt.

A múlt héten fordult először elő, hogy már több időnk jutott a matekra, mint az adatgyűjtésre. Ez sokkal szórakoztatóbb volt mindennél, amit már jó ideje csináltunk. Talán én vagyok az egyetlen ember a világon, aki még nem fogta fel, hogy milyen őrült helyzetbe keveredtünk, emocionális és személyes értelemben egyaránt. Annyira elvonta a figyelmemet a munka, hogy csak késve fogom fel a helyzet súlyosságát, ahogy a dolgok kissé lelassulnak

– vallotta be Gardner. A tervezett fejlesztésekkel sem haladnak olyan gyorsan, mint szeretnék, de a jövő hétre ígérik, hogy a területi halálozási arányokat, illetve a tesztek számát is megjelenítik az oldalon. Elméleti szinten most az Egyesült Államokra vonatkozó kockázatelemző modell kidolgozása elsődleges a kutatócsoport számára.

Dong kínai származású, így – legalábbis a járvány kezdeti időszakában – sokkal jobban aggasztották a történések, mint a csoport többi tagját. A témavezetője azzal nyugtatgatja, hogy a jelenlegi helyzet nem normális. Még csak elsőéves a mesterképzésben, és

remélhetőleg a többi év már sokkal unalmasabb lesz ennél.

