Nagyon könnyű félreérteni a járványról szóló statisztikákat

További Tech-Tudomány cikkek
A koronavírus-járvány kapcsán egyre nagyobb és egyre gyorsabban növekvő számok röpködnek, a fertőzött és a halálos áldozatok száma is egyre magasabb. Már Magyarországon is minden reggel azzal kezdődik, hogy számot vetünk a járvány napi állásával. (Csütörtökön 261-re nőtt a fertőzöttek, 10-re a halálos áldozatok száma.)
A számok nem hazudnak – tartja a mondás. De ettől még óvatosan kell bánnunk velük, mert könnyen félreérthetők, és félrevezető következtetések vonhatók le belőlük. Emiatt a szándékos manipulációnak is kitűnő eszközei lehetnek.
Érdemes megállni egy pillanatra a számháborúban, és megnézni, melyik szám mire jó, és mire nem, illetve milyen buktatói vannak a kontextus nélkül dobált statisztikáknak – amihez a magyar közmédia konkrét példája remek szemléltetőeszköz nyújt, mint majd látni fogjuk.
Az összes eset nem az összes aktív eset
A transzparencia és a naprakész tájékoztatás jegyében a hatóságok (és nyomukban a média) naponta közlik az új azonosított fertőzöttek, az új halálesetek és az új gyógyultak számát. Ez a megfelelő kontextus nélkül félrevezető lehet, több okból is.
Egyrészt nem feltétlenül azon a napon betegedtek meg az új regisztráltak, amikor a fertőzöttségüket igazolták, míg a haláleseteket és a gyógyulásokat könnyebb pontos naphoz kötni. Ez az időbeli elcsúszás torzíthatja a statisztikákat és az azokból levont következtetéseket. Ahogy a kínai példán is látható volt, mire a betegek eljutnak odáig, hogy regisztrálják őket, a valós megbetegedések száma (az utólagos felmérések alapján) már hetekkel megelőzte azt, ahogy a statisztikákban megjelennek. A naponkénti esetszámjelentés azért is megtévesztő képet adhat, mert egy-egy rövid távú megugrás arra engedhet következtetni, hogy felgyorsul a vírus terjedése. Pedig lehet, hogy csak valamelyik kórházban késtek egy napot az adatok jelentésével, vagy – ahogy Kína példáján látni fogjuk – módszertani változás okozta a hirtelen megszaladást.
Másrészt az összes azonosított esetből nem derül ki, hogy hányan gyógyultak meg, illetve hányan betegek most. Hiszen mit jelent a növekedés az összes azonosított eset számában? Hogy ennyi olyan emberről derült ki, hogy fertőzött, akiről eddig nem tudtuk – azaz a vírus ennyi új emberre terjedt tovább. De fontos tudatosítani, hogy a megemelkedett összesetszám nem jelenti azt, hogy az adott pillanatban ennyi a tényleges beteg.
A tényleges betegek száma az aktív esetszámból derül ki, amelyet ritkábban látni a híradásokban. (Magyarországon a csütörtöki állás szerint 223-an vannak.) Miért idézi akkor mégis mindenki az összes eset számát (is)? Mert ez mutatja meg azt a trendet, hogy hogyan halad előre a járvány kibontakozása, és válik egyre több ember érintetté. És még mindig ez teszi leginkább lehetővé az országonkénti összehasonlításokat (persze az időbeli eltolódásokat és a népességszámbeli különbségeket is figyelembe véve).

Mindebből egyenesen következik, hogy az összes igazolt eset száma csak növekedni tud, csökkenni soha nem fog. Ez persze logikus, mégis érdemes leszögezni, mert ahogy nap mint nap érkeznek az új fertőzöttekről szóló adatok, demoralizáló a folyamatos emelkedést látni, ha valaki nincs tisztában azzal, hogy nem az éppen aktuálisan beteg emberek számát látja, hanem az összes olyan emberét, aki a járvány kezdete óta egy ponton igazoltan beteg volt.
Vegyünk egy példát.
Ha mondjuk arról ír az Index, hogy egy országban egyik napról a másikra 5000 új fertőzöttet regisztrálnak, és ezzel az összes eset száma 60 000-re emelkedik, ebből tudni lehet, hogy a járvány kitörése óta az adott ország egészségügyi ellátórendszerének eddig összesen ennyi beteggel kellett megküzdenie. Látszik belőle az is, hogy ha mondjuk előző nap még csak 4500 új fertőzöttet regisztráltak, még egy nappal korábban pedig 4300-at, akkor a járvány még kibontakozóban van, az új megbetegedések száma gyorsuló ütemben nő. (Természetesen egyszerűsítünk, ilyen kevés adatból messzemenő következtetéseket a trendekre nézve még nem lehetne levonni.)
Ami azonban nem látszik az 5000-es, illetve a 60 000-es számból, hogy pillanatnyilag hány beteg van az országban, és ez mennyivel több, mint az előző napon volt. Hiszen előfordulhat, hogy a járvány kezdete óta 4000-en meghaltak, 6000-en pedig már felépültek, így a 60 000 összes regisztrált esetből már csak 50 000 az aktív, tehát az egészségügyre jelen pillanatban 10 000-rel kevesebb beteg nehezedik, mint amit az első számok alapján gondolhatnánk. Ugyanígy, ha mondjuk tegnapról mára meghalt 500, illetve meggyógyult 1000 fő, akkor az aktív esetek száma csak 3500-zal nő, azaz kevesebbel, mint az a bizonyos első helyen kiemelt 5000 fő.
A globális és a magyarországi adatokat folyamatosan frissülve követő grafikonunkba ezért mi is bevettük az aktív esetek számát, hogy teljesebb körű és pontosabb tájékoztatást adjunk, illetve a friss számokról szóló napi híradásainkban is igyekszünk minél többféle mutatót közölni és kontextusba helyezni.
Miért nem tesszük térképre a magyarországi eseteket?
A kormány adatvédelmi szempontokra hivatkozva nem közöl területi bontást a regisztrált fertőzöttekről (noha az influenza esetében a jelek szerint nincsenek ilyen aggályaik). Bár más forrásokból érkezik információ helyi esetekről, ez túl ingoványos talaj ahhoz, hogy térképet alapozzunk rá: a bejelentések hitelessége elég vegyes, a skála a polgármesterek Facebook-bejegyzéseitől egy-egy cég közlésén át magánemberek posztjaiig terjed.
Hivatalos területi adatok híján az átfedések kiszűrése is problémás lenne, mert egy-egy helyi bejelentésről nem lehetne biztosan tudni, hogy már benne van-e a központi összesítésben, vagy annál frissebb esetről van-e szó. Ha viszont csak a területi információt is tartalmazó bejelentéseket vinnénk térképre, az a központi statisztika figyelmen kívül hagyása miatt adna torz végeredményt.
Ráadásul egy ilyen térkép épp a transzparensebb adatközlőkre üthetne vissza, mert ha egy adott város polgármestere rendszeresen közzétenné, ha új fertőzöttet regisztrálnak náluk, míg egy hasonló méretű város polgármestere nem, a térkép azt a hamis látszatot keltené, hogy az első számú város súlyos gócpont, a másodikba meg el se ért a járványt – miközben lehet, hogy utóbbiban valójában már kétszer annyi beteget azonosítottak.
Az is kérdéses, hogy lenne-e még egyáltalán hírértéke annak, hogy egy-egy régióban, megyében, városban hányan betegedtek meg, miközben a járvány már a kormány szerint is mindenhol jelen van. (Egyébként lenne: a járvány levonulása utáni elemzésekhez hasznos lenne majd látni, hol hogyan bontakozott ki, merre és hogyan terjedt a fertőzés. Már csak azért is, mert ez a későbbi járványok elleni védekezés felépítéséhez is kulcsfontosságú lehet.)
A halálozási arány nagyon bizonytalan
Az egyik legtöbbet idézett, egyben a legproblémásabb mérőszám a halálozási arány (Case Fatality Rate, CFR). Ezt úgy kapjuk meg, hogy a halálesetek számát elosztjuk az összes azonosított fertőzött számával, és az eredményt megszorozzuk százzal. A WHO a koronavírusnál ezt eleinte 2 százalékban határozta meg, később 3,4 százalékra módosították, de több epidemiológus szerint a valós szám inkább 1 százalék körül lehet. Ezek az önmagukban kicsinek tűnő eltérések sok tízmillió emberrel megszorozva sok százezres különbséget jelenthetnek a halálozások számában.
Miből adódik ez az ingadozás?
Egyrészt ezek a halálozási arányok egyelőre becslések. Mivel a járvány még javában tart, lehetetlen pontos számokat mondani, a statisztikák még jelentősen változni fognak. (Több más ok mellett ezért is félrevezető más, már lezajlott járványokkal, például a szezonális influenzával vagy a spanyolnáthával összehasonlítani.)
Másrészt országonként elég nagy eltérések lehetnek a halálozási arányban, így egyetlen átlagszám csak korlátozott információt ad arról, hogy egyes országokban várhatóan milyen súlyos lefolyású lesz a járvány. Az eltérések adódhatnak abból, hogy
- melyik ország milyen intézkedéseket hoz a vírus terjedése ellen;
- ezeket mikor, milyen gyorsan hozza meg;
- milyen a járvány kitörése előtti járványügyi felkészültségük;
- hol milyen színvonalú az egészségügyi rendszer;
- milyen a demográfiai összetétel (mekkora a koronavírus-fertőzés által komolyabban veszélyeztetett idősek aránya); illetve
- milyen széles körben tesztelnek, azaz milyen arányban azonosítják a létező fertőzéseket.
Most minden a tömeges tesztelésen áll vagy bukik
Jó hír, hogy a hatékony teszteléshez minden tudás adott, az eljárás egyszerű és nem drága. De a kapacitásokat meg kell sokszorozni, a tünetmentes fertőzötteket kiszűrni és izolálni.
Harmadrészt sok esetben a tünetek olyan enyhék (vagy egyáltalán nincsenek), hogy a fertőzötteket nem is azonosítják, így nem kerülnek be a statisztikákba (ami megint csak a tesztelés hatékonyságának különbségeihez vezet vissza), ezzel pedig torzítják a halálozási arányt is.
Negyedrészt nemcsak a fertőzöttek valódi száma bizonytalan, de egy adott időpillanatban a haláleseteké is. A járvány levonulása után pontosan tudni fogjuk, hányan haltak meg a fertőzöttek közül, de menet közben a halálozási arányt torzítja, hogy míg a halottak rögtön bekerülnek a statisztikákba, nem tudhatjuk, hogy a többi betegből hányan fognak meghalni, és hányan gyógyulnak fel.

Ez utóbbiból az következik, hogy mondjuk januárra magasabbnak tűnhet a halálozási arány, mint februárra vagy pláne márciusra, hiszen a régebbi esetek közül több zárult már le – így könnyen azt a csalóka következtetést vonhatnánk le, hogy egyre kisebb arányban halnak meg az emberek (ami más okokból lehet egyébként így, de pusztán ebből a számból nem következik).
Ugyanígy, ha az összes eset számának növekedése kezd majd lassulni, szükségszerűen egyre nagyobb lesz a halálozások aránya, mert új esetből kevesebb lesz, a régiek közül viszont több fog véget érni (halállal és gyógyulással is). Ez a két torzító tényező – a valós esetek alulbecslése és a kimenetelek időbeli eltolódása – végső soron statisztikailag ki is egyenlítheti egymást.
Attól most tekintsünk el, hogy a koronavírus-járvány összes áldozata a végső számnál is több lehet majd, mert ahogy az egészségügyi ellátórendszert egyre inkább leterheli a fertőzöttek ellátása, egyre kevesebb kapacitás marad a más betegségben szenvedőkre – éppen azért küzd most minden ország a járvány lassításáért, hogy ezt a járulékos veszteséget minél alacsonyabb szinten tudja tartani.
Még a halálesetek száma sem egyértelmű
Bár maguknak a haláleseteknek a megállapítása legalább egyértelműnek tűnhet elsőre, ezzel kapcsolatban is merülnek fel módszertani kérdések, hiszen nem minden esetben világos, hogy egy beteg ember a koronavírus-fertőzés miatt halt-e meg, vagy a már meglévő egyéb betegsége okozta a halálát, miközben egyébként fertőzött is volt.
Erre világított rá a Kásler Miklós, az emberi erőforrások miniszterének levele körül kialakult félreértés is. A miniszter a halottak vizsgálatával kapcsolatban elrendelte, hogy ha egy halott kórtörténetében olyan kritikus, krónikus betegség vagy állapot szerepel, amely önmagában is halálhoz vezethetett volna, akkor azt kell a halál okaként feltüntetni. Ha koronavírus-fertőzött is volt, akkor ennek a ténynek ilyenkor csak a “Kísérő betegségek vagy állapotok, amelyek az alapbetegségtől függetlenek, de hozzájárulhatnak a halálhoz" rubrikába kell bekerülnie. Ebből néhányan azt a következtetést vonták le, hogy a kormány kozmetikázza a koronavírusos halottak számát, pedig valójában ez az általánosan elfogadott megközelítés, és például az influenza esetén is ez a bevett gyakorlat.
A fentiek tisztázzák azokat a haláleseteket, ahol már tudott volt a koronavírus-fertőzés ténye. Felmerül azonban a kérdés, hogy mi lesz azokkal, akik esetleg úgy halnak meg, hogy haláluk előtt nem derült fény az esetleges fertőzöttségükre. Ezt Müller Cecília országos tisztifőorvos rendelete [pdf] válaszolja meg: azoknál a halottaknál, akiknél felmerül a koronavírus-fertőzés gyanúja, a halál beálltának megállapítása után 30 percen belül felső légúti orr- és torokmintákat kell venni, amelyekből posztumusz tesztet lehet elvégezni. Erre egyébként elsősorban nem a statisztika miatt van szükség, hanem hogy ha beigazolódik a fertőzés, fel lehessen keresni az illető potenciálisan szintén fertőzött kontaktszemélyeit.
A közmédia esete Ausztriával
A fenti problémák szemléltetéséhez megrendelésre sem készülhetett volna jobb esettanulmány, mint amit az M1 mutatott be néhány nappal ezelőtt. A csatorna híradójában az akkori magyar és osztrák regisztrált esetszámokat hasonlították össze. A grafikon látványosan azt sugallta, hogy míg a 2388 fertőzöttet azonosító Ausztriában egyre nagyobb a baj, Magyarország a maga 85 fertőzöttjével ura a helyzetnek:
Look how Hungarian Govt propaganda working in #covid19 crisis.
— Balazs Csekö (@balazscseko) March 21, 2020
State-owned #M1 compares No. of infected persons in Hungary (85) with Austria (2388).
What they hide:
6 deaths in Austria (Mort.rate: 0.2%)
4 deaths in Hungary (4.7%) pic.twitter.com/87Rnm7EbC7
Ez több szempontból is elég vaskos csúsztatás.
Az most mellékes, hogy abszolút számokat amúgy sem szerencsés így összevetni, még akkor sem, ha a konkrét esetben a két ország népessége nagyságrendileg egy kategóriába esik. Az összehasonlíthatóságra az egymillió főre vetített számokat szokás használni. Az adatok ilyen tálalása azonban két másik szempontból még problémásabb.
Egyrészt a regisztrált esetek száma, ahogy már fentebb részleteztük, nagyban függ a tesztelések számától, Magyarország pedig ezen a téren nem áll túl jól nemzetközi összehasonlításban. Elég csak Ausztria példáját továbbvinni:
- A cikkünk írásakor a friss számok szerint Ausztriában 5560, Magyarországon 261 az eddig összesen igazolt eset.
- Odaát a cikkünkig 32 407 tesztet végeztek el, míg nálunk 8005-öt.
- Ez lakosságszámra vetítve durván 0,36, illetve 0,08 százalék.
- A regisztrált fertőzöttek aránya a tesztekhez képest: 17,16 százaléka, 3,26 százaléka.
Ausztria tehát arányosan sokkal több tesztet végez el, amelyekkel arányosan sokkal több fertőzöttet azonosít, nem csoda hát, hogy jóval magasabb náluk az összes regisztrált eset száma. Ez azonban nem a kisebb fegyelemről, hanem feltehetően a létező esetek nagyobb arányú feltárásáról tanúskodik.

Másrészt a halálesetek is nagyon más képet mutatnak, mint amit az M1 ábrája közvetít:
- Ausztriában 31, Magyarországon 10 haláleset történt a cikkünk írásáig.
- A halálesetek aránya a fertőzöttek számához képest ott 0,56 százalék, nálunk 3,83 százalék. A magyar adat nemcsak az osztrákhoz képest, de regionális összehasonlításban is kiugró.
Ez utóbbi is arra utal, hogy Magyarország vastagon alulmérheti a fertőzöttek számát, mert semmi nem indokolja, hogy ennyivel nagyobb arányban haljanak meg a magyarországi betegek. (Kézenfekvő alternatív magyarázat lehetne az egészségügy színvonalbeli különbsége, illetve hogy nálunk nagyobb arányban fertőződnek meg az idősek és a krónikus betegek, akik nagyobb eséllyel halnak ebbe bele – de erre nem utal semmilyen adat.)
Ebből egyébként az is látszik, hogy bár a tesztek számának visszafogásában vonzó lehetne, hogy ezzel papíron az esetszám is alacsonyan tartható, a sokkal nehezebben kontrollálható halálesetek számának emelkedése viszont annál rosszabb képet fest, minél kevesebb fertőzött (és ezzel szükségszerűen kevesebb tesztelés) társul hozzá.
Kozmetikázhatók-e az adatok?
A statisztikák jellegéből adódó általános bizonytalanságokra rárakódik még az is, hogy a mára globálissá vált járvány kiindulópontjának tekinthető Kína esetében – az ország autoriter államberendezkedése és a más témákban korábban tapasztaltan alapján – felmerül a gyanú, hogy a nyilvánosságra hozott statisztikák nem feltétlenül megbízhatók.
Ezt erősíti, hogy februárban különös dolgok történtek a Kínából érkező adatokkal:
- Az országban eleinte csak a pozitív labortesztet produkáló betegeket számították az igazolt fertőzések közé.
- Február 12-én azonban megváltoztatták az esetdefiníciót, onnantól már a tünetek produkálása is elég volt ehhez – de csak a járvány epicentrumának számító Hupej tartományban. Ennek hatására a teljes esetszám egyetlen nap alatt hatalmasat ugrott (51 ezerről 70 ezerre).
- Február 20-án aztán visszaálltak a teszt alapú számolásra, és utólag töröltek bizonyos eseteket.
A legtöbb kutató szerint ezek a változtatások valószínűleg nem azért történtek, mert Kína kozmetikázni akarta volna a számokat, hanem mert a hupeji egészségügyi rendszer február közepére úgy túlterhelődött, hogy nem bírták fenntartani a tesztelést, majd később akkor állt vissza a módszertan, amikor sikerült növelni a tesztkapacitást. A többszöri változtatgatás mindenesetre nem tett jót a kínai statisztikák iránti bizalomnak.
Ugyanakkor tényleges visszaélésekre utaló jelentések is érkeztek. A járvány decemberi eltussolását is feltáró Cajhszin (Caixin) kínai üzleti lap szerint például a tünetmentes eseteket egyes helyi hatóságok egyszerűen nem jelentik le. A South China Morning Post nevű hongkongi lap pedig titkosított kormányzati dokumentumok alapján arról írt, hogy február végéig több mint 43 ezer tünetmentes fertőzöttet azonosítottak Kínában, akiket nem számoltak bele az összesített esetszámba.
Hasonló félelmek az Oroszországból érkező számokkal kapcsolatban is felmerültek, de valószínűleg nem a statisztikák manipulációjának köszönhetők az ottani alacsony esetszámok. A valós adatok nagyságrendjének eltitkolása a járvány által a legkomolyabban sújtott egyik országban, Iránban is csak ideig-óráig bizonyult kivitelezhetőnek.
Az egyes európai országok által jelentett esetszámok kapcsán érdekes összefüggésre világít rá egy Twitteren keringő grafikon:
So much attention to #COVID #data and what it might mean for the future. So little attention to how strongly #freedomofthepress correlates with confirmed cases in Europe. Look at this, folks. It's probably worse than you think. pic.twitter.com/CgiRhokFPs
— Curtis Bell (@curtismbell) March 21, 2020
Az ábra azt mutatja, hogy minél nagyobb egy adott országban a sajtószabadság (a Riporterek Határok Nélkül rangsora alapján), jellemzően annál több az egymillió főre vetített igazolt eseteik száma. Ebből persze nem következik, hogy a kettő között van-e közvetlen összefüggés – például az adatok manipulálása vagy visszatartása –, véletlen egybeesésről is lehet szó. Az is elképzelhető, hogy ahol jobb a sajtó helyzete, ott a tesztelési kapacitás is nagyobb, ebből adódnak a magasabb esetszámok. (Ráadásul, ahogy egy olvasónk a cikk megjelenése után felhívta a figyelmünket, az ábra nem veszi figyelembe, hogy a járvány a különböző országokba más-más időpontban érkezett meg, így az adatok ebben a formában nem is közvetlenül összehasonlíthatók.) Magyarország mindenesetre sajtószabadság szempontjából a skála közepe táján helyezkedik el, de a regisztrált esetek tekintetében csak az első harmadot érjük el.
(Borítókép: Egészségügyi dolgozó a határon átkelők testhőmérsékletét ellenőrzi az osztrák-magyar határon, Hegyeshalomnál 2020. március 17-én. Fotó: REUTERS/Szabó Bernadett)
Vannak, akiknek már nincsenek kérdéseik,
És vannak, akik az Indexet olvassák!
Támogasd te is a független újságírást,
hogy ebben a nehéz helyzetben is tovább dolgozhassunk!
Kattints ide!