Ma che dati ci date?


Cesare Cislaghi | 20 Aprile 2020

Negli ultimi giorni sono aumentati dubbi e lamentele sulla correttezza dei dati relativi all’espandersi dell’epidemia da Covid-19 ed è forse opportuno fare qualche ragionamento per cogliere pregi e difetti della comunicazione per vedere se è possibile introdurre da ora dei correttivi o comunque per farne buon uso per il futuro.

 

 width=

 

 width=

 

I siti nazionali istituzionali che comunicano sul web i dati e di cui riproduciamo le infografiche aggiornate al 17 aprile sono due: il sito della Protezione Civile (qui PC) e il sito dell’Istituto Superiore di Sanità (qui ISS), Dipartimento di epidemiologia “Epicentro”.

Oltre a questi siti nazionali anche molte delle Regioni pubblicano i loro dati ma è qui opportuno, per non complicare l’analisi, dedicarsi ai due siti nazionali.

 

Si deve innanzitutto precisare che i casi di contagio sono registrati nei servizi ospedalieri e territoriali e poi raccolti dalle Regioni che li trasmettono formalmente al Ministero della Salute. La qualità del dato all’origine non è quindi ne merito ne colpa di PC o di ISS e sicuramente nei momenti più drammatici dell’epidemia gli operatori locali erano più preoccupati di assistere efficacemente le persone che non di raccogliere correttamente i dati. Si consideri però che, nonostante spesso non se ne faccia la necessaria considerazione, qualsiasi decisione relativa alle misure di prevenzione da adottare in un evento epidemico non può prescindere dalla conoscenza precisa del quadro epidemiologico. Per salvare la popolazione servono sicuramente i clinici e i rianimatori ma anche gli epidemiologi e gli esperti di medicina preventiva, e spesso di ciò non si ha piena consapevolezza.

 

Ma quando è “scoppiata” l’epidemia quali erano le urgenze affidate alla PC? Fondamentalmente era quella di valutare la compatibilità delle strutture assistenziali con il bisogno crescente ed in particolare era indispensabile sapere e prevedere se fossero sufficienti i posti letto, soprattutto quelli di terapia intensiva. Con questo obiettivo la PC era indirizzata verso il dato di “prevalenza”, cioè il numero di “casi” contemporaneamente presenti nel paese o nelle singole Regioni e Province e bisognosi di assistenza.

Per far questo innanzitutto era necessario definire chi si dovesse considerare “caso” e fu deciso all’insorgere dell’epidemia che casi sono solo i soggetti risultati positivi a un test con tampone che doveva/poteva essere effettuato su soggetti con gravi indizi sintomatologici. La limitazione iniziale dei test con tampone dipendeva anche e soprattutto dalla limitazione delle possibilità ad attuarli e della assoluta precedenza dovuta alla conferma delle diagnosi per non rischiare di considerare contagiato un paziente che non lo era nonostante dei sintomi apparentemente simili. In ogni modo la definizione di “caso”, per considerarsi affidabile, non può prescindere dall’esser stato effettuato un test che ha dato esito positivo; purtroppo le diagnosi anamnestiche o cliniche o strumentali non possono dare livelli accettabili di certezza.

 

Questa tabella evidenzia che nella comunicazione della PC sia prevalente l’interesse di documentazione

 width=

 

Ma ciò che più serve a chi ha compiti di prevenzione e di attuazione delle misure di contenimento, a differenza di chi deve predisporre dei mezzi di assistenza clinica, non è la stima della prevalenza bensì la stima dell’andamento dell’ ”incidenza”, cioè dei nuovi casi che contraggono il contagio. È questa l’informazione che permette di definire la forza espansiva dell’epidemia.

La confusione tra prevalenza ed incidenza porta poi a dei gravi fraintendimenti come ad esempio questo diffuso il 17 aprile dall’ANSA:

 width=

 

 width=

 

La prevalenza in Italia era realmente aumentata quel giorno solo di 809 soggetti, ma tale esito era dovuto ai 2200 guariti ed ai 482 deceduti che chiaramente, entrambi, non necessitavano più di assistenza, ma l’incidenza era aumentata ben di più, di 3491 soggetti. E se la Lombardia rappresentava il 94% dell’incremento della prevalenza, invece rappresentava solo il 35% dell’aumento dell’incidenza giornaliera, e addirittura un punto inferiore alla proporzione di tutti i casi positivi riscontrati sinora in Regione. E i telegiornali, naturalmente, hanno riportato questi dati diffondendo ulteriore confusione.

 

In realtà il minor calo della prevalenza dipende dalla registrazione dei casi di guarigione che vengono certificati non tanto con diagnosi clinica bensì sulla base di due test che vengono effettuati e soprattutto registrati e trasmessi in modi e tempi difformi tra le Regioni e spesso non a scadenze giornaliere ma aggregando più giorni assieme.

 

Ma a parte questi “granchi” presi dall’informazione e favoriti dall’inadeguatezza della comunicazione della PC, rimane il fatto che la stima dei numeri dei contagi e anche dei decessi lascia molte, troppe incertezze. Infatti la definizione di “caso” di cui abbiamo prima parlato, oggi non è più rispettata e vengono individuati dei positivi anche tra soggetti con sintomatologia inferiore o addirittura senza sintomatologia. La mescolanza, in quote differenti, di tutte queste diverse forme di casi produce numeri non affidabili; insomma “chi cerca trova”, e “chi cerca di più trova di più”.

 

La PC riceve e pubblica dati aggregati mentre l’ISS riceve ed analizza record individuali, quasi delle “cartelle cliniche” che posseggono molte utili ed importanti informazioni. Però non si può non notare che se la PC il 17/4 dà 175.925 casi positivi certificati, alla stessa data l’ISS ne dà 162.006 e non è chiaro da cosa dipenda questa differenza che per lo meno dovrebbe essere spiegata. È anche molto interessante il grafico dell’ISS (in alto a destra nella  infografica dell’ISS esposta in apertura dell’articolo) che classifica i “casi” per rilevanza dei sintomi, peccato che poi risulti che questo grafico è fatto solo su 56.439 casi, quindi solo il 35% del totale. Non stupisce che la comunicazione di dati individuali contengano dei missing, ma un 65% di missing vanifica la fonte.

Anche il grafico che illustra l’andamento non per data del tampone ma per data dell’esordio dei sintomi sarebbe molto informativo se non si considerassero anche gli asintomatici (che ovviamente non avendo sintomi non hanno la data con cui sono iniziati) e soprattutto se non ci fossero appunto i troppi dati mancanti e forse anche imprecisioni dei ricordi (il cosiddetto recall bias).

 

Concludendo: gli sforzi delle Regioni e del Ministero a creare dei sistemi informativi sull’epidemia deve essere lodato negli sforzi ma il risultato ahimè non è molto soddisfacente. Queste imprecisioni sino ad oggi non hanno comportato gravi conseguenze anche perché per la decisione relativa al lockdown bastava anche solo un dato approssimativo.  Ma adesso, con la prospettiva di passare alla cosiddetta fase due, l’informazione dovrà essere precisa e completa e non solo quella locale, che dovrà basarsi su un contact tracing efficace.

Sarà anche imprescindibile disporre di una informazione generale sull’andamento dell’incidenza delle differenti casistiche e sui differenti rischi di contagio per ambito di vita e di attività. Speriamo che il Ministero della Sanità, l’ISS e la PC sappiano rimodulare i propri strumenti informativi e che chi li analizza e li comunica lo faccia con una sufficiente competenza epidemiologica.