Un recente articolo apparso sul Corriere ha avuto il grande merito diffondere le basi della modellizzazione epidemiologica spiegando che il cuore del problema è un numero, R0, che controlla il tasso di diffusione del coronavirus: ogni malattia ha il suo, quello del coronavirus appare essere circa 2,5.
Se questo numero è minore di 1 la malattia non si diffonderà, mentre se è maggiore di 1 avverrà un ‘outbreak’ che porterà al diffondersi dell’epidemia. Ma da dove viene questo numero? Da cosa dipende? Cosa vuol dire che rappresenta “il numero medio di persone che ogni contagiato contagia”? E come dobbiamo interpretarlo?
Dato che 2.5 non è, evidentemente, un valore così basso, tanto che ci troviamo tutti confinati in casa, ho deciso di scrivere un articolo in cui si spiega la questione della matematica del contagio.
IL MODELLO SIR
Questo semplice (e semplicistico) modello si basa su due premesse fondamentali:
1 – divisione in compartimenti:
le persone sono classificate in base al loro ‘stato’. Quando una persona cambia stato, non fa altro che passare da un compartimento ad un altro. Non si tiene conto dell’eta’, dello stato di salute e di nessun altro fattore: tutte le persone sono, ai fini della modellizazione, uguali. Data una popolazione di N individui, il modello SIR considera tre possibili stati:
- Sano (S): Gli individui che non si sono ancora ammalati ma che, potenzialmente, potrebbero farlo. Per questo a volte si usa il termine suscettibili.
- Infetto (I): Gli individui infetti e, quindi, contagiosi, che diffondono la malattia.
- Rimossi (R): Gli individui che sono stati infettati ma che ora non diffondo piu’ la malattia né possono riprenderla. Quindi possono essere i guariti (recovered) o i morti. Ai fini di questa modellizzazione non fa differenza e quindi parliamo genericamente di rimossi.
Essendo ogni membro della popolazione parte di uno di questi tre gruppi, è facile convincersi che S + I + R = N. Questa equazione deve valere in ogni istante di tempo! Se un individuo si ammala “I” aumenterà di una unità e S calerà di una, in modo che il totale N rimarrà comunque invariato.
2 – Mixing omogeneo
Questa ipotesi consiste nell’assumere che ogni persona ha le stesse probabilità di incontrare un individuo infetto. Detta in parole povere significa che se il 10% della popolazione è infetta, anche il 10% delle persone con cui entrate in contatto è infetta. La stessa cosa vale anche per gli altri due compartimenti. Tale ipotesi appare un po’ grossolana (per non dire irrealistica), ma ci permette di non andare a considerare le diverse reti di contatti, abitudini o caratteristiche di ogni individuo: per grandi numeri, tende a funzionare abbastanza bene, almeno in prima approssimazione.
Forti di queste due assunzioni, andiamo a porci la seguente domanda: immaginiamo di conoscere al tempo t = 0 il numero dei Sani S, degli infetti I e dei rimossi R. Come varieranno queste quantità nel tempo? Per farlo, iniziamo a ragionare sul funzionamento della malattia.
CONTAGIO
Un individuo si può ammalare quando entra in contatto con un infetto. Come possiamo modellizzare questo fenomeno? La nostra malattia avrà un tasso di diffusione “proprio”, dipendente dalle caratteristiche del patogeno, che chiameremo β: questo numero rappresenta la probabilità che ha un individuo sano di ammalarsi quanto entra in contatto con un infetto. Immaginiamo ora che, in media, un infetto entri in contatto con k persone. Usando l’ipotesi di mixing omogeneo, sappiamo che di queste “k” persone il numero di persone sane sarà S (il totale di sani) diviso N (la popolazione totale). Questo numero altro non è che la “densità di sani” ed e’ facile intuire che, all’inizio dell’epidemia, e’ un numero molto vicino ad 1 dato che S e’ quasi uguale ad N. Essendoci “I” individui infetti che trasmettono il patogeno, la variazione del numero di infetti sarà:
Ok. Mi rendo conto che questa e’ una equazione differenziale ma non preoccupatevi: capire cosa significa, ovvero, cosa ci sta dicendo, è estremamente semplice. Riscriviamola in questa forma (mi perdonino i matematici che leggono):
la variazione (dI) del numero di infetti è uguale al termine tra parentesi (che abbiamo discusso) sopra, moltiplicato per l’intervallo di tempo preso in considerazione (ad esempio, un giorno). Non siete ancora convinti? Scriviamo I(t) per indicare i malati al tempo t (ad esempio, oggi). Vogliamo sapere quanti saranno i malati a tempo t+dt (domani). Per quanto detto:
Cioè i malati domani I(t + dt) saranno uguali ai malati di oggi I(t) più la variazione nel numero di malati giornaliera (β k I S/N) moltiplicata per la “lunghezza” del giorno dt.
Siccome sento le urla del mio prof di analisi devo smetterla con questo esempio, ma spero che il concetto si sia capito: abbiamo una equazione che ci dice come varia il numero di infetti.
Che ne è dei sani? Siccome il numero di persone deve rimanere costante, ogni infetto non è altro che un sano che si ammala. Perciò la variazione dei sani è data semplicemente dall’opposto della variazione dei malati. In formule:
GUARIGIONE
Siccome sono tempi bui, lasciamoci prendere da un po’ di ottimismo e assumiamo che R corrisponda al numero dei Recovered, ovvero alle persone che dopo essere state infetti, guariscono.
La guarigione nel nostro modello funziona in modo diverso dal contagio: una persona infetta guarisce dopo un certo tempo, semplicemente. Questa cosa viene modellizzata definendo il tasso di guarigione, ovvero la probabilità di guarigione di un infetto per unità di tempo, indicata con μ. Di conseguenza, la variazione del numero di guariti dR NON dipenderà dal numero di guariti, ma dal numero di infetti: più persone sono infette, più persone guariranno. In simboli
e siccome il numero totale di persone deve rimanere invariato, andremo anche a modificare l’equazione degli infetti aggiungendo un termine che tenga conto di questa variazione.
Ora, siccome tutte queste quantità non dipendono dall’esatto numero di persone N, attuiamo una “normalizzazione”, dividendo S, I ed R per N. Avevamo già incontrato S/N e la avevamo chiamata densità di sani, quindi ci limitiamo a fare lo stesso con anche gli altri due compartimenti, definendo s = S/N, i = I/N e r = R/N. Le nostre nuove equazioni normalizzate saranno semplicemente:
Per sapere quanti sono effettivamente, ad esempio, gli infetti non dobbiamo fare altro che moltiplicare i per la popolazione totale (ad esempio, 60 milioni). Notiamo che essendo s,i,r quantità solo positive, i guariti non possono che aumentare (la loro variazione e’ il prodotto di due quantità positive) e i sani non possono che calare (la loro variazione e’ un prodotto di 4 termini positivi con davanti un meno).
Sarà quindi interessante capire la variazione degli infetti, che avendo sia un termine positivo sia uno negativo possono avere un comportamento non monotono.
EPIDEMIA O NO?
Bene è momento di dare un senso ai nostri termini. Torniamo alla loro interpretazione: le malattie con alto β tenderanno a diffondersi molto, perché e’ molto facile che il contatto con un infetto risulti in un’infezione.
Invece μ rappresenta quanto tempo ci mette una persona a guarire (o morire): se una malattia ha alto μ, significa che le persone rimangono poco infette (passato subito da i ad r). Ma questo implica che la malattia si diffonderà PIÙ LENTAMENTE, perché ogni infetto avrà meno tempo per infettare gli altri prima di guarire (o morire): è questo il motivo per cui le malattie che uccidono molto velocemente gli infetti (ad esempio l’ebola) difficilmente si espandono largamente, per quanto infettive siano: gli infetti tendono a morire prima di avere diffuso la malattia.
Vediamo quindi che è molto naturale definire il rapporto tra queste due quantità (tendendo conto anche di k), ed esso non sarà altro che l’ormai famoso R0.
R0 infatti rappresenta il numero medio di persone infettate da una persona infetta: questo numero sarà alto se la malattia si diffonde molto facilmente (alto β) o se un infetto rimarrà tale molto a lungo (basso μ). Ma perché la soglia “critica” e’ proprio R0 > 1?
Le equazioni del modello SIR sono discretamente complicate. Tuttavia possiamo aiutarci con una semplificazione: quando la diffusione della malattia è all’inizio, i guariti saranno in numero trascurabile (r = 0). Questo ci permette di scrivere s = 1 – i (perche’ S + I = N, quindi s + i = 1) e avere una singola equazione per l’evoluzione dell’epidemia (almeno al suo inizio), ovvero:
che dipende solo da i. La soluzione di questa equazione per tempi brevi può essere approssimata da un esponenziale, nella forma:
Vediamo chiaramente che l’argomento dell’esponenziale avrà segno negativo quando R0 è minore di uno. Questo significa che la quantità iniziale di infetti i0 tenderà a DIMINUIRE col passare del tempo! Se invece R0 è maggiore di 1, il segno sarà positivo e gli infetti aumenteranno. In altre parole, il valore di R0 determina la possibilità di avere un outbreak o meno.
Nella figura ho disegnato l’evoluzione del numero di infetti per malattie con diversi R0.
vediamo che, come previsto, gli infetti tendono a calare sin da subito quando R0 <1, mentre negli altri casi raggiungono un picco prima di iniziare a scendere.
Questo fenomeno è dovuto ad una saturazione: come abbiamo detto, la soluzione esponenziale vale solo quando gli infetti sono pochi, perché si può assumere che ci siano abbastanza sani da contagiare. Col passare del tempo, la diffusione sarà più difficile perché i sani saranno sempre meno, sostituiti da infetti o da guariti (che, nel nostro modello non possono essere infettati).
Ci si potrebbe chiedere: che ruolo gioca il μ che compare nella formula esponenziale davanti a R0? Non e’ altro che un fattore di scala (temporale): malattie con lo stesso R0 ma diverso μ si diffonderanno allo stesso modo, ma lo faranno in più o meno tempo.
Si noti nella figura che il valore massimo raggiunto dagli infetti è sempre lo stesso, solo spostato nel tempo.
IL PERICOLO DELL’EPIDEMIA
Ci interessa ora capire cosa significhino questi valori. Immaginiamo di considerare una malattia con un R0=2 (per ossere ottimisti rispetto al coronavirus) e proviamo a vedere l’andamento degli infetti nel tempo.
Innanzitutto vediamo che la previsione exponenziale si discosta abbastanza rapidamente dalla realtà: assumendo che la scala temporale sia in giorni, dopo tre settimane è già in atto una saturazione. Il picco di casi avviene a circa 40 giorni, dopo di che inizia scendere. Al giorno 150 non ci sono più infetti. Ci tengo a specificare che questi numeri non sono indicativi, hanno il solo scopo di descrivere il fenomeno in modo più che qualitativo: non aspettatevi 6 mesi di quarantena (non a causa di questo modello almeno).
Se osserviamo il picco però capiamo perché ci sia da preoccuparsi: al quarantesimo giorno, quasi 18% della popolazione è infetto! Su una popolazione di 60 milioni, sono quasi 11 milioni di persone. È un numero enorme, drammatico. Ma non è finita qui. Proviamo a mostrare non solo il numero di infetti, ma anche il variare di s e di r.
Incredibile vero? Al termine dell’epidemia (ovvero quando i = 0) quasi l’80% della popolazione è stata contagia ed è tra i rimossi!
Ipotizzando che una letalità (numero dei morti tra i contagiati, che nel nostro caso corrispondono ad r) del 4% (che è più o meno il valore stimato per il COVID19) , la mortalità (ovvero il numero di morti sulla popolazione totale) sarebbe del 3.2%! Significherebbero quasi due milioni di morti su una popolazione di 60 milioni, un numero davvero gargantuesco. È per questo che stanno venendo prese misure cosi’ stringenti in questi giorni: il pericolo e’ enorme.
Cosa fare quindi? Come abbiamo visto, R_0 dipende da β e da μ che sono caratteristiche del patogeno e su cui è molto difficile agire. Tuttavia, vi è anche un altro termine: k, il numero di contatti medio che ha una persona per unita’ di tempo. Ed è proprio su quello che si applicano queste misure restrittive: spingere la gente a restare a casa e a non frequentare luoghi affollati, ha il semplice scopo di diminuire i contatti e le occasioni di contagio, e quindi ridurre R_0.
Io non sono un medico né mi occupo di epidemiologia: il solo scopo di questo articolo era dimostrare come anche una semplice modellizzazione può spiegare un fenomeno complesso quale la diffusione di una epidemia per dare un senso alle misure così restrittive che stiamo subendo in questi giorni.
Le fonti di ispirazione per il mio articolo sono state lo splendido video di 3B1B e il capitolo 10 del libro di Barabasi, che contiene anche modelli di contagio più raffinati, che tengono conto della rete di contatti delle persone o discutono il ruolo delle vaccinazioni.
Buon isolamento.
11 comments
Buongiorno Pietro.
Tutto molto bello. Anzi molto brutto, anzi drammatico.
Però, da vecchio fisico ((cioè laureato 28 anni fa) (se conosci il francese capisci la battuta criptata)), mi sarebbe piaciuto leggere nel tuo articolo anche come si ricava, anche a grandi linee, i(t) “reale”. Anzi, per essere precisi mi piacerebbe sapere se il modello ha una soluzione analitica e come si ricava, sempre a grandi linee. Tutto questo, ovviamente, senza accedere alla letteratura… ché altrimenti che gusto c’è a leggerti? Un saluto ed un incoraggiamento e, naturalmente, in bocca al lupo!
Marco
Beh, colpa anche del Coronavirus non ho ceduto alla tentazione è sono andato a spiare la letteratura… Quindi conosco già la risposta che mi darai. :-)
Un saluto,
M
[…] fase, non dimentichiamo che siamo stati i primi in tutta Europa e non solo a veder nascere focolai in crescita esponenziale di contagiati e morti, record battuto solo dalla […]
[…] politici, su quello di cui ha bisogno il paese per uscire dalla crisi economica grave in cui cadremo dopo questa emergenza. Si sente parlare di interventi per tenere sotto controllo lo spread, di emissione di Eurobond, di […]
[…] Come si trasmette il contagio dagli ospedali all’economia? In questa puntata di Inglorious Globastards spieghiamo in termini semplici la patologia di questa recessione, a beneficio di chi non ha una formazione economica. […]
[…] economista degno di questo nome concorda sul fatto che 3 (non causato da scelte di politica economica) che riduce sia l’offerta (le imprese non […]
[…] Alcuni politici italiani di destra e sinistra (sempre unite nella devastazione di fondi pubblici), hanno pubblicato un annuncio a pagamento a tutta pagina sul quotidiano tedesco Frankfurter Allgemeine Zeitung (FAZ) per inscenare la solita recita da straccioni ed indurre la Germania a pagare il debito pubblico italiano con la scusa della pandemia. […]
[…] fronte dell’Epidemia Covid19, esiste una differenza elementare tra due dati che troppi organi d’informazione continuano a […]
[…] a gennaio la catena di comunicazione della segnalazione di polmoniti atipiche, mentre in Cina scoppiava una epidemia mondiale di polmoniti anomale, non ha raggiunto la catena di comando della Regione. Dove e come il meccanismo di comunicazione si […]
[…] Le rilevazioni sui “nuovi contagi” sono distorti, perché in Italia si fanno i (pochi) test solo sui sintomatici, e negli ospedali. Non abbiamo idea della percentuale di asintomatici. Le autorità non hanno predisposto finora un’analisi a campione sulla popolazione e quindi si brancola nel buio quanto a velocità di diffusione. […]
[…] Times (e apparsa poi tradotta nel Corriere della Sera), il Professore sostiene di aver cercato di impegnarsi per combattere la pandemia, ma di essere stato ostacolato dai meccanismi burocratici e di essere, perciò, molto deluso dalle […]