 Buongiorno a tutti, io mi chiamo Paolo Pin e insegno al Dipartimento di economia politica e statistica dell'Università di Siena. Quindi sono un economista. Però vi voglio parlare di un argomento che tutti ormai conosciamo benissimo perché fa parte pervasiva delle nostre vite attualmente che è il Covid-19. Allora, vi voglio dire alcune cose basate da un articolo scientifico che ho scritto. Trovate il link qui nelle slide con Alessio Muscillo che è un altro ricercatore del nostro Dipartimento in cui analizziamo le politiche di quarantena e di contenimento per limitare la diffusione del virus. Voi naturalmente non è che potete accedere al link dal video, ma se andate sulla mia pagina personale che trovate qui, potete appunto entrare nella mia pagina. E se andate su teaching che sta per didattica, potete trovare un link alle slide che vi sto presentando per cui per i dubbi che potete avere o per ricontrollare alcune parti, potete andare a scaricarveli. Ok, dunque, quello che voglio fare è a parte una lezione su l'approccio che usiamo in questo articolo, iniziare con una breve introduzione su quella che è l'approccio che l'economia ha e che può essere utile in situazioni complesse del mondo attuale, fra cui questa della diffusione del virus, per poi entrare nell'argomento e farvi vedere come il nostro contributo è quello di andare ad arricchire dei modelli ben noti in epidemiologia, però appunto con questo punto di vista che arriva dall'economia e dalle scienze sociali. Ok, e poi alla fine ritorneremo al punto di partenza da cui inizierò appunto la presentazione. Questo punto di partenza, qui vedete una scaletta di quello che intendo dirvi oggi, parte appunto dal concetto di Big Data. Allora, attualmente cosa vuol dire Big Data? Tutti noi, tutti i giorni, usando Facebook o facendo qualsiasi attività online o anche solo spostandoci ma col telefonino connesso al GPS, generiamo tantissimi dati. Il mondo genera un amole enorme di dati ogni giorno e forse non ci avete mai pensato ma l'umanità ha generato più dati negli ultimi 10 anni ma probabilmente basterebbero 5 che in tutta la sua storia precedente. Quello che la traccia scritta di tutto quello che facciamo è molto più pervasiva di quanto non fosse in passata. Questi dati però non sono facili ad analizzare, uno non è che può capire tutto quello che succede nel mondo grazie a questo. Per due motivi. Uno è l'amole enorme appunto di dati per cui anche un super computer non li può considerare tutti insieme. L'altra è che questi sono generati da persone. Non sono dati che registriamo dalle molecole di una reazione chimica o dalle onde elettromagnetiche dell'universo per fare degli esempi dalle scienze fisiche o dalle scienze dure. Questi sono dati generati da persone e le persone reagiscono all'ambiente si adattano imparano e da questo punto di vista uno può analizzare in maniera critica le politiche che vengono scelte ad esempio la politica di quarantena per il virus. Date delle imposizioni non tutti si assimilaranno ma tutti si comporteranno rispondendo a quello che gli viene chiesto. Chi è il maggiore su una maggiore chi immisura minore. L'approccio delle scienze sociali in questo in questo ambiente quindi è quello di dare una traccia per analizzare e capire questi dati e poter fare previsioni su questi dati appunto indirizzare le politiche che possono essere prese. Le amministrazioni pubbliche e le aziende generano tantissimi dati e vogliono anche capire i dati da loro stessi generati e dati che si trovano a disposizione. E quindi questa è un po' l'aiuto che l'approccio economico può dare e può essere apprezzabile anche in una situazione complessa come è quella attuale della diffusione di questo di questo nuovo virus. Il virus appunto è studiato fortemente dagli economisti se voi andate in uno o qualsiasi dei link che vi ho messo qui sotto ad esempio il primo che dell'associazione europea degli economisti trova una lista di progetti dove i vari economisti europei. Studiano in un modo o nell'altro questa epidemia di covid 19 e questi studi non sono studi medici o epidemiologici sono studi che per lo più si inseriscono in uno di queste tre categorie. Un altro aspetto il secondo è che il fatto che per via della quarantena tutti dobbiamo stare in casa è un classico esperimento naturale così viene chiamato nelle scienze sociali praticamente questa imposizione che ci viene di dover cambiare le nostre vite. Ad esempio ci permette di studiare come sono i nostri comportamenti rispetto allo smart working quindi il lavoro da casa oppure rispetto agli acquisti online oppure di valutare come possono essere efficienti in mezzo di didattica nelle scuole a distanza che tutte le scuole in Italia stanno facendo. Quello che parleremo invece è il terzo punto noi abbiamo un processo di diffusione di un virus e cerchiamo di fare delle politiche di contenimento possiamo studiare se queste sono efficaci o meno. I modelli di diffusione sono stati usati già da tempo dagli economisti come me io stesso ho incentrato su questo la mia ricerca negli ultimi 15 anni e spesso ho analizzato modelli di diffusione per capire come si diffondevano nella società ad esempio idee o i prodotti di consumo. E il contributo che io così come tutti gli altri che come me hanno lavorato in questo campo e di avere regole più complicate di diffusione che però non ci interessano se parliamo della diffusione di un virus per cui torniamo ai modelli epidemiologici originali. Però il nostro contributo si incentra sul secondo e sul terzo punto abbiamo siamo andati a valutare come la diffusione avviene se abbiamo caratteristiche diverse per gli individui nella società se analizziamo le differenze che ci sono tra gli individui e se consideriamo il fatto come dicevo prima che gli individui prendono decisioni independenti che influenzano il modo in cui si diffonde qualcosa in questo caso la malattia. Quindi quello che voglio fare ora è spiegarvi brevemente qual è il modello più semplice di diffusione usato in effidemiologia e poi andare a vedere come il nostro contributo lo arricchisce tape delle previsioni che secondo noi sono interessanti. Ci sarà un po' di matematica ok perché il modello è appunto un modello matematica nelle prossime slide ma cercherò di darvi l'intuizione per non renderla troppo pesante ok. Allora il modello di base si chiama si s o si s e il modello base delle fedemolugia ok essenzialmente le persone in questo modello possono essere in due stati suscettibili o infette quindi sane o malate ok. o malate e vanno avanti e indietro quindi questo è un modello che va bene per quelle malattie che uno può prendere anche dopo averla presa la prima volta e non è chiaro se questo sia il caso del Covid-19 ci sono casi di persone che l'hanno contratto una seconda volta ma si spera che come altre malattie contagiose virali una volta contratta l'individuo produga le anticorpi per non prenderla più ok ma questo questo non è così importante questo è il modello più semplice i modelli un po più ricchi che per esempio ammettono l'immunità alla fine non si comportano molto diversamente questo è una delle cose che abbiamo fatto ok nel nostro lavoro e a cui vi potrei accennare più avanti nella discussione ok quindi rimaniamo sul modello base le persone sono suscettibili o infette ok e possono passare da uno stato all'altro se sono sane e suscettibili la probabilità di ammalarsi dipende da quante persone hanno intorno per una e poi per una probabilità beta ok che ha un numero maggiore di 0 che ci dice quanto è infettiva la malattia ok ma più malati ci sono in giro più è facile ammalarsi inoltre si passa dallo stato di infetto cioè malato a quello di sano cioè suscettibile con una probabilità sempre delta maggiore di 0 ok poi l'ultimo ingrediente di questo modellino è un numero che chiamiamo ro questa è la lettera greca ro come una p minuscola che è la percentuale la proporzione di infetti in un certo momento nella popolazione ora questo modello si analizza con uno strumento che si chiama con un parolone un sistema dinamico ma il concetto è abbastanza semplice chiamiamo con questo simbolo che si chiama del ro di t il cambiamento nel tempo di ro ok è quello che vogliamo fare trovare un equilibrio qual è un equilibrio è una situazione in cui le due forze quella di nuove persone che si ammalano data da questo fattore ok che è dato dal numero di sani uno meno ro che incontrano i malati ro e con un certo proporzione beta si possono ammalare meno la forza delle guarigioni ok che data dal numero dei malati per il fattore di guarigione delta quando è che queste due forze si bilanciano questa cosa è uguale a zero per cui il sistema ok questo del ro di t non si muove ed è stabile ora questo sistema ha sempre una soluzione diciamo così banale semplice se il ro uguale a zero ok questa equazione è sempre uguale a zero ok però se delta è minore di beta ok se quindi è più facile ammalarsi che guarire ok esiste anche un'altra soluzione compresa fra 0 e 1 ricordiamo che questa è una frazione ok e in questo caso l'altra soluzione ro uguale a 1 meno delta sub beta ora questo delta sub beta ok è l'inverso e lo vedremo anche più avanti nel nei lucidi di va bene banalmente di beta su delta ma questo è il fattore di riproduzione della malattia è il ro zero di cui sentiamo parlare spesso ok in televisione sui giornali quando questo ro zero è maggiore di 1 il suo inverso è minore di 1 e quindi esiste una soluzione interna per la malattia e diciamo che la malattia è endemica quando il fattore di riproduzione della malattia supera la soglia a 1 la malattia può essere endemica nella società altrimenti esiste solo la soluzione banale ro uguale a zero quindi quello che cerchiamo di fare abbasare ok questo fattore di propagazione della malattia perché la malattia è già nella società e vogliamo evitare che sia endemica in questa soglia ok questa spiegazione però ci è quella che troviamo sempre sui media non distingue tra quali sono gli effetti biologici ok medici della malattia ok la contagiosità la probabilità di guarire da quelli che sono gli aspetti sociali cioè qual è il tessuto sociale su cui la malattia si diffonde ok per fare questa cosa dobbiamo arricchire il modello ed è quello che noi abbiamo fatto essenzialmente abbiamo iniziato a studiare la configurazione della società quelli che noi chiamiamo i network ok in cui l'individui sono i nodi di un network e le connessioni fra l'individui si chiamano link ok e una caratteristica particolare dei network è che e che andremo a studiare è che ci sono alcuni nodi che hanno tanti contatti che sono centrali in questa matassa della figura mentre altri nodi sono periferici come questo qui che ad esempio ha solo due contatti ok e questa è una caratteristica pervasiva delle nostre società ok alcune persone sono molto più connessi di altri come possiamo arricchire il modello sis con questa heterogeneta ok inanzi e su tutto possiamo dire che ogni nodo può essere definito dal numero di di contatti che ha ok dal numero di link e con P maiuscolo di D possiamo dire qual è la probabilità ok di trovare qual è la frazione di persone che hanno quel certo numero di contatti ok per esempio se P di 10 è uguale a 0,2 vuol dire che il 20 per cento della popolazione avrà 10 contatti ok poi usiamo di nuovo la lettera ro che può essere questa P minuscola ok come avevamo fatto prima ma in questo caso per ciascun per ciascun numero di contatti ok questo si chiama la lista per degri ok in inglese e il ro di di D è la frazione di nodi con di contatti che sono infetti ok e ci può essere diversità quindi noi come prima studiavamo un sistema dinamico con una sola equazione ora abbiamo tante equazioni per quanti sono per quanta heterogenetà c'è il numero di contatti allora una cosa importante di cui tenere conto quando si analizzano i network sociali e le percezioni che gli individui hanno dentro i network sociali è che quando si è in un ambiente è molto più facile incontrare qualcuno che ha un D alto ok piuttosto che uno che ha un D basso ok ad esempio fra i nostri amici di facebook ok c'è una sovra rappresentazione di quelli che hanno tanti contatti perché loro compaiano molto più spesso ok fra gli amici di altre persone ok questa cosa quindi ci dice la probabilità di incontrare un nodo con un certo degri di non è PD PD e sono quelli che sono ma le probabilità che noi li incontriamo deve essere pesata proprio per la loro rappresentatività per il loro degri e questa probabilità è la probabilità originale però per il loro degri sulla media dei degri questo è di D è il valore atteso del degri ok per quanto loro eccedono o sono sotto la media del degri le probabilità vengono riscarati e così la probabilità di incontrare un nodo in fetto è dato da questa nuova ingrediente che abbiamo questo theta questo theta è come abbiamo detto appunto la probabilità che noi incontriamo un nodo in fetto ed è per ciascun degri la probabilità che lo incontriamo questa espressione qua sopra per ok la probabilità che quel nodo sia in fetto e qui questo difende solo dal degri di quel nodo e questa cosa la sommiamo su tutti i degri possibili che ci sono nella società questa simbolo qui ci dice dobbiamo fare la somma di questa espressione per di uguale a 1 a 2 e a 3 fino al degri massimo ok quindi questa è un'espressione che ci dice qual è la probabilità di incontrare un un nodo in fetto nella società e qui l'ho riscritta ora possiamo fare quello che abbiamo fatto prima possiamo considerare il sistema dinamico del cis che ho scritto qui però lo consideriamo per ciascun di ok per ciascun numero di contatti la prima parte è la forza di passare da essere sano a essere malati ok dove c'è il numero di sani di quel degri che possono ammalarsi se incontrano theta con probabilità theta una persona in fetta ok moltiplicato per il loro degri c'è quante persone incontrano e poi per questo beta che dipende dalla malattia meno ok la forza della guarigione che è costante è la stessa per ciascun degri ora questa cosa la vogliamo mettere a 0 per ciascun di e da questa espressione possiamo ricavare il rod di di attraverso questa formula dove abbiamo usato tutte le variabili che erano qui ma abbiamo scritto lambda uguale beta su delta ok questo lambda è il fattore refroduttivo della malattia di cui vi parlavo prima ma adesso ha in sé solo gli aspetti metici ok il beta e il delta una politica medica ok può variare entrambi ok il beta può essere diminuito se ad esempio indossiamo delle mascherine il delta può essere aumentato se troviamo un medicine migliori per curare la gente più velocemente dalla malattia ma questo lambda ok dipende solo dal rapporto di questi due fattori che sono prevalentemente medici ora andiamo a studiare qual è invece l'apporto del tessuso sociale l'apporto del network ok se sostituiamo questa equazione qui in questa espressione per ciascundi ci ritraviamo con questa espressione che ci dice che theta è una funzione di vari parametri ok e di theta stesso questa espressione qui è complicata ok e l'equazione ok è quella che si chiama un'equazione implicita cioè la variabile theta dipende da tante cose ma anche da se stessa in particolare a questa equazione non si può risolvere si dice esplicitamente non si può ricavare theta come un'espressione di tutti gli altri parametri però possiamo comunque dire molto di quello che succede ok se chiamiamo la parte di destra h maiuscolo una funzione h maiuscolo di theta ok in azione tutto possiamo studiare le caratteristiche di questa funzione qui che è crescente con cava queste sono termini abbastanza semplici hanno l'intuizione geometrica ok crescente vuol dire che all'aumentare di theta la funzione sarà sempre più alta e con cava vuol dire che ha questa curva per cui all'aumentare di theta la pendenza sarà sempre minore ok perché è importante questa cosa perché essendo h crescente con cava può non incontrare mai ok la bisettrice di 45 gradi ok questa retta che ci dice quando è che theta ok uguale a se stessa può non incontrarla mai oppure incontrarla una sola volta questa differenza è esattamente quello che ci dice se ricordate il modello sisso originale in una sola variabile quando è che la malattia può essere endemica o meno se non la incontra mai c'è solo la soluzione zero se la incontra una volta per un valore di theta superiore a zero la malattia può essere endemica e come facciamo a dire se la incontrerà o meno ci basterà andare a vedere la pendenza dell'origine se sopra la bisettrice incontrerà la bisettrice se sotto non la incontrerà mai e questa pendenza di questa curva si può calcolare esattamente perché si fa quella che si chiama una derivata in zero della funzione ok anche se non sapete di cosa si tratta vi dico che uno può trovare un'espressione che ci dice la pendenza di questa funzione h in questo punto e questa derivata in zero è uguale a lambda per il valore atteso del d quadro sul valore atteso di d ok ora questo numero ci dice se è maggiore di uno che la malattia può essere endemica se è minore di uno che la malattia può o non può essere endemica quindi se l'amda è maggiore di questa frazione ok la malattia può essere endemica altrimenti no e quindi non c'è da considerare un r0 minore o maggiore di uno ma considerare la relazione fra due variabili una che difende dalla malattia e una che difende dal testuto sociale che chiamiamo mu mu è la frazione del valore atteso del degri sul valore atteso del degree quadro e la possiamo scrivere ok se avete qualche avete fatto qualche corso preliminare di statistica come un'espressione semplicemente della media della varianza delle distribuzioni del degree questo mu più è basso più la malattia tenderà a riprodurci può essere visto come un inverso ok della conduttività del network quanto il testuto sociale aiuta la malattia di fondersi qual è l'intuizione ok se la varianza è alta questo mu sarà più alto cosa vuol dire che ci sono tanti nodi con degri basso e alcuni nodi con degri molto alto quando questo succede mu è basso questi nodi con degri alto sono dei degli ottimi condettori si ammalano facilmente e possono trasmettere la malattia ok per cui un mu basso ci dice che ci sono questi forti condettori ok che possono diffondere la malattia vediamo un esempio ok che è tratto dal lavoro che avevamo fatto immaginiamo di avere questo questa configurazione originale questo network originale ok questo network con 500 nodi ok in cui il 40 per cento ha 5 contatti un rimanente 40 per cento a 10 contatti ce n'è un 10 per cento che ha 20 contatti e infine ci sono un 5 per cento che hanno 40 contatti un 5 per cento che hanno 50 contatti ora immaginiamo di fare una politica di 40 ok ad esempio diciamo che tutte le persone non possono più fare una certa attività come ad esempio chiudiamo le scuole per i bambini ok o impediamo alle persone di andare in ufficia facciamo smord working da casa questa è un'attività che taglia a tutti i nodi un certo numero di link 3 5 o 10 ok ma chi aveva originariamente tanti nodi in proporzione subirà un taglio molto minore di chi ne aveva originariamente pochi ok quello che succede che se ne tagliamo 3 ok alcuni rimangono con 2 quelli che avevano 5 link se ne tagliamo 5 il 40 per cento dei nodi sono completamente isolati rimane un sottonector per il rimanente 60 per cento se ne tagliamo 10 l'80 per cento dei nodi è estremamente tagliato è escluso dal network e solo rimane solo un sotto insieme dei nodi il 20 per cento che rimangono condizioni qual è il problema è che il mu ok che abbiamo definito prima ma a mano che tagliamo i link ai nodi diminuisce quindi nonostante il network tagli il numero di contatti diventa più permissivo alla malattia di diffondersi cosa succede nel caso limite ok l'80 per cento delle persone è isolato ma quel 20 per cento che rimane connesso fra sé rimane fra sé connesso in maniera più denza per cui se la malattia in questo network poteva essere destinata a spadrire in quest'altro può diventare endemica ok fra quei pochi nodi che rimangono attivi e la quarantena diventa inutile ok la quarantena serve solo a fare da incubatore alla malattia che rimane endemico in questo sottonector e al momento in cui finiamo la quarantena ok la malattia ritorna da cavo come prima ok quindi quello che vogliamo dire con questo lavoro è che se realizziamo ok politiche che limitano il numero dei contatti dobbiamo considerare questo rapporto fra le caratteristiche della malattia e le caratteristiche del tessuto sociale che potrebbero diventare peggiori anche limitando ma limitando in maniera sbagliata i contatti fra le persone ok questo è un calcolo basato su sull'esempio precedente di come se tagliamo ok uniformemente lo stesso numero di link ai nodi il mu diminuisce abbiamo visto è questa aumenta la conduttività del network ok se invece facciamo una politica proporzionale per cui a tutti i nodi tagliamo il 10 il 20 il 30 al 40 per cento dei link il mu cresce e otteniamo ok l'effetto desiderato l'effetto desiderato viene ottenuto se tutti i nodi rispondono in maniera proporzionale ok al taglio e non che quelli che già avevano più contatti rispondono proporzionalmente meno ok di quelli che ne avevano pochi sulla base di questi risultati del modello possiamo fare due cose possiamo fare delle simulazioni ok essenzialmente possiamo generare dei network questo è un network con dieci nodi in cui c'è quell'effetto e vi dicevo prima in cui c'è un nodo che ha tanti contatti ok e gli altri ne hanno pochi se simuliamo il cis ok su questo network partiamo con tre nodi infetti al al passo successivo il nodo centrale si infetterà il nodo centrale rimane infetto solo due periodi e poi guarisce ma nel frattempo ha infettato tutti gli altri e quindi questi cinque passaggi possono essere riassunti in questo grafico in cui si parte da tre al tempo successivo sono ancora tre ma in questo momento si è infettato il nodo centrale e la la diffusione della malattia schizza ai valori di 8 6 e 7 ok e quando è 7 il nodo centrale non è più infetto ma la malattia si è diffusa la stessa cosa può essere fatta studiando network casuali ma con certe caratteristiche generati con migliaia di nodi e possiamo studiare qual è l'efficacia ok di un di una politica rispetto a un'altra e in questo esempio ad esempio le righe verdi e rosse rappresentano l'andamento di malattie che si estinguano mentre le linee blu già la viola rappresentano l'andamento di malattie che rimangono endemiche quando facciamo queste simulazioni possiamo arricchire le caratteristiche del tessuto sociale considerare tutte le politiche possibili ma anche considerare modelli di diffusione più complicati ok all'inizio abbiamo parlato del fatto che forse il 6 non è la soluzione migliore per analizzare il covid 19 ma qui possiamo usare qualsiasi modello epidemiologico e quello che abbiamo visto finora è che più o meno le predizioni del modello semplice ok vengono rispettate anche dai modelli più complicati l'ultima cosa che vorrei raccontarvi è come ok possiamo usare questo modello per risornare all'origine come possiamo prendere queste indicazioni per scegliere dei dati che ci permettono di capire ok se le politiche che sono state fatte sono giusti o sbagliate quello che ci viene in soccorso adesso è il fatto che esiste una mole enorme di dati sulla mobilità delle persone ok non sono dati che si trovano direttamente vanno a chiesti alle aziende le producono ok ma ci sono già molti esempi online ok di aziende che che forniscono delle prime statistiche sui dati ad esempio ok questo primo link è un progetto di facebook ok che sta iniziando a dare dati ok sulla mobilità delle persone proprio in relazione a covid 19 ok ad esempio in questa cartina questa è un'analisi fatta sui dati prima ok della quarantena si vede quanto la gente si moveva avanti e indietro fra le province italiane ok e qui viene rappresentato ok quanto le varie province italiane fossero connessi con la provincia di lodi ok dove ci sono stati a codonio ok la prima area rossa ok e vediamo ad esempio spiegato come mai nella provincia di pesaro urbino che è qui ok ci siano stati tanti casi subito ok alla fine di febbraio perché questa è una provincia dove c'erano molte persone che pendolavano fra questa provincia e la provincia di lodi questi siti ok questo tipo di dati ci danno anche delle ok delle delle rappresentazioni di come è cambiata la mobilità per le varie aree del mondo questa è una cartina della california in cui vediamo che in alcune zone la gente si sposta molto meno di prima in altri si sposta proporzionalmente meno di prima se facciamo l'assunzione che la mobilità è proporzionale ai numero di persone che incontriamo che possiamo contagiare vediamo l'importanza di questi dati per studiare il nostro modello un altro esempio sono questi dati di google ok che ora vi faccio vedere uno può mettere una qualsiasi parte del mondo e ottiene dei dati sulla sulla variazione di mobilità in quella parte del mondo questi sono i dati sulla toscana e per esempio vedete in toscana rispetto alla fine di febbraio è diminuito nel 60 per cento la mobilità delle persone verso i posti di lavoro questi dati sono ottenuti da tutte quelle persone che usano google maps sono dati analoghi che uno può tenere dagli operatori telefonici ok gli operatori telefonici sanno a quale celle telefoniche ci agganciamo e sanno quanto ci muoviamo tutti questi dati però sono dati sul valore medio della mobilità ma abbiamo visto nel nostro modello che per calcolare cimu e quindi per sapere quanto il testuto sociale aiuta o meno la diffusione di una malattia ci serve anche un dato sulla varianza o almeno il valore atteso del del mobilità al quadrato quindi quello che vogliamo fare adesso è contattare queste aziende e cercare di avere questi dati per poter verificare se le politiche di quarantena che sono state fatte in giro per il mondo o ad esempio nelle varie regioni di italia hanno sono stati efficaci o meno in base a come ok non in media ma individualmente le persone hanno aderito alle imposizioni e quindi potremo analizzare il nostro modello quindi per concludere vi ho detto come nelle società attuali ci sono problemi complessi fra cui covid ci sono tanti dati ma questi sono difficili da analizzare possiamo fare dei modelli questo è uno dei contributi che possiamo dare studiando l'economia e questi modelli ci possono aiutare a selezionare il tipo di dato che dobbiamo studiare per capire che decisioni prendere o se le decisioni hanno preso le autorità in una certa regione sono efficaci o meno allora grazie tante per l'attenzione a rivederci