 Ok, la registrazione è partita, vai all'egra. Grazie. Con pomereggio a tutti, benvenuti alla seconda edizione del webinar COVID-19 con divisione dei dati perché in Italia si fa troppo poco. È un webinar che introduce una serie di altri eventi che saranno tutti online di cui vi dirò tra un momento. È un'iniziativa che vede uno sforzo congiunto di varie organizzazioni infrastrutture, potete vedere in alto nella prima slide il logo delle varie organizzazioni infrastrutture che hanno partecipato e che stanno partecipando nella realizzazione di questa iniziativa. Qui abbiamo i prossimi appuntamenti, in realtà sono i prossimi eventi e le date sono ancora da definire, ma si svolgeranno comunque tutti nelle prossime settimane e mesi. Questo d'introduzione è un webinar che tocca la questione dell'open science, dell'open data, la necessità della condivisione dei dati per contrastare la pandemia in corso, mentre le altre iniziative e le altre webinar e tutorial invece si focaliseranno su specifici set o tipologie di dati. Quindi avremo un webinar che si occuperà del problema dei dati epidemiologici, un webinar che si occuperà di dati clinici e poi un tutorial, anzi in realtà saranno due tutorial, un tutorial parte uno, parte due su i dati omici e poi infine avremo un tutorial che sarà dedicato ai protocolli e altri strumenti per l'analisi dati. Le persone direttamente coinvolte in questo scorso organizzativo e anche di progettazione sono Malazzari, Gina Pavone, Francesca Deleo, Lorena Lepera che è la sottoscretta. Allora da dove nasce tutto questo? Da dove nasce l'esigenza di parlare, la forte esigenza di parlare di open science e di condivisione dei dati? In realtà il discorso come vedrete è molto generale ma c'è un'esigenza particolarmente forte legata alla questione del covid. Dunque appunto nevrangico è il fatto che l'Italia condivida molto poco i dati relativi al covid. Questo che vi mostro è un esempio, in Italia abbiamo al momento più di un milione di casi più di 45.000 morti e le sequenze depositate in Jinbank, perché non lo sapesse è la più grande banca d'acchi al mondo dove vengono raccolte tutte le sequenze che vengono prodotte di qualsiasi organismo ma in particolare Jinbank ha sviluppato una sezione completamente dedicata a covid-19, l'Italia ha depositato in Jinbank 75 sequenze ad oggi. Per darvi un'idea di per darvi un confronto l'Australia che ha avuto 27 quasi 28.000 casi solo poco poco più di 900 morti ha depositato in Jinbank più di 11.000 sequenze. Quindi ci si domanda perché l'Italia in fondo condivida così poco i dati che produce. L'esempio della sequenza è un esempio ma in realtà il problema è relativo alla condivisione dei dati epidemiologici e dei dati clinici anche e non è solo la questione di condividere. Il problema non è solo condividere ma è anche come condividere quindi come raccogliere dati perché la questione per esempio di raccogliere dati in maniera tale che siano confrontabili ad esempio tra regione e regione in maniera tale che vengano raccolti seguendo dei protocolli standardizzati in maniera tale che vengano annotati, annotati significa che ad ogni dato viene associata un'informazione, quelli che vengono chiamati metadati, delle informazioni che permettono che diano la tracciabilità del dato che facciano capire come quel dato è stato ottenuto e non solo c'è la fortissima necessità che tutta questa informazione standardizzata, notata, venga poi condivisa in modo che sia legibile per esempio da computer. I dati che sono legibili dal computer vengono detti interoperabili e questo è particolarmente importante perché questi dati possono essere analizzati, possono essere confrontati e quindi possono essere utilizzati nella ricerca e utilizzati per prendere decisioni strategiche. La comunità scientifica sempre più sta portando all'attenzione dell'intera comunità la necessità di sviluppare delle risorse proprio per la raccolta e la condivisione dei dati. In particolare abbiamo qui vicito anche questo un po' ad esempio così preso a campione però penso sia abbastanza significativo, vicito Giorgio Parisi, un fisico presidente dell'Accademia dell'Incei che dice, non ne sono fuori controllo, non si può girare la cieca, con un database nazionale si potrebbe fare un tracciamento più preciso dei contatti, non solo servono dati affidabili, puntuali, armonizzati a livello europeo per studiare e combattere il Covid-19, servono un database europeo multidisciplinare. Qui abbiamo un'altra situazione che dovrebbe far capire insomma quale sia il messaggio, in questo caso della dott. Resta Stefania Salmaso, epidemianologa d'Ex-directorice del Centro Nazionale di Epidemiologia e Surveglianza dell'Istituto Superiore di Sanità che ad agosto 2020, quindi già da un po' di tempo diceva, abbiamo avuto 250.000 casi e ancora non sappiamo qual è il rischio delle singole situazioni in cui siamo esposti al contagio, ne sapremo di più servissimo raccolto e dati in modo coordinato, invece ancora oggi non esiste uno strumento tecnologico per registrare i dati dei casi e dei loro contatti. È proprio della scorsa settimana, delle ultime due settimane, una peticione di Change.org, qui in alto potete vedere proprio il link alla peticione, in cui di anni è richiesto che dati siano pubblici, disaggregati, continuamente aggiornati, ben documentati, facilmente accessibili ai ricercatori, decisori, media e cittadini. Ora, quindi, questi sono una serie di esempi che dovrebbero far capire quanto in questo momento sempre più sia chiaro che l'unico modo veramente da un lato per prendere decisioni strategiche, dall'alto per fare sì che la ricerca possa andare avanti e trovare soluzioni per questa pandemia sia quella di arrivare ad avere delle risorse dove dati vengono condivisi, dove dati siano aperti, dove dati siano trasparenti e quindi utilizzabili e leggibili. La buona notizia è che in realtà si stanno muovendo una serie di iniziative sia a livello europeo. Questo è una lettra che è stata fermata dalla Commissione Europea che invita chiunque pubblici dati relativi a Covid-19 di rendere questi dati immediatamente accessibili attraverso ripositori pubblici in maniera tale che possa essere veramente supportata la ricerca. Ci sono anche altre iniziative che stanno andando in questa direzione. Questo è un altro esempio dell'ICD o SIVI, l'Italian Computing and Data Infrastructure che sta supportando la raccolta di informazioni ad accesso libero. Non entro ovviamente nel dettaglio per questioni di tempo, però vorrei ancora menzionare, remoto rapidamente, un'altra serie di iniziative. Queste sono iniziative che più in generale sono dedicate o si dedicano o muovono tantissimo la condivisione di dati e dei risultati delle ricette. Sono tutte iniziative infrastrutture, organizzazioni iniziative che stanno in questo momento compiendo un enorme sforzo proprio intorno ai dati di Covid-19. Andò un po' veloce perché vorrei passare la parola agli speaker di oggi. Ci tengo a dire che inizative di cui ci sarebbe ben più da dire, quindi mi dispiace che vada un po' rapidamente, però veranno menzionate dalle speaker di oggi e quindi è bene che chi ascolta abbia meno un'idea di che cosa si stia parlando. Quindi una di queste è la RDA Research Data Alliance. È una iniziativa che è nata nel 2013 e che relativamente a Covid-19 ha prodotto delle linee guida e raccomandazioni proprio per una condivisione dei dati che sia robusta, che sia funzionante, che sia curando anche appunto gli aspetti, per esempio, legali ed etici, eccetera, eccetera. In realtà nelle linee guida ci sono anche relative alla condivisione del software per la ricerca. Altra iniziativa infrastruttura estremamente rilevante è OpenAir che è l'infrastruttura open access per la ricerca in Europa, amata nel 2009, supporta molto fortemente l'open access. OpenAir è tra l'altro degli organizzatori di questa serie di webinar e tutorial. Elixir è un'infrastruttura per i dati nelle scienze della vita. Attualmente forse l'infrastruttura più grande in Europa, che si occupa appunto di dati per le scienze della vita, ha 22 membri. In realtà sono 23 membri. Ogni membro è uno stato europeo e, diciamo, Elixir ha sviluppato una serie di risorse in supporto proprio della ricerca su Covid-19, quindi in particolare di queste risorse vi parleremo più tardi. Questa è la piattaforma di cui vi ho accennato, che è la piattaforma, appunto, Elixir, per la ricerca, per la colta di dati nella ricerca su Covid-19, chiamato Covid-19 In ultimo, questo è iOSC, l'European Open Science Cloud. Questo è una iniziativa europea molto estesa, che ha come scopo quello di promuovere pratiche di open science a livello europeo. Questo è più o meno quanto due parole sul programma di oggi, in modo che io possa lasciare la parola a chi entrerà veramente nel merito delle cose che io vi ho solo molto superficiamente accennato. Come prima cosa vi ho messo qui in alto un link a un questionario. In realtà è un questionario di una sola domanda, a cui vi invitiamo caldamente a rispondere nel corso di tutto il pomeriggio e poi le vostre risposte saranno il punto di partenza della discussione che si terrà a fine giornata. In realtà il questionario è costituito da una sola domanda, quindi non dovrebbe prendervi troppe energie o tempo. Per rispondere a questa domanda dovreste digitare www.menti.com e vi apparea vivere a richiesto un codice. Voi potete mettere questo codice, il codice è 4025925. Potete anche accedere al questionario utilizzando il QR code che ho messo qui in alto a destra e poi dopo che avrete digitato il codice vi comparià la domanda e voi avrete la possibilità di rispondere. Il primo speaker di oggi è Malazzeri che vi parlerà dell'efficacia del modello Open Science e il sommetto di recuperazione nel contesto della pandemia in corso, ruolo e azioni di OpenR e RDA. Dopo Emma Grazzano Pesole che è il coordinatore di elixirita, quindi del nobitaliano dell'infrastruttore elixir, vi parlerà della condivisione dei dati al tempo del Covid-19, sfide opportunità per l'Italia, ruolo e azioni di elixirita. Successivamente avrà inizio la discussione, la sezione domande risposte e Q&A. Voi potete fare domande durante tutto il corso delle relazioni di Emma Lazzeri e Grazzano Pesoli, cliccando sul bottone che dovreste vedere sull'interfaccia Zoom in basso a destra dove c'è scritto Q&A. Cliccando lì potete fare le vostre domande. Ci sarà Gina Pabone e noi tutti che raccoglieremo via via le domande che voi farete in maniera tale poi da fare sì che le domande vengono ad attivare una risposta in maniera diciamo il più possibile strutturato organizzata. La discussione partecipe anche Sara Casati che è un eticista esperta di condivisione dati, è un eticista nella ELSI service che sta per etica legal and social issues services per un'altra infrastruttura importante europea che si chiama BBMRI. Per chi volesse un certificato di partecipazione può richiederlo a questo link qui sotto. Https-bit.ly, un certificate 16, trattino 11, trattino 2020, rideremo alla fine della giornata questo link. Il link è rimarattivo per una settimana quindi se voi richiederete il certificato dopo la settimana prossima questo link non sarà insomma più accessibile. Ok, direi che è tutto, io passo la parola a Demma interrompo la condivisione dello schermo, posso che riesca a farlo? Grazie Allegra, credo di essere, sono probabilmente riuscita a eliminare il tuo schermo e ora faccio partire la mia presentazione un attimo di allora dovreste poter vedere il mio schermo adesso. Grazie Allegra, grazie a tutti per la partecipazione, io passo subito a parlarvi di, insomma comincio da da qualche anno fa ormai sono quasi 15 anni questo ero io diciamo ma come credo chiunque si affacce nel mondo della ricerca immagina il suo futuro e la sua vita come ricercatore o come ricercatrice immagina tutta una serie di attività di scoperte anche di esperimenti interessanti e poi si ritrova chiaramente a far ricondicolare realtà e quello che succede che oggi penso ciascuno di voi chiunque di voi fai ricercatore oggi capisce adviced molto velocemente che in realtà quello che viene richiesto al ricercatore è pubblicare, pubblicare non solo ma pubblicare in riviste scientifiche ad alto impatfactor e il bisogno la necessità di essere citati e quindi tutti prima o poi molto presto anzi capiamo velocemente che il dilema è sempre quello quindi publish or perish ma chiediamoci poi che cosa succede è di tutta la nostra ricerca tutto quello che noi facciamo finisci in queste riviste scientifiche e come si ha accesso a queste riviste scientifiche sicuramente con il con il lockdown e con le situazioni che stiamo vivendo in questo momento per via del covid abbiamo capito benissimo che noi abbiamo accesso solo se siamo all'interno della nostra rete istituzionale oppure se abbiamo delle credenziali di accesso e come funziona chi ci da queste credenziali ce le danno le nostre istituzioni quindi da una parte ci sono le istituzioni per cui lavoriamo a cui siamo affiliati che pagano e dall'altra noi possiamo avere in questo modo accesso alla letteratura scientifica attenzione perché noi abbiamo accesso ma non possediamo niente molti anni fa prima dell'avvento del digitale in realtà le istituzioni acquistavano le riviste quindi avevano poi a disposizione le riviste nelle biblioteche oggi non è più così adesso ci sono abbonamenti per l'accesso al servizio che chiaramente una volta che finiscono quindi se un'istituzione decide di non pagare più l'abbonamento fanno sì che il ricercatore non abbia accesso nemmeno a diciamo alle riviste ai numeri passati delle riviste quindi le istituzioni in pratica non possiedono più più niente in realtà diciamo c'è una certa complessità nel nelle riviste scientifiche in particolare nei modelli di business che i grandi editori propongono alle istituzioni quello di cui vi parlavo prima quindi il modello tradizionale è quello che prevede il pagamento di un abbonamento e questo abbonamento è un abbonamento di solito annuale che le istituzioni pagano appunto per dare accesso ai propri ricercatori ai contenuti della rivista questi i costi di questi modelli sono esorbitanti si parla di 1 3 milioni di euro a seconda della grandezza dell'istituzione per istituzione ogni anno sono tantissimi soldi se facciamo un conto globale c'è poi un altro modello un altro modello di business ci tengo sottolineare che si chiama gold open access in questo modello ci sono è previsto che un autore pubblici in una rivista se può pagare la cosiddetta apc è anche vero che molte molte riviste di questo tipo soprattutto quelle che vengono vengono sostenute dalle università non richiedono agli autori di pagare alcun che solamente il 27% delle riviste richiede il pagamento di una apc agli autori per pubblicare e questa apc chiaramente ha dei costi molto più bassi si parla qui per articolo quindi un articolo può può costare dai 100 ai 6000 euro a seconda della rivista ripetono non tutte le riviste chiedono un pagamento per la pubblicazione e c'è poi un terzo modello questo modello è il cosiddetto modello ibrido dove abbiamo un giornale che tradizionalmente si sostiene attraverso un abbonamento ma che richiede agli autori di uno specifico articolo un costo per aprire solo quell'articolo al mondo intero e renderlo quindi open access qui diciamo le ipc che si pagano sono un pochino inferiore si parla più o meno della metà di quello che viene pagato per il modello gold access in realtà tenete presente che sotto questa rivista c'è pur sempre un abbonamento quindi abbiamo qui il cosiddetto fenomeno del double dipping cioè da una parte la rivista che dei soldi ha un'istituzione per permettere ai ricercatori di leggere i contenuti dall'altra che dei soldi agli autori per aprire in open access un determinato articolo quindi diciamo che queste sono le riviste con con i maggiori costi da sostenere per per la società pensate che globalmente questa è una stima un po' vecchia si parla ormai del 2015 si spendevano allora 10 miliardi di dollari a livello globale per gli abbonamenti chiaramente tenete presente che questi sono i soldi che globalmente pagano tutte le istituzioni di ricerca per ricomprare gli articoli che i propri ricercatori scrivono e sono veramente tanti soldi e qual è il problema di questi modelli qual è il problema del fatto che i ricercatori si affidano a dei modelli commerciali a degli editori commerciali per disseminare il sapere scientifico beh intarto questo sistema non è per niente trasparente i grandi accordi con gli editori non sono trasparenti cioè noi sappiamo quanto pagano le università ma non sappiamo i dettagli degli accordi c'è chiaramente un problema di accesso perché solo chi si può permettere di spendere ha accesso alla ricerca e comunque ce l'ha con dei ritardi enormi rispetto al momento in cui vengono fatte determinate scoperte lo vediamo soprattutto ora con con il covid escono molto spesso quelli che chiamiamo in gergoi preprint e che sono articoli che ancora non sono stati sottoposti a revisione ma perché lo facciamo perché è importante in questo momento sapere subito quali sono i risultati delle ricerche soprattutto appunto in in situazioni come quella in cui ci troviamo adesso in tutto questo gli autori che cosa fanno regalano i propri diritti agli editori pensando di non avere scelta in realtà ce l'hanno la scelta ma non sono consapevoli quindi quando voi firmate il cosiddetto copyright in realtà l'editore vi propone una cosa che dovreste essere voi invece a scrivere perché voi appunto state dando i vostri diritti di autore agli editori senza chiedere niente in cambio i costi degli abbonamenti continuano a crescere ogni anno si parla di un 1 2% anno come aumento i costi delle ipc non sono tracciati quindi poche istituzioni sanno quanto i propri autori spendono per i modelli che abbiamo visto prima di tipo gold open access o addirittura ibridi e in più gli autori i revisori e gli editori scientifici delle riviste non sono pagati probabilmente molti di voi hanno sono stati autori ma tanti sono anche revisori e editori editor di riviste scientifiche sapete benissimo che ne sono ci paga per questo però quello che facciamo è che regaliamo la materia prima ai grandi publisher che fanno grandissimi profitti perché appunto non pagano la materia prima questi sono numeri del 2010 quindi si parla di ormai di dieci anni fa in quell'anno el severe ha avuto un margine di profitto del 36 per cento che all'epoca era addirittura più più alto di apple google o amazon ma la domanda quindi che io vi faccio è perché perché stiamo spendendo questi soldi che sono soldi pubblici solo per chiudere i risultati delle ricerche dietro a delle riviste che hanno accesso limitato e che quindi non tutti possono leggere lo facciamo lo sapete benissimo perché abbiamo un sistema di valutazione scientifica che si basa proprio sul fatto che noi scriviamo articoli in queste riviste si basa quindi su numeri sul numero di citazioni che noi riceviamo che influenzano alcuni indici in particolare l'impact factor e l'index e quindi noi veniamo valutati sostanzialmente solo per i giornali dove noi scriviamo nemmeno per i contenuti per il giornale per il nome della rivista e in tutto questo ci stiamo perdendo un sacco di di questioni che cosa ci perdiamo beh ci perdiamo tutto il resto dell'attività di ricerca ci perdiamo i risultati negativi che sono importantissimi pensate in questo momento quanto è importante sapere subito quali sono per esempio le cure che non portano a un successo oppure altri altri risultati negativi di tantissime ricerche questi non vengono pubblicati ci perdiamo il software ci portiamo anche tante tante soft skills che non vengono considerate per esempio le skill relative al leadership e lo sviluppo di prodotti e soprattutto ci perdiamo i dati ma la domanda è lo dice valegra prima ma perché perché abbiamo bisogno dei dati e perché i ricercatori hanno bisogno di condividere i propri dati pensiamoci un attimo perché chiaramente un esperimento è riproducibile solo finché un altro laboratorio non cerca di di riprodurlo beh la riproducibilità degli esperimenti scientifici è ancora oggi parte integrante del metodo scientifico quindi i dati sono le prove che quello che noi abbiamo scritto in un articolo corrisponda abbia abbia una una base solida e come fanno gli altri altrimenti a credere a quello che noi scriviamo se non diamo le prove delle delle nostre tesi dei nostri articoli questa è una frase molto interessante di gram stile che dice pubblicare la ricerca senza i dati è semplicemente fare pubblicità non è fare scienza pensate quanto è vera questa frase e pensate anche che pubblicare i dati non si significa solamente renderli pubblici ma significa anche conservarli ci sono tante ricerche che ormai hanno dimostrato che questa è una di una ricerca di settore che ci indica che nel 2013 il 90 per cento dei dati che erano stati raccolti negli anni 90 era andato perduto per sempre questo perché scusate l'80 per cento questo perché perché i ricercatori conservano i loro dati in molti luoghi diversi ma non si preoccupano veramente della cosiddetta conservazione a lungo termine quindi si scrivono i dati su quaderni di laboratorio si tengono i dati dentro a pennine o a floppy disk che poi diventano obsoleti quindi non possiamo più accedere a questi dati oppure sono dentro un computer che viene perso o comunque viene viene dismesso e questi dati quindi forse esistono da qualche parte ma noi non siamo più in grado di accedere a loro contenuto i dati poi sono importantissimi queste storie che questa storia che vi racconto ora è una storia molto famosa si tratta della famosa teoria l'austerity che che abbiamo imparato a conoscere qualche anno fa c'erano alcuni ricercatori che stavano scrivendo appunto di questa di questa teoria a un certo punto arriva un un professore che chiede a un suo phd come compito come come esercizio di riprodurre i grafici che erano presenti in questo famosissimo articolo lui ci prova raccoglie i dati che sono tutti i dati pubblici quindi va a prendere questi dati cerca di riprodurre questi grafici che dimostravano appunto questa teoria e non ci riesce non ci riesce nessun modo applica le formule sicuro di averli applicate nel modo corretto alla fine scrive un email disperato perché deve consegnare questo questo esercizio scrive un email agli autori che gli inviano un file excel dicono guarda questo qui è il file che noi abbiamo usato per per costruire i grafici guarda qui parti da qui e vedi che cosa riesce a ottenere e beh si scoprirà che questo file excel conteneva degli errori proprio le formule erano state riportate in modo errato qui quindi chiaramente non c'è un errore diciamo fatto dagli autori e si avevano fatto un errore nel foglio di calcolo ma perché erano riusciti a pubblicare così tanto con un errore alla base nel calcolo perché non avevano condiviso fino in fondo i loro dati e quindi da qui l'articolo viene ritrattato e questo phd scrive invece molti articoli citando citando il fatto che aveva trovato appunto degli errori negli articoli che è così detti rejected questo succede anche ora succede anche con il covid abbiamo visto in questi mesi che molti articoli sono stati stati rigettati e ritirati è molto importante che ci sia una discussione nella comunità scientifica e la discussione può avvenire solo se si hanno a disposizione tutte le informazioni è chiaro che io posso andare nel dettaglio e diciamo discutere con i miei pari solo se ho a disposizione tutte le informazioni quindi il preprint in realtà oggi ha un un valore notevole perché permette proprio quella discussione scientifica che si è un po' persa negli scorsi anni chiaramente la discussione non deve finire con il processo di revisione quello che fanno le riviste è chiaro che io non posso avere tutta la comunità che sempre discute però a volte forse chiediamo ci sei due o tre revisori con tutto quello che comporta chiaramente tutti tutti le falle che ci sono anche nel processo di revisione se sono necessari e sufficienti per per dire che quello che io ho scritto nell'articolo effettivamente è la verità abbiamo bisogno dei dati abbiamo bisogno di una discussione tra pari e quindi qui per dire che in realtà il fatto che un articolo venga rigettato è una cosa buona per la scienza perché vuol dire che la comunità riesce a convalidare oppure no i risultati a fare un check molto molto dettagliato anche oltre quello che è il processo di dire visione tra pari che avviene all'interno delle riviste c'è in questo proposito un blog molto interessante che vi segnalo che si chiama retraction watch che ci lista e ci fa vedere quali sono tutti gli articoli che vengono rigettati però ogni articolo viene scritto un blog post quindi si scopre qual è la storia che sta dietro agli articoli che vengono che vengono rigettati è molto anche interessante perché contiene un sacco di dati è molto interessante vedere che per alcuni articoli le citazioni aumentano dopo che l'articolo viene ritirato e questo sta un po a valora un po quello che io vi dicevo prima cioè la discussione nella comunità scientifica è fondamentale in questo caso ci accorgiamo che per molte questioni c'è una grossa discussione anche dopo che l'articolo viene viene ritirato e tutto questo ci porta a parlare di open science che cos'è l'open science beh non vi dico che cos'è ma vi dico che cosa non è cioè il contrario di open science non è closed science quindi scienza chiusa ma è bad science quindi una scienza fatta proprio nel modo sbagliato come si fa a fare scienza nel modo corretto abbiamo visto che la discussione della comunità è fondamentale e quindi noi che cosa dobbiamo fare per permettere una una discussione tanto più veritiera dobbiamo aprire ogni ogni step ogni ogni passo del nostro ciclo della ricerca ci sono dei principi fondamentali che ci guidano la trasparenza la riproducibilità la collaborazione è una scienza più inclusiva accessibile accurata e aperta al riuso è inutile che io debba ricominciare da capo ogni volta e raccogliere nuovi dati quando questi sono già stati raccolti da qualcun altro quindi riutilizziamo quello che c'è già non in reinventiamo sempre la ruota l'open science poi si basa su una questione fondamentale beh noi la ricerca la finanziamo soprattutto con i fondi pubblici e i soldi pubblici sono i soldi delle tasse dei cittadini e per questo motivo dovremmo avere come scelta etica quella di mettere immediatamente a disposizione della comunità quello che noi troviamo con le nostre ricerche molti enti finanziatori tra cui diciamo quello quello più che ha speso di più in questioni di open science e la commissione europea molti appunto hanno fatto delle scelte scelte ben precise verso l'open science che cosa significa fare open science significa dare accesso alla ricerca che viene finanziata con i fondi pubblici quindi partire da risultati già raggiunti da altri e collaborare sempre di più e cercare di non duplicare gli sforzi quindi essere più efficienti e cercare di fare in modo che l'innovazione sia più veloce pensate che è stato calcolato che un prodotto che si basa su risultati aperti viene immesso nel mercato con due anni di anticipo rispetto ai prodotti che si basano su quello che noi scriviamo negli articoli che poi chiudiamo dietro a degli abbonamenti e poi c'è anche un aspetto fondamentale che si coinvolgono i cittadini e la società quindi si aumenta anche la trasparenza del processo scientifico la collaborazione è fondamentale lo vediamo benissimo adesso e lo abbiamo visto e toccato con mano proprio all'inizio di questa pandemia quando c'è stata una corsa l'apertura delle informazioni quindi degli articoli soprattutto scientifici che trattavano il virus il virus SARS-CoV-2 e la malattia quindi il Covid-19 pensate che i più grandi editori hanno fatto annunci dove hanno detto non vi preoccupate noi apriremo tutto quello che vi servirà per per fare in modo che questa pandemia si riesca a contrastare nel modo più veloce possibile ma chiaramente c'è sempre un ma questa apertura non sarà per sempre ma sarà adesso diciamo la data ultima di alcuni alcuni alcuni editori è il 31 gennaio del 2021 prima era il 28 ottobre del del 2020 insomma qui ci stanno dicendo va bene noi vi apriamo tutto però finché ci sarà un'emergenza dopo di che ricchiuderemo di nuovo tutto dietro i nostri abbenamenti è quello che che è stato è stato chiaramente chiedetevi perché lo stanno facendo perché se aprire tutto aiuta a collaborare e a contrastare più velocemente la pandemia non dobbiamo aprire veramente tutta la ricerca perché ci sono malattie che forse possono essere contrastate con più tempo fra tanti anni possono quelle malattie pensiamo al cancro o a qualsiasi altra malattia possono aspettare perché non c'è una pandemia globale questa è la domanda che facciamo soprattutto agli editori ma dobbiamo anche anche pensare a questo fatto lo sappiamo benissimo oggi le decisioni dei cosiddetti policy maker si basano su su dati spesso su dati scientifici e perché quindi è importante condividere questi dati ma ancora più perché è importante saperli gestire nel modo corretto perché è importante che questi dati siano veritieri perché poi qualcuno su quei dati prenderà delle decisioni importanti per la comunità abbiamo parlato di open science ma che cosa vuol dire fare open science open science è un termine ombrello che racchiude l'apertura di diversi passaggi della ricerca si parla di open data di pubblicazioni aperte di metodologie software protocolli e workflow che vengono aperti si parla anche di open peer review si parla di citizen science e tutto questo si fa tenendo ben presente che c'è un ambiente dove si apre la scienza che non può fare a meno di integrità della ricerca non può fare a meno di infrastrutture allegra c'è nascitate parecchie durante la sua introduzione e si parla soprattutto di cambiare i meccanismi di valutazione della ricerca l'open access che probabilmente molti di voi hanno hanno già già sentito come termine è uno dei pilastri della scienza aperta si parla di open access alle pubblicazioni o ai dati per molti enti finanzatori anche che ve lo richiedono e che cosa vuol dire significa mettere a disposizione in modo libero e senza restrizioni e online i risultati della ricerca quindi i testi e i dati senza costi per l'utente finale vorrei sottolineare che open access non vuol dire pagare per pubblicare abbiamo visto che esiste un modello di business sui quali publisher scientifici basano il loro introiti che si chiama gold open access ma l'open access in realtà vuol dire altro vuol dire mettere a disposizione una copia del vostro articolo per esempio su una piattaforma ben specifica qual è questa piattaforma e soprattutto quello che chiamiamo repository un repository può essere di vario tipo è sostanzialmente una piattaforma che mi dà la possibilità di caricare un oggetto digitale e renderlo anche accessibile al pubblico e soprattutto ha una politica di archiviazione a lungo termine ben definita quindi mi permette non solo di condividere ma anche di conservare ci sono varie tipi di repository sicuramente conoscerete i repository istituzionali quindi della vostra istituzione tematici di letteratura di dati oppure di tipo cacciol come per esempio zenodo perché ci servono i repository lo abbiamo detto prima per conservare da una parte quindi io carico su una piattaforma che conserverà a lungo termine il mio contenuto perché ci sono delle persone che si occupano di curare il contenuto in questo caso per esempio in italia questo viene fatto per i repository istituzionali dai bibliotecari dai dati librarians oppure ci sono comunità scientifiche molto solide che hanno repository per esempio di dati di tipo tematico che si occupano di conservare e di curare i dati e poi mi permette d'altra parte di condividere il mio contenuto con chi voglio nel momento in cui voglio io quindi posso anche mettere delle restrizioni per esempio sull'apertura del mio dataset in un certo momento oppure anche delle restrizioni dal punto di vista di chi può accedere ai miei dati in tutto questo è molto importante gestire correttamente i dati della ricerca e perché beh perché gestire i dati della ricerca significa significa avere più visibilità e impatto significa permettere ad altri di riutilizzare i miei risultati e ma il primo riutilizzatore sarò sicuramente io quando continuerò la mia ricerca a partire da quelle che ho fatto nel passato mi permette di essere più trasparente e anche di fornire dati più affidabili permette ad altri di riprodurre la mia ricerca e quindi abilità quello che è la verifica di quello che delle mie tesi e poi soprattutto mi aiuta a collaborare con con altri ricercatori i dati secondo non solo la commissione europea ma da altri entri finanziatori ormai questo è una cosa che è abbastanza soddata devono aderire a quelli che sono i principi fer fer non vuol dire che voi dovete aprire vostri dati ma vuol dire che li dovete rendere trovabili quindi chiunque deve poterli trovare con una ricerca semplice in questo modo può anche citarvi devono essere accessibili per almeno dieci anni quindi questo non vuol dire che devanno essere aperti ma deve essere chiaro dove sono i dati e chi può avere accesso a questi dati devono essere interoperabili vuol dire che devono essere facilmente integrabili con altri dati devono essere leggibili dalle macchine oppure devono essere collegati ad altri risultati della ricerca per esempio ad un articolo e poi l'aspetto fondamentale che tutto questo noi lo facciamo perché i dati devono essere riutilizzabili per un'analisi ulteriore oppure addirittura per nuove ricerche ma quanto ci costa quanto ci costa non rendere i dati ferma quanto ci costa non rendere i dati ferbe questo è una uno studio che è stato commissionato dalla Commissione europea l'anno scorso e scopriamo che il costo che il costo che abbiamo che dobbiamo sostenere per esempio per per la non gestione dei dati nel modo corretto è altissimo si parla di un costo diretto di dieci miliardi di euro ogni anno in Europa più altri 16 miliardi di costi indiretti questo semplicemente per lasciare le cose come stanno quindi per non gestire secondo i principi fer i nostri dati la Commissione europea ha fatto molte cose in questo in questo periodo di pandemia per cercare di rendere più facile e efficiente e la condivisione dei dati relativi a covid io ho vicito un paio di iniziative che sono legate alle infrastrutture che Allegra ci ha presentato la prima è quella di open air open air è l'infrastruttura per l'open access che è stata finanzata ormai e finanzata da da dieci anni dalla Commissione europea e si occupa dei risultati della ricerca open air ha creato una comunità in zenodo che è il repository che open air stesso ha sviluppato con il serner dove chiunque può depositare risultati della ricerca questa community a oggi ha avuto più di mille inserimenti questa community è curata da da un team di open air quindi non tutte le le cose che vengono inserite in zenodo vanno a finire qui dentro è un posto dove voi potete andare e caricare un risultato della ricerca che pensate sia sia diciamo si possa utilizzare per il contrasto a questa pandemia e poi ha creato quello che chiamiamo open air covid 19 gateway è un posto dove open air raccoglie tutti i risultati della ricerca si parla di pubblicazioni dati software e altri risultati e anche altre risorse molto utili per per la ricerca in in questo ambito e ad oggi questo questo unico punto di accesso diciamo raccoglie più di 100.000 pubblicazioni abbiamo più di 5000 data set 440 cosiddetti codici quindi software e altri risultati della ricerca ci sono tutti i progetti collegati a covid 19 che possono vedere qui i loro risultati e poi c'è un'altra iniziativa che è quella della risorse data alliance la risorse data alliance è una comunità di esperti che lavorano con i dati ricercatori ma non solo di tutti i settori disciplinari e è un forum di discussione dove si cercano soluzioni alle barriere per la condivisione dei dati in tutti i settori della scienza quindi non solo il settore elstra ci sono tutti i settori che sono rappresentati funziona con dei gruppi di lavoro spontanei che nascono per diciamo per riuscire a a trovare una soluzione a dei problemi ben specifici questo gruppo di lavoro in particolare è nato all'inizio della pandemia per dare delle linee guida ai ricercatori ma non solo per la condivisione dei dati ha prodotto alla fine di giugno delle raccomandazioni su tipologie specifiche di dati lo vedremo poi più avanti negli eventi che vi proporremo nei prossimi mesi andremo nel dettaglio di queste raccomandazioni anche di altre linee guida ha recentemente rilasciato anche delle linee guida per i policy maker nel settore della salute e diciamo ha prodotto tutta una serie di output che vi invito a andare a vedere io vi lascio con questa slide dove sono raccolti tutta una serie di scuse che i ricercatori hanno prodotto negli ultimi anni quando alla domanda diciamo ma perché non condividi i tuoi dati una che vorrei farvi notare in particolar modo è questa scusa che mi è stata riportata di persona un direttore di un istituto importante del cnr al quale io spiegavo perché doveva condividere i suoi dati a un certo punto questa persona mi ha fermato e mi ha detto guardi a me non interessa sapere come fare a condividere i miei dati io voglio solo sapere come fare per usare i dati degli altri io vi lascio quindi con questa questa questa slide questa schermata di scuse e passo a questo punto la parola a graziano per la sua presentazione grazie grazie allora prova a condividere il mio schermo lo vedete mi sentite ti sentiamo ma non vediamo lo schermo vediamo un attimo va meglio sì perfetto grazie bene ringrazio Emma e io tenterò di affrontare un po il discorso generale che ha fatto Emma sul data sharing focalizzandomi un po di più sugli aspetti legati a questa tragica pandemia e diciamo vedendo anche gli aspetti potenzialmente positivi di fatto questa pandemia rappresenta una enorme sfida per tutti quanti noi che può diventare una opportunità molto importante per farci iniziare a percorrere una strada in tempi molto più rapidi e con maggiore efficienza di quanto non sia stato fatto finora perché effettivamente in quest'ambito della open say open science e opendeta abbiamo moltissimo cammino da fare ora poi vi dirò anche quelle che sono le mie riflessioni sulle problematiche e sulle motivazioni che di fatto hanno rendono questo percorso tuttura molto difficile molto complicato volevo giusto iniziare dando qualche informazione di carattere generale su quelle che sono le iniziative più importanti in quest'ambito la prima che volevo citare e che spero conoscete la cosiddetta european open science cloud che è un'iniziativa promossa dal sinna 2016 della Commissione europea per valorizzare uno sviluppo tecnologico molto importante che appunto lo sviluppo dato dalla possibilità di utilizzare tecnologia la cloud che si presta ovviamente molto bene come infrastruttura generale per condividere in modo trasparente e senza alcun tipo di barriere servizi per storage per il calcolo per la gestione per i dati di ricerchi in tantissimi ambiti quindi questa è un'iniziativa molto importante è un'infrastruttura di grande respiro che si sta sviluppando a livello europeo che vede la numerosissimi progetti europei finanziati uno di questi è os pillar che credo sia diciamo coinvolto nell'organizzazione di queste iniziative un altro in cui siamo coinvolti in cui credo anche il prossimo relatore sarà casati coinvolte osclife quindi ci sono tutta una serie di iniziative che in qualche modo sono nel solco di questa grande iniziativa che l'euro piano pensa in cloud che serve a costruire un framework europeo per questa finalità l'altro aspetto che diciamo è ma già in qualche modo citato e a parte tutto questo noi dobbiamo avere quindi a parte come dire gli aspetti infrastrutturali è importante avere delle linee guida costituiti ovviamente dal vice di esperti nei diversi settori che in qualche modo ci guidino a rendere i nostri dati come dire compliant con gli standard internazionali e che diciamo ne facilitino la cosiddetta fireificazione e appunto l'iniziativa research data lians rda che è un'iniziativa anche questa che lanciata nel 2013 che è la missione di appunto costruire tutto quello che serve per la condivisione aperta dei dati e ovviamente rda ha avuto un ruolo molto importante al quando è partita la pandemia perché se capito immediatamente che uno sforzo importante per condividere tutti i tipi dei dati che vi avevano venivano prodotti quindi clinici molecolari bibliografici di no au farmacologi e così via era importantissimo per diciamo sconfiggere più rapidamente questa pandemia insomma agire con un unione di intenti su scala globale mondiale e diciamo un modo assolutamente fondamentale per avere una possibilità di avere di arrivare prima la fine diciamo di questa complicata situazione in tutto questo diciamo si colloca il ruolo dell'infrastruttura e di ricerca quindi ce ne sono diverse coinvolte in questa situazione di pandemia una delle quali elixir che è l'infrastruttura di ricerca per le scienze della vita quindi si occupa sostanzialmente di fornire servizie infrastrutturali per i dati biologici a un punto di vista formale elixir è una organizzazione intergovernativa che formalmente è stabilita nel 2016 nell'ambito del framework Esfri che sa per gli european research infrastructure form che ha lo scopo di come dire mettere sul tavolo mettere a fattore comune risorse bioinformatiche a servizio delle scienze della vita che cosa intendiamo per risorse bioinformatiche quindi intendiamo basi di dati strumenti software materiale didattico best practice cioè metodologia lo stato dell'arte capacità di capacità di calcolo ed di storage in modo da dare ai ricercatori gli strumenti per poter ottimizzare il loro contributo allo sviluppo della ricerca quindi l'obiettivo di elixir è appunto quello di coordinare tutte queste risorse su scale europea e internazionale in modo da ottimizzarle in modo da come di si riceva prima non reinventare la ruota quindi usare al meglio ciò che esiste e costruire su quanto esiste per accrescerne le potenzialità di utilizzo da parti di tutti i ricercatori e quindi questo è un compito molto importanti che ha ricadute le più varie come direte in questa slide sull'ambiente sulla biomedicina sull'agricoltura e così via come è organizzata elixir a livello europeo è molto semplicemente organizzata in cinque piattaforme che quindi sono l'entità che erogano i servizi e queste cinque piattaforme sono appunto compute cioè capacità di calcolo e storage tools strumenti per analizzare i dati e conferire conoscenza biologica i dati stessi che sono una risorsa importantissima la piattaforma di interoperabiliti che quindi fornisce gli strumenti per la standardizzazione e l'interoperabilità per la riproducibilità ad esempio ovviamente un dato per poter essere scambiato deve essere formatato in un dato che non solo possa essere diciamo letto correttamente da un computer ma a livello internazionale tutti devono usare lo stesso tipo di dati formato in modo da poterselo scambiare e questo è un aspetto diciamo molto importante altrimenti i dati si creano delle barriere che impediscono come dire l'utilizzabilità su scala globale dei dati lo stesso vale anche per esempio per i software moltissimi software bio informatici sono difficilissime da riprodurre in altri laboratori perché magari uno usa un computer diverso con un sistema operativo diverso e così via e quindi anche su questo con diciamo soluzioni come i containeri docere così via si fanno si fanno degli sforzi molto importanti per rendere tutto questo come dire il più possibile interoperabile ovviamente altro quinta piattaforma molto importante il training perché bisogna fornire una base di conoscenza alla a tutti i ricercatori in modo da poter utilizzare al meglio le risorse che vengono offerte ma queste risorse a che cosa servono servono a comunità di ricercatori che operano negli ambiti più diversi questa è la ragione nell'organizzazione di elixir diciamo al di fuori delle piattaforme ci sono tutte le cosiddette thematic community che quindi sono gruppi di ricercatori che hanno un focus di ricerca comune e che quindi cercano di fare l'exploiting di queste piattaforme nel modo più congeniale a quelle che sono le loro risigenze e quindi qui vedete tutte le piattaforme che al momento sono attivi nell'exir che vanno dal plant science metabolomica 3d bio info quindi strutture tridimensionale proteomica malattierare dati umani e così via questo è molto importante perché le piattaforme utilizzando scusate le community utilizzando le piattaforme allovo rulta formiscono un feedback di utilizzo che in qualche modo ottimizza e specializza i servizi che queste piattaforme sono in grado di offrire per quanto riguarda l'organizzazione del nodo italiano come potete notare elixir italia è coordinata dal consiglio nazionale delle ricerche e vede fra i partecipanti numerosissime istituzioni di alto profilo a livello nazionale che sono università varie università enti di ricerca ma anche cosiddetti provider tecnologici che quindi hanno l'expertise per formire supporto tecnologico quindi ad esempio le mea i cinica nfn crs 4 e il gar in questo modo si tenta di mettere a fattor comune sia il no ao come dire biologico bioinformatico che il no ao tecnologico per come dire creare un'infrastruttura di ricerca il più completa e efficiente possibile a un punto di vista formale costituita in forma di una joint research unit che è un accordo formale sottoscritto dai legali rappresentanti delle istituzioni partecipanti allora naturalmente tutte le infrastrutture ovviamente comprese elixir nel momento in cui la scoppiata questa pandemia si sono posti il problema di mettere in campo quelle che potevano essere le azioni più rilevanti per combattere questa pandemia va una delle sfide più importanti e quindi condividere dati e conoscenze in un modo coordinato condividere dati e conoscenze e questo veramente è un compito ciclopico io penso che un come dire sotto prodotto che ci lascerà questa esperienza che purtroppo durerà ancora alcuni mesi è che capniremo finalmente l'importanza di questa azione poi su questo vi darò un ulteriore commento e vi dirò quale quale a mio parere un dei problemi principali che funge da come dire da barriera al fatto che questo possa realmente partire ma in ogni caso diciamo la commissione europea ha come dire alimentato questi sforzi ed in particolare nell'ambito di ilixir è stato sviluppato un covid-19 data portal che appunto un punto di accesso che serve a mettere e rendere visibili tutte le risorse possibili che via via vengono realizzate dai membri per come dire facilitare lo scambio la condivisione di strumenti di dati per accelerare la ricerca nell'ambito dell'infezione da coronavirus per visto che ora parleremo di quali sono i dati che vogliamo condividere mi consentirete una rapidissima digressione su diciamo che qual è il ciclo di vita del coronavirus così abbiamo un'idea di quello che accade come sapete questo è un virus ai premia positivo e tra l'altro questo fatto che viene usato l'emia positivo come dire alimentato la fake recentemente diffusa dei media di un tizio tra l'altro pugliese che usava una affare a cattioni positivi per espingere i virus positivi che era il presidente di nuova puglia che ora lo può aver detto stefandone del vineso quindi diciamo abbiamo che questo virus un virus erena positivo colonizza si lega alle cellule che infetta nel momento in cui si lega inietta in cellula il suo ereneggianomico questo ereneggianomico può esprimere due diversi set di proteine un primo set di proteine che quello espresso diciamo dalle cosiddette poliproteine a e a b che diciamo sono costituiscono l'apparato per la proliferazione del virus quindi ad esempio la erenegna polymerasi erenegna dipendente che è capace di creare un'altra copia del genoma e una volta che questo apparato viene costruito il virus si può replicare perché vengono come dire prodotti gli erenegna messaggeri che codificano per le cosiddette proteine strutturali come qui vedete in questa slide che sono se mn quelle principali queste proteine strutturali sono quelle che costituiscono il capsidio che quindi si ricompone incorpora una nuova molecula del genoma virale che questo gire ne ha più e quindi va a come dire a colonizzare altri lidi a quindi infettare altre celle quindi questo è il ciclo vitale e quindi noi possiamo raccogliere dati come ha detto prima Allegra sulla sequenza del genoma virale perché ovviamente è chiaro che questo genoma virale si è adattato all'ospite per poterlo infettare ai messaggeri virali che vedete si chiamano sg rma perché sono rma di scontini detti anche subgenomici possiamo raccogliere dati relativamente al profilo di espressione del genoma dell'ospite dati relativi alla struttura delle proteine così via quindi questa slide potete avere un'idea della grande varietà di dati che possiamo raccogliere ovviamente a parte i dati ma di questo poi magari vi dirà un accendo sarah ci sono anche i campioni biologici che andrebbero racconti quindi vedete il primo tipo di dato sono i risultati dei cosiddetti tamponi quindi questi tamponi c'hanno un risultato che è il positivo negativo ma se si fa un tampone molecolare per real time abbiamo anche un numero che ci dà l'idea del grado di infezione e poi diciamo altri dati che riguardano come dire l'apporto sperimentale poi naturalmente abbiamo le sequenze del genoma virale e del trascrittoma del virus i dati di espressione dell'ospite le proteine espresse dal virus che ovviamente possono come dire mutare in ragione del mutazione che subisce Grade genoma virale le strutture tridimensionali i bersagli molecolari per i farmaci e moltissimi altri ad esempio i dati di imaging che ad esempio danno l'idea dei danni che i polmoni hanno in seguito alle famose polmoniti bilaterali i dati clinici che sono correre co-relati all'infezione di cui poi parleremo tutti questi dati devono essere come dire integrati per produrre conoscenza biologica rilevante faccio un esempio per dire che un ceppo virale sia più o meno virulento bene se non l'associiamo a un dato clinico a sintomatico sintomatico sottoposta terapia intensiva di fatto divento impossibile ora per quanto quello che vi sto per dire vi sembrerà sorprendente ad oggi non c'è nessun sistema standard per creare questa associazione e su questo stiamo ancora purtroppo tremendamente indietro comunque su questo magari ci torneremo tra un momento questo giusto per darvi l'idea dell'aspetto che ha il covid 19 data portal questo è il portale europeo che è stato sviluppato che come vedete ha tutta una serie di dati che vengono riportati e sempre all'interno di elixir ogni stato membro sta realizzando alcuni l'hanno già fatto un covid 19 portal nazionale anche noi in italia stiamo realizzando un covid 19 data portal per l'italia il flusso diciamo dell'informazione è quello che qui viene in qualche modo rappresentato quindi noi abbiamo dei dati dei pazienti che transitano sia attraverso i laboratori diagnostici che attraverso le strutture ospedaliere questi dati vengono raccolti diciamo in vari tipi di repositori che sono specifici per i diversi centri che erogano questi dati che poi confuiscono in un sistema diciamo che dovrebbe essere unitario che poi viene diventa visibile dal portale covid 19 usando naturalmente il framework che dicevamo prima eosk open science cloud giusto per dare un'idea questo è il portale svedese e perché è importante fare questo tipo di sforzo perché mai in un momento come questo è importante ottimizzare gli sforzi evitare di reinventare la ruota razionalizzare e coordinare tutti gli sforzi che a livello locale regionali si fanno in modo da come dire coordinare questi sforzi massimizzandone se possibile l'efficienza quindi evitando la frammentazione delle azioni che di fatto ha un impatto terribile sull'efficienza poi e sui risultati che otteniamo ma anche sui tempi che poi sono necessari per raggiungere risultati importanti e quindi diciamo sempre in questo solco eosk ha creato una una sorta di task force per come dire sviluppare uno uno sforzo europeo internazionale per coordinare le azioni per integrare questi dati e è stato costituito un gruppo di contatto italiano all'interno della piattaforma eosk covid 19 che è come vedete costituito dal pressor giorgiorossi che è membro del eosk governi board dal dottor zambelli che il technical manager di elixir italia e dal dottoressa minghetti e dal dottor grigioni del istituto superiore di sanità questo naturalmente per cercare di fare uno sforzo organico a livello nazionale integrato con quanto si sta tentando di fare a livello europeo è internazionale ma quali sono i tipi di dati che noi come dire stiamo in qualche modo con grandi difficoltà cercando di integrare supponiamo di avere dei dati molecolari per esempio sull'espressione e l'ospite o sul genuma virale sulle mutazioni qua vedete un pannello molto semplice che noi abbiamo proposto all all'istituto superiore di sanità per sviluppare un form che dovrebbe essere compilato per integrare questi dati quindi ovviamente l'età il sesso del paziente se ha comorbidità le condizioni di salute se immuno compromesso e così via e poi vedete se ha tutta una serie di sintomi febbre tosse difficoltà respiratorie e così via naturalmente questo è un dato un formo molto semplice ma non è necessario inventare nulla perché nella organizzazione mondiale della sanità c'è uno sforzo che si chiama isaric che di fatto stabilisceразia tutta una serie di informazioni quindi il minimum sed informazioni che vanno raccolte e anche tutte le altre informazioni accessorie in un formato standard, che si chiama ISARIC. Anche su questo, per esempio, abbiamo che in questo database sviluppato da ISARIC ci sono alcune decine di migliaia di campioni depositati, ma a quasi nessuno di essi e associato, sono associati i dati molecolari del virus. ISARIC distribuisci anche i formi che andrebbero compilati per ottenere questo tipo di informazione. Ora, diciamo, qual è la situazione italiana? La situazione italiana è la seguente. Come sapete, in Italia la sanità è regionalizzata, quindi ogni regione più o meno si organizza in modo autonomo, seguendo standard differenti e all'interno della stessa regione lo sforzo è ulteriormente frammentato. Ora, diciamo, riflettendo sul perché ancora non, come dire, non abbiamo questa integrazione, bene, io la risposta già ve la posso dare, scusatemi, è il perché che non è prevista in ambito clinico la presenza del data scientist, cioè di una figura, di una risorsa umana che di in qualche modo coadiovi i clinici e il personale impegnato nei laboratori a integrare questi data, perché tutte le volte che ho tentato di parlare con i clinici la risposta è sempre stata la medesima. Noi siamo, diciamo, in una situazione drammatica dobbiamo fare i tamponi, non riusciamo a farli diciamo, a fare i numeri di tamponi che ci arrivano e quindi siamo in ritardo, figuriamoci se abbiamo il tempo di inserire questi dati. In realtà, come sapete, loro inseriscono, diciamo, i dati ma sono proprio i dati minimi che rendono di fatto inutilizzabile qualunque tipo di analisi integrativa che quindi sono ad esempio il sesto, l'età, il fatto se uno ha sintomi o no, ma sono i dati che richiede la piattaforma dell'istituto superior di sanità, ma ancora non c'è uno sforzo organico per fare tutto questo e per farlo in Italia tutti allo stesso modo. Vi dirò di più, questo a questo consorzo isaric partecipano alcuni ospedali italiani, ma ad esempio non partecipano l'istituto superior di sanità, non partecipano lo spallanzani e così via, cioè ognuno fa un po' come gli pare e questo, diciamo, rende di fatto impossibile al momento, salvo che non ci sia un'azione molto importante, diciamo, che io dico top down per cercare di mettere in ordine questa giungla che abbiamo al momento, naturalmente difficile che questa accada prima della fine della seconda ondata, speriamo di non aspettare la quarta ondata. Quindi qual è il compito che ci proponiamo di assolvere, di compiere per avere una ricerca open, aperta nel sforzo per contrastare la pandemia, quindi identificare le sorgenti dei dati generati dalla ricerca, ovviamente quello che stiamo cercando di far con elixir e continueremo a farlo naturalmente, quindi identificare ricerche in corso in modo da intercettare i dati che vengono prodotti, sollecitare i ricercatori a depositarli secondo gli standard fail, offrire supporto alla deposizione di questi dati secondo questi standard, formulare dei modelli per integrazione di metadati, un po' quella tipo quella scheda che vi ho mostrato prima. Se tutti accettiamo un modello minimo, poi diventa molto più semplice condividere in modo fruttuoso ed effettivo questi dati, quindi creare un catalogo unico di questi metadati è ovviamente integrare tutto questo a livello nazionale e internazionale nell'ambito, diciamo, dell'infrastruttura EOSCOVID-19. Quindi in questo modo dovremmo riuscire a, come dire, rendere a far dialogare tra loro l'enormità di dati clinici che vengono fuori nelle strutture cliniche con i dati molecolari che vengono fuori sia delle strutture cliniche che dalle strutture di ricerc. Naturalmente tutto questo va fatto secondo le regole e quindi va fatto considerando in funzione del tipo di progetto di ricerca, il cosiddetto DPA, quindi Data Protection Impact Assessment, cercando di rispettare le regole del GDPR per diciamo che stabiliscono le regole di privacy che naturalmente sono un po' attenuate nel caso di ricerca scientifica tant'è in questa situazione di pandemia. E, oltretutto, questo è molto importante, la condivisione dei dati, questo lo accennava Emma su un discorso più generale per fare un fact checking, perché se i dati tutti li possono in qualche modo controllare, di fatto C è una sicurazione sulla integrità e correttezza dei dati, perché sia gli scienziati che poi la società in modo corretto in qualche modo hanno uno strumento potentissimo per valutare se questo che viene fuori è di fatto supportato dall'esperimentazione, quindi da un metodo scientifico rigoroso oppure no. Giusto per darvi un'idea del mondo in cui viviamo, vi ho fatto un po' alcuni snapshot di quello che ve leggete sui giornali, un po' estrapolati nel tempo, c'è una dichiarazione di Zaya, ho fatto sequenziare il cepo serbo e più virulento, più o meno contemporaneamente veniva fuori la famosa intervista di Zangrillo che il virus era clinicamente morto, oppure vedete c'è un altro studio del campus biomedico di Roma che all'epoca diceva che ecco perché la pandemia sia tenuata perché il virus perde pezzi. Tutte queste opinioni, nessuna di queste di fatto è supportato da dati scientifici come dire poi realmente validati anche perché anche se alcune di queste osservazioni sono stati oggetto di pubblicazione su preprint poi di fatto non hanno ricevuto alcuna poevalizzazione successiva però il fatto che fossero come dire disponibili ha consentito i ricercatori di dire guardate che state prendendo una cantonata ad esempio nella mia limitatissima esperienza quando ho letto la storia che il virus perdeva pezzi siamo andati a guardare e abbiamo visto che era un osservazione del tutto irrilevante perché era giusto una mutazione relativa a una elezione in un numero trascurabile di ceppi virali che tra l'altro in Italia non era presente quindi naturalmente questo di fatto indeboliva moltissimo la conclusione diciamo che su questo giocano due fattori da un lato i giornalisti che vogliono vendere la notizia quindi più viene pompata più la notizia si vende dall'altro diciamo un po l'autocerebrazione dei ricercatori che un po diciamo in qualche modo gli piace essere come dire considerati grandi scopritori di grandi cose ma quello che potete vedere per esempio una delle tipiche domande che fa un giornalista il virus muta è certo che muta noi analizzando tutti i genomi finora disponibili di sars cov 2 abbiamo trovato 28 300 diverse mutazioni però la maggior parte di questi come vedete in questo plot è presente in un solo genoma quindi noi abbiamo più di 100 mila genomi analizzati uno su 100 mila c'ha un gran numero di questi hanno un'unica mutazione su unico genoma quindi da un punto di vista epidemiologico capirete che è assolutamente irrilevante mentre se è andata a guardare le mutazioni presenti in almeno l'1 per cento dei genomi queste da 28 mila di vendono 72 e quindi queste magari sono più interessanti e potrebbero essere come dire utili oggetto di studio per capire se hanno in qualche modo alterato la potogenicità o l'infettività degli un altro aspetto molto importante quindi torniamo un po' a quello che viviamo è proprio per questa disorganizzazione a livello locale regionale nazionale internazionale abbiamo che le conoscenze che abbiamo sono come dire molto disomogenea come diceva prima allegra noi abbiamo un grandissimo numero di genomi vedete il top ranking e united kingdom che ne ha sequenziati tantissimi guardate qua la scale logaritmica mentre diciamo altri paesi fra cui l'italia ne hanno fatti molto meno naturalmente queste differenze non sono dovute all'incidenza della pandemia cioè l'italia ha più o meno lo stesso numero di casi positivi che il regno unito però naturalmente abbiamo un paio di ordine di grandezza differenti rispetto ai genomi sequenziati per capire e per fare quella che si chiama la sorveglianza molecolare dell'evoluzione del dius che cosa quindi giusto per darvi l'idea di cosa accade in italia ad oggi abbiamo oltre 190 mila genomi virali questo dato è aggiornato al 10 di novembre e qui in questa gradatoria vedete in scala questa volta non logaritmica quanti sono i genomi italiani per cento casi quindi in questo caso vedete al primo posto della nuova zealanda l' australia l'island e così via quindi anche qui non ci distinguiamo per diciamo grande efficienza per quanto riguarda l'italia ecco allegra vi citava un numero più basso in realtà diciamo il portale open science per eccellenza e gembank ma la maggior parte dei genomi pubblici non sono disponibili su gembank ma su un'altra piattaforma che si chiama gisade che pone tutta una serie di restrizioni e quindi in totale in realtà ce ne sono quasi 900 di questi diciamo il mio gruppo di ricerca ne ha prodotti oltre 100 fra puglia e basilicata il protocollo che abbiamo seguito noi un protocollo così detto metagenomico nel senso che sequenza sia l'eremia virale che l'eremia dell'ospita come potete vedere di questi 891 abbiamo solo per 406 abbiamo almeno un pacient status cioè se è a sintomatico sintomatico o in terapia intensiva e in ogni caso quello che emerge chiaramente che tutti questi genomi italiani appartengono a un unico diciamo ceppo virale almeno per quelle che sono le nostre conclusioni altro argomento importante questi genomi quando sono stati come dire quando i campioni relativi sono stati raccolti questo è diciamo un grafico che riporta il numero di genomi per data di isolamento e come potete vedere è stato fatto uno sforzo molto importante a seguida la pandemia prima ondata marzo aprile ora un po diciamo il numero di genomi disponibili è un po più limitato anche se sarebbe molto importante come dicevo per la sorellianza molecolare continuare a seguire l'evoluzione del genoma virale nel tempo perché questo come potete immaginare ha implicazioni rilevanti per valutare l'efficacia dei vaccini ed eventualmente aggiornarli ovviamente c'è un drop diciamo in tempi più recenti perché dal momento dell'isolamento al momento in cui il genoma viene poi depositato almeno nel primo repositori che gisade ci vuole almeno circa un mese nella migliore delle ipotesi questa è la situazione italiana che vedete ancora peggio perché abbiamo molti genomi che sono stati la maggior parte per la prima pandemia in pratica c'è stato un grosso contributo l'ha dato un progetto cariplo per cui sono stati sequenziati oltre 300 genomi in lombardia ma come potete vedere della seconda andata abbiamo poco o niente e quindi anche qui sarebbe importante perché questi dati condivisi siano poi utili avere dei dati che siano omogenei nel tempo e nello spazio quindi uno dovrebbe campionare diverse località in tempi di fare allora per concludere qual è diciamo in sintesi quello che può essere il contributo di elixir a fronteggiare questa pandemia e appunto mettere a disposizione for free alla comunità scientifica nazionale piattaforme di calcolo e storage allo stato dell'arte a tutti i ricercatori quindi sono account di calcolo che sono anche come dire vestiti non solo il solo tempo di calcolo ma un ambiente di calcolo dotato di tutta una serie di programmi e basi di dati utili all'analisi di questi dati abbiamo anche sviluppato degli strumenti per analizzare questi dati e l'ultimo nato ad esempio si chiama corgata serve ad notare il genoma virale abbiamo già dei sistemi basati su un sistema workflow molto comune che si chiama galaxy in ambiente cloud per fare l'analisi dei dati anche in modo compliant alle regole GDR forniamo assistenza ai gruppi di ricerca per rendere questi dati fail interoperabile e ovviamente su questo magari allegra potrà commentare in seguito sviluppiamo attività di training per informare i ricercatori e dagli tutti gli elementi rilevanti per utilizzare sia le risorse che i dati che vengono risi disponibili spero di non avervi agnoniati troppo e vi ringrazio per l'attenzione ora direi che possiamo passare alla alla fase di la della discussione allegra ci sei e che ci sono eccola allora io intanto se se vuoi posso iniziare a condividere lo schermo con i risultati che stanno arrivando nel nel mentimeter e nel frattempo è arrivata sarah casati quindi se vogliamo procedere con le domande che erano arrivate ciao a tutte a tutti non posso farmi vedere perché purtroppo viaggio in ed adsl oggi quindi menta non c'è problema sarah da accendere così la luce allegra vai dunque scusate sto aprendo forse vogliamo condividerli è ma i sì sì sì sto condividendo lo schermo un secondo e questi sono i risultati diciamo nel i commenti che sono arrivati al mentimeter ok ehm beh aiuto sparito sì ok ehm allora beh insomma mi sembra che ci siano tanti spunti qui vediamo alcuni vediamo con un commento semplicemente le ragioni su il barriere sono semplicemente organizzative informatiche e in questo senso i i tutorial che stiamo organizzando avrebbero un po lo scopo di cercare di creare un supporto proprio per superare questo tipo di barriere vedo qui mancanza di tempo il punto è che secondo me eh la mancanza di tempo è anche un posto sciata a un a una ehm mancanza del senso della priorità che queste che che la condivisione dei dati quindi caricare le le sequenze o piuttosto insomma darsi da fare per condividere i propri dati ehm rappresenta cioè squando qualora la condivisione diventasse una vera priorità perché se ne comprendesse fino in fondo l'importanza ehm naturalmente il il tempo in qualche modo verrebbe eh trovato ok mancano le standard la volontà è il tempo di condividere dati ecco questo mi sembra ehm diciamo questo mi risuona molto ehm e però di nuovo ehm la volontà eh il tempo ehm sono ehm figli appunto del comprendere l'importanza ehm della condivisione mancano le standard ehm in parte mancano le standard per esempio nel caso della condivisione delle sequenze ehm gli standard ci sono ehm ehm io aggiungerei in molti casi non si conoscono le standard e di nuovo ehm questo è ehm ehm una delle ragioni per cui c'è questa iniziativa e e forse dovrebbero essere messe appunto molte altre insomma per esempio il training ehm è una una di quelle iniziative che permette di far conoscere ehm gli standard, organizzare, strutturare poi far conoscere gli ehm gli standard. Ignoranza qui abbiamo ehm ok vado avanti è stata che ok. Ignoranza dei contenuti di open science ehm e di nuovo appunto ehm assolutamente fa parte diciamo l'ignoranza di varie cose appunto degli standard vede contenuti di open science e l'importanza dell'open science sono tutti ehm delle bariere chiaramente scarsa consacurezza e la condivisione dei dati, timore di perdere la paternità della scoperta, di nuovo anche questo. Io non so ehm ma se via via tu vuoi anche aggiungere le commie dell'importante che tu lo facessi per esempio sulla sul timore di perdere la scoperta credo che tu abbia una cosa da dire. Sì ehm dunque questo è un una scusa, una delle scuse che vengono che vengono dati nel diciamo più frequentemente cioè io non condivido i miei dati perché ho paura che se no poi qualcuno me li me li prende scrive l'articolo al posto mio e ehm e quindi i dati non sono più miei. Allora ehm in realtà è proprio vero il contrario perché nel momento in cui io deposito i dati in un riposito, in una piattaforma ehm io ho ehm la possibilità di dimostrare che ehm sono stato il primo a raccogliere quei dati. Ci sono ehm chiaramente dei meccanismi che ehm rendono la data di deposito certa ehm assegnano addirittura ai dataset un un identificativo persistente e assegnano il fatto che io sei autore di quel dataset diciamo quindi in realtà depositare e condividere è proprio l'atto con il quale si può dimostrare di ehm aver per primo raccolto quei dati quindi è proprio tutto il contrario. Ehm è chiaro che ehm credo che insomma sotto a questo commento ci sia il fatto che ehm se io condivido i miei dati prima di averli sfruttati eh al massimo ehm non potrò poi pubblicare così tanto quanto voglio e qui si ricade un po' nel discorso che si faceva prima rispetto alla ehm alla valutazione ehm della ricerca. Ho visto che c'è un commento anche su questo ehm la questione della valutazione della ricerca ehm è ehm oggi ehm proprio diciamo oggetto di dibattito internazionale soprattutto europeo ehm l'Europa ha fatto tutta una serie di passi e ci sono delle discussioni proprio ad alto livello ehm per cercare di cambiare la valutazione ehm nel prossimo programma quadro Horizon Europe ci saranno importanti novità verrà valutato molto di più ehm l'aspetto open science ehm sia in fase di progettazione di di domanda diciamo per i finanziamenti sia anche ehm nelle nelle fasi successive la la commissione ha messo per esempio a disposizione una piattaforma di ehm pubblicazione completamente aperta ehm in tutte le fasi della pubblicazione scientifica questa ehm entrerà nel poi anche nella ehm nel sistema di evaluation delle delle proposte. A livello italiano ehm forse molti di voi si sono accorti che ehm ad agosto il ministero ehm della ricerca ha ehm pubblicato una ehm una consultazione pubblica sul nuovo piano nazionale della ricerca. Beh in quel piano era contenuta ehm anche un un piano per l'open science dove eh si fa ehm esplicito riferimento alla necessità di abbandonare ehm i metodi correnti di valutazione basati su indici bibliometrici per passare a un altro metodo di valutazione della ricerca. Quindi diciamo che questo aspetto sta cambiando. È chiaro che ci vorrà tempo ehm ci vorrà un una grossa discussione con le singole comunità perché ogni comunità scientifica è diversa e ehm però insomma ci si sta arrivando quindi anche quello eh diciamo lo stiamo lo stiamo superando. Ehm posso aggiungere. Certo. Prego a Sara. Oltre che ringraziarvi per aver ascoltato. Vi dà grazie a no meraviglia e per avermi coinvolta. Come tu hai ben segnalato Horizon Europe eh cerca di spingere verso quell'orizzonte collaborativo ed io pensavo in che stiamo descrivendo che che è alla base della condivisione dei dati dei campioni di quello che ho chiamato il dato globale integrato e tra i requisiti evalutati positivamente c'è anche il fatto che le infrastrutture di ricerca estri siano eh elemento previsto già eh dal progetto stesso e anche nei costi del progetto perché segnano questo perché come penso sapiate se non lo sapete dico due parole io ehm lavoro a livello nazionale europeo nel come un serviselsi eh di bbm rai l'infrastruttura del biobancaggio e ehm la messa a disposizione dei campioni in qualità grazie alla terzietà e tutto il lavoro che fanno le biobanche è un è un ottimo lavoro di condivisione è un ottimo esempio di condivisione eh di condivisione perché la scienza possa fare quel cambio di passo che qua è in un gioco sì che c'è anche questo aspetto e sono completamente d'accordo che questi nuovi indici da tempo sono diciamo agognati perché in fondo noi stiamo andando verso un orizzonte l'Europa ci chiede i cittadini di andare verso quell'orizzonte di ricerca responsabile collaborativa che necessita di modalità ai criteri differenti di valutazione del ricercatore. Ok grazie ehm stavo osservando che questo diciamo la le risposte eh le vostre risposte sulla questione della perdida di paternietà qui vedo la credenza che dati vengono urbati ehm la la classica mentalità italiana eh premia di ortosità possessività gelosia in video sono la quale si tende a proteggere ciò che viene considerato proprio non pensando che la scienza che avreste più rapidamente se si condivide ehm ehm ehm ehm la gelosia dei ricercatori ehm Pabde e Cio Appere ci dà un lato dare un dato al gruppo che ricerca dall'altro ehm insomma ehm molti di voi insomma hanno hanno questa, questa idea. Mi chiedo se, non so se è ma, o Sara, avete commenti su qualcuno di queste altre, di queste altre risposte, date dei partecipanti sulle barriere alla condivisione dei dati covid? Allora io volevo fare un commento, c'era, c'è stata una domanda che è stata posta in fase di diciamo descrizione, avete visto nel modulo, vi avevamo chiesto se avevate alcune domande e è una domanda che io rivolgerei, rivolgerei a Sara e poi magari anche anche a Graziano, rispetto a come si può fare per raccogliere i dati degli ospedali, i dati clinici che vengono, vengono raccolti negli ospedali. Vedo che ci sono anche altri commenti che fanno riferimento per esempio al, al fatto che abbiamo una, una sanità su base regionale, ma che questo diciamo è un problema che dobbiamo affrontare globalmente, quindi come, come, come sistema paese quello del, della, della condivisione dei dati. Non so se Sara ha un commento da fare. Sì volevo solo aggiungere che a questo riguardo diciamo quindi con questa domanda c'è anche una domanda nella, nella sezione per domande risposte che è solamente che dice difficile ottenere i dati omogenei dall'ovario strutturo ospedaliere e come si può superare questo problema. Quindi questo è anche... Allegro diciamo il modo c'è il problema che non, poi magari quando finisce scrape Sara dicono come la pensa. Ok, grazie. Io sarò a leggera perché è un'intesa titanica soprattutto rispetto all'Italia quella che diciamo va sotto il cappello di semplificazione dell'uso di dati che si originano dalla clinica, quindi per scopi terapeutici diagnostici in un orizzonte di ricerca e di scopi scientifici futuri. Allora mi sento di condividere alcune cose che stiamo facendo quindi e che penso che siano quanto più efficaci, quanto più occasioni come queste sono occasioni di condivisione, di come si sta lavorando e quindi di come si può anche integrare e non solavorare per semplicitare questo accesso e anche io lo dico dal punto di vista di una persona che è bioeticista e innanzitutto allora molto conta l'inizio della storia come nelle favole, come si origina quel dato, se quel dato è un dato che al di là del momento di pandemia ha quei requisiti che permettono la condivisione e innanzitutto quindi il consenso del cittadino e della cittadina a che al di là della diagnostica della regione terapeutica per cui quel dato è stato acquisito possa anche e in quali termini essere utilizzato per scopi di ricerca. Non dico che metà del lavoro è fatto ma c'è un grande passo in avanti tra l'altro è per me interessante leggere questa gelosia del dato da parte dei ricercatori, stiamo parlando di dati che si originano attraverso quello che è la condizione di salute di una persona che innanzitutto se c'è qualcuno che dovrebbe dire sono io il proprietario di quei dati particolari o di quei campioni è il soggetto da cui si sono originati quindi innanzitutto fare attenzione a come si origina per dato avere cura di quell'origine e quindi accanto all'interazione con il cittadino e i cittadini e le giovani generazioni sembra che parli del un mondo che non c'è è qualcosa che noi stiamo facendo da tanto tempo tanto è vero che adesso lavoreremo anche con le scuole sempre parlando del dato biologico innanzitutto ma anche dai dati collegati al dato biologico per quello che è l'engagement dei minori e delle giovani generazioni a sentirsi partecipi cittadini scientifici della ricerca anche proprio perché dando un accesso controllato alla ricerca entrano nel processo della ricerca controllato attraverso il consenso che tipo di consenso qua c'è molto da discutere un processo dinamico partecipato eccetera eccetera l'altro discorso è l'alleanza con i clinici perché se i clinici noi l'abbiamo visto tantissimo nel mio bancaggio covid e non covid soltanto sono si sentono diciamo estranei a questo processo ostacolano ostacolano il processo stesso o mille esempi di ostacolo di ostacolamento che si può ostacolare in molti modi anche raccogliendo in con mala voglia il dato non con quella correttezza con quella con quella fairness di cui abbiamo bisogno e poi tornando al discorso di come la condivisione apre a modo diverso di confrontarsi con tutti gli altri soggetti che hanno permesso quel processo che diciamo di quel flusso quel processo di raccolta di conservazione e di dati a livello di di bbm r i mi sembra molto interessante condividere con voi che abbiamo lavorato l'anno scorso sulla condivisione in correlazione al trasferimento dei campioni negli stati extra europei e non solo anche all'interno dei progetti collaborativi e tra gli elementi che sono emersi oltre a quello che appena discusso del del consenso come determinante la qualità della condivisione c'è anche tutto il tema della cootership cioè chi in questo caso deve inclusione dei ricercatori che sono poi bio bancari che raccoglono in qualità e diciamo e strutturano i dati intorno al campione che sono comunque poi parte del processo di sviluppo scientifico e che meritano di essere inclusi questo a dire che quando per mille ragioni io sono tra i vettori come ricercatore clinico che portano al dato alla condivisione quel processo è già di per sé scientifico e deve essere riconosciuto e ci sono veramente non solo dibattiti ma strumenti già a disposizione perché questo accada il mondo delle bio banche dal mio punto di vista del bio bancaggio è molto interessante e utile sotto questo profimo perché costantemente terzo quello che fanno i ricercatori nelle bio banche ma allo stesso tempo è altamente scientifico infatti spesso non solo per le pubblicazioni ma anche nell'ambito di quello che è il risultato di quella ricerca quindi anche per quanto riguarda brevete e diciamo trassegimento tecnologico molto si sta determinando in modo che siano tutti riconosciuti nella parte di lavoro che viene fatto e svolta per finire voi sapete che il decreto lorenzi questa è un informazione decreto lorenzina scusate la leggerone lorenzina aveva tra i suoi decreti attuativi un decreto in cui si diceva che l'istituto superiore di sanità in collaborazione con bbm rai avrebbe dovuto scrivere questo un anno e mezzo fa recitava il decreto la linea guida per la semplificazione dell'uso dei dati di origine clinica per scopi scientifici e il covi da stravolto un po tutto però noi adesso siamo a un re del razione ma perché questo in modo molto accelerato trovi una conclusione stiamo per finalizzare il programma del 2021 di bbm rai italia e tra le questioni chiave che saranno nel programma uno è qua un po pena descritto e quindi sono tutti benvenuti in modo in cui noi lavoriamo è aperto e partecipato e tra l'altro il cnr accanto a tutte le biovanche di ospedale l'università è sempre presente nei lavori l'altro tema è diciamo tema che è stato toccato nei commenti della ma che struttura di che struttura abbiamo bisogno perché questo accada di che piattaforme ma anche di che infrastrutturazione a parte che ci sono infrastrutture di ricerca come appena detto e dal mai da vent'anni stiamo cercando di capire che modello è voluto di biobanca registro dentro negli istituti negli ospedali abbiamo bisogno che si sviluppi e con che integrazione pubblica e condivisa diciamo a livello di sistema paese finisco il non è qui presente spero che la prossima volta possa essere presente un interlocutore fondamentale di nuovo in uno dei vostri commenti dove si parla del fatto che ci sono due ministeri in gioco in tutto questo come due istituti scientifici importanti ma quindi muro cnr e ministeri della salute istituto superiore di sanità bene proprio il covide ha portato quel documento di cui vi ho parlato condivisione trasferimento condivisione dei dati dei dati dei risultati trasferimento in qualità ad essere la base per un lavoro tra bbm rai 52 ir ccs che fanno questa meraviglia che solo l'italia a perché ci sia un'unica buona pratica un un'unica linea di indirizzo in questo caso per quanto riguarda il trasferimento ma il ministero della salute sta lavorando perché tutto quello che si genera a livello di clinica venga messo al sistema fatto comune per la ricerca e quindi è di oggi di qualche giorno fa la notizia che c'è il primo numero di delle bussole che è una una linea editoriale curata da ministero della salute io diciamo sono come vieticista felice di condividerlo non sono parte del ministero della salute se non indirettamente perché il ministero finanzia ministero della salute insieme al murra bbm rai è una delle tre infrastrutture delle delle le sciences co finanziate dai due ministeri e bene c'è questa questa nuova linea che raccoglierà tutte le linee di indirizzo che cercheranno appunto di fare coine tra i 52 e i rcs quindi forse noi potremmo avere potremmo contribuire molto come per esempio stiamo facendo ma anche imparare portare a casa portare nei nostri contesti perché ci si armonizzazione perché è un po questo quello che è in gioco molto altro da dire ma di nuovo lascio lo spazio agli altri è troppo importante quello che faccia in gioco e sul covid ho già condiviso con con emma e non solo tutti i materiali che di nuovo sono stati creati gli strumenti dalla linea di indirizzo quali dati raccogliere a un consenso semplificato unico a seconda che il paziente sia in emergenza piuttosto che sul territorio tutti quindi l'assetto etico normativo gli strumenti utili perché la raccolta sia con i requisiti etico legali e in qualità allo stesso tempo dentro un contesto armonizzato questo lo potete trovare sia sul sito dell'istituto superiore di sanità che sul sito di bbm r italia grazie mille su questo volevo sentire ancora un momento graziano poi abbiamo ancora un paio di domande legate diciamo gli strumenti di più bancaggio e dunque molto rapidamente ringrazio sarah perché ci offerte una panoramica molto importante e anche evidenziando alcune problematiche una di questa è venuta fuori dal mentimeter che sarà citato e che noi a monte in italia abbiamo una frammentazione per esempio dei ministeri il ministero della sanità e il ministero della ricerca ora forse si sta capendo che questa frammentazione in qualche modo va superata perché altrimenti corriamo il rischio come dire di far girare il motore per lo più a vuoto e un altro elemento molto importante che non usciremo da questa impasse se non c'è un commitment top down cioè non questa integrazione di dati non può essere fatta su basi volontarie o su iniziative sporadiche singole così via è importante un commitment top down al più alto livello che poi venga in qualche modo sviluppato per che sia condiviso quindi quello che diceva sarah iniziativa bm rai ministero sarote x mi trova molto felice e spero che possa come dire proseguire e concretizzarsi ma qual è lo stato dell'arte lo stato dell'arte purtroppo scusate ma è tragico se voi andate a chiedere a un clinico che cosa vuol dire feiro che cosa vuol dire gdpr io scommetto che 9 su 10 non non sanno di che cosa parla ve lo dico per esperienza spicciola cioè quando mi arrivano i dati i dati dei campioni dei pazienti tipicamente mi mandano un foglio excel con nome con nome e data di nascita giusto per darvi un esempio ma perché questo non come dire non si riesce a sviluppare sia per tutte un po alcune delle motivazioni che qui vedo riportate eccetera eccetera ma anche perché i professional che al momento abbiamo in ambiente clinico diciamo non hanno una una preparazione o una inclinazione a fare tutto questo ecco perché dicevo che bisogna come dire introdurre in questa realtà delle figure di supporto che io chiamato data scientist ma chiamatele come volete che in qualche modo fungano da interfaccia fra il sistema che i dati li raccoglie e li rende fruibili a quelli che i dati li producono in modo che aiuti il personale che è in corsia che in i laboratori diagnostici gli aiuti e risupporti in tutto questo altrimenti secondo me l'impresa sarà come dire probabilmente senza in posti mission impossible come si può dire ora naturalmente la pandemia ci ha messo di fronte una crisi molto seria su questo e ci stiamo accorgendo di quanto tutto questo si è ralentando il progresso della ricerca in italia altro elemento molto importante ma questo diciamo saralo sabbene è che quello che facciamo in italia non deve essere limitato al nostro perimetro ma comunque si deve integrare in quelli che sono standardi internazionali perché il dialogo l'interazione non è ristretto a livello locale intendo l'Italia ma deve essere ovviamente il più ampio possibile posso prendere una parla al balzo su questo aspetto graziano perché è vero che l'Italia sta messa male però io ho un osservatorio speciale di cui veramente non sarò mai abbastanza grata del fatto che ho lavoro in questo osservatorio speciale che è l'LC services e le ristorcioni di bbm e raieri che è il servizio trasersale a tutte le infrastrutture di ricerca per quanto riguarda l'aspetto etico legale sociale della ricerca in particolare avanzate in particolare della ricerca basata su dati e campioni e in questo momento non abbiamo parlato di tanti soggetti in gioco stiamo facendo diciamo una mappatura di quello che è l'attualità in in Europa della valutazione etica dei progetti basati colaborativi basati su campioni e dati è davvero veramente ancora più tragico di quello che tu descrivevi dell'Italia ci sono farabmentazioni inimmaginabili e solo il nord europa sta cercando di promuovere tra i comitati etici perché adesso stiamo parlando di questo soggetto che è fondamentale anche come soggetto dentro questo processo perché molte volte tanti consensi quel consenso a cui io mi riferivo sono rigettati dai comitati etici che in modo pedisse co leggono le prescrizioni del nostro garante e sul bio bancaggio hanno molto meno competenze o soldato integrale comportamentale di immagini di quello che dovrebbero avere per far poi delle valutazioni e solo nel nord europa si sta arrivando a quello che si chiama recognition quindi quel fenomeno per cui quando io sottometto un progetto di ricerca in norvegia vengo valutata positivamente questa è la valutazione del comitato etico che mi porto in giro per tutta l'Europa quindi una condivisione anche è una armonizzazione di quello che sono i processi di valutazione delle ricerche che prevedono accesso a dati i campioni per poter essere svolte questo come come in effetti l'altro aspetto che volevo dire è che la situazione è tragica però a fronte di professionalità e noaudia eccellenza di cui disponiamo il che diciamo anche a livello nazionale il lavoro splendido che state facendo io ti volevo fare una domanda per esempio anche su discorso il biancaggio di raccogliere non buttare via i campioni ha fatto una domanda a cui nessuno mi sa rispondere anche io credo voi sapete che ora in italia stiamo facendo centinaia di migliaia di tamponi da pari soggetti e ovviamente positivi negativi tutti questi campioni biologici sono estremamente preziosi non solo ovviamente i positivi in cui si va a vedere cosa c'è anche negativi perché se voi avete ad esempio un negativo di un rsa e abbiamo un certo gruppo di soggetti che sono negativi pure in ambiente ostile evidentemente avranno un profilo genetico molto interessante la domanda che io ho fatta a cui nessuno mi sa rispondere che cosa succede a tutti questi tamponi che vengono fatti cioè la risposta che mi soddate che vengono buttati via comunque il che diciamo non mi rincuora molto volevo sapere se tu ne sapesti qualcosa in merito scusate e sospiro tra l'altro c'è una domanda sul mio bancaggio anche commercialo istituzionale ciò di cui stiamo parlando è bio bancaggi istituzionale bbm rai è una bio banca che muove il mio bancaggio per un uso no profit le bio banche possono essere anche presso in t convenzionati e privati però un uso no profit per rispondere a te graziano quando tutto è iniziato ci ha preso un po incontropiede ma rapidamente abbiamo compreso della quanto prezioso fosse qualsiasi campione come tu è ben descritto quindi da lì quel consenso semplificato che abbiamo messo a disposizione di tutti sia in inglese che in italiano e e abbiamo fatto vedere anche al garante una mediazione perché ci fosse uno strumento che ci permettesse perché il punto uno potrebbe dire quei campioni li anonymizziamo e li usiamo così anonymizzati possiamo farlo in un stato di emergenza ma non ci serve per quello che è il lo sviluppo e la ne c'è della ricerca stessa in gioco e la necessità di andare a connettere con altri dati che non sono solo quelli che il campione ci offre e allora quando abbiamo costruito questo questo consenso perché fosse nel tempo possibile no ricontattare le persone o diciamo chi rappresenta che la persona che può andare a fratevo magari è deceduta ci siamo andetti due cose uno evitare quello che purtroppo è successo io siamo registrati purtroppo sì comunque è un dato è che tantissimi di questi campioni vengono lo stesso usati per ricerca ma fuori dal circuito di cui noi stiamo parlando che è un grosso problema e quel circuito in cui ci sono collezioni interscambi sotto banco tuttora qualcosa che non dovrebbe più esistere perché poi diciamo fa un danno alla qualità della ricerca e a quello che è la diciamo l'esigenza del cittadino che si si luppi ricerca correttamente le responsabili che ritorni a cittadini l'altro aspetto è che durante la prima ondata si è pensato però se è detto che non era il momento opportuno sia anche proposto di fare una grande campagna diciamo pubblicità progresso chiamiamola così con tutti i cittadini per far capire l'importanza di rendere disponibili i campioni alla ricerca qualsiasi campione e in particolare proprio allora poi tutto fu bloccato adesso probabilmente lo riprendiamo un lavoro con i minori come già vi accennavo prima vediamo se questo accadrà però dovremmo anche in questo unire le forze graziano cioè siamo tutti parte di quello che vorremmo essere una zona di sistema bisogno di armonizzarsi bisogno di alcune azioni in cui i cittadini e i clinici devono essere supportati e dal mio punto di vista informati ma non è così complesso informare noi abbiamo dalla nostra parte cittadinanza scientifica e tutte le associazioni dei pazienti hanno lavorato con noi a quel consenso per la ricerca covid che vi ho detto è pronte a a fare un'azione di sistema per finire abbiamo anche scienza ander diciotto che non sa se conoscete come rete di tutte le scole che pensano la scienza come in termini di proattività dei ragazzi dagli studenti anche loro assolutamente interessati ad esserci scusa sarapè come siamo in in chiusura io volevo portare diciamo delle domande forse non c'è in questo momento il tempo di rispondere però c'è Marco Ciaramella che ha posto più domande tutte legate agli aspetti poi pratici direbbe allora a cui si sta pensando un sistema un infrastruttura per la raccolta d'acchi eccetera però poi lui fa domande del tipo esiste una procedura europea a me verrebbe da dire anche esiste una procedura italiana per mettere a disposizione supponiamo i dati di tamponi su una piattaforma oppure dice potete dirci di più su gli strumenti di più bancaggio quali sono con che modalità come organizzare tutto questo e poi dice sono un beta scientist posso fare il volontario cioè dal punto di vista poi pratico di chi vorrebbe capire quali sono appunto tutti gli standard per la raccolta dei dati che vorrebbe fare il volontario per la raccolta dei dati dal punto di vista pratico come fare per far conoscere l'iniziativa che ci sono in atto e poi per renderle in prospettiva operative e in che tempi. Io rispondo per quanto lo ho insciato su una delle domande per quanto riguarda i campioni sia nella direttore italiana di VVM Rai.it che nella direttore europea c'è proprio una sezione covid 19 e non sono pochi campioni anche italiani che sono stati diciamo resi disponibili per darvi alcuni nomi alcuni numerici sono dieci corpi con più di 82 mila campioni di 10.500 pazienti abbiamo anche 20 RSA della Lombardia e una RSA delle Marche con 1.650 pazienti e 9.800 campioni, la corte dei pazienti pediatrici che è al bambino in Gesù, la corte dei lavoratori sanitari, tutto questo lo trovate sulla direttore di VVM Rai Italia, allo stesso tempo c'è tutta una sezione dedicata nella direttore di VVM Raieri. Questo per i campioni e i dati diciamo di minima che sono stati associati ai campioni. Dati molto legati attraverso quale test, con quale status del paziente, con quale follow-up, sono dati molto no, strettamente legati al covid 19, non dati a altri come come ascoltavo prima graziano dalle lingue di Graziano e sugli strumenti che cosa si intende per strumenti io posso dire che per quanto riguarda di nuovo la raccolta dei campioni e dei dati covid ma non solo covid ci sono strumenti sia Elsie che di qualità di nuovo a disposizione. Come partecipare se persona per la prima volta ascolta tutto questo? semplicemente scrivendo diciamo per quanto riguarda l'Italia a italiettbmrai.it per bbm rai erich se si vuole andare direttamente in Europa scrivendo alla media di bbm rai erich e segnalo mi sono dimenticata noi stiamo facendo una giornata nazionale modulare di bbm rai dovuta il covid cioè due ore ogni due settimane e il 25 novembre credo ci saranno due ore tutte dedicate alla ricerca covid 19 vado a verificare perché io non ho una buona memoria no mi sono sbagliata il 26 novembre dalle 14 alle 16 e dove si dice appunto nel dettaglio e anche dalle persone che ognuno con il suo ruolo ha contribuito tutto questo quindi dal data set a come entrare nella directorie usarla gli strumenti etici e normativi che abbiamo preparato quindi non è per partecipare le le porte sono aperte ed è molto semplice basta escriversi e avere la newsletter e magari a seconda di dove si è c'è per quanto riguarda le bio banche c'è una mappatura di tutte le bio banche partner che fa parte di bbm rai che copre tutto il paese e uno può guardando la cartina dell'Italia capire dove la bio banca vicina e interfacciarsi con questa bio banca se c'è questo interesse per quanto riguarda gli rccs io spero che ai cdi presto decida di far sì che la direzione degli rccs come direzione sia coinvolta in questa grande e meravigliosa azione che state provovendo perché anche lì molto molte azioni sono in campo e c'è grande disponibilità a interscambiare diceva giustamente grazie a noi forse anche qualcun altro se c'è già una buona pratica ma prendiamola facciamo una nostra mettiamo la sistema non andiamo o no ogni volta a ripetere e a lavorare per compartimenti stagni un grosso problema è quello dei compartimenti stagni silos no non è più per silos nella ricerca né né è la struttura che permette la ricerca io sono a disposizione per chi vuole potete scrivere a lc et bbm rai punto e t io rispondo a quella mia chi vuole sapere degli strumenti nel dettaglio prepara che essere ulteriormente convolta in questa iniziativa di disseminazione dei nostri webinar e tutorial grazie molto non passo la palla d'emma che grazie allegra grazie sare grazie graziano io voi avete visto c'è un nuovo spazio su 20 meter dove potete lasciarci tre concetti noi lo lasciamo aperto ancora nei prossimi giorni quindi se volete poi potete continuare a condividere con noi quello che vi ha lasciato questo webinar io giusto per chiudere direi che ci sono un sacco di domande di commenti ai quali non siamo riusciti a rispondere per motivi di tempo ma risponderemo a tutti come siamo soliti fare attraverso un un pdf che metteremo a disposizione su zennodo e anche sul sulla pagina degli eventi che stiamo organizzando sul portale di open air che probabilmente conoscete quindi vi invitano i prossimi giorni ad andare a vedere se abbiamo finito di scrivere e abbiamo condiviso con voi tutto inseriremo anche i contatti di sarah quindi se ve li siete persi chiaramente li ritroverete lì ci saranno i link a tutto quello che lei ci ha ci ha descritto e vi ringrazio perché ci avete dato molti spunti ci sono state molte domande mi dispiace di non essere riuscita insomma a rispondere a tutto ma ci saranno chiaramente altre occasioni quindi tenetevi come si dice stay tuned perché stiamo organizzando per voi i prossimi eventi e quindi ci vedremo presto.