 Ma sera a tutti, direi che possiamo cominciare. Benvenuti al webinar COVID-19 con divisione dei dati, perché in Italia si fa troppo poco? Questo è un webinar, significa che purtroppo non sarà possibile per voi intervenire con accendendo il microfono, però non cercheremo comunque di renderlo quanto più possibile interattivo, intanto facendovi qualche domanda a cui vi chiederemo di rispondere durante il webinar e poi dandovi la possibilità di fare tutte le domande che volete con avete a disposizione una box per domande risposte che vi identificate come Q&A. Le vostre domande verranno raccolte durante il webinar e poi alla fine degli interventi, degli speaker, avremo un momento abbastanza consistente di discussione, di risposta alle vostre domande. Dunque questo webinar come è nato. In realtà insieme a questo webinar è nato un'iniziativa un po' più importante di cui adesso vi dirò. Dunque è nato dal fatto che nell'emergenza COVID si è reso evidente che fosse non solo importante ma anche urgente che ricercatori, clinici e tecnici condividessero i loro dati e che la condivisione sia un elemento fondamentale per contrastare questa pandemia e non solo per contrastare mentre hai altre future pandemie, non necessariamente solo COVID. Ma il punto è che quello che si sta osservando è che nonostante l'Italia sia uno dei paesi con i trentograni numeri di casi di COVID, in realtà stia facendo veramente molto poco in termini di condivisione, di condivisione di dati. Questo che vi mostro è solamente un esempio. Il caso dell'Australia che ha presentato ad oggi poco più di 12.000 casi ha depositato in Jimbank che la banca dati che colleziona la più importante banca dati per la collezione di sequenze nucleotidiche, 1.420 sequenze, quindi questo è quello che ha fatto l'Australia, viceversa l'Italia di come sappiamo a un numero ben maggiore di casi ad oggi ha depositato 27 sequenze, insomma questi numeri fanno in pressione. In realtà ci sono altre paesi in Europa che seguono il trend dell'Italia, ma noi oggi ci occupiamo dell'Italia. Ci siamo domandati quali e ci si domande in generale quali siano le ragioni di questa difficoltà, comunque di questa osservazione, di questi numeri così piccoli di condivisione di dati. Le ragioni in realtà possono essere varie. Un motivo potrebbe essere che gli abbetti ai lavori, cioè ricercatori clinici e tecnici che si occupano della produzione e della raccolta di dati covid, non sono interamente consapevoli dell'importanza e dell'orgenza della condivisione dei casi, della condivisione dei dati. Un'altra ragione potrebbe essere che invece alcuni non sappiano dove come condividere, però ci possono essere anche altre ragioni e saremmo tra l'altro molto interessati a sapere voi che cosa ne pensate, quindi a un certo punto vivere ha dato l'opportunità di dire, non a parole ma a voce ma a mascherendo, quale pensate voi che possano essere le ragioni di questa mancanza o sufficienza di condivisione. Ora, in questo contesto alcune delle infrastrutturali europee più importanti per la condivisione dei dati, che si occupano di dati che supportano fortemente la condivisione dei dati, hanno cominciato naturalmente a muoversi e i nodi italiani di queste infrastrutturali europee di cui poi adesso voi oggi sentirete parlare parecchio e di cui adesso io vi dirò qualche cosa. I nodi italiani hanno iniziato una collaborazione per sviluppare una serie di eventi online, in particolare tre webinar e questo è il primo e tre tutorial proprio per cercare di fornire degli strumenti a ricercatori clinici e tecnici, diciamo fornire strumenti e consapevolezze strumenti per cercare di supportare la condivisione dei dati covid. Il webinar di oggi è generale e parleremo molto di open science e covid 19 e poi gli altri webinar e tutorial si concentrano su tipi specifici di dati, quindi il prossimo webinar questi saranno tutti dopo l'estate a cominciare da settembre, il primo sarà concentrato sui dati epidemiologici, il secondo sui dati clinici, poi avremo due tutorial sui dati omici, sui vari tipi di dati omici e poi avremo un tutorial finale sulla condivisione del software che è un altro punto cruciale in questa situazione, in generale in questa situazione. Chi sono le persone convolte nell'organizzazione e nello sviluppo e nell'organizzazione di tutti questi eventi? Un gruppo di persone, di ragazze del CNR che c'è scolato in noi però è anche convolta in uno più dell'infrastrutture a cui vi è accennato, quindi abbiamo Emma Lazarie per open air, RDA e Io Spilla, Gina Pavone per open air e RDA e poi Francesca Deleo, Loredana Lepera e me per Elixir Italy. Prima di guardare un momento insieme il programma di oggi e poi passare la parola ad Emma che è il primo speaker del webinar, vi dirò quindi come vi ha anticipato un paio di informazioni su quale sono le principali iniziativi europee per la condivisione dei dati. Inizio da RDA però insomma ve lo mostro non in un ordine particolarmente significativo, diciamo casuale. Dunque RDA sta per Research Data Alliance ed è una iniziativa, come si so dire, community driven che è nata da, diciamo, nel 2013, da una collaborazione della Commissione Europea, della National Science Foundation del Governo degli Stati Uniti, del National Institute of Standards and Technology sempre degli Stati Uniti e dal Dipartimento dell'Innovazione del Governo australiano. Lo scopo di questa iniziativa è quella di rendere possibile la condivisione del rutilizzo di dati in tutti i modi possibili, in maniera tale che questo possa essere uno strumento per affrontare le più grosse sfide mondiali fra cui, per esempio, in questo momento la sfida che ci pone la pandemia da Covid. Quello che RDA sta facendo, fra le varie cose che sta facendo per l'emergenza Covid è quella di avere prodotto, sviluppato e rilasciato proprio molto recentemente, il 50 giugno del 2020, una serie di linee guida e di raccomandazioni proprio per la condivisione dei dati Covid. Un'altra organizzazione iniziativa assolutamente importantissima è Open Air. Open Air sta per Open Access Infrastructure Research in Europe ed è finanziata già da 2009 e dai, dalla comunità europea, dal sottoforma diciamo nei programmi FP7 e Horizon 2020. Anche questa è una organizzazione che supporta fortemente l'Open Access in Europa, anzi l'idea è quella di fare in modo che i risultati della ricerca finanziata pubblicamente siano resi Open accessibili a tutti, nel modo più ampio e trasparente possibile. Dopodiché abbiamo Elixir. Elixir è un'organizzazione intergovernativa che è stata fondata nel 2013 ma ha iniziato il suo primo programma quintuennale nel 2014 ed è una infrastruttura che fondamentalmente coordina tutte le risorse in Europa per le scienze della vita. Che cosa si intende per risorse? Si intende banche dati, software, materiali per il training, cloud storage e supercomputer. Comprende 22 paesi che vengono chiamati nodi elixir e per un totale perché poi in ogni paese sono membre del nodo e di ogni paese le istituzioni, le organizzazioni di ricerca di ciascun paese. Elixir accoglie più di 220 organizzazioni per la ricerca. Che cosa sta facendo Elixir per supportare la ricerca nell'ambito di Covid? Sta facendo una longa lista, sta facendo tutta una serie di cose importanti che vanno da dare la possibilità di trovare i banchedati dove poter depositare i propri dati oppure rendere possibile l'accesso a dati che sono rilevanti per Covid-19 e così via di scorenda. Non ve le elenco tutte, le potete trovare al sito di cui ho messo il link in basso a destra, ma soprattutto una cosa molto importante quello che è il Covid-19 data portal che è un portale sviluppato dal NDL-DI che è uno dei membri Elixir e è un portale che è veramente pagonato molto recentemente, è stato lanciato in aprile del 2020 e che mette insieme tutti i possibili data set rilevanti per la condivisione e l'analisi dei dati di Covid-19 con gli idea di fornire veramente un supporto e accelerare la ricetta in questo settore. L'ultima infrastruttura di cui vi voglio accennare è l'European Open Science Cloud, iOSC, che è un'iniziativa europea che si propone di sviluppare una infrastruttura cloud che permetta essenzialmente la condivisione di dati. In questo quadro si sviluppano progetti diciamo sotto l'ombrello di iOSC, uno di questi progetti è l'IOSCAPILAR che è un progetto regionale anche questo finanziato dalla Commissione europea per supportare la creazione dell'infrastruttura e i paesi con volche sono l'Italia, il Belgio, l'Astraia, la Germania, la Francia. Dunque l'ultima cosa che voglio dirvi riguardo il programma di oggi comincieremo subito con un piccolo questionario. Saranno solamente due domande. Adesso apriamo una slide dove potremmo vedere interattivamente le vostre risposte alle domande che vi faremo. Quindi dovreste andare utilizzando il vostro cellulare oppure il browser del vostro computer su www.menti.com e poi inserire il codice che vedete qui. Ma adesso quando vi faremo vedere la slide specifica per questo questionario avrete di nuovo si è link per il codice potrete vedere si è link per il codice. Dopo questo piccolo questionario Emma Lazzary ci parlerà del meraviglioso mondo dell'open science, cioè il modello dell'open science e il suo metodo di cooperazione nel contesto in particolare della pandemia in corso e dopo di che vi parlerà in maniera un pochino più approfondita di Open Air e Arcade dicendo sicuramente meglio di come ve l'ho detto io di quali sono le azioni che in particolare Open Air sta facendo nell'ambito di Covid-19. Dopo Emma vi parlerà che ha sanno tesole fondamentalmente di quali sono le azioni di elixir per Covid-19 e quali sono le sfide e le opportunità per l'Italia della condivisione dati in questo momento molto particolare. Come vi ho detto avrete la possibilità di fare le domande nella box Q&A che potete vedere sull'interfaccia Zoom e l'ultima parte del webinar consisterà nel rispondere alle vostre domande. L'ultimissima cosa per chi ha il bisogno di un certificato di partecipazione a questo webinar può farne richiesta seguendo il link che vi verrà poi anche copiato nella chatta quindi insomma non mi preoccupate avrete modo di fare richiesta anche se non vi ricordate adesso questo link. Va bene quindi io mi fermo qui e passiamo al Mentimeter, al questionare di cui vi ho parlato. Allora voi in questo momento dovreste poter vedere il mio schermo con i risultati di Mentimeter, lo vedete mi confermate? Ok perfetto allora state già rispondendo è molto semplice come avete visto basta collegarsi al sito www.menti.com e vi richiede un codice, il codice è 821448 e sarete in grado di rispondere a questa domanda. Questa è una domanda un po' per rompere il ghiaccio oggi e la lasciamo attiva ancora un pochino di tempo per permettere a tutti di poter rispondere e poi proseguiamo con la domanda successiva. Allegra non sa se vuoi commentare vedo che una delle risposte che i partecipanti stanno dando di più è il fatto che loro condividono i dati in accesso aperto e ristretto e questi dati vengono opportunamente trattati quindi questa è una cosa molto positiva. Vediamo che c'è anche qualcuno che non condivide ad oggi i propri dati alcuni condividono con i colleghi e della pova situazione e qualcuno dice non so anche questo è interessante perché non so ci fa pensare che forse non sa come fare. Passerei alla domanda successiva? Vorrei essere sicura che tutti abbiano capito bene come fare per rispondere a questa domanda si tratterebbe di andare utilizzando il pavo browser oppure anche il pavo cellulare o qualsiasi altro device a su www.menti.com e poi appare una casella dove poter scrivere il codice che vedete in alto 821448 e mettendo quel codice avete la possibilità di rispondere in maniera facile va bene direi che più o meno abbiamo possiamo andare avanti ok passiamo alla domanda successiva che io a questo punto vi lascerei aperta in modo che voi possiate pensare un attimo a una risposta da dare questa è una domanda a risposta aperta cioè se ti liberi di scrivere un testo vi ricordo che quello che scrivete è anonimo quindi il vostro nome non compare nella risposta se volete farci sapere chi ha scritto cosa potete scrivere chiaramente il vostro il vostro nome all'inizio del del commento dovrebbe essere anche possibile inserire più di una risposta dunque io vedo vi ricordo che potete usare il question answer per inserire le domande e nel frattempo termino questa visualizzazione ma come ripeto potete continuare comunque ad utilizzare il tool e partirei con invece con una cosa posso dire che ha detto io mi sono distratta questo rimane aperto fino alla all'inizio della discussione la possibili avete possibilità di rispondere a questa domanda fino all'inizio della discussione quindi ok grazie all'egra intanto vorrei ringraziare tutti i partecipanti per essersi collegati oggi vi ricordo che comunque le slide saranno rese chiaramente accessibili a tutti in access aperto ovviamente e saranno disponibili sui vari siti dove avete trovato la notizia di questi webinar così come la registrazione di oggi allora io diciamo il mio intervento di oggi sarà relativo al farvi comprendere un po quali sono le motivazioni che stanno dietro alla scelta dell'open science che hanno fatto diversi enti finanziatori in questi anni in particolare la commissione europea che è dal 2007 che lavora verso una scienza per una scienza più aperta e vedremo anche come questo si inserisceaky in il contesto della pandemia che stiamo vivendo allora io parto con una breve spiegazione di come funziona oggi la scienza perché è importante per capire il contesto dell'open science che vedremo più avanti, innanzitutto i ricercatori iniziano loro percorso un nuovo percorso di ricerca con un'idea, quest'idea necessariamente molto spesso a bisogno di finanziamenti per essere portata avanti, quindi quello che si fa si fa una richiesta di finanziamento quindi molto spesso ancora una volta questi soldi sono soldi pubblici che derivano dalle tasse di tutti noi cittadini, se il finanziamento il progetto viene accettato si inizia l'attività di ricerca, l'attività di ricerca è molto varia, i ricercatori fanno molte cose, ci sono molti aspetti che vengono coperti, quindi si studia, si osservano dei fatti, si strutturano degli esperimenti, si portano avanti questi esperimenti in laboratorio, si raccolgono dei dati e quello che si fa poi si producono dei risultati. Questi risultati possono avere varie forme, sono stati collezionati, sono dei metodologi nuove, dei processi, dei testi, dei report e quello che poi alla fine ad oggi chiude il ciclo della ricerca è il fatto che ad un certo punto i ricercatori scrivono un articolo in una rivista scientifica e questo articolo però purtroppo viene chiuso dietro quello che si chiama in gergo un paywall, quindi diventa una risorsa a pagamento ad accesso limitato e diciamo cancella in qualche modo nasconde tutto il resto dell'attività di ricerca che viene portata avanti invece dai ricercatori e tutti gli altri risultati. Questo poi fa sì che si porti avanti la storia famosa del publisher, cioè i ricercatori sono in qualche modo portati a pubblicare sempre di più altrimenti la loro carriera in qualche modo viene interrotta e non va avanti. Ma come avviene l'accesso alla letteratura scientifica che abbiamo visto essere l'unico prodotto che emerge dell'attività del ricercatore? Beh sostanzialmente l'accesso alla letteratura scientifica è un business quindi c'è qualcuno che paga, spesso è un'istituzione, la vostra istituzione di appartenenza quindi università anti di ricerca che paga un abbonamento per dare ai propri ricercatori l'accesso ai risultati. Che cosa vuol dire? Vuol dire che purtroppo da quando abbiamo avuto la rivoluzione digitale non si possiede più la rivista cartacea ma quello che succede è che si paga per avere accesso quindi per leggere gli articoli scientifici. Tutto questo ha chiaramente dei costi, ci sono dei costi divisi in vari modelli di business. Il modello di business più attivo ad oggi è quello tradizionale ad abbonamento che cosa significa? Significa che una istituzione di ricerca paga ogni anno una quota per dare accesso appunto ai contenuti di alcune riviste. Non si può chiaramente pagare per avere accesso a tutte le riviste che vengono pubblicate ma si fa una selezione. Quanto costa questo tipo di abbonamento? Ha dei costi enormi perché pensate ogni istituzione ogni anno paga da uno a tre milioni di euro per dare accesso alle riviste scientifiche più utilizzate ai propri ricercatori. Questo vuol dire che ogni università o niente di ricerca paga queste cifre in tutto il mondo quindi chiaramente si parla di moltissimi soldi. C'è poi un altro modello che si chiama Gold Open Access. Ora questo modello ha un nome che è simile all'open access di cui parleremo oggi e nei prossimi anche eventi ma non ha niente a che vedere con l'open access che è quello invece richiesto dagli enti finanziatori. Qui si parla di un modello di business che prevede che gli articoli che vengono pubblicati in una rivissa a Gold Open Access siano immediatamente accessibili al pubblico dal momento della loro pubblicazione quindi chiunque potrà andare e leggere quell'articolo. A volte non sempre è richiesto agli autori di pagare quella che si chiama article process in charge cioè una quota per poter appunto pubblicare in quella rivista. Questa quota varia dai 100 ai 6000 euro per articolo e a volte viene pagata direttamente dagli autori in Italia in realtà molto spesso perché poche sono le istituzioni che hanno un sistema centralizzato per il pagamento delle IPC e pochissime veramente poche si contano sulle dita di una mano pochissime istituzioni tracciano questi costi quindi questi costi sostanzialmente sono invisibili e non si vedono nei budget delle istituzioni di ricerca. Non sono quindi tracciati. C'è poi un altro modello che è un modello ibrido dove sostanzialmente il giornale è a abbonamento ma si prevede che un autore possa pagare un IPC per rendere un determinato articolo e solo quell'articolo della rivista ad accesso aperto quindi la rivista è tradizionale ad abbonamento molti articoli sono chiusi in accesso chiuso solo per coloro che pagano l'abbonamento ma qualche articolo può essere reso accessibile a tutti. I costi qui delle IPC sono inferiori a quello del modello gold open access ma quello che avviene in realtà è che questo è il modello più costoso di tutti questo perché è comunque modello da abbonamento quindi abbiamo l'istituzione che paga per la lettura e un'altra intità che spesso appunto è l'autore che paga per pubblicare e questo è il fenomeno che si chiama in gergo double dipping. Ma quanto è il costo di tutto questo? Beh a livello mondiale si stima, questa è una stima in realtà del 2015 quindi è già abbastanza vecchiotta. Questo studio del 2015 appunto ci dice che si paga attualmente le istituzioni di ricerca pagano a livello mondiale 10 miliardi di dollari per gli abbonamenti ai giornali questi sono soldi che le istituzioni pagano per ricomprare sostanzialmente gli articoli che scrivono i loro ricercatori e allora qual è il problema? Beh il problema è evidente a tutti intanto questo sistema non è per niente trasparente questo perché i contratti con gli editori non vengono pubblicati o meglio noi sappiamo quanto viene speso dalle singole istituzioni ma non abbiamo accesso ai dettagli dei contratti. La ricerca ancora oggi può essere letta da poche persone quindi solo sostanzialmente quelli che pagano per avere accesso e con ritardi enormi pensate che il tempo medio di pubblicazione per un articolo è di 18 mesi vuol dire che io oggi faccio una scoperta scrivo un articolo il mio articolo viene pubblicato tra un anno e mezzo e questo è un problema enorme pensate se la ricerca del covid fosse disponibile con questi ritardi chiaramente non è sostenibile non è pensabile. Gli autori quindi voi ricercatori noi ricercatori cediamo in modo gratuito i nostri diritti i nostri copyright agli editori pensando di non avere scelta ma in realtà non è così perché il copyright viene ceduto dall'autore e che invece dovrebbe essere colui che si preoccupa di cedere solo i diritti che gli fanno comodo e non gli altri ma questo non è percepito dai ricercatori. I costi degli abbonamenti crescono ogni anno con una media dell'1-2 per cento pensate a quanto vi ho detto si pagava nel 2015 pensate oggi quanto sono arrivati questi costi e i costi delle IPC come vi dicevo prima non sono tracciati quindi le istituzioni non sono sostanzialmente consapevoli di quanto sia in effetti il costo della della letteratura scientifica pensate però che chi lo fa e ci sono oggi gli strumenti che ce lo consentono scopre molto spesso di pagare esattamente quanto paga per gli abbonamenti quindi quell'1-3 milioni che avete visto prima in realtà sono doppi perché se si potesse conteggiare anche il costo delle IPC. La cosa fondamentale è che in realtà gli editori scientifici fanno immensi profitti sugli articoli che noi scriviamo questo perché sostanzialmente sono aziende che non pagano la materia prima perché gli autori, i revisori, gli editori dei giornali che provengono dalla comunità scientifica non sono pagati per il lavoro che svolgono all'interno del giornale e della rivista. Nel 2010 per esempio Elsevier ha dichiarato di aver avuto un profitto di 724 milioni di sterline con un margine del 36% pensate che questo margine nel 2010 era superiore a quello di Apple, Google e Amazon quindi si sta parlando veramente di molti soldi che in realtà noi potremmo usare per fare ricerca. Ma la domanda è ma perché lo stiamo facendo? Perché i ricercatori spendono tutti questi soldi pubblici per chiudere i propri risultati delle ricerche dietro a giornali, riviste scientifiche, ad accesso limitato e a pagamento? Beh lo facciamo, lo sapete benissimo perché abbiamo un sistema di valutazione della ricerca che si basa proprio sugli indici bibliometrici che derivano dai giornali, cioè ad oggi noi veniamo valutati solo perché scriviamo in determinati giornali, non viene valutata la qualità della nostra ricerca e il suo impatto, solamente viene valutato quante citazioni noi riceviamo e che cosa ci stiamo perdendo in tutto questo? Beh l'abbiamo visto prima, ci stiamo perdendo la gran parte del lavoro dei ricercatori, ci perdiamo per esempio importantissimi i risultati negativi, gli algoritmi, il software che viene realizzato, le proposte di progetto, la peer review, lo sviluppo di prodotti e soprattutto ci perdiamo i dati. E perché invece dovremmo condividere i nostri dati? Perché i dati della ricerca sono così importanti? Beh ci sono vari aspetti, uno di questi chiaramente è la riproduciabilità. Questa è una famosissima frase di Alexander Kohn che io mostro sempre nelle mie presentazioni che dice che un esperimento è riproducibile fino a che un altro laboratorio non prova a riprodurlo. Beh ma la riproduciabilità invece è una parte molto importante della ricerca ed è ancora uno dei principi alla base del metodo scientifico e i dati in realtà rappresentano le prove che quello che noi scriviamo negli articoli corrispondono a verità. Quindi sono un aspetto molto importante perché gli altri dovrebbero crederci quando noi scriviamo e facciamo delle affermazioni nei nostri articoli, se non possono avere accesso ai dati sui quali noi ci basiamo. Beh riflettiamoci perché anche qui ci sarebbe molto da discutere. Questa è un'altra frase interessante di Graham Sill che non è un ricercatore ma è un avvocato che ha assistito i parenti di pazienti di malattierare proprio perché non riuscivano ad avere accesso ai risultati della ricerca che avrebbero invece consentito in qualche modo ai loro cari di portare avanti una vita diversa e lui afferma a un certo punto del suo lavoro che secondo lui pubblicare la ricerca senza i dati è semplicemente fare pubblicità, non è fare scienza. Beh pensate a questa affermazione quanto può essere vera oggi nella pandemia che stiamo vivendo. Pensate anche al fatto che se noi questi dati non li condividiamo e comunque se non li gestiamo nel modo corretto perché poi questa è un po' la chiave di tutti i discorsi che sentirete oggi questi dati poi alla fine vanno persi. Questo è uno studio del 2013 che ha dimostrato che la maggior parte dei dati si parla dell'80% all'epoca dei dati degli anni 90 è andato perso per sempre quindi si parla di milioni, miliardi di euro che sono stati spesi in progetti di ricerca e poi i risultati di questi progetti alla fine sono andati persi per sempre questo perché i ricercatori non hanno gestito i dati nel modo corretto. Questa ricerca ha dimostrato che i dati in realtà forse si trovavano da qualche parte ma nessuno era in grado di avere accesso a questi dati perché magari erano scritti in quaderni di laboratorio che chissà dove si trovavano perché magari erano all'interno di computer che ormai non si accendevano più o che erano andati distrutti perché erano stati salvati in supporti tecnologicamente ormai obsoleti quindi a questo punto la domanda è ma che cosa stiamo facendo cioè la nostra attività di ricerca in che cosa si riduce in realtà e poi ci sono altri aspetti importanti cioè l'aspetto sicuramente dell'integrità della ricerca e della verifica dei risultati questo è un articolo molto famoso che sicuramente di cui sicuramente avrete sentito parlare che mostrava in qualche modo sul quale si basava la famosa teoria della austerità, la austerity. Beh pensate che questo articolo e altri articoli collegati che erano stati pubblicati ad un certo punto vengono in massa ritrattati perché uno studente di dottorato a quale il professore per cui lavorava aveva aveva chiesto di riprodurre i grafici presenti in questi articoli che si basavano su dati pubblicamente disponibili delle amministrazioni dei vari paesi prova a riprodurre questi grafici e non ci riesce quindi a un certo punto disperato manda un email agli autori e dicemi date per favore l'estrazione dei dati che avete utilizzato perché io non riesco a riprodurre gli stessi risultati beh questo studente scopre che il file excel che gli autori avevano utilizzato per produrre questi grafici conteneva degli errori nelle formule che erano state utilizzate quindi gli articoli vengono ritrattati e chiaramente poi si sviluppa tutta una serie di letteratura che in qualche modo commenta l'episodio e commenta quello che è stato scoperto questo succede spessissimo succede in tutte le discipline succede oggi anche con gli articoli relativi al covid come voi ormai avrete imparato a conoscere a sapere oggi oggi si condivide sostanzialmente un grande quantitativo di letteratura anche prima del del processo ufficiale di review beh questa letteratura quindi viene condivisa come preprint ma anche come articoli che vengono in realtà valutati dai pari e possono essere ritrattati in questi giorni abbiamo sentito diverse ritrattazioni anche su riviste prestigiosi come il lan set beh ma questo è un male io direi di no in effetti se noi condividiamo i nostri preprint prima che questi vengano revisionati da un da un team rispetto di esperti quello che facciamo è che permettiamo alla scienza di fare una discussione molto più ampia sulla nostra ricerca in più scoprendo che gli articoli vengono ritrattati anche successivamente alla peer review in realtà ci accorgiamo che la discussione nella comunità scientifica non si ferma con il processo di revisione ma va avanti quindi che cosa significa questo significa che comunque la comunità scientifica è molto attenta ed è perfettamente in grado di capire se ci sono delle falle negli articoli che stanno che sta leggendo e questo va oltre il diciamo tradizionale processo di di review che viene portato avanti dalle riviste scientifiche questo è un blog molto interessante che vi invito a andare a andare a leggere che si chiama retraction watch è un blog che tiene traccia di tutti gli articoli che vengono ritrattati nelle varie discipline c'è un database molto interessante che può essere può essere consultato e da anche la lista degli autori che hanno il maggior numero di articoli ritrattati come vedete ci sono alcuni autori che hanno decine centinaia di articoli che vengono ritirati dalla pubblicazione e poi ci dà anche delle informazioni interessanti questo per esempio è la lista dei primi dieci articoli più citati che sono stati ritrattati ma vengono citati queste articoli anche dopo che vengono ritrattati questo perché chiaramente come potete capire la discussione nella comunità scientifica viene anche in qualche modo stimolata dalla ritrattazione di uno studio importante e questo ci fa anche un po' ragionare sulla valutazione della ricerca e sugli indici citazionali che vengono utilizzati e che non tengono per niente conto del del contesto nel quale avvengono determinate citazioni a volte anzi spesso le citazioni possono essere anche fatte in modo negativo quindi non è detto che un articolo che riceve molte citazioni in realtà sia un articolo con un'alta qualità e allora veniamo un po' al al al cuore del del del del evento di oggi che cos'è che cos'è l'open science beh l'open science come diceva john tenon non è il contrario di closed science ma il contrario di open science è bad science quindi la scienza aperta dovrebbe essere il default della scienza la scienza dovrebbe essere aperta per per definizione in realtà chi non l'apre sta sta facendo cattiva scienza non lo fa nel modo corretto e allora che cosa vuol dire fare scienza nel modo corretto open science vuol dire aprire ogni singolo passo del del processo scientifico del ciclo della ricerca e si basa su un principio fondamentale che è quello che se una ricerca è finanziata con soldi pubblici deve i risultati della ricerca devono essere resi immediatamente disponibili a tutta la comunità e quindi devono avere il più alto impatto possibile i principi poi sono trasparenza riproducibilità collaborazione lo vedremo oggi accessibilità e riuso dei dei risultati che cosa vuol dire poi rendere i risultati aperti nel modo più più ampio possibile beh questo aiuta sicuramente a costruire nuova ricerca a partire dai risultati ottenuti da altro da altri quindi si in qualche modo si si migliora la qualità anche dei risultati della ricerca e loro impatto si incoraggia la collaborazione e si evita la cosiddetta duplicazione dei degli sforzi quindi non si finanziano ricerche che sono già state finanziate da altri quindi si ha più efficienza l'innovazione viene accelerata è stato calcolato che i prodotti che si basano sui risultati della ricerca aperta vengono immessi sul mercato con due anni di anticipo rispetto a quelli che invece si si fondano su una ricerca che viene chiusa dietro il paywall che abbiamo visto prima e poi si coinvolgono i cittadini e la società nel processo scientifico e questo chiaramente aumenta la trasparenza del processo scientifico che cosa vuol dire poi oggi fare collaborazione bella abbiamo visto tutti c'è uno sforzo mondiale nel nel contrasto della pandemia che stiamo vivendo e pensate se oggi i risultati della ricerca del covid fossero chiusi dietro a un paywall sarebbe chiaramente un disastro ancora peggiore di quello che stiamo vivendo quindi gli scienziati ora aprono tutto gli editori scientifici stanno mettendo in accesso aperto tutti i risultati relativi al covid attenzione perché qualcuno ha già detto che però autobre li richiuderà di nuovo tutti quindi questa apertura che all'inizio è stata è stata fatta da qualsiasi editore scientifico sta già cominciando a tornare indietro ma la domanda che io vi faccio è ma se l'open access fosse così deleterio per gli editori che cosa vuol dire che ora lo stanno perché ora stanno invece aprendo tutta la ricerca relativi al covid bella la risposta è che in realtà aprire la scienza velocizza il processo scientifico e ci permette di portare avanti innovazione e di avere un progresso vero e veloce dal punto di vista scientifico ed è per questo che siamo aprendo tutti i risultati del covid chiaramente ma tutte le altre ricerche perché forse la ricerca sul cancro non è ugualmente importante la ricerca ambientale non è ugualmente importante perché solo il covid e perché solo per un breve periodo di tempo importante è anche condividere i risultati perché molto spesso chi prende le decisioni anche per noi basa le sue decisioni sui risultati della ricerca lo abbiamo visto e lo vediamo particolarmente oggi con il covid i policy maker basano le proprie decisioni e le raccomandazioni che hanno nei confronti del pubblico proprio sulle evidenze scientifiche e se queste sono chiuse chiaramente capite che c'è qualcosa che non va e c'è un cortocircuito in tutto questo processo ma che cosa vuol dire fare open science in pratica beh open science è un termine ombrello che comprende una serie di attività si parla di apertura e non solo delle pubblicazioni scientifiche ma anche dei dati ma delle risorse di formazione e tutto questo si inseriscela in un contesto dove ci sono tre pilastri fondamentale il primo è l'integrità della ricerca poi abbiamo un cambiamento che sarà necessario e che è già in atto in questo momento in molti paesi e la discussione sta partendo adesso anche a livello proprio europeo centralizzato del cambiamento sulla valutazione della ricerca e poi servono chiaramente infrastrutture che ad oggi esistono già per poter permettere agli scienziati di fare open science uno degli elementi fondamentali dell'open science è l'open access alle pubblicazioni e ad altri risultati della ricerca quindi anche ai dati e che cosa significa significa dare accesso libero gratuito e senza restrizioni online ai risultati della ricerca attenzione perché questo non vuol dire pagare per pubblicare quindi non confondete come vi dicevo prima il modello gold open access con il l'open access che che invece vuoi al quale vi vi che di cui vi parleremo oggi come fate quindi a dare accesso aperto ai vostri risultati bello potete fare attraverso quelli che si chiamano repository che cosa sono i repository sono degli archivi online che consentono di di caricare degli oggetti digitali quindi si parla di dati pubblicazioni software qualsiasi tipo di oggetto digitale il risultato in questo caso della ricerca e che portano avanti una policy una politica di archiviazione a lungo termine ci sono vari tipi di repository istituzionali tematici o disciplinari di letteratura quindi di articoli oppure di dati oppure anche che sono in grado di di farvi condividere e conservare qualsiasi tipologia di oggetto digitale quindi le due diciamo principali i due principali scopi di un ripositori sono la conservazione e la condivisione quindi conservazione dei vostri risultati abbiamo visto essere fondamentali per per non perdere i risultati della ricerca questo si può fare perché i gestici un repository è solitamente un istituzione un università un centro di ricerca un infrastruttura oppure una comunità scientifica molto solida pensate all'esempio di archive per la fisica che quindi è in grado di conservare di garantire una conservazione a lungo termine dei contenuti del repository poi vi permette anche di condividere le informazioni direttamente dalla piattaforma condividere non significa necessariamente mettere in accesso aperto quindi aprire a chiunque i risultati ma potete decidere chi è come e quando avrà accesso magari ai dati che che avete caricato sulla piattaforma questo ci porta poi a un altro a un altro discorso più ampio che è quello della gestione dei dati e poi anche estendendo ai tutti i risultati della ricerca perché li dobbiamo gestire nel modo corretto beh perché la gestione dei dati ci permette di avere un impatto e una visibilità come ricercatori chiaramente migliore di quella che che abbiamo non gestendo in nessun modo i nostri dati abilita il riuso quindi ci potrebbero essere anzi sicuramente ci sono dei ricercatori nel mondo che a partire dai vostri dati potrebbero tirare fuori dei risultati che voi non avevate pensato ma ci inserisceavescia anche in un contesto più ampio lo abbiamo visto di trasparenza e di affidabilità della ricerca la riproducibilità dei risultati è garantita dal fatto che si può dare accesso ai dati sui quale si basano le nostre affermazioni poi chiaramente come vediamo in questo in questo momento si abilita una grande collaborazione i dati in realtà dovrebbero essere gestiti seguendo quelli che si chiamano i principi fer ora non parleremo qui di principi fer li vedremo magari nelle nelle negli eventi che abbiamo preparato per voi più avanti sostanzialmente fer è un acronimo che ci aiuta ad attivare delle delle politiche che permettono delle buone pratiche che ci permettono di condividere nel modo corretto i nostri dati non vuol dire aprire i dati ma vuol dire preparare i dati per il riuso da parte di altri questi dati devono essere quindi findable accessible interoperable reusable che vuol dire che devono essere trovati devono avere una collocazione ben definita devono essere accessibili per almeno dieci anni e deve essere chiaro chi e come può avere accesso ai dati devono essere interoperabili quindi le macchine devono poterle leggere i computer possono devono poter leggere questi dati e dovrebbero essere facilmente integrabili con altri dati tutto questo nell'ottica che questi dati vengano poi riutilizzati da altri ma quanto ci costa gestire i dati in realtà quanto ci costa gestire i dati lo possiamo calcolare ma non è così importante come sapere quanto ci costa in realtà non gestire i dati questo è uno studio che la Commissione europea ha pubblicato l'anno scorso dove è stato calcolato quanto ci costa attualmente non avere dei dati della ricerca che aderiscono ai principi fer ci costa pensate ad oggi dieci miliardi di euro l'anno in tutta Europa con un costo diciamo collegato quindi questi sono costi diretti per la non gestione dei dati con un costo collegato di altri 16 miliardi di euro l'anno in Europa quindi è importante gestire i dati è importante condividerli che cosa sta facendo l'Europa oggi per permettervi di gestire condivideri risultati della ricerca covid in particolare nel modo corretto le iniziative abbiamo visto all'egra ce l'ha descritta io ora vado un pochino più nel dettaglio ma vi lascio poi tutti i link per poter approfondire open air ha realizzato in in collaborazione con il serne di genevra che gestisce Soft che gestisce captured zenodo che è un repository forse probabilmente lo conoscete già che è stato sviluppato proprio grazie alla commissione europea zenodo è un repository che chiunque può utilizzare per condividere la sua ricerca all'interno di zenodo abbiamo creato uno spazio dedicato alla ricerca covid quindi c'è una community dove voi potete caricare articoli preprint ma anche dati che non trovano altra altra collocazione lo vedremo poi più avanti specifica e poi ha creato quello che si chiama covid gateway cioè un punto un unico punto di accesso per i risultati delle ricerche relativi a covid quindi si parla di pubblicazioni ma anche di dati software e altre risorse c'è poi la parte che diceva allegra relativa alla research data alliance che ha creato questo gruppo di lavoro dove gli esperti di tutto il mondo hanno dialogato fra loro per scrivere queste raccomandazioni per la condivisione di diversi tipi di dati si chi si parla di dati clinici dati omici epidemiologici e quelli relativi alle scienze sociali chiaramente ci sono anche aspetti legali e considerazioni etiche che sono state raccolte e questo è stato un grande sforzo che ha portato alla versione finale di queste linee guida che sono uscite il 30 giugno questo è uno sforzo vorrei farvi notare che è stato però portato avanti in modo collettivo cioè queste raccomandazioni hanno avuto diverse versioni che sono state rese pubbliche condivise con tutta la comunità scientifica che ha avuto modo di commentarle prima di arrivare alla versione definitiva e questo è il metodo di lavoro che in realtà rda usa per qualsiasi tipo di problema relativo alla condivisione dei dati vi lascio poi con un ultima slide relativa a le risposte che sono state riportate da vostri colleghi durante tutta una serie di eventi eventi pubblici del motivo per cui non condividono i propri dati le le potete guardare ora le potrete guardare poi quando vi lascerò le slide una delle cose principali che emerge che i ricercatori hanno paura a condividere i loro dati perché secondo loro questi dati sono in qualche modo sbagliati oppure non sono non sono puliti e i loro colleghi probabilmente leggendo li potrebbero trarre conclusioni errate e poi vi lascio con l'ultima chicca che mi è stata lasciata tempo fa da un direttore di un istituto di ricerca al quale io stavo cercando di spiegare l'importanza della condivisione dei dati e come poteva fare lui per condividere i suoi dati e i dati dei suoi ricercatori lui a un certo punto mi ha interrotto e mi ha detto guardi che io non voglio condividere i miei dati io voglio che lei mi dica come faccio a usare i dati degli altri questo con questo io vi lascio passo la parola chiaramente a graziano per continuare le presentazioni di oggi graziano ci sei ci sono intanto potete vedere parte delle risposte che state dando ok vai intanto chiedo se vedete lo schermo si perfetto allora buonasera a tutti e ringrazio allegra edemma per quanto ci hanno raccontato che pensano tutti noi diciamo conosciamo bene ora è evidente che questa pandemia veramente ci ha portato a capire l'importanza della condivisione dei dati perché diciamo in italia soprattutto non c'è una tradizione in questa direzione che riguarda in particolar modo come vedremo tra un attimo soltanto particolarmente interessante clinico quindi diciamo per quanto abbiamo vissuto e stiamo vivendo un momento veramente difficile come diceva di andré dai diamanti non nasce niente magari dai dalle tame nascono i fiori quindi nel senso che da una situazione veramente critica almeno in questo campo possiamo in qual modo trarne un insegnamento che ci potrà guidare per il futuro quindi ecco perché opportunità e sfide il titolo del webinar di oggi era appunto perché in italia si fa troppo poco effettivamente in italia si fa troppo poco per due ragioni intanto perché si producono pochi dati e in modo frammentato e poi anche perché questi pochi dati o non vengono condivisi o vengono condivisi male come già avete un po di stato presentato la problematica di condividere e riusare il più possibile i dati è una sfida globale nel senso che se c'è un'informazione più questa informazione viene usata e condivisa più il suo valore aumenta e quindi da questo un po nasce l'iniziativa open science cloud che va un po al di lanche dell'ambito delle scienze della vita che come è stato già raccontato all'obiettivo di mettere le basi per una scienza aperta in Europa e a livello internazionale avete già sentito del rda che appunto si colloca in in quest'ambito e anche questa diciamo ci dà delle linee guida molto importanti per come dire darci indicazione non solo sull'importanza della condivisione di dati ma anche su come questi dati vanno condivisi in modo che i dati siano interoperabili. Vi faccio un semplice esempio supponiamo di in campo covid che poi riprenderemo successivamente una delle informazioni più rilevanti sui pazienti e lo stato del paziente ora avete imparato a familiarizzare con una serie di terminologie sintomatico a sintomatico pauci sintomatico e così via ma cosa vogliono dire questi termini in che modo vengono attribuiti. È evidente che se non abbiamo uno standard comune sia nell'uso delle parole che nel significato delle stesse diciamo i dati e le informazioni che vengono prodotti di fatto sono poco utilizzabili e quindi sono poco riutilizzambili e come vi diceva prima Emma c'è un documento molto corposo sviluppato da RDA che diciamo supera le 100 pagine che ci dà tutta una serie di indicazioni molto importanti su come su quali tipologie di dati vanno condivisi e con quali modalità. In questo si colloca anche l'infrastruttura elixir che come vi ha già detto Allegra è una organizzazione intergovernativa che si occupa diciamo di mettere insieme tutta una serie di strumenti per la condivisione e l'utilizzo dei dati nel campo delle scienze della vita che quindi includono basi di dati, strumenti di analisi, materiali training, best practice ma anche ovviamente infrastruttura i ct quindi l'obiettivo di elixir è quello di mettere a fattor comune tutte queste risorse su scala europea in modo da massimizzare l'uso che è possibile fare della ricerca nel campo delle scienze della vita. Molto brevemente per chi di voi non conoscesse l'infrastruttura organizzazioni elixir e organizzate in cinque piattaforme che qui vedete diciamo all'interno di questa slide strumenti potenza di calcolo training interoperabilità i dati che servono una serie di user community che appunto utilizzano queste piattaforme per varie finalità ad esempio nel campo della pandemia è rilevante citare human data, rdc, proteomics e così via. Qui ci sono tutta una serie di comunità di esperti che utilizzano questa infrastruttura per trarre il massimo utilizzo dai dati e dalle ricerche che vengono condotte. Giusto una parola per raccontarvi del nodo italiano di elixir che come vi ha già detto Allegra è anche infrastruttura italiana e una infrastruttura distribuita coordinata dal CNR e che vede il coinvolgimento di 23 istituzioni che includono diverse università, centri di ricerca ma anche istituzioni tecnologiche tipo l'INFN, il CNEC, il GAAR anche perché è importante che mettere a fattor comune non solo il NOAO nel campo della ricerca delle scienze della vita ma anche le piattaforme tecnologiche in modo tale da poter gestire al meglio le informazioni insieme in termini di potenza di calcolo che di capacità di storici. Come dicevo prima questa pandemia ci ha messo di fronte alla necessità di condividere i dati e le scoperte in modo da accelerare il più possibile la ricerca per fronteggiare questa pandemia perché è evidente che più le informazioni prodotte vengono riusate più volte più è probabile che la ricerca e la conoscenza possa fare progressi più rapidamente e in questo caso noi abbiamo bisogno di procedere nel modo più rapido possibile. Questa è la ragione per cui una delle iniziative che è stata avviata dalla Commissione europea in collaborazione con laboratori europeo di biologia molecolare e l'Istituto europeo di bioinformati con l'EBI di creare il COVID-19 in data portal cioè un punto di accesso per tutte le risorse di dati di informazione di NOAO che i paesi membri e quindi i gruppi di ricerca afferenti potessero mettere a disposizione in modo da accelerare la ricerca nel campo. Ora di che cosa stiamo parlando? Questa è l'unica slide un po' più scientifica. Ovviamente se parliamo di dati dobbiamo capire quale il nemico che dobbiamo fronteggiare. Come sapete si tratta di un virus RNA che è costituito da un genoma RNA di circa 30.000 nucleotidi. Questo genoma utilizza l'informazione genetica sia per produrre l'armamentario per la propria riproduzione che è cosiddette proteine strutturali che servono a propagare le particelle virali ad altri ospiti. Ovviamente in questo caso l'ospite umano quindi è evidente che il virus vive e funziona solo quando riesci a infettare una cellula ovviamente umana e quindi per comprendermi il suo funzionamento, la sua virulenza e le sue capacità infettive dobbiamo ovviamente comprendere questo processo e quindi avere informazione sia sul genoma che ovviamente è costituito da una stringa di 30.000 caratteri ma anche sui suoi prodotti di espressione quindi le proteine, i RNA subgenomici discontinui che guidano la traduzione le proteine strutturali che come dire ricostituiscono le particelle virali che poi andranno a infettare altre cellule. Dobbiamo comprendere l'interazione fra la particella virale e il recettore dell'ospite e quindi abbiamo tutta una serie di informazioni che chiameremo omiche che riguardano quindi non solo l'espressione del genoma virale, l'espressione degli RNA messaggeri virali, la struttura tridimensionale delle proteine virali e del recettore dell'ospite e tutti i pattuei che vengono in qualche modo accesi durante il processo di infrezione. Quindi chiaro, quelli che chiamo SARS-CoV-2 FACTS, noi possiamo in qualche modo passare in rassegna i possibili dati e ci renderemo conto che purtroppo ben poco è stato fatto. Quindi quali sono i dati che possiamo condividere? Tutti i giorni sentite parlare di tamponi. Ora il dato che viene reso pubblico dal Ministero della Salute è un dato binario, nel senso che abbiamo numero di tamponi effettuati, numero di tamponi positivi. Questo è un dato assolutamente sottodimensionato rispetto al bagaglio di informazione che questi dati ci possono dare. Ad esempio il dato del tampone, a parte tutte le informazioni sperimentali su come questo tampone è stato ottenuto, ci danno anche dei dati quantitativi che in qualche modo sono correlati alla carica virale, il cosiddetto valore CT. Ora se noi avessimo disponibili i valori di CT, quindi la carica virale dei diversi tamponi nel tempo e nello spazio, avremmo uno strumento potentissimo per seguire la pandemia e capire se ad esempio la carica virale più bassa, più alta e come si si muove nel tempo e nello spazio. Ad oggi questi dati non sono disponibili, non solo, ma tampone positivo negativo, giusto per fare un altro esempio, dipende anche dall'approccio sperimentale che è stato usato. Come sapete il tampone si fa con un esperimento di real time PCR, per fare una real time si usano uno o più target che sono i geni del virus, tipicamente la proteina N, la proteina E o la proteina S, per cui usiamo vari primer, vari laboratori usano varie metodologie per fare questi tamponi e non è detto che i risultati siano compatibili. Nella mia esperienza diciamo personale sappiamo che abbiamo sia falsi positivi che falsi negativi. Se questi dati fossero disponibili avremmo degli strumenti molto più efficaci per minimizzare falsi positivi e falsi negativi. Secondo tipo di dato le sequenze del genoma virale, a che cosa ci servono? Ci servono a capire in che modo il genoma muta, quali sono le mutazioni, quali sono le implicazioni funzionali di queste mutazioni. Ma naturalmente non solo abbiamo bisogno dell'informazione del genoma, ma abbiamo bisogno anche di conoscere i prodotti di espressione del genoma per capire in che modo vengono espresse le proteine strutturali, ma non solo avremmo anche bisogno di conoscere i dati grezzi da cui diciamo la sequenza genomica è stata ottima e perché abbiamo bisogno di conoscere anche questi. Perché solo avendo a disposizione i dati grezzi possiamo sapere ad esempio se c'è una coinfezione, quindi due cipi virali, che hanno infettato lo stesso ospite. Ad oggi pochissimi, a fronte dei dati genomici presenti, pochi di questi hanno anche i dati grezzi. Ovviamente il virus interagisce kl con l'uomo, con le cellule dell'ospite e quindi in che modo l'infezione virale altera il profilo di espressione dei diversi tipi cellulari dell'ospite e così via. Quindi vedete in questa rassegna tutti i tipi di dati che potrebbero essere, come dire, condivisi i dati di espressione, proteine, strutture importantissimo, diciamo anche quest'ambito, perché conoscendo la struttura delle proteine virali potremmo, come dire, predire ad esempio l'interazione di farmaci e ad esempio l'efficacia di vaccini, quindi target e farmaci e moltissimi altri. Ad esempio qua faccio due esempi, l'imaging e il clinical data. Avrete visto, se fate una ricerca, molte radiografie polmonari. Ora associare i dati genomici ai dati di imaging che vengono dalle radiografie polmonari è un altro tipo di dato che sarebbe molto interessante, oltre ai dati clinici su cui poi torneremo in seguito, che diciamo anche questo è il vero tallone d'akile di tutta la faccenda. Quindi come vi ho già raccontato a livello europeo si è sviluppato questo Covid data portal che di fatto altro non è una casa, quindi una sorta di data infrastructure che di fatto è relativamente utile se non viene come si usa in modo gergale, popolata con i vari tipi di dati, quindi vedere un po le sequenze, i dati di espressione, le strutture e così via. E chi la deve popolare? I vari gruppi di ricerca che in tutta Europa, in tutto il mondo lavorano per ottenere strumenti sempre più efficaci per fronteggiare la pandemia. Quindi diciamo lo schema e il seguente abbiamo dati che derivano dei pazienti, questi dati confluiscono attraverso le infrastrutture nazionali, quindi il sistema sanitario nazionali, i laboratori nazionali o i laboratori di ricerca che producono i dati e eventualmente attraverso le infrastrutture di ricerca che possono fornire un supporto su questo e ci sono tutta una serie di infrastrutture di ricerca che stanno lavorando attivamente in Europa per supportare la ricerca per la pandemia, quindi non solo elixir, ma gli ebiemerae per le biobanche, quindi i campioni biogici e atris che diciamo la medicina traslazionare, i euro by imaging, quindi le immagini in ambito bioedico, instruct le strutture, ma tutte queste infrastrutture a loro volta sono diciamo case che se non vengono riempite e riempite in modo corretto tutti gli sforzi sono di fatto inutili. Uno sforzo diciamo un esempio che porto sempre, che ricordò sempre, è l'esempio svedese. All'irello svedese è stata fatta un'azione concertata su scala nazionale per coordinare le attività di ricerca, ad esempio in Svezia tutti i gruppi che si sono messi a fare ricerca genomica nel campo del Covid-19 sanno che questa ricerca la fanno con soldi pubblici, ma hanno come dire come indicazione top down quella che i soldi poi gli vengono dati, se i dati vengono resi open access, altrimenti non beccano il finanziamento, quindi loro sono obbligati a seguire delle precise procedure di data sharing perché sono fruitori di fondi pubblici. E quindi all'irello svedese si sa quali sono i progetti di ricerca che si stanno portando avanti, quali sono i dati che questi progetti hanno prodotto in vari settori, vedete qui questa slide, dati di genomiche trascrittomiche, proteine, image e così via. Quindi uno ha, diciamo, non solo la casa, ma come questa casa viene riempita a livello nazionale. Quindi questo è un esempio, diciamo, virtuoso. In Italia tutto questo, diciamo, non è propriamente possibile, perché non è possibile. Ora ve lo dirò tra un momento, c'è uno sforzo in questa direzione. E lo sforzo maggiore che rappresenta anche la maggiore criticità in ambito europeo è quello di rendere, diciamo, interoperambili i dati biomedici, biomolecolari e i dati clinici. E su questo c'è una... siamo molto molto indietro soprattutto per quanto riguarda i dati clinici, nel senso che non esiste un'ontologia, non esistono dei vocabulari controllati e di fatto ogni centro clinico produce i suoi dati alle cartelle cliniche che vengono fatti in modo assolutamente disomogeneo in Italia, dove come sapete la sanità è governata livello regionale, ma anche all'interno della stessa regione ogni, diciamo, ospedale, ogni clinica ha i suoi standard, diciamo, ogni gruppo ha le sue abitudini per far tutto questo. C'è stato richiesto dall'Europa di, come dire, facilitare il compito dello sharing in questo campo ed è stato creato un gruppo di lavoro promosso dal coordinatore Esfri Italiano che è il professor Rossi che vede appunto la partecipazione del dottor Zambelli come rappresentante di Elixir, la dottoressa Minghetti dell'Istituto Superiore di Sanità e il dottor Grigioni sempre dell'Istituto del Superiore di Sanità come rappresentante del Ministero della Salute. Come dicevo perché in Italia è tutto più difficile, in Italia è tutto più difficile perché c'è uno scollamento assoluto fra la ricerca e la pratica clinica. Come sapete la ricerca è a pannaggio del Ministero della Ricerca e la salute è a pannaggio del Ministero della Salute e questi due ministeri seguono, diciamo, vie parallele che si incrociano pochissimo con indicazioni diverse e che quindi l'uno non sa cosa sta facendo l'altro. Ad esempio le infrastrutture di ricerca sono per lo più governate dal Ministero della Ricerca e di fatto fino a poco tempo fa il Ministero della Salute nemmeno sapeva che queste esistessero. Queste infrastrutture sono finanziate con soldi pubblici quindi è importante che tutti gli sforzi vengono messi a fattor comune. Ci stiamo provando ma vi assicuro che è molto difficile, tanto è vero che se io facessi un censimento fra i partecipanti a questo webinar gli pare che piuttosto improbabile che ci sia qualche partecipante che viene dalla realtà clinica però magari questo poi lo vedremo successivamente. Qui vedete diciamo tutta una serie di possibili attività che è possibile fare per rendere i dati accessibili, per rendere di fare e così via su cui diciamo non ritengo utile soffermarmi perché potrebbe essere molto più interessante la discussione successiva. Giusto per focalizzare il punto quello che per noi è fondamentale per fare progressi rilevanti nella ricerca è incrociare dati clinici e dati diciamo chiamiamoli omici. Quindi come faccio a dire che un virus è più aggressivo o meno aggressivo se non posso correre i dati genomici con i rispettivi dati clinici? Al momento questo di fatto è praticamente impossibile e quindi ho bisogno di fare studi di popolazione che siano studi in qualche modo su campionamenti ampi che mettono insieme queste due tipologie di dati. Ora diciamo fortunatamente almeno in Europa e in particolare in Italia l'emergenza si attenuata quindi questo è il momento in cui ha fatto il massimo sforzo per mettere a fattor comune le risorse, le esperienze e fare uno sforzo in questa direzione. Abbiamo come l'exil dei contatti con i colleghi dell'Istituto Superiore di Sanità e come dire stiamo cercando di per esempio determinare qual è il minimum set di informazioni cliniche con i vocabulari appropriati per fare uno sforzo in questa direzione. In tutto questo diciamo ci dobbiamo anche confrontare con il GDPR, cioè le regole europee per la protezione dei dati. Ora è evidente che anche questa parolaccia GDPR in ambito clinico è di fatto una parola ignota nel senso che non è impossibile condividere i dati molecolari e clinici se si seguono una serie di precauzioni, ma quello che serve da un lato avere l'infrastruttura e le personalità deputate a far questo ad esempio importante che ogni istituzione individui un data protection officer che in base all'attività che svolge venga reddato un DPA, data protection impact assessment e poi diciamo è possibile perché ci sono essenzioni per la ricerca scientifica rendere queste informazioni utilizzabili, cioè qual è l'obiettivo del GDPR è non rendere come dire possibile risalire all'identità del paziente ovviamente per problematiche di privacy, ma ci sono tutta una serie di pratiche di procedura che di fatto rendono possibile questa attività ma purtroppo le nostre istituzioni cliniche vi ripeto non sanno nemmeno cos'è la GDPR. Vi dico semplicemente che avendo avuto interazioni con diversi ospedali alla faccia della GDPR ho ricevuto diciamo dei tamponi, dei campioni in cui nel foglio Excel ci era riportato il nome il cognome e l'indirizzo dei pazienti da cui questi campioni provenivano altro che pseudo anonymizzazione. L'opendeta è oltretutto importantissima anche per fact checking. Ora in questo periodo di pandemia immagino che tutti quanti abbiate come dire assistito alle passerelle dei cosiddetti virologi o come dire opinionisti virologi che ma non solo ma anche politici perché come sapete ormai tutti parlano di scienza. Se i dati sono condivisi questi servono non solo agli scienziati per poter riprodurre e riusare le ricerche ma servono anche per verificare le affermazioni dei colleghi e quindi è un fatto fondamentale non solo per il progresso della ricerca ma anche per la società che in questo modo può avere come dire la possibilità di verificare le come dire le notizie che vengono dati. Vi riporto solo due esempi questo è il comunicato stampa del governatore Zaya ho fatto sequenziare il ceppo serbo attenzione e più virulento di quello locale perché pare che abbiano trovati in questo ceppo serbo diciamo una mutazione che non conosciamo. Ora nel pannello che vedete a destra vi dico che la maggior parte ovviamente i virus cambiano tutti i virus cambiano cambiano moltissimo noi nell'analizzando come dire oltre 20.000 genomi qualche tempo fa avevamo identificato oltre 9.000 cambiamenti bene la maggior parte di questi cambiamenti era presente in un unico genoma quindi da un punto di vista funzionale epidemico di fatto è assolutamente irrilevante solo l'1% di questi cambiamenti cioè una cinquantina erano presenti in più dell'1% dei genomi virali sequenziati quindi quando si fanno queste affermazioni diciamo se non sono corredate da solidi dati scientifici diciamo facciamo come dire come diceva prima in bad science. Ultimo comunicato stampa questo ha avuto un eco enorme sul sui giornali anche perché fondazione cariplo ha finanziato con un budget cospicua uno studio e qua vi dice questo è un articolo del corriere della sera lo studio della fondazione cariplo ha esaminato le sequenze del genomo di 350 pazienti il confronto genetico permetti di migliorare così via. Ora diciamo di questo studio non c'è traccia da nessuna parte nemmeno nei preprente di cui parlavamo prima cioè quel bio archive dove uno mette le pubblicazioni scientifiche e nemmeno questi 350 genomi non ci sono semplicemente non ci sono quindi su che cosa si basa questa affermazione ora diciamo è importante anche che i media su questi aspetti maturino perché prima di pubblicare una notizia di questo tipo dove come vedete nel nel cartù sotto si parla di ceppo a più veloce e ceppo b più lento dove non c'è nessuna base scientifica per dire che un ceppo sia più veloce o più lento perché semplicemente non c'è questo dato ora diciamo è importantissimo che la crescita non riguardi solo la comunità scientifica ma anche la società e soprattutto i media che riportano diciamo questa informazione per concludere qual è la situazione in italia allora ad oggi i dati i genomi virali pubblicati e pubblicati diciamo i depositori più grandi è un deposito che si chiama gisade che al momento contiene 68.000 genomi virali l'italia come vedete qui la freccetta è uno dei paesi che ha contribuito meno e fra i paesi occidentali è veramente un fanalino di cosa in italia in totale abbiamo 201 genomi in totale disponibili sempre in questa piattaforma g6 convia detto prima Allegra in genbank ce ne sono ancora meno ma diciamo è un problema di lag time perché poi i genomi di g6 poi dovrebbero andare a finire anche in genbank diciamo noi nel nostro piccolo ne abbiamo prodotti 34 però tutti quelli pugliesi e lucani che sono tutti liberamente disponibili e per quanto ci consta tutti i genomi italiani appartengono lo stesso ceppo quindi due ceppi più veloci della bergamasca io li vorrei come dire di dire sono tutti dello stesso ceppo e eccetto i due genomi cinesi dei due cognogi i due ricoverati allo spalanzane di cui sicuramente avete avuto notizie cosa possiamo fare qual è il contributo di elixir il contributo di elixir naturalmente mettere a disposizione le sue infrastrutture ct sia per lo storage e l'accesso iranti mettere a disposizione vuol dire che queste piattaforme sono accessibili senza pagamento di fee al momento mettere a disposizione un sistema galaxy cloud che consente di fare analisi di dati sensibili in modo compliant alla alla normativa gdpr può dare nuau quindi fornire assistenza ai colleghi clinici e non solo per vendere questi diate fea e per facilitarne la integrazione come dati clinici come dicevo è il veramente il punto clinico critico di tutta la vicenda e questo grazie veramente al lavoro esemplare che sta facendo allegra promuovere attività di training a vari livelli per come dire insegnare ai ricercatori come rendere i dati fair e riusabbili il più possibile e con questo diciamo ho concluso e sono diciamo disponibile a rispondere alle vostre domande allora per quanto riguarda le domande mi sentite mi sentite tutti buonasera a tutti allora potremmo partire con le domande giusto sì sì ok e abbiamo ricevuto una serie di domande con il formidiscrizione la prima è cosa si sta facendo per raccogliere informazioni riguardanti i genomi dei pazienti in metadati ad essi associati allora come dicevo questi dati vanno a finire in vari repositori il repositori più rilevante e gisade che molti di voi conoscono e per sottomettere i dati a gisade va anche riempito un form con un set di metadati che per la verità è molto limitato che ad esempio ovviamente contiene l'informazione del data in cui il campione è stato prelevato la collection date e il clinical status del paziente però come vi dicevo a parte che il su questo non c'è un vocabolario controllato in modo tale da rendere facilmente riusabili questi dati molti dati si non ci sono quindi cosa si sta facendo non c'è nessuna indicazione top down ad esempio fondazione cari plo che ha fatto il comunicato stampa non ha detto ai gruppi di ricerca che ha finanziato che questi dati dovevano essere risi disponibili quindi ammesse non concesso che questi 350 genomi ci siano è chiaro che vanno depositati nei repositori internazionali riconosciuti cosa si sta facendo non so che dirvi cioè è importante che i funding bodies diano disposizione in questo senso e ci sono funding bodies privanti che fanno quello che gli pare anche se cari plo di fatto non è propriamente privata perché pagino chi abbia una partecipazione la regione bombardia è incortante che faccia lo stesso il ministero della salute ma non mi risulta che nei progetti ora c'è stato un'altra col diciamo queste fast call ministero salute che dia indicazioni precise sull'obbligo di rendere questi dati come dire open access è disponibili quindi noi che stiamo facendo moral suation ma più di questo non possiamo fare quindi è importante che ci siano delle azioni concertate di tipo top down dei funding bodies in particolare quelli pubblici che devono dare indicazioni in questo senso quindi più di questo non so che dirvi ok allora un'altra domanda che è stata posta con il formi di scrizione oltre alla condivisione dei dati quello che riscontra spesso la difficoltà di ottenere metadati associati al dato genomico trascrittomico eccetera questo rende di fatto complicato se non impossibile una qualsiasi forma di analisi statistica perché non permette di stratificare correttamente i soggetti cosa ne pensate che ha perfettamente ragione nel senso che ad esempio se si sottomettoni i dati a g6 ma anche a gemmen che non c'è un set minimo di metadati obbligatori da inserire quindi non tutti i dati g6 sono diciamo ugualmente ricchi di metadati oltre tutto questi dati non sono disponibili perché g6 diciamo ha una sua governance un po' diciamo privatistica che così può far al momento nulla ok allora poi un'altra domanda è più aperta direi qual è il ruolo dell'abbio informatica in questo momento ed è in particolare ed in particolare come può aiutare ad anticipare le prossime mosse del virus il ruolo dell'abbio informatica è assolutamente strategico perché l'abbio informatica si occupa di intanto di della gestione e della conservazione dei dati nell'ambito di live science quindi ci dà tutta una serie di strumenti che ci dicono come immagazzinare i dati diciamo omici in modo che poi siano diciamo riusambili e ci offre tutta una serie di strumenti per produrre conoscenza biologica ad esempio l'abbio informatica ci può aiutare a capire se date le sequenze dei genomi virali ci sono dei sottotipi virali e che questi sottotipi virali quali sono e come evolvono nel tempo nello spazio e questo ci fa capire cosa ci possiamo aspettare quindi una seconda una tertondata ci possono far capire studiando come dire la struttura del recettore e delle proteine virali come cambia l'interazione e quindi l'abbio informatica ci ha fatto capire ad esempio che SARS-CoV-2 ha un grado di infettività maggiore di SARS-CoV che di farci sappiamo ha riguardato poche migliaia di persone perché c'è stata una disgraziatissima inserzione di 12 nucleotidi quindi analizzando il genoma abbiamo visto questo dato che rende come dire l'ingresso del virus nella cellula molto più agevole quindi l'abbio informatica ci ha fatto capire questo naturalmente ovviamente da indicazioni poi agli esperimentali per testare e validare le ipotesi che l'abbio informatica fa diciamo che sono ovviamente di carattere più previttivo quindi l'abbio informatica gioco un ruolo fondamentale bene allora adesso possiamo passare a raccogliere alcune domande che sono invece state scritte diciamo durante il webinar nella sezione di domande nel box delle domande per esempio qualcuno chiede chi assicura i ricercatori che i dati depositati non vengano usati d'agziende private per perseguire i propri scopi e guadagni in fondo l'esperienza del sequenziamento del genoma umano in parte mi sei luce anche l'enorme vantaggio che venter ebbe non so emma vuoi rispondere a questa domanda si posso rispondere io beh dunque lo si può fare con attraverso le licenze cioè quando noi mettiamo a disposizione qualcosa è buona norma associare a il materiale che mettiamo a disposizione quella che si chiama licenza di riuso le licenze di riuso più utilizzate nell'open science sono le creative commons e ci permettono di per esempio di indicare che noi non vogliamo che il database che mettiamo a disposizione sia utilizzato ai fini commerciali ora però questo mi permette di fare una riflessione la domanda è perché noi non vogliamo che qualcuno guadagni dalla nostra ricerca perché forse vogliamo guadagnarci noi ma davvero lo faremo poi magari in un futuro perché se qualcuno ha un'idea e sfrutta commercialmente in qualche modo i risultati a cui noi siamo arrivati questo non è consentito tenete presente poi che per esempio la pubblicazione scientifica è un'operazione commerciale quindi se voi condividete un dataset e imponete un riuso non commerciale un ricercatore che un domani fa una ricerca utilizzando i vostri dati non potrà scrivere un articolo scientifico perché come avete visto la pubblicazione scientifica è un uso commerciale c'è dietro chiaramente un'azienda che guadagna dagli articoli che noi scriviamo attraverso avete visto gli abbonamenti quindi anche quelle un uso commerciale quindi in realtà le licenze vanno dosate sarebbe meglio aprire il più possibile il riuso per cui ecco ci sono tanti aspetti da considerare c'è un piccolo articolo un fact sheet che è stato scritto da creative commons proprio su come si devono licenziare i dati della ricerca che vi consiglio ora dopo riesco a ritrovarlo ve lo inserisco nella chat e ci sono tutta una serie di considerazioni come quella che vi stavo facendo prima cioè l'uso commerciale in realtà è uno degli usi che dovrebbero essere previsti anche per esempio per aumentare l'innovazione europea e anche italiana quindi non è il male se qualcuno riuse i nostri dati per fare profitto in realtà gli editori commerciali lo stanno già facendo e nessuno si scandalizza perché fanno soldi con gli articoli che ricercatori scrivono si volevo con sì in effetti molti ricercatori questo accade quando si pubblica un articolo quando prima di andare in stampa non so se avete notato ci chiedono che tipo di licenze intendiamo sottoscrivere ma anche per chi fa bio informatica e pubblico un database per esempio in elixir tu devi dire con quali modalità con quale tipologia di licenza tu metti a disposizione i dati e io diciamo concordo anche con Emma sul fatto che il fatto che anche l'industria possa utilizzare la ricerca pubblica per produrre innovazione se questa innovazione a parte il profitto per l'azienda che ovviamente come dire ragionevole che ci sia produce un vantaggio sociale why not oltretutto per esempio in elixir come sapete esiste un gruppo di lavoro industri che si occupa appunto di col di promuovere l'interazione fra la ricerca pubblica e l'industria che sviluppare l'industria vuol dire posto di lavoro vuol dire sviluppo del paese quindi non è diciamo il demonio grazie a questo riguardo c'è qualcuno che fa una domanda e chiede se il lixir italico inizia con supporto per introdurre open science nelle polizie aziendali al momento diciamo se qualcuno ci dovesse porre la problematica possiamo valutarlo c'è un working group industri di elixir di cui la dottoressa delio fa parte non so se vuole intervenire per dire qualcuno su questo però chiaramente lixir ha un occhio molto attento alla retta industriale perché come sapete anche la ricerca ora promuove l'interazione fra l'accademia e l'industria che è fondamentale che è un grosso problema dell'italia fino a poco tempo fa che la ricerca come dire industriale e la ricerca accademi che erano due monti distinti che non si parlavano affatto favorire una maggiore osmosi fra queste due realtà vuole anche significare maggiore risorse per la ricerca accademica e tutti sapete delle progettualità in ambito ponni in ambito misse che ovviamente sono molto importanti anche per sostenere la ricerca come dire accademica non la chiamo di base perché non ha senso parlare di ricerca di base mio pare ma buona e cattiva ricerca e la distinzione e se volete diciamo già che sono stata chiamata in causa sono Francesca De Leo si partecipa al gruppo industria per elixiri italia e stanno le e soprattutto le applicazioni che possono derivare dall'utilizzo della bioinformatica e dal che possono essere in assolutamente interessanti per le aziende e sono topic assolutamente nuovi anche per l'app per per il sir Europa che diciamo attività come quelle di scienze della vita più legate alla bioinformatica possiano adesso di grosso interesse dal punto di vista industriale soprattutto per tutto quello che anche concerne lo scelindata ma anche per quanto riguarda la parte di compute quello che è la parte di possibilità di accesso a risorse di calcolo tutto questo è qualcosa che vedremo sicuramente nei prossimi anni e che anche l'open science ha il suo valore proprio per quello che anche Emma dice precedentemente anche grazie non rispetto al perché no le aziende poi non debbano utilizzare anche quello sviluppo cioè dalla ricerca poi si si parte attraverso l'open science tutta quella accelerazione che è data da origine allo sviluppo dando a nuova ricerca quindi perché no un commento qui non so se vogliamo cominciare e mostrare le risposte dei partecipanti ai alla domanda che avevano fatto con qui quello che esce molto interessante quello che esce dai dai vostri commenti diciamo io direi una maggioranza di risposte che si refereisce al fatto che fa un po manca una cultura del dell'open science non si sa come che hanno un po le le ipotesi iniziali e per quello diciamo una mancanza di cultura si si risolve comunque si affronta cercando più possibile di fare cultura e quindi cerca c'e organizzando sempre più eventi come questo e come quelli che vi proveremo ma insomma cercare di farlo un po a tutti i livelli livelli più generali per esempio una discursione che abbiamo adesso nel nostro gruppo in atto è di organizzare l'eventi di disseminazione di divulgazione proprio per le persone per i cittadini e quindi questa è una parte importante e poi ci sono alcune risposte che dicono beh perché i ricercatori prima di rendere disponibile con linee delle prove dati ci vogliono pubblicare sopra no quindi c'è questa idea e questo secondo me è un po uno dei un po uno dei motivi per cui appunto uno dice va beh ma insomma io non condivido i dati con l'industria non condivido i dati in generale perché se no magari ad altri vengono le idee prima che a me e ci poi ci possono fare qualche cosa e poi ecco qui appunto non so se è ma tu vuoi fare diciamo che è ma ci ha detto moltissimo su questo su questo tipo di atteggiamento non so se tu vuoi commentare qualche cosa altro su questo tipo di questa modalità di beh intanto grazie all'egra volevo volevo far notare che soprattutto in ambito medico molte riviste oggi chiedono invece di in qualche modo condividere i dati che che che ci hanno portato poi alla pubblicazione per esempio c'è un'iniziativa che si chiama l'anset reward dove proprio l'anset si impegna a richiedere la condivisione dei dati per gli articoli che vengono pubblicati alcune riviste oggi per esempio springer ma anche il severe per alcune riviste richiedono obbligatoriamente la condivisione del dato per la la pubblicazione dovrebbe essere una questione etica cioè io devo devo poter dimostrare quello che sto che sto affermando lo abbiamo lo abbiamo visto prima tenete presente che io l'ho accennato brevemente ma il sistema della valutazione della ricerca oggi è proprio in in grande discussione ci sono degli esempi di paesi e di istituzioni che oggi stanno attuando già dei metodi di valutazione della ricerca che non prevedono più l'utilizzo dei soli delle sole citazioni degli articoli si sta andando sempre di più verso una valutazione qualitativa e soprattutto una valutazione a 360 gradi dei risultati quindi i dati software tutto quello che noi condividiamo sarà diciamo oggetto della valutazione e a quanto emerge ora sarà oggetto della valutazione il riuso che altri faranno dei nostri risultati quindi il fatto di condividere oggi dei dati permetterà un domani di essere valutati perché se noi chiaramente non cominciamo a condividere nessuno potrà riutilizzare quello che noi produciamo c'è un dibattito che ormai si è aperto a riverlo per esempio della europea no university association che che sta già discutendo come fare per valutare i ricercatori è chiaro che in italia siamo ancora molto indietro però l'europa come sapete in questo ci ci fa abbastanza da trino l'avvento di ios che per esempio molti dei fondi europei del prossimo programma quadro saranno legati all'utilizzo in qualche modo di osc quindi verrà valutato anche il riuso che si farà dell'esistente ma anche quello che si metterà a disposizione e volevo fare grazie ma volevo fare ancora una domanda a garziano perché è sempre specifica delizia questa un po più tecnica se si chiede se tramite elizia ed entri partecipanti si stia prevedendo l'eventuale sistema di cura manuale controllo di congruenza dei database associati a covid 19 quindi se c'è in atto prima parlare non so dell'assenza per esempio di vocabulari controllati e quindi se redazione dati covid si sta facendo ilixir si sta muovendo in questa direzione allora ilixir si sta muovendo sia a livello europeo che a livello nazionale per trovare modalità di integrazione di dati molecolari e clinici perché il come vi dicevo il problema non è tanto sviluppare come dire le indicazioni per i metadati molecolari classici su cui abbiamo già una lunghissima tradizione e quindi su questo non ci sono problemi ma quali sono i metadati clinici che vanno integrati con quali modalità e quant'altro però ovviamente questo si può fare con la collaborazione della parte clinica ed è necessario un input top down che di indicazioni precisi a seguire sta percorso altrimenti si rischia di fare come si dice vox clamans in deserto sicuramente a livello europeo c'è una altissima sensibilizia sensibiliziazione in questa direzione quello che è importante come dire sottolineare è che questi sforzi sono sforzi che non possono essere localistici ma devono essere sforzi diciamo come dire a perlomeno pane europei in modo tale che il lavoro che si fa comunque venga in qualche modo sia veramente un lavoro utile altrimenti si rischia di rimanere come dire nell'angolo quindi per quanto riguardi i dati molecolari le banche dati hanno già diciamo dei sistemi di firefighter che sono assolutamente come dire standard purtroppo nell'altro versante questa emergenza covid ci sta ci ha messo di fronte a un problema molto serio io vi farei vedere i metadanti di richiesti da g6 e vedete che siamo molto lottani da un sistema che può dirsi in qualche modo fair anche perché sta cronimo nella realtà clinica di fatto e anche un meologismo sì diciamo in prospettiva una cosa importante una cosa importantissima diciamo nell'ambito delixiera e che c'è ci sono stati grandi finanzamenti per la formazione del di figure come quella che si chiama dello data steward c'è quello che si prende cura dei dati e del data manager nonché ovviamente del data analista quindi diciamo sul panorano europeo sono stati messi risorse importanti proprio per per creare queste figure in europa sono previsti addirittura la formazione di 500 mila di queste di queste tra virgolette nuove figure in particolare lixiera italy si sta occupando proprio dello sviluppo di un curriculum in data steward ship management e analisis che diventerà operativo a partire da bamba calemico 2021 2022 sarà aperto naturalmente quindi questo è lo sforzo sempre diciamo cercando di rispondere più possibile con la cultura alla mancanza con la formazione con la cultura alla mancanza appunto di conoscenza adrebbe fatto lo stesso sforzo in ambito un clinical data steward ship sarebbe auspicabile ma ci arriveremo forse fra qua un po adesso il tema dei dati clinici verrà affrontato il discorso il tema è abbastanza complicato perché come sapete non so quanti di voi sanno che esiste come dire la cartella clinica elettronica così detto fascicolo sanitario elettronico quindi in teoria per il ministro della salute il problema non esiste ma di fatto non c'è nessuna come dire e come dire un bambino nato morto non so se chiamo quindi questa questo fascicolo sanitario elettronico riguarda soprattutto la parte amministrativa diciamo del del clinical care non riguarda la parte diciamo applicativa e quindi andrebbe un po tutto ripensato quindi io mi auguro che questa pandemia come dire apra gli occhi a chi doveva ok va bene io direi grazie a tutti a tutti i partecipanti a l'arsano peso del ma l'azzeri a gina pavone a francesca de leo l'orena di pera e prima di arrivare alla che diamo ancora è un momento di partecipazione in cui vi chiediamo di lasciarci tre parole concetti che vi hanno colpito nel seminario di oggi e di farlo adesso subito in maniera tale che vediamo vediamo la nuvola di parole formarsi e vediamo tutti insieme che cosa vi ha colpito oggi poi successivamente per i mail manderemo il link a una posizionare di feedback che le vostre opinioni su questo webinar che per noi sono estremamente importanti soprattutto nel lavoro che stiamo facendo di sviluppo dei prossimi web inare e tutt'orne questa cosa del del world cloud è sempre è sempre molto carina perché ci permette poi di capire che cosa vi è rimasto del dell'evento che che abbiamo organizzato per voi il come diceva allegra poi invieremo a tutti coloro che si sono iscritti un piccolo questionario veramente molto breve che diciamo è strutturato sempre nello stesso modo cioè ci dà la possibilità di di capire come possiamo migliorare questa questo tipo di eventi e non so se probabilmente ci sarà anche una parte dove dove potrete darci anche dei commenti aperti quindi se se avete bisogno di di altre informazioni sicuramente rimaniamo a disposizione per qualsiasi domanda che potete avere anche successivamente chiaramente a questo webinar quindi se avete delle domande specifiche ci potete contattare nelle nelle nostre presentazioni sono presente le mail quindi potete anche contattarci direttamente le presentazioni le metteremo a disposizione su Zenodo le troverete poi linkate sulla pagina di open air relativa a questo webinar e vi invieremo comunque comunicazione attraverso le mail che ci avete fornito come abbiamo fatto oggi per darvi il link per partecipare quindi per chi ci sta seguendo ancora dal dal canale youtube e quindi forse non è riuscito a descriversi in tempo troverà comunque tutto sul sul sito di open air poi linkato chiaramente a catena sul sito del cnr quello di elixir quindi cercheremo di diffondere il più possibile questa informazione bello vedere che è la parola più più condivisa e condivisione esatto se la parte chiaramente anche della della formazione della cultura mi sembra molto molto importante e comunque ecco come diceva legra prima questi eventi noi li organizziamo in modo periodico quindi se anche avete bisogno di qualcosa di un pochino più personalizzato potete contattarci per capire se abbiamo qualcosa in agenda o se possiamo offrirvi supporto e poi vi invito anche a come si dice stay tuned no e vedere se quali sono i programmi poi che abbiamo per i prossimi webinar e anche farci sapere che cosa vorreste vedere magari certo certo come avrete più o meno intuito la scelta dei temi da trattare sono quelli che sono venuti diciamo da rda che si è focalizzata una serie di dati però ci potrebbe essere di corsa dei problemi delle questioni che invece voi sentite il bisogno di che vengono trattati allora certo come diceva ma assolutamente contattateci e intrateci presente quali possono essere delle necessità che potremmo almeno tentare di di a cui potremmo tentare di rispondere in qualche modo va bene io diciamo vi lasciamo con questa bella nuvola e un saluto a tutti e buonaserata si grazie veramente a tutti e speriamo di rincontrarvi nei prossimi webinar e tutorial grazie a tutti a rivederci a tutti