 Allora, buongiorno a tutti, io sono Emma Lazzeri, lavoro al CNR e sono coinvolta in diversi progetti relativi all'Open Science tra i quali Open Air, che è la grande infrastruttura europea per l'Open Access e l'Open Science. Il webinar di oggi è dedicato a fornirvi un'introduzione alle tematiche Open Science e Open Access, con me c'è Silvia Damberini, degli GG, che mi aiuterà nella presentazione, cercando di sottolineare un pochino più gli aspetti relativi agli ambiti delle scienze della terra e dell'ambiente. C'è anche con noi la mia collega Gina Pavone, che ci assisterà dal punto di vista tecnico. Io vi prego di utilizzare per le domande durante la presentazione il tasto Q&A, che potete vedere sulla barra in basso del vostro schermo. Le domande verranno raccolte e risponderemo al termine delle presentazioni. Potete, per favore, utilizzare questo tasto e non la chat che riserverai solo per problemi di tipo tecnico, se non senteteci a qualche problema. Lascio quindi la parola per una breve introduzione a Silvia e poi possiamo cominciare. Grazie, innanzitutto io ringrazio Emma e Gina e lo staff di Open Air per la collaborazione, perché sono stati veramente bravissime, disponibilissime e gentilissime come sempre. Abbiamo pensato di fare questo seminario originariamente per il nostro istituto, per l'instituto di scienze e georisorze del CNR, ma poi abbiamo deciso di allargarlo a una platea più ampia per il grande interesse che secondo noi questi temi hanno nel mondo della ricerca. Per ora faremo un piccolo assaggio di quello che sono i temi che potremmo affrontare e vedrete che le domande e le curiosità saranno tante. Abbiamo pensato di organizzare, penso dopo la fine dell'estate, un corso più articolato e più strutturato sull'open access, probabilmente in modalità webinar come questo, che sicuramente potrà soddisfare le curiosità e le domande che verranno fatte oggi. Dall'altro, Emma ci farà vedere un sistema per otterre le questioni in answers, un sistema per condividere le risposte e le domande che verranno durante il seminario. Io vi parlerò più che altro, vi prenderò poco tempo per parlare di una iniziativa internazionale sull'accesso pubblico e la condivisione dei dati di osservazione della terra dall'iniziativa del Group on Earth Observation. Poi credo che Emma parlerà anche un po' delle infrastrutture per la ricerca e quindi l'uso dei dati aperti nell'infrastruttura europea per la ricerca scientifica. Io direi che ci siamo, Emma se vuoi iniziare, non so se vuoi far vedere come funzionamenti meter prima di iniziare e poi passiamo ad iniziare. Lo possiamo fare alla fine della mia presentazione. Ok, perfetto. Vi spiego tutto dopo. Ok, a questo punto chiedo di spegnere il video e i microfoni, chiedo ai pannelli sobbiamente di spegnere il video e i microfoni e posso iniziare. Ovviamente i partecipanti non possono accendere il microfono in questa modalità webinar però come mi ho detto prima potete utilizzare il tasso Q&A per le domande e la chat, se ci sono problemi ad esempio di connessione Gina, ci sta seguendo e quindi si occuperà lei di rispondere. Allora partiamo con l'apprentazione di oggi. Questo webinar appunto è dedicato a diciamo fare una piccola overview di come si può dare accesso alla conoscenza, accesso aperto attraverso l'open access e ci concentreremo poi su che cosa accade nell'ambito delle scienze della terra e dell'ambiente. Io mi piace sempre partire nelle mie presentazioni, nei miei seminari con una grossa parte piuttosto corposa di introduzione e di motivazioni perché credo siano molto importanti per capire a fondo quali sono i principi che stanno dietro all'open science e comprendere che l'open science e l'open access non sono solo un aggravio burocratico ma hanno veramente un senso e il senso è quello di migliorare fondamentalmente il modo in cui facciamo scienza. Questo che vedete è un estratto della nostra costituzione, l'articolo 33,1 che dice che l'arte e la scienza sono liberi e libero ne è l'insegnamento. La domanda che io vi faccio oggi e che accompagnerà un po' tutto questo seminario è veramente così, siamo davvero sicuri che la scienza sia libera. I ricercatori sono liberi di studiare gli argomenti che sono di loro interesse o sono in qualche modo legati ad un sistema che li costringe a scegliere determinati argomenti e a proseguire il loro lavoro su determinate linee di ricerca. Vediamo un pochino in modo molto semplice, stilezzato come funziona oggi il ciclo della ricerca. Parte tutto da un'idea, l'idea di un ricercatore che per portarla a termine per fare ricerca, per capire se le sue ipotesi che derivano chiaramente dall'osservazione dell'ambiente corrispondono alla realtà dei fatti ha bisogno di chiedere un finanziamento. Quindi fa una proposta di progetto oppure utilizza i fondi che gli vengono dati dalla sua istituzione e poi una volta ottenuti questi finanziamenti è in grado di proseguire e di iniziare il suo lavoro di ricerca vero e proprio, quindi pianificare esperimenti, raccogliere dati e produce in tutto questo una serie molto varia di risultati e di prodotti, articoli scientifici, raccoglie dati, crea software e così via. Tutto questo poi si riduce allo stato attuale delle cose a chiudere tutto quello che ha prodotto all'interno di un articolo scientifico. Questo articolo scientifico spesso viene chiuso dietro il cosiddetto paywall e diciamo le attività del ricercatore si riducono al famoso tetto publisher perish. Cioè se io non riesco a pubblicare un certo numero di articoli e non riesco a farmi citare dalla mia comunità purtroppo la mia carriera in qualche modo non va avanti quindi io come ricercatore muoio e la mia carriera finisce toppa comunque non prosegue. Siete sicuramente consapevole in questo momento che ler i articoli di cui voi siete autori al di fuori della vostra rete istituzionale non è per niente gratuito. Questa è una pagina, uno screenshot che ho fatto degli articoli che ho scritto in passato. Come vedete se io faccio questo screenshot dalla mia computer di casa o mentre sono fuori comunque dalla mia rete istituzionale questi articoli sono per me tutti chiusi. Io non li posso nemmeno leggere. Devo necessariamente come vedete in alto effettuare un institutional sign-in. Quindi devo farmi riconoscere come appartenente ad una determinate istituzione per poter leggere i miei scaricare e quindi fuire del mio stesso articolo che ho scritto. Quello che sicuramente avete notato in questo periodo in cui molti di noi sono in tele lavoro è che se voi volete provare a scaricare l'articolo dopo avervi chiesto di effettuare un sign-in quindi farvi riconoscere come qualcuno che può avere accesso perché lo vedremo poi dopo ha pagato un abbonamento. Vi scontrate se non avete questo sign-in, vi scontrate contro il cosiddetto paywall, cioè in questo momento l'hai tripoli con il quale io ho pubblicato diversi articoli nel corso della mia carriera, mi chiede dai 15 ai 33 dollari ad articolo per poter scaricare e fluire di quello che io ho scritto. Qual è la situazione attuale? La situazione attuale è che la vostra istituzione paga e le rivise scientifiche si basano per la maggior parte su abbonamenti, quindi la vostra istituzione paga questi abbonamenti per cosa? Per darvi accesso ai contenuti, che cosa significa? Quello che voi ottenete non è la propietà dell'articolo come avete visto se non siete dentro la vostra rete istituzionale non potete avere accesso. Quello che voi avete è l'accesso per un anno a determinati articoli contenuti in una lista di riviste per la quale la vostra istituzione paga un abbonamento. Questo è una grande differenza rispetto al passato prima dell'era digitale in cui in realtà le biblioteche pagando possedevano qualcosa, quindi entravano in possesso delle riviste cartace. Dal momento in cui abbiamo avuto la rivoluzione digitale non si parla più di possesso, ma si paga per avere accesso, quindi per leggere qualcosa. Quindi la domanda che io vi faccio è perché stiamo spendendo soldi pubblici per chiudere i risultati delle ricerche in riviste scientifiche che sono attualmente ad accesso limitato e a pagamento, cioè danno accesso solo a chi ha pagato un abbonamento alla lista. Perché lo facciamo? Perché abbiamo un sistema di valutazione della ricerca che in qualche modo segue le nostre attività e ci costringe a far parte di questo sistema. Come funziona la nostra valutazione della ricerca? Sicuramente voi conoscete questi argomenti, ma io vorrei oggi focalizzarmi su alcuni aspetti e suzziccare un pochino il vostro spirito critico. Si basa su indici bibliometrici oppure per i settori non bibliometrici su liste di rivista di fascia. Quali sono gli indici bibliometrici che vengono utilizzati? Sono tutti basati sul numero di citazioni. Il numero di citazioni è importante per calcolare sia l'AC index, come sapete è un indice che ci fa capire, mette in relazione il numero di articoli che un ricercatore scrive e quanto questi articoli sono citati dalla comunità. Quindi uno scienziato un indice H index N, se ha almeno N lavori, con almeno N citazioni ciascuno. E poi c'è il cosiddetto impact factor. L'impact factor, a differenza dell'H index, non si riferisce prende all'autore, ma si riferisca alla rivista nel quale l'autore ha pubblicato un articolo. Per un dato anno l'impact factor di una rivista prende in considerazione i due anni precedenti di storia della rivista e ci dà una media delle citazioni per articolo. Quindi sommando il numero di citazioni totali che gli articoli contenuti in una determinata rivista per i due anni precedenti a quello che stiamo considerando e dividendo questo per il numero totale di articoli pubblicati sia il cosiddetto impact factor. Beh, questi indici presentano diverse criticità. Innanzitutto gli scienziati giovani sono penalizzati perché chiaramente hanno una produzione scientifica inferiore. Non si considera il contesto delle citazioni, quindi se io cito negativamente un articolo, questo articolo comunque ha una citazione in più. E poi dopo nel corso della presentazione quanto questa questa affermazione importante sono influenzati da le limitazioni delle banche date, delle citazioni considerate che per esempio Scopus sulla quale si basa il calcolo di questi indici è una banca dati che è in mano agli editori, è una banca dati chiusa a pagamento, quindi anche lì voi potete andare su Scopus e verificare questi indici solo perché la vostra istituzione ha pagato un abbonamento. Non sono per niente trasparenti perché noi abbiamo a disposizione da Scopus il valore dell'aka index o dell'impact factor, ma non sappiamo su quali dati si basano questi valori. Non abbiamo accesso ai dati grezzi delle citazioni. Come sapete il numero di citazioni di un articolo può essere facilmente manipolato sia da autori che da revisori. Questi, diciamo, queste male pratiche avvengono sia in modo diciamo consapevole che inconsapevole, chiaramente. Siamo spesso portati a citare dei gruppi di ricerca che conosciamo oppure che con i quali collaboriamo. Come sapete i revisori hanno per esempio la facoltà di suggerire alcune citazioni che non sono state ancora incluse nell'articolo in fase di peer review. Non tengono conto del numero di autori di un articolo e soprattutto non tengono conto dell'effettivo contributo di ciascun autore. Quindi chi ha veramente fatto il lavoro sporco, ha lavorato, ha avuto l'idea e noi non lo possiamo distinguere da chi è stato inserito per altri motivi nella lista degli autori. Non tengono conto della multidisciplinarità della ricerca perché questi indici sono strettamente legati e hanno una forte correlazione con la comunità di ricerca alla quale appartengono i ricercatori, quindi hanno valori medi più alto e più basse a seconda della disciplina scientifica di riferimento. Non agevano per niente la libertà della scienza che viene sancita dalla costituzione per ovvi motivi. Allora, la domanda che io vi faccio è che cosa stiamo valutando? Stiamo valutando una cosa molto semplice, la capacità dei ricercatori di adattarsi a questi indici e a come sono costruiti. Questo è un articolo che è uscito su Plus One l'anno scorso e ha mostrato come dal momento in cui in Italia è nata Hamburg e sono nati quindi criteri che vi ho appenelencato per valutare i ricercatori. Quello che è successo è che le autocitazioni in qualche modo, cioè l'indice che mi fa capire quanto un ricercatore citi se stesso o il suo gruppo di ricerca, abbiano avuto un'impennata rispetto alle medie degli altri paesi e questo fatto si può stegare facilmente con l'adattamento che i ricercatori italiani hanno avuto rispetto al modo in cui producono questi articoli, al modo in cui citano se stesso o altri gruppi, questa modalità si è adattata alle nuove regole imposte da Hamburg e i criteri di valutazione. Come funzionano oggi le riviste scientifiche? Lo sappiamo molto bene tutti però io vorrei anche qui farvi ragionare e soffermarmi su determinati aspetti. Abbiamo una comunità scientifica di riferimento, in questo caso la vostra è quella delle scienze della terra e dell'ambiente. Un ricercatore che appartiene a questa comunità ha un'idea, scrive un articolo. Questo articolo nel gergo si chiama preprint, è un manuscritto originale che l'autore scrive e appartiene a lui. Questa copia non è soggetta a nessun tipo di copyright da parte degli editori. Che cosa fa l'autore? Invia a un editor scientifico, a un journal editor, il suo preprint per una valutazione, chiaramente per una peer review e un'eventuale pubblicazione. Vorrei sottolineare come l'editore al quale voi inviate questo preprint, la persona che assegna poi i revisori al vostro articolo appartenga alla comunità scientifica e non è qualcuno pagato dal publisher. Quindi è un vostro collega, voi stessi. L'editor sceglie i revisori, i revisori accettano di cominciare questo processo di peer review, leggono il preprint, fanno i loro commenti, apportano delle correzioni, fanno domande. Il mano scritto viene inviato con i commenti di nuovo all'autore. Cosa fa l'autore? A questo punto risponde ai commenti integra, cambia l'articolo, lo modifica sulla base dei commenti dei revisori e crea quello che si chiama postprint. Ora il postprint, come vedete, è il risultato di un lavoro che è stato svolto sia dagli autori dell'articolo originale del preprint, ma anche dai revisori. In tutto questo ancora non abbiamo visto la figura del publisher, quindi tutto si sta svolgendo attraverso il lavoro di persone che appartengono alla vostra comunità scientifica, quindi a voi stessi. Siamo parlando di ricercatori. Questo postprint viene di nuovo sottoposto ai revisori che possono chiaramente approvarlo e rifiutarlo, se lo approvano. Questo viene preso a questo punto dal journal editor, dal publisher, quindi da una persona che lavora per il publisher scientifico, Elsevier, Light Tripoli, qualsiasi tipo di publisher di riferimento della vostra comunità. A questo punto, questa persona fa dei piccoli editing, magari sposta delle immagini, inserisce specia il nome del journal, il volume, la pagina, mette il fiocco a questo postprint e lo fa diventare la versione editoriale. Dopodiché vi fa fermare un copyright con il quale voi cedete tutti i vostri diritti all'editore e crea la versione editoriale che viene pubblicata. Questo è come funziona oggi e quali sono i ruoli della comunità e dei publisher per la pubblicazione. Come si fa poi ad avere accesso a quello che viene pubblicato? A questo punto voi avete ceduto i vostri diritti, non siete più proprietari di niente, sostanzialmente siete solo gli autori. Questo però non significa, come avete visto prima, che potete andare sul sito dell'editore e scaricare il vostro articolo. Da questo momento in poi non lo potete fare più. L'accesso funziona attraverso diversi modelli di business, li vediamo nel dettaglio. Ci sono dei modelli editoriali e dei costi che si differenziano. C'è il modello tradizionale ad abbonamento. Questo modello prevede come abbiamo visto che le istituzioni paghino un abbonamento annuale per dare accesso ai contenuti al proprio personale. Io vi chiedo, secondo voi, quanto costa un abbonamento per un'istituzione media. Questo abbonamento, quindi il costo che ogni istituzione, il CNR, l'Università di PISA, l'Università di Defense, singolarmente paga per darvi accesso. Questi costi sono enormi, si parla di una cifra compresa fra uno e tre milioni di euro l'anno per consentire accesso, quindi per farvi leggere i vostri articoli sul sito dell'editore, per farvi leggere a voi chiaramente che appartenete a queste istituzioni. Questi sono i costi medi che vengono spesi da ogni istituzione di ricerca del mondo, quindi non complensivi, ma il CNR spende per esempio tre milioni di euro l'anno, l'Università di PISA ne spenderà due, chiaramente dipende dalla dimensione dell'Università o dell'ente di ricerca, ma questi sono le cifre. C'è poi un altro modello che è quello che noi associamo al termine open access. In realtà questo modello di business non ha niente a che vedere con l'open access così come lo impareremo a comprendere oggi. Questo è un modello di business, quindi è il modo in cui gli editori fanno soldi grazie a quello che voi scrivete. Il Gold Open Access viene chiamato nel giardgo tecnico, è un modello secondo il quale è l'autore che paga un IPC, article process in charge, per rendere accessibile il suo articolo. In realtà non è poi così vero perché molte riviste Gold Open Access non chiedono un contributo agli autori, solo il 27% delle riviste Gold Open Access chiedono il pagamento di un IPC. Il restante si basa su altri modelli di sostentamento. L'articolo a questo punto è accessibile a chiunque, quindi anche voi potete andare sul sito dell'editore e scaricarlo, anche se siete fuori dalla vostra rete istituzionale. Quanto costa questa IPC? Beh questa IPC ha un costo molto vario, dipende dal giornale. Si parla di poche centinaia fino a 5-6 mila euro. C'è poi il modello ibrido. Questo modello prevede che la rivista sia una rivista tradizionale ad abbonamento, ma l'editore chieda un contributo economico agli autori per rendere accessibile a chiunque, solo quell'articolo che è compreso nella rivista. Queste IPC, queste article processing charges che vengono chieste agli autori sono molto inferiori, diciamo più o meno la metà rispetto a quello che viene chiesto in un modello tradizionale Gold Open Access. Ma qui c'è un po' il diavolo perché questo modello rappresenta un double dipping, cioè tenete presente che voi pagate poco per rendere accessibile al mondo il vostro articolo, ma in realtà la vostra istituzione sta ancora pagando un abbonamento per fare in modo che voi possiate avere accesso alla vostra produzione su quella rivista. Le problematiche degli attuali modelli quindi a questo punto le avrete capite, i contratti degli editori non sono trasparenti, gli autori cedono tutti i loro diritti, copyright, pensando di non aver scelta, ma in realtà non è così perché siete voi che state cedendo qualcosa all'editore, non è l'editore che vi sta imponendo di rinunciare ai vostri diritti sugli articoli. I costi degli abbonamenti salgono sempre di più, ogni anno si parla di un incremento di 1-2%. I costi delle IPC, cioè i costi che voi pagate per il Gold Open Access e per il modello ibrido come autori non sono tracciati e le istitutoni non hanno idea di quanto siano, chi l'ha fatto perché esistono dei modelli che ci consentono di farlo, ha scoperto che questi costi complessivi annuali sono più o meno paragonabili ai costi degli abbonamenti, quindi quei due milioni di euro mediche che le istituzioni pagano in realtà sono raddoppiati dai costi di queste IPC. Gli autori e i rivisori non sono rimunerati, voi non venite pagati per scrivere, non venite pagati per revisionale o per fare da editor a una rivista, ma fornite sostanzialmente in modo gratuito la materia prima agli editori che con questa materia prima fanno enormi profiti. Questo che io vi ho lasciato qui è un estratto dell'articolo che trovate poi sul Guardian, nel link che vi lascio. Nel 2010 Elsevier ha riportato di avere un margine di profitto del 36% nella sua gestione e che ha addirittura superiore a quello di Apple e di Google. Quindi pensateci bene mentre quando scrivete un articolo, quando fate la vostra ricerca e quando chiudete tutto dietro a questi paywall. Questi sono i profiti che gli editori fanno perché voi li fornite la materia prima in modo gratuito. Questa è una frase molto carina di Graham Steele che non è un ricercatore, ma ha avuto a che fare con il mondo chiuso della ricerca. Publishing research without data is simply advertising not science. Cioè quando voi scrivete un articolo e non ha legato a questo articolo i dati e questo ci porta poi a capire la seconda parte di questa presentazione, state semplicemente facendo pubblicità alla vostra ricerca, non state dimostrando niente perché le prove stanno nei dati e se voi non fornite i dati chiaramente non fornite le prove che quello che voi state scrivendo corrisponda alla realtà dei fatti. La domanda quindi è, abbiamo visto che i ricercatori scrivono questi articoli e chiudono il contenuto delle loro ricerche dietro a un paywall, ma tutto il resto, tutto il resto di quello che un ricercatore fa durante la sua vita di tutti i giorni. Dov'è finisce? Che cosa ci stiamo perdendo in questo sistema di valutazione della ricerca che tiene in considerazione solo i giornali e le riviste sui quali noi pubblichiamo? Ci stiamo perdendo un sacco di cose. I risultati negativi per esempio che sono importantissimi per la scienza, i dati, le metodologie, i software, le proposte di progetto, le capacità di leadership per esempio di un ricercatore. Tutto questo non è considerato nella valutazione, soprattutto non vengono considerati i dati che vengono raccolti e che vengono collezionati dai ricercatori. Questo è un articolo ormai di qualche anno fare, in una sala al 2013 dove è stato dimostrato che la maggior parte, si parla dell'80% dei dati che erano stati raccolti negli anni 90, è perso per sempre. Perché? Perché è contenuto in dei dispositivi che ormai sono obsoleti e non riusciamo più a aprire sostanzialmente, ad avere accesso ai nostri dati. Pensate a quanti dati sono stati conservati dentro dei flop disc che oggi non abbiamo la possibilità di leggere perché i nostri computer non hanno più un lettore adatto. Questi dati sono da qualche parte, ma i ricercatori non riescono ad avere accesso, non sanno più dove il computer è un computer vecchio, non si accende più insomma, ci sono tutta una serie di motivazioni anche molto simpatiche che potete trovare in questo articolo, ma la cosa fondamentale è che noi perdiamo ogni anno il 17% della produzione dei dati. Quindi questo ci porta un po' a capire perché oggi vi parliamo di Scienza aperta di Open Science perché questo è sinonimo di buona scienza. Questa è una vignetta molto carina dove si sottolinea che i ricercatori non vogliono in qualche modo condividere i dati perché pensano che siano una loro proprietà, ma gli si fa notare chiaramente da parte della società che questi dati sono stati prodotti con i soldi pubblici che provengono dalle nostre tasse, quindi noi abbiamo diritto di vedere dove sono questi dati. Vi faccio qui alcuni esempi che si ricollegano un po' al discorso che facevamo in precedenza sul fatto che noi siamo un po' chiusi dentro questo sistema che ci fa scrivere le ricerche in questi articoli, non condividiamo i dati, ma questo poi porta chiaramente non a un modo sano di fare scienza. Questo è un paper molto famoso che è quello su cui si basano tutte le teorie famose sulla austerity che sono state applicate in diversi paesi in passato. Quindi l'atesi che questo paper fondamentalmente voleva portare all'attenzione è che se la crescita economica rallenta drasticamente quando la dimensione del debito di un paese supera il 90% del prodotto interno l'orto. Che cosa è successo? Successo che a un certo punto gli autori di questo paper hanno cominciato a pubblicare molto su questo argomento. Molte pubblicazioni sono dietro l'altro. Un giorno arriva un professore che chiede a uno studente di dottorato di replicare come esercizio i grafici che erano contenuti in questo articolo. Beh, lui non riesce a pubblicarli perché i dati non sono messi a disposizione. In realtà sono dati pubblici, quindi dati aperti, ma lui non riesce in nessun modo ad applicare l'algoritmo che è descritto in questo paper per produrre gli stessi grafici. Quindi che cosa fa? Chiava gli autori, scrive una mail, e si fa mandare il foglio Excel con il quale loro avevano creato questi grafici. Beh, sorpresa delle sorprese questo foglio conteneva degli errori di calcolo. Quindi pure essendo i dati disponibili perché erano pubblici, dati pubblici, il modo in cui erano stati selezionati e analizzati conteneva degli errori. Questi errori sono stati chiaramente trovati dallo studente di dottorato e questo articolo e altri sono stati ritrattati. Quindi sono stati, diciamo, in qualche modo cancellati dalla produzione scientifica. Cancellato non è così tanto vero perché comunque l'articolo rimane disponibile ed è per questo che prima vi dicevo che il contesto delle citazioni importanti, questo articolo ha ricevuto tantissime citazioni dopo la sua ritrattazione perché c'è stata un po' una corsa a voler dimostrare che comunque quello che era contenuto lì era falso e perché? C'è poi un altro esempio molto carino che vi lascio oggi. Questo è la storia di un autore di Dietrich Stapel che aveva pubblicato a un certo punto della sua carriera, ha cominciato a pubblicare su una linea di ricerca nuova. Di questa linea di ricerca e diventato l'autore di riferimento nella comunità ha pubblicato cinquantotto articoli. Anche qui, a seguito delle segnalazioni di tre studenti di dottorato dell'università olandese per la quale lui lavorava, è stata avviata un'indagine che ha portato a scoprire che in realtà questo ricercatore si era completamente inventato i dati sui quali basava le sue ricerche. Questo perché? Perché ha cominciato con un articolo. L'articolo ha avuto un grandissimo successo, lui ha ricevuto tantissime citazioni, è diventato, diciamo, l'esperto maggiore di quella linea di ricerca e non ha più saputo fermarsi. Lo che è successo è che chiaramente gli è stato ritirato il dottorato, i suoi articoli sono stati riprattati, ha messo pubblicamente di aver fabbricato i dati che stavano sotto a questi articoli. Quindi i dati non esistevano, lui scriveva di cose inesistenti. Quindi che cosa è successo poi? Dopo è successo che l'università olandese per la quale lavorava e tutta l'Olanda in generale ha cominciato a considerare seriamente l'open science e la pubblicazione dei dati soprattutto insieme agli articoli e oggi sono uno dei paesi più avanti rispetto a queste tematiche proprio perché hanno avuto un danno d'immagine enorme per via di questa vicenda. La domanda che vi faccio è se questa persona avessi condiviso i suoi dati probabilmente qualcuno della comunità si sarebbe accorto subito che c'era qualcosa che non tornava. Questo non è stato fatto e chiaramente ha portato poi alla conclusione di questa storia. Questo che vi lascio è un blog molto importante, interessante, si chiama Retraction Watch e lista tutti gli articoli che vengono ritrattati. Lista anche i motivi per cui vengono fatti ritrattati e vi fa poi una classifica molto interessante degli autori che hanno avuto più ritrattazioni nella loro carriera. Potete andarlo a consultare, è molto interessante. Vi lascio poi con una diciamo una vicenda un po' di attualità. Vi faccio notare come lo pensai oggi per il coronavirus sta avendo un grandissimo riscontro. Che cosa sta succedendo? Sta succedendo per esempio che molti editori stanno mettendo in open access tutti gli articoli, quindi non rientrano più negli abbonamenti. I ricercatori stanno condividendo i dati. Ad oggi per esempio abbiamo 3.697 sequenze del virus depositate in GenBank che ha un repository di riferimento per la comunità. Gli scienziati stanno condividendo tutto. Perché lo stanno facendo? Perché condividere in questo momento porta chiaramente a accelerare il processo scientifico. La domanda però che vi faccio è ma se lo stiamo facendo perché in questo momento è strettamente necessario perché questo virus sta bloccando il mondo intero e sta chiaramente uccidendo tantissime persone, perché non lo possiamo fare sempre? Perché rallentiamo la scienza dietro a questo sistema che in realtà non ci porta nessun beneficio? E qui inizio a parlarvi di Open Science perché serve l'Open Science perché come abbiamo visto il sistema della comunicazione scientifica è regolato oggi sostanzialmente da interessi di mercato che sono in mano ai grandi editori commerciali e è basato su critere di valutazione della ricerca che sono non solo obsoleti ma anche diciamo in qualche modo non legati alla vera qualità della ricerca. Abbiamo visto che le istituzioni pagano costi enormi per via di questo sistema e si sta parlando di fondi pubblici. L'editori di euro ogni anno finiscono nelle mani degli editori scientifici che non producono risultati. Non sono loro che producono i risultati. I risultati li producete voi. In tutto questo li producete e li date agli editori in modo gratuito. C'è una stima che è stata fatta nel 2015 oggi chiaramente si parlerebbe di altre cifre molto più alte. Si è stimato che nel mondo si pagano circa 10 milioni di dollari ogni anno solo per gli abbonamenti. Quindi quei famosi milioni di euro che ogni anno le vostre istituzioni pagano diventano complessivamente 10 miliardi di dollari. Pensate quante ricerche si potrebbero portare avanti con questi soldi. E allora come si fa open science che cosa vuol dire? Open science vuol dire rendere aperto ogni passo della ricerca. Quindi non solo i vostri articoli ma tutto i dati e i software qualsiasi cosa voi producete come scienziati. Si basa su principi di trasparenza, riproducibilità, collaborazione, inclusività, riuso e si basa sull'idea fondamentale che se la ricerca viene finanziata con fondi pubblici deve necessariamente essere pubblicamente disponibile. Quindi ogni cittadino al diritto di trarre vantaggio dalla ricerca che viene finanziata con i soldi sono da le sue tasse. La Commissione Europea in questi anni ha compito una scelta decisa a favore dell'open science. Sono più di 10 anni che la Commissione parla di open science e lo vedremo poi in seguito. Quali sono i vantaggi? Vantaggi sono enormi. Qui ce ne sono alcuni ma chiaramente voi potete ragionare e trovarne sicuramente altri. C'è un miglioramento della qualità della ricerca quindi si parla anche di etica della scienza. L'efficienza lo abbiamo visto e lo vediamo in questi giorni con il coronavirus. L'innovazione si velocizza e si ha anche un convolgimento dei cittadini della società nel processo scientifico aumentando in questo modo la rasparenza. L'esempio che facciamo sempre nei nostri corsi è quello di internet. Internet è nato come un protocollo di scambio interno del CERN. Se il CERN avessi in qualche modo brevettato questo protocollo la storia del mondo oggi sarebbe molto diversa hanno scelto invece di aprirlo a tutti. E oggi noi abbiamo internet. Che cosa vuol dire fare Open Science? Open Science è un termine ombrello che si pone in una, nelle dinamiche anche che coinvolgono l'integrità della ricerca, la valutazione di trastrutture che ci consentono poi di fare Open Science e comprende tante cose non solo Open Access alle pubblicazioni ma anche Open Access ai dati protocolli aperti OpenPRreview che ha un aspetto molto importante. Un pilastro fondamentale è l'Open Access alle pubblicazioni ai dati della ricerca. Che cosa vuol dire? Vuol dire dare accesso online libero e senza restrizioni ai risultati della ricerca e ai dati. Vorrei come faccio sempre sottolineare che Open Access non vuol dire pagare per pubblicare. Abbiamo visto prima che quello che noi conosciamo come Open Access in realtà è un modello editoriale un modello di business il Gold Open Access che non va confuso con l'Open Access che invece i ricercatori possono portare avanti nel lavoro diciamo di tutti i giorni aprendo i propri contenuti e i propri risultati. Come si fa a dare accesso alla produzione scientifica istituzionale, lo si fa attraverso un repository che cos'è un repository? È un archivio di oggetti digitali Open Access che sono resi disponibili e scaricaribili ed è accessibile e interoperabile attraverso un protocollo di scambio di informazioni che si chiama OEIPMH. Questo significa che delle infrastrutture possono avere accesso ai dati che sono contenuti in questo repository e avere accesso alle informazioni che ci sono dentro in modo automatico. Quindi non solo l'utente può andare sul repository e avere accesso ai contenuti ma anche una macchina può processare le informazioni. Soprattutto la cosa che vorrei sottolineare è che un repository archivia gli oggetti e implementa una politica di archiviazione a lungo termine, cioè conserva l'informazione. Se voi archiviate un articolo nel vostro computer o in un cloud è vero che lo avete archiviato ma non è detto che avete implementato una politica di conservazione a lungo termine di informazione. Ci sono vari modi per scegliere un repository. Molte istituzioni hanno un repository istituzionale per le pubblicazioni dedicato ai propri ricercatori. Se la vostra istituzione non ne ha uno potete usare i repository messi a disposizione per la vostra comunità o comunque in modo generale. Zenodo per esempio forse molti di voi lo conoscono è un repository che è stato creato in collaborazione fra Openair il CERN ed è aperto a tutti chiunque può andare leggere le informazioni e farsi un account e depositare i propri risultati della ricerca. Che cosa vuol dire quindi fare Open Access dare access aperto alla letteratura scientifica, agli articoli. Abbiamo visto il modello di business called Open Access questa è una strada per dare access aperto alla vostra produzione come vi dicevo prima solo nel 26% dei casi ci sono dei costi per l'autore per la pubblicazione aperta accessibile a tutti sul sito dell'editore potete se no se non scegliete di pubblicare in una rivissa di questo tipo per correre quella che si chiama la strada verde cioè il green open access ovvero si deposita in un archivio aperto quindi in un repository istituzionale, tematico oppure su Zenodo rispettando il copyright che voi avete fermato con l'editore quindi qui non si viola niente la versione che l'editore vi consente di depositare per l'open access ovunque questa sia stata pubblicata quindi in qualsiasi tipo di rivista a volte l'editore chiede un embargo cioè nel copyright questo che per 6 mesi 12 mesi 18 mesi l'accesso all'articolo che voi depositate nel repository non sia possibile in modo aperto perché l'editore vuole avere in qualche modo l'esclusiva della pubblicazione questo va benissimo potete impostare il periodo di embargo quindi l'apertura pianificata del vostro articolo al pubblico attraverso le funzionalità che i vostri repository vi mettono a disposizione come si fa quale sono le versioni che si possono depositare si parla di preprinto lo abbiamo visto prima quindi la vostra bozza il vostro manuscritto che inviata l'editore per chiedere la pubblicazione in una rivista questo non ha ancora i commenti dei revisori inclusi c'è poi il postprint o accepted manuscript che abbiamo visto essere la copia la versione finale che è quella che inviate sostanzialmente all'editore prima che vi venga notificata l'acceptazione quindi è uguale nel contenuti alla versione invece editoriale o pubblicata sul sito dell'editore l'unica differenza sta nell'impaginazione editoriale per sapere qual è la versione che è possibile depositare seguendo il copyright che voi firmate con l'editore c'è una banca dati che vi aiuta si chiama Sherpa Romeo in questa slide che poi chiaramente vi metterò a disposizione trovate tutti i link per trovare invece una rivista open access e sapere se fa pagare IPC potete consultare la directory of open access journal la domanda che vi faccio è è solo un obbligo serve davvero beh serve tantissimo serve non solo per tutto quello che abbiamo detto in precedenza ma serve anche per abilitare servizi come per esempio un paywall che cerca in rete una versione aperta del paper a cui non avete accesso è lo shiab legale tanti di voi sicuramente conoscono shiab shiab è illegale non lo potete usare la persona che lo ha creato probabilmente lo sapete ma continua a scostarsi di paese in paese ed è ricercata a livello mondiale Openair vi offre la stessa funzionalità su Openair potete andare a cercare articoli, capire dove sono le copie open access e andarle direttamente a scaritare abilitano il text in data mining che sono strumenti molto preziosi rappresentano un strumento molto prezioso per affrontare la contestità della conoscenza e poi da accesso ai risultati alle piccole e medie imprese potete velocizzare lo stiamo vedendo molto bene ora la diciamo il processo di pubblicazione perché voi potete pubblicare i vostri risultati come preprint favorire l'open peer review ed evitare questo ritardo enorme che oggi gli articoli hanno dal momento in cui voi fate una scoperta al momento in cui questa viene resa disponibile al mondo in questo momento con il coronavirus i preprint hanno avuto un'impennata pazzesca e gli stessi editori pubblicano i preprint prima della peer review e infine se la vogliamo vedere dal punto di vista la prospettiva del sistema in cui siamo ancora richiusi oggi se il lavoro vale crescono anche le citazioni qui ora io queste slide le scorrerò molto velocemente ma ve le lascio come riferimento è un articolo molto carino che è stato scritto l'anno scorso e che ci dice quali sono i 10 famosi miti da sfatare sul open access ce ne sono 10 qui trovate una traduzione in italiano che è a cura di l'aria fava uno fra tutti ve lo sottolineo qui ma poi lo possiamo vedere meglio nella discussione l'open access ha creato i predatori publisher questa cosa non è assolutamente vera i predatori publisher li conosciamo molto bene esistevano molto prima delle politiche open access della Commissione europea è un modo fraudolento di fare scienza la cosa molto di fare pubblicazioni scientifiche la cosa molto interessante è che più persone hanno provato per esempio a fare una lista dei predatori publisher e ad descriverli attraverso alcune caratteristiche è uscita una lista l'anno scorso di caratteristiche dei predatori publisher e John Brams ha dimostrato che ciascuna di esse si poteva applicare ad Elsevier quindi è molto difficile capire qual è il confine fra i predatori publisher e gli editori tradizionali io questi chiaramente poi ve li lascio ora non li vado a vedere nel dettaglio sono riflessioni molto carine molto interessanti vi parlo ora di come si può fare per dare accesso in modo aperto ai dati della ricerca intanto vi chiedo perché perché bisogna condividere i dati lo abbiamo visto prima perché la scienza diventa più affidabile c'è più trasparenza c'è possibilità di controllo che non è per niente una cosa negativa lo abbiamo visto ci sono persone che in modo diciamo più o meno consapevole si possono approfittare di questo sistema si può riprodurre verificare la ricerca che voi pubblicate si possono riutilizzare i dati anche per ipotesi di ricerca molto diversi alle quali magari voi non pensereste mai si dà visibilità e impatto la produzione scientifica vi faccio rivedere la vignetta che abbiamo visto prima per introdurre un aspetto molto importante sul quale solitamente c'è molta discussione durante questi seminari i dati non sono vostri i dati della ricerca non sono opera di ingegno ma sono informazioni non possono essere soggette a copyright quindi addiritto d'autore che copre l'espressione ma non le idee quindi voi potete chiaramente imporre chiedere il copyright sull'articolo scientifico perché è uno scritto originale vostro è un'opera del vostro ingegno ma non potete chiudere con un copyright i vostri dati il copyright può applicare ai dati la tutela in realtà esiste sulle grandi banche dati sulla struttura della banca dati che può essere un'opera di ingegno cioè se io strutturo la mia banca dati in modo ingegnoso posso in qualche modo mettere un copyright sulla struttura ma non sul contenuto c'è una legge in Europa il diritto sui generis che copre anche la riproduzione la diffusione di una parte sostanziale di un database che è stato prodotto però con alcune regole cioè con un investimento di soldi, di tempo molto importante ed è un diritto difficile da far valere perché chiamiamente la legge non ci dice cosa vuol dire investimento sostanziale non ci dice qual cosa voglia dire il centuale sostanziale di estrazioni coperta da questo diritto i dati grezzi quindi non sono coperti dal copyright voi non potete vantare nessun diritto sulla misura delle temperature esterna della vostra stanza dal letto chiaramente come abbiamo visto prima questa è un'informazione quindi non potete vantare nessun diritto sull'informazione se per sé abbiamo visto che si può avvantare qualche diritto sulla struttura la selezione l'organizzazione dei contenuti di un database non sui dati che contiene e che c'è un diritto sui generi che si applica solo in Europa proteggendo lo sforzo sostanziale per la raccolta non per la creazione dei dati attenzione perché spesso chi possiede questi diritti è l'istituto nel non il cercatore qui c'è un piccolo riasunto di quello che vi ho detto prima quindi sostanzialmente le domande che bisogna porsi sono due siete autori del dataset che avete creato sì nel momento in cui lo potete dimostrare e per questo è importante che voi depositiate i vostri dati in un repository per avere una data certa di pubblicazione un identificativo persistente siete proprietari dei diritti sul dataset no perché i dati sono informazioni quindi i dati della ricerca non vi appartengono ed è per questo che dovete imparare e li dovete gestire nel modo corretto quindi chiaramente qui si entra nella parte relativa all open science che copre la gestione dei dati la gestione non vuol dire aprire necessariamente i dati perché ci sono alcuni dati che effettivamente non possono essere aperti e non si può fornire accia saperto a chiunque a questi dati per vari motivi perché? perché possono contenere informazioni personali perché possono contenere informazioni confidenziali alcuni database come abbiamo visto possono essere soggetti a copyright o addiritto sui generous oppure per altre motivazioni una differenza importante però che io vorrei che fosse molto chiara è che c'è una differenza fra il depositare quindi caricare i dati su una piattaforma che consenta di descrivere in modo corretto attraverso una serie di metadatti strutturata i miei dati e che mi garantisca di conservarli a lungo termine il deposito si fa in un repository caricare i dati quindi fare un upload dei vostri dati ed escriverli non vuol dire aprirli perché voi una volta depositati potete decidere che tipo di accesso dare ai vostri dati chi li potrà vedere quando li potrà vedere e se l'accesso deve essere per esempio connesso a una richiesta specifica quindi deve seguire determinate regole si deve poi indicare una licenza di riuso sostanzialmente come le persone che arrivano sui vostri dati possono avere accesso ad essi e che cosa ci possono fare perché è importante ve lo spiego di nuovo con un aneddoto anni fa un professore italiano ha ricevuto una richiesta da parte di una rivista nella quale aveva pubblicato un articolo gli sono stati richiesti i dati a distanza di qualche anno per dimostrare che quelle che lui aveva pubblicato era corretto beh questo professore non ha potuto mettere a disposizione i dati perché ha ammesso di averli persi durante il terremoto della Aquila quindi l'articolo che aveva scritto è stato ritrattato e lui ha perso la sua pubblicazione questo vi fa capire che depositare i dati è importante per la conservazione come si fa Open Access ai dati beh se i dati possono essere aperti chiaramente si fa un deposito quindi in un archivio il più possibile se esiste tematico quindi un repository disciplinare che la vostra comunità già riconosce e utilizza è molto importante farlo perché questi archivi mettono a disposizione delle schede che descrivono i vostri dati che li descrivono al meglio perché sono specializzati su determinate tipologie di dato se non esiste un archivio disciplinare potete cercare la lista di archivi suddivise per discipline su questo sito che si chiama questo archivio che si chiama Retridata potete andare a consultarlo se non esiste un archivio per la vostra comunità un repository istituzionale in Italia ne esistono veramente pochissimi si contano sull'edità di una mano altrimenti potete utilizzare un repository di tipo catchwall che può archiviare qualsiasi tipologia di oggetto digitale come Zenodo dovete descrivere molto bene questi dati per essere sicuri che chi li incontra sappia come utilizzarlo potete renderli accessibili aprirli si può imporre un embargo a discrezione del progetto o della tipologia di dato quindi potete tenerli chiusi per un certo periodo di tempo e poi aprirli automaticamente quando questo periodo scade e poi dovete dire come questi dati possono essere utilizzati da terzi cioè quale è la licenza di riuso di questi dati depositate una ricca documentazione in modo tale che chi trova questi dati possa sapere come sono stati prodotti chi li ha prodotti se sono stati utilizzati dei protocolli particolari dei setup sperimentali e così via per comprendere meglio questi dati vediamo ora l'ultima parte della presentazione che ci porta un po' a vedere che cosa la commissione europea ha fatto finora che cosa intende poi come intende proseguire il percorso rispetto alle tematiche dell'open access io direi più in generale dell'open science perché non si parla solo di accesso aperto ai dati e alle pubblicazioni questa è diciamo un riassunto della storia dell'open science in Europa parte dal 2007 con l'FP7 quindi il settimo programma quadro il progetto pilota viene creata una open science policy platform con otto priorità fra queste vi faccio notare che ci sono anche rewards and incentives quindi ci sono anche delle politiche che sono discusse molto nel dettaglio in questo periodo su come si potrà mettere in piedi incentivi e come si potrà cambiare poi la valutazione della ricerca quindi anche con gli indicatori e una nuova generazione di metri che ci consentono di valutare in modo più qualitativo la ricerca che viene svolta ci sono tanti iniziative importanti la commissione europea ha anche sta creando una piattaforma di pubblicazione aperta per i beneficiari dei suoi fondi quindi a partire dall'autunno di quest'anno i ricercatori che ricengono fondi europei avranno a disposizione una piattaforma gratuita di pubblicazione open access che aprirà completamente il processo di anche PRVU quindi voi potrete caricare su questa piattaforma il preprint che verrà sottoposto a PRVU quindi alla revisione dei vostri pari della vostra comunità attraverso un processo aperto e trascarente e gestirà poi anche tutto il processo di posto pubblicazione quindi anche la cura e la conservazione degli articoli c'è poi questa grande iniziativa sulla quale io spendo pochissime parole ma che poi può venire discussa più nel dettaglio magari negli eventi che stiamo pensando per voi successivi a questo seminario che è l'european open science cloud l'european open science cloud è uno spazio virtuale di ricerca per l'accessibilità e l'interoperabilità dei dati scientifici che vengono prodotti in Europa in tutte le discipline è un unico punto di accesso per tutta la produzione scientifica europea che in questi anni è stato pensato e progettato e che sta per entrare nella sua seconda fase di test a partire dal primo gennaio del prossimo anno questa è un'iniziativa che io vi invito fortemente a seguire attraverso i link che vi ho messo a disposizione ma potete chiedermi più informazioni perché cambierà sostanzialmente il modo in cui ricercatori europei hanno scenza ed è unica nel suo genere perché nessun altro tipo di paese o continente ha mai pensato di condividere apertamente tutti i dati prodotti dalla ricerca scientifica andiamo poi un pochino più nel dettaglio di quelli che sono gli obblighi che la commissione europea ha attualmente pensato per chi riceve fondi di ricerca attraverso i suoi finanziamenti beh, innanzitutto c'è da dire che la scelta fondamentale che voi dovete fare all'inizio del vostro del vostro progetto o comunque quando producete nuovi dati e nuovi risultati è quella di capire se volete sfruttare commercialmente i risultati della ricerca quindi brevettare o comunque proteggere in altro modo i vostri risultati oppure se volete fare diseminazione scientifica e quindi pubblicare beh, se decidete di pubblicare entrate in una strada che vi obbliga per contratto quindi questo obbligo è contenuto nel grant agreement che voi firmate con la commissione al momento dell'inizio del vostro progetto è un obbligo contratto dovete per forza rendere accessibile le vostre pubblicazioni e destire in modo corretto i vostri dati che cosa si può fare come abbiamo visto per le pubblicazioni la strada verde e la strada oro quindi pubblicare riviste di tipo gold open access che rendono accessibile immediatamente sul sito dell'editore l'articolo che voi scrivete oppure scegliere di depositare con la strada verde in un repository di riferimento della vostra comunità oppure istituzionale la copia consentita per l'open access vediamo nel dettaglio il mandato alla letteratura per la letteratura scientifica beh qui c'è un obbligo un obbligo contratto voi dovete per forza dare accesso aperto a tutte le pubblicazioni scientifiche per review che vengono prodotte dal progetto c'è un periodo di embargo attualmente previsto in realtà per il prossimo programma quadro il periodo di embargo è stato portato a zero vi spiegherò poi perché attualmente per il settore delle scienze STEM diciamo è sei mesi per il settore SSA 12 mesi che cosa dovete depositare dovete depositare il postprint la versione dell'editore in una copia machine readable che cosa vuol dire sostanzialmente un PDF che contenga esattamente quello che viene pubblicato dall'editore quindi ora versione editoriale si è consentita oppure il postprint cioè l'ultimo manoscritto che vi inviate all'editore prima di ricevere l'acceptazione per la pubblicazione i metadati quindi la scheda che descrive il vostro articolo all'interno del reposito che scegliete per il deposito deve contenere i riferimenti al progetto questo per tracciabilità quindi sostanzialmente la commissione europea i vostri revisori i vostri project officer considereranno valide solo le pubblicazioni che vengono marchiate in qualche modo con un riferimento al progetto dove potete depositare in un repository che rispetti le linee guida di OpenR vedremo poi dopo come funziona OpenR questo è un obbligo contratuale per i dati diciamo che la situazione è un pochino più più libera cioè voi entrate di default all'interno di questo programma un opt-out motivandolo che cosa dovete depositare sicuramente i dati che hanno portato a una pubblicazione ma anche tutti gli altri dati che avete prodotto ripeto il deposito vuol dire mettere questi dati al sicuro e conservarli, non vuol dire necessariamente aprirli i metadati anche qui devono avere un riferimento al progetto, dovete usare un repository che rispetti le linee guida di OpenR dovete poi accompagnare il tutto con un data management plan cioè un documento che spieghi come intendete gestire questa produzione di dati il principio con il quale dovete aprire o no, i vostri dati deve essere il più aperto possibile chiuso solo quando necessario che cosa vuol dire quando necessario una di queste opzioni che la Commissione vi mette a disposizione quindi come abbiamo visto se volete sfruttare commercialmente o dal punto di vista industriale i risultati se aprire i vostri risultati può mettere a rischio la sicurezza nazionale o europea se ci sono dei dati personali che dovete proteggere se condividere i vostri dati potrebbe in qualche modo influenzare il raggiungimento degli obiettivi del progetto se non producete nessun tipo di dato oppure per altre legittime ragioni queste ragioni non solo le dovete scrivere nel datamanagement plan ma sono sottoposte all'acceptazione da parte del project officer dei revisori quindi non è detto che se voi scegliete una di queste opzioni di queste motivazioni per l'optout vi venga poi consentito che cosa vi chiede sostanzialmente la Commissione europea vi chiede di gestire i dati per non perderli per questo è richiesto il datamanagement plan che è un deliverable obbligatorio entro il sesto mese dall'inizio del progetto e dovete rendere i vostri dati adderenti a quelle che si chiamano principi fair anche se poi non li volete aprire che cosa sono i principi fair liberiamo in modo proprio molto base e poi lo approfondiremo se volete seguire il corso che abbiamo in programma per voi per rendere adderente i dati ai principi fair significa renderli findable accessible, interoperable and reusable non vuol dire renderli aperti findable vuol dire che devono essere trovabili quindi devono avere una collocazione precisa e di conseguenza possono essere citati accessible vuol dire che devono essere accessibili per almeno dieci anni anche qui non vuol dire aperti ma deve essere chiaro come chi avrà accesso a questi dati però vuol dire che devono essere leggibili anche dalle macchine con un software libero il più possibile libero devono essere integrabili con altri dati e possibilmente collegati ad altre risorse per comprendere bene come sono stati creati e chi li ha creati devono essere reusable, cioè utilizzabili da terzi per un ulteriore analisi quindi si parla di trasparenza e degretà della ricerca, ma anche come punto di partenza per nuove ricette ricette ripetiamo che tutto questo deve essere aperto il più possibile quindi i dati io li devo aprire il più possibile e chiuderli solo se è necessario come si fa beh la tecnologia esiste già ci sono infrastrutture, ci sono strumenti ci sono buone pratiche descritte ci sono standard della comunità procedure per rendere i vostri dati fair e poi per aprirli tutto questo esiste già e solo imparare a conoscerli meglio attenzione però perché se voi siete destinatari di un grande europeo e non rispettate gli obligi open access ricordatevi che avete firmato un contratto che li prevede e quindi se non lo rispettate potreste andare incontro a sanzioni quali sono le sanzioni sono la riduzione o la sospensione dei pagamenti del grant fino ad oggi la commissione europea non ha mai diciamo nostra conoscenza ha applicato una riduzione del grant ma ha già detto che a partire dal prossimo programma quadro è finito il periodo di adattamento all open science vi ricordo che il percorso open science della commissione è cominciato nel 2007 con l'fp7 e il primo programma pilota quindi ormai non ci sono più scuse dovete ottemperare agli obligi contratto chi vi viene incontro vi aiuta open air che è la grande frastruttura europea per l'open access open air sostanzialmente è in connessione con tutti i repositori i più grandi repositori del mondo si parla di 17.000 fonti raccogliei dati per dati si intende non solo i dataset che voi diciamo depositate ma sostanzialmente raccoglie le informazioni di questi dataset attraverso le schede discrittive i metadati che voi compilate quando depositate dataset o pubblicazioni nei repositori raccogliei informazioni sulle istituzioni che le hanno prodotte i progetti che sono collegati ad essi gli enti finanziatori e costruisce un grafo quindi costruisce dei collegamenti fra tutte queste entità che io vi ho descritte e poi lo mette a disposizione sul suo portale e soprattutto lo mette a disposizione degli enti finanziatori questi sono i numeri di open air raccogliamo più di 40 milioni di pubblicazioni 3 milioni di progetti 10 milioni di dataset ci occupiamo di software serviamo più di 20 enti finanziatori poi che cosa facciamo? se andate sul portale di open air potete vedere il grafo che noi costruiamo su diverse prospettive la prospettiva istituzionale, il repositori il singolo progetto il prodotto quindi per esempio nella pagina del progetto troverete tutte le pubblicazioni che open air ha raccolto ed associato al vostro progetto questi dati noi non solo ve li facciamo vedere ma li inviamo agli enti finanziatori quindi per esempio quello che voi trovate sul vostro participant portal rispetto alle pubblicazioni prodotte dal progetto e i dataset deriva proprio dal portale di open air open air non è solo questa infrastruttura ma è una rete di persone che fa supporto e formazione in ogni paese su open science copriamo 34 paesi e lo facciamo in modo specifico perché ogni paese ha un po' le sue peculiarità questi sono i nostri contatti per l'Italia open air coordinato dal CNR e ha anche comprende anche l'Università di Torino con Elena Giglia che cosa facciamo facciamo informazione e formazione come il seminario che state seguendo ora vi diamo supporto e quindi rispondiamo un po' a tutte le vostre domande vi aiutiamo a portare avanti gli oblighe contratuali della commissione e di altri enti finanziatori forniamo servizi per questo forniamo servizi a 360 gradi vi consentiamo di esplorare il grafo quindi di trovare le copy open access degli articoli, di trovare i dataset vi forniamo supporto a vari livelli e tra tutto vi aiutiamo appunto a ottemperare gli oblighe attraverso per esempio Zenodo che vi consente di depositare qualsiasi tipologia di oggetto digitale, pubblicazioni dati, software, tutto quello che voi producete vi forniamo servizi specifici come per esempio Amnesia che consente di anonymizzare i dati eliminando le informazioni personali e vi aiutiamo anche a scrivere che si potete usare un supporto dedicato potete chiedere a noi oppure potete utilizzare il tool automatico che vi mettiamo a disposizione si chiama Argos e lo trovate sul nostro portale un servizio importante che facciamo per la comunità è quello di creare una visione del grafo che sia relativa alla comunità di riferimento che è una delle infrastrutture di ricerca legate al settore della terra e dell'ambiente qui trovate divisi per comunità tutti i risultati, i progetti, le pubblicazioni i dati di interesse per la vostra comunità in un unico punto di accesso gli amministratore della community possono scegliere le fonti per la raccolta di informazione selezionano quindi il tipo di fonte che viene associata alla vostra comunità neonata e anche il gateway il servizio per la comunità che si occupa di raccogliere tutte le tipologie di risultati quindi ci tengo di nuovo a ripeterlo pubblicazioni, dati, progetti relativi al coronavirus vi invito poi dopo questo lungo seminario che sicuramente vi avrà stimolato ma vi avrà anche confuso molto ad approfondire stiamo programmando per voi un corso dettagliato su tutti questi aspetti dettagliato non solo ma anche personalizzato sulla peculiarità della vostra comunità su open access e research data management questo corso si svolgerà a settembre quindi vi invito a informarvi attraverso l'open air e del cnr nella sezione 20 perché presto metteremo online il programma di questo corso vi lascio poi con questa slide che anche qui come quella dei 10 miti su open access vi può fare riflettere parecchio questa è una raccolta di 50 scuse che i ricercatori negli anni hanno portato avanti perché non stavano condividendo i dati sono molto interessanti molte di queste le potremmo dare anche noi per non condividere i nostri dati sostanzialmente molte di queste si basano sul fatto che questi dati non sono precisi oppure che le persone potrebbero vedendoli non capirli questo vi invito a ragionarci un pochino su perché se i dati non sono chiari come facciamo noi se si attrarre conclusioni precise e se i dati non sono chiari perché gli altri non riescono a capirli forse perché noi non li stiamo gestendo nel modo corretto allora con questo io concludo la mia presentazione passo ora la parola a Silvia che invece ci parlerà un pochino più del dettaglio di Geo, di questa iniziativa che scusate concludo la presentazione Silvia C6 questa iniziativa che è relativa proprio alla vostra comunità di riferimento per il mio schermo ti sentiamo si devi condividere il tuo schermo allora io ti ringrazio innanzitutto per la presentazione molto chiara e molto esastiva vi rubo altri 10 minuti e poi la passiamo alla discussione credo no? si esattamente allora vediamo se riesco a condividere mettermi in modalità presentazione esatto allora io nanzitutto ringrazio Emma per avermi dato la possibilità di introdurre brevemente il gruppo di osservazione della terra il gruppo Nerd Observation come uno degli esempi di istituzioni che lavora di avere i dati della ricerca scientifica aperti disponibili proprio nel campo delle osservazioni della terra io presento Geo in qualche modo ne sono entrate a fare parte la mia partecipazione a Geo è iniziata con il progetto Horizon 2020 co-potential che è stato un grande progetto sull'uso dei dati di osservazione della terra per lo sviluppo di l'ecosistemi naturali questo progetto per l'appunto è sento in Horizon 2020 aderiva allo chiuso pochi mesi fa aderiva allo Open Data Pilot che ha descritto Emma prima precedentemente e quindi per rispondere a requisiti della Coal aveva proprio il mandato di rendere i dati aperti e le pubblicazioni della ricerca scientifica Open Access e aveva anche il mandato da parte della Coal di contribuire a Geo e in particolare a due iniziative di Geo che dopo vedremo una sull'ecosistemi che si chiama GeoEco e una sulle montagne che si chiama Gejagnom e quindi mi sono affacciata così al mondo al mondo di Geo e la voglio condividere con voi che cosa è Geo è un gruppo una partnership intergovernamentale vuol dire costituita da governi dei paesi che ha lo scopo di migliorare la disponibilità all'accesso e l'uso di dati di osservazione della terra e quindi ne promuove l'accesso aperto e gratuito quindi Geo ha proprio come mandato la condivisione di dati aperti coordinati e sostenibili e di promuovere le infrastrutture per migliorare la ricerca e per informare i decisori pubblici quindi applica in pratica i fondamenti della scienza aperta che è scritto precedentemente quindi i fondamenti programmatici di Geo stanno in tre documenti internazionali che definiscono l'azione della politica dei nostri paesi e sono l'agenda del 2030 per le obiettivi di sviluppo sostenibile l'agenda delle nazioni unite l'accordo di Parigi sul clima del 2015 e il meno conosciuto Sendai framework che in realtà è molto importante perché anche questo è un accordo internazionale sulla riduzione del rischio di disastri che è nato dopo gli eventi di Fukushima quindi Geo supporta l'implementazione di questi programmi e fornisce come fa fornendo i dati necessari per il monitoraggio alle politiche ad esempio un esempio per tutti quello dei sustainable development goals cioè del monitoraggio degli obiettivi per lo sviluppo sostenibile quindi raccoglie fornisce i dati alle nazioni unite su un mandato delle nazioni unite i dati necessari per il monitoraggio dell'aggiungimento degli obiettivi di sviluppo sostenibile allora come come è fatta Geo cioè a Geo partecipano più di 100 paesi e più di 100 organizzazioni internazionali tra cui le nazioni unite e l'Unione Europea cioè la Commissione Europea il CNR è anche molto presente in Geo e lo vedremo successivamente quali dati di osservazione della Terra raccoglie Geo allora i dati di osservazione della Terra riguardano diciamo ogni comparto non solo i dati di tipo diciamo geologico ma i dati che riguardano l'atmosfera l'inquinamento, le terremerze, gli oceani e tutti i dati satellitari ma anche i dati in situ e perché noi pensiamo che sia necessario diciamo mettere a disposizione a livello planetario i dati di osservazione della Terra oltre tutte le motivazioni che ha spiegato Emma prima cioè motivi di trasparenza di facilitazione di dati della ricerca c'è un motivo ben specifico che noi diciamo scienziati della Terra conosciamo bene ed è questo allora quindi diciamo questa immagine che conosciamo tutti, il cui senso immediato che la Terra è un insieme interconnesso e quindi i dati che riguardano il studio della Terra devono essere gestiti e condivisi globalmente quindi non mi soffermo oltre perché questa immagine diciamo che parla da sola allora per introdurre la filosofia di Geo e gli obiettivi che si pone vi propongo di guardare insieme due primi minuti di questa bellissima intervista a Barbara Ryan che è una scienziata diciamo molto incredibile che è stata fino a due anni fa la direttrice della segretaria generale di Geo allora adesso la condivido con voi e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e