4.4. Dati della ricerca¶
I dati della ricerca sono definiti dal Decreto come “documenti informatici, diversi dalle pubblicazioni scientifiche, raccolti o prodotti nel corso della ricerca scientifica e utilizzati come elementi di prova nel processo di ricerca, o comunemente accettati nella comunità di ricerca come necessari per convalidare le conclusioni e i risultati della ricerca”.
Esempi di tale tipologia di dati sono forniti nella Direttiva: statistiche, risultati di esperimenti, misurazioni, osservazioni risultanti dall’indagine sul campo, risultati di indagini, immagini e registrazioni di interviste, oltre a metadati, specifiche e altri oggetti digitali. La Direttiva precisa anche che i dati della ricerca, come da definizione, sono diversi dagli articoli scientifici, in cui si riportano e si commentano le conclusioni della ricerca scientifica sottostante.
must
REQUISITO 9: dlgs36-2006/opendata/req/research/free
I dati della ricerca DEVONO essere resi disponibili gratuitamente per il riutilizzo per fini commerciali o non commerciali.
I dati da considerare sono quelli che rappresentano il risultato di attività di ricerca finanziata con fondi pubblici e resi pubblici, anche attraverso l’archiviazione in una banca dati pubblica gestita a livello istituzionale o su base tematica, da ricercatori, organizzazioni che svolgono attività di ricerca e organizzazioni che finanziano la ricerca.
Nel processo di identificazione dei dati della ricerca da rendere disponibili per il riutilizzo è necessario tenere conto della protezione dei dati personali, degli interessi commerciali, dei diritti di proprietà intellettuale [1] e dei diritti di proprietà industriale [2].
Il Decreto dispone che i dati della ricerca DEVONO rispettare i requisiti di reperibilità, accessibilità, interoperabilità e riutilizzabilità che rappresentano i 4 principi del framework FAIR (Findable - Accessible - Interoperable - Reusable) [3]. Di seguito le indicazioni per adempiere a tale disposizione [4].
Findable (Reperibile) - Il primo requisito da rispettare per garantire il riutilizzo dei dati è di rendere i dati reperibili da macchine ed essere umani. Per fare questo, dovrebbero essere resi disponibili i metadati attraverso una risorsa consultabile online e dovrebbe essere assegnato un identificatore persistente a dati e metadati.
must
REQUISITO 10: dlgs36-2006/opendata/req/research/findable
Per rendere i dati reperibili è necessario:
- documentare i dati con metadati dettagliati secondo il Requisito 15 e il Requisito 16;
- assegnare a dati e metadati un identificatore univoco e persistente (per es. DOI);
- rendere disponibili online i metadati attraverso una risorsa consultabile, come per esempio un catalogo o un repository, seguendo il Requisito 29 e il Requisito 30;
- specificare l’identificatore del dato nei metadati seguendo le indicazioni presenti nei documenti di cui al Requisito 15 e al Requisito 16.
Accessible (Accessibile) - Deve essere possibile per essere umani e macchine accedere ai dati attraverso protocolli standard e aperti.
must
REQUISITO 11: dlgs36-2006/opendata/req/research/accessible
Per rendere i dati accessibili è necessario:
- consentire l’accesso a dati e metadati a partire dall’identificatore univoco e persistente assegnato;
- utilizzare protocolli standardizzati e aperti (per es. https);
- rendere sempre disponibili i metadati anche quando i dati non sono accessibili (o perché sono applicati meccanismi di autenticazione e autorizzazione all’accesso o perché non più disponibili).
Interoperable (Interoperabile) - Dati e metadati devono poter essere combinati con altri dati e/o strumenti. Per questo, devono essere conformi a formati e standard riconosciuti.
must
REQUISITO 12: dlgs36-2006/opendata/req/research/interoperable
Per rendere i dati interoperabili è necessario:
- fornire i dati in formato aperto secondo i requisiti definiti nelle presenti Linee Guida;
- utilizzare gli standard pertinenti per i metadati coerentemente con il Requisito 15 e il Requisito 16;
- utilizzare, ove possibile, vocabolari controllati, parole chiave, thesauri e ontologie;
- inserire riferimenti qualificati ad altri dati o metadati.
Reusable (Riutilizzabile) - I dati devono essere ben documentati in modo che possano essere interpretati correttamente, replicati e/o combinati anche in contesti diversi. Ai dati, inoltre, bisogna assegnare una licenza chiara e accessibile in modo che si possa capire che tipo di riutilizzo è consentito.
must
REQUISITO 13: dlgs36-2006/opendata/req/research/reusable
Per rendere i dati riusabili è necessario:
- rendere disponibili dati accurati e ben descritti con molti attributi pertinenti;
- assegnare ai dati una licenza d’uso chiara e accessibile secondo il Requisito 20 e il Requisito 21;
- rendere chiaro come, perché, quando e da chi i dati sono stati creati e processati;
- seguire i pertinenti standard di dominio per dati e metadati (v., per questi ultimi, Requisito 15 e Requisito 16).
La necessità che i dati della ricerca seguano e siano conformi ai principi FAIR è ribadita anche dal Programma nazionale per la ricerca (PNR) 2021-2027 [5], che considera tale conformità come uno degli “strumenti” per l’attuazione della scienza aperta. Si legge: “I dati come tutti i risultati della ricerca devono innanzitutto essere conformi ai criteri FAIR e cioè essere reperibili tempestivamente, accessibili su richiesta, interoperabili e comunque riusabili con le opportune regole, strumenti e risorse. I criteri FAIR sono la base per la fruizione e il riutilizzo di dati di diversa provenienza tematica e metodologica. Fare in modo che la produzione di dati FAIR diventi lo standard di riferimento per i risultati della ricerca finanziata con risorse pubbliche comporta un’innovazione sostanziale nella prassi scientifica sia a livello di produzione dei dati sia a livello della fruizione dei medesimi per elaborare nuove conoscenze. Si tratta di evoluzione delle prassi della ricerca (utilizzo di informazioni esistenti, sviluppo della multidisciplinarietà e della interdisciplinarità, collaborazione formale e informale) validazione e valutazione dei risultati. Essa apre anche nuove prospettive di innovazione tecnologica (acquisizione automatica di dati FAIR ove possibile e sviluppo di servizi digitali per la cura, l’archiviazione, l’accesso, l’analisi e la fruizione di risorse di calcolo)”.
In tema di politiche di accesso aperto, il PNR include il “Piano nazionale per la scienza aperta” (non ancora adottato) che ha tra i suoi obiettivi, tra l’altro, l’accesso aperto, appunto, agli strumenti di produzione della ricerca, ai dati generati e alle pubblicazioni scientifiche nonché il sostegno all’accesso ai dati FAIR.
Un ruolo essenziale nell’attuazione della strategia sulla scienza aperta e delle politiche di accesso aperto è svolto dalle infrastrutture di ricerca, oggetto del “Piano nazionale per le Infrastrutture di Ricerca” [6] (parte integrante, anch’esso, del PNR), a cui si rimanda per tutti gli aspetti che possono avere un impatto sull’applicazione del Decreto con riferimento alle banche dati pubbliche, gestite a livello istituzionale o su base tematica, necessarie per l’archiviazione dei dati della ricerca da rendere disponibili per il riutilizzo.
should
Raccomandazione 3: dlgs36-2006/opendata/req/research/fair
Ove possibile, i principi FAIR dovrebbero essere seguiti e applicati per tutte le tipologie di dati, non solo per quelli della ricerca.
Risorse utili
- text/html FAIR principles
- text/html The FAIR data principles
- text/html How to make your data FAIR – Guides for Researchers
- text/html How FAIR are your data? Checklist
- application/pdf Programma nazionale per la ricerca (PNR) 2021-2027
- application/pdf Piano Nazionale Infrastrutture di Ricerca (PNIR) 2021 – 2027
[1] | legge 22 aprile 1941, n. 633 |
[2] | decreto legislativo 10 febbraio 2005, n. 30 |
[3] | https://force11.org/info/the-fair-data-principles/ |
[4] | Nella definizione dei requisiti, si è fatto riferimento alla guida “How to make your data FAIR” pubblicata nell’ambito dell’iniziativa OpenAIRE (v. https://www.openaire.eu/how-to-make-your-data-fair) e la checklist “How fair are your data?” creata da Sarah Jones e Marjan Grootveld (v. https://zenodo.org/record/5111307#.YhEfAd_SKCQ). |
[5] | https://www.mur.gov.it/sites/default/files/2021-01/Pnr2021-27.pdf |
[6] | Piano Nazionale per le Infrastrutture di Ricerca 2021-2027 adottato con DM n. 1082 del 10/09/2021 (v. https://www.mur.gov.it/it/atti-e-normativa/decreto-ministeriale-n1082-del-10-09-2021). |