Docs Italia beta

Documenti pubblici, digitali.

7.2. Dati

Lo scopo di questa sezione è documentare tutti gli aspetti relativi ai dati, consentendo di tenerne traccia nel corso del progetto. Vanno quindi descritte sinteticamente le tipologie di dati raccolte nel progetto o i documenti digitali conservati dall’Istituto, i formati utilizzati, l’origine dei dati e l’eventuale migrazione di dati esistenti. Contiene inoltre informazioni sintetiche sulla tipologia di documenti digitali o di beni oggetto di digitalizzazione, e sulla quantità di dati che si prevede di raccogliere nel corso del progetto.

Tutte queste informazioni sono utili per documentare i processi che generano e trasformano i dati del progetto. Di seguito sono descritti più nel dettaglio i principali aspetti relativi ai dati che è opportuno descrivere nel DMP. Di fianco al nome di ogni sezione è indicata la responsabilità nella compilazione.

7.2.1. Produzione e raccolta dei dati ⓘ

In questa sezione è opportuno descrivere le modalità di produzione e raccolta dei dati in relazione agli obiettivi del progetto. In particolare, occorre descrivere dettagliatamente in che modo i dati vengono raccolti/prodotti all’origine, chi è responsabile della raccolta o della produzione, se la raccolta/produzione avviene in maniera automatica o manuale.

In caso di produzione automatica dei dati, sarebbe rilevante esplicitare quali strumenti software vengono utilizzati per questa attività e se e in che modo i dati vengono trasformati dopo la raccolta. Nel caso vengano trasformati, quali strumenti software vengono adottati. Per ulteriori informazioni, fare riferimento al capitolo «Il progetto di digitalizzazione, Come» delle Linee guida per la digitalizzazione del patrimonio culturale e alle Linee guida per l’acquisizione, la circolazione e il riuso delle riproduzioni dei beni culturali in ambiente digitale .

7.2.2. Tipologie e formati di dati ⓘ

È opportuno che il DMP descriva tutte le tipologie di dati prodotti/raccolti nel progetto, e per ogni tipologia il formato in cui sono raccolti i dati, facendo riferimento al capitolo Formati delle Linee guida per la digitalizzazione del patrimonio culturale e alle linee guida AgID sui formati aperti per i dati e i documenti [7]. L’uso dei formati consigliati dalle linee guida garantisce la migliore esecuzione del processo di digitalizzazione e della valorizzazione del bene. Inoltre, buona pratica per la conservazione a lungo termine di progetti di digitalizzazione, è la generazione di file master (lossless e non compresso) e di uno o più file derivati.

7.2.3. Origine dei dati ⓘ

Un aspetto che va sicuramente monitorato e tracciato è l’origine dei dati che ci si trova a trattare. Affinché possano essere documentate la conoscenza delle origini e gli eventuali spostamenti dei dati, è importante indicare chi ha originariamente prodotto i dati e in che modo, quando e dove sono stati prodotti i dati, e se si tratta di dati nuovi o già esistenti. Inoltre, se si tratta di dati esistenti, è opportuno indicarne la provenienza e descriverne le modalità di migrazione (sezione 7.2.5).

7.2.4. Tipologia di beni ⓘ

Per ciò che riguarda un progetto di digitalizzazione, la precisazione della tipologia dei beni a cui si riferiscono gli oggetti digitali può essere di supporto alla documentazione e a una successiva verifica. In particolare, è utile descrivere nel dettaglio tutte le tipologie di beni a cui si riferiscono i dati e per ogni tipologia indicare la quantità di beni oggetto di digitalizzazione, l’intervallo temporale e il luogo geografico di origine dei beni. Queste informazioni potranno essere utili anche a fini statistici e di ricerca.

7.2.5. Migrazione di dati esistenti ⓘ

Nel caso di migrazione o conversione di dati esistenti, è opportuno indicare nel DMP le tipologie di migrazione e conversione e i metodi utilizzati, verificando se ci siano incongruenze tra il vecchio e il nuovo formato, e controllando che non siano più utilizzati formati obsoleti. A corredo di queste informazioni va inoltre affiancata una descrizione dei vari passaggi della migrazione e della conversione, con particolare riferimento alla pulizia dei dati, alla preparazione e rimozione di informazioni duplicate per garantire l’integrità dei dati, alla qualità e alla sicurezza dei dati. In questo modo, sarà possibile tenere traccia delle procedure seguite ed eventualmente ripeterle in caso di necessità. Inoltre, nel DMP è opportuno indicare quali strumenti software vengono utilizzati per compiere queste operazioni e descrivere l’archivio dei file sorgenti.

7.2.6. Quantità di dati prevista ⓘ

È importante stimare fin dall’inizio del progetto la quantità di dati che si prevede di raccogliere, o almeno il loro ordine di grandezza. In base alla quantità di dati indicata, potranno essere previsti diversi profili di configurazione, con riferimento anche al conferimento alla costituenda infrastruttura nazionale dei dati del patrimonio culturale (cfr. par. Infrastruttura nazionale dei dati del patrimonio culturale del PND).

[7]Cfr. https://docs.italia.it/italia/daf/lg-patrimonio-pubblico/it/stabile/arch.html#formati-aperti-per-i-dati-e-documenti