Docs Italia beta

Documenti pubblici, digitali.

7.2. Dati

Lo scopo di questa sezione è documentare tutti gli aspetti relativi ai dati, consentendo di tenerne traccia nel corso del progetto. Vanno quindi descritte sinteticamente le tipologie di dati raccolte nel progetto o i documenti digitali conservati dall’Istituto, i formati utilizzati, l’origine dei dati e l’eventuale migrazione di dati esistenti. Contiene inoltre informazioni sintetiche sulla tipologia di documenti digitali o di beni oggetto di digitalizzazione, e sulla quantità di dati che si prevede di raccogliere nel corso del progetto.

Tutte queste informazioni sono utili per documentare i processi che generano e trasformano i dati del progetto. Di seguito sono descritti più nel dettaglio i principali aspetti relativi ai dati che è opportuno descrivere nel DMP. Di fianco al nome di ogni sezione è indicata la responsabilità nella compilazione.

7.2.1. Produzione e raccolta dei dati ⓘ

In questa sezione è opportuno descrivere le modalità di produzione e raccolta dei dati in relazione agli obiettivi del progetto. In particolare, occorre descrivere dettagliatamente in che modo i dati vengono raccolti/prodotti all’origine, chi è responsabile della raccolta o della produzione, se la raccolta/produzione avviene in maniera automatica o manuale.

In caso di produzione automatica dei dati, sarebbe rilevante esplicitare quali strumenti software vengono utilizzati per questa attività e se e in che modo i dati vengono trasformati dopo la raccolta. Nel caso vengano trasformati, quali strumenti software vengono adottati. Per ulteriori informazioni, fare riferimento al capitolo I, sezione D delle Linee guida per la digitalizzazione del patrimonio culturale e alle Linee guida per l’acquisizione, la circolazione e il riuso delle riproduzioni dei beni culturali in ambiente digitale.

7.2.2. Tipologie e formati di dati ⓘ

È opportuno che il DMP descriva tutte le tipologie di dati prodotti/raccolti nel progetto, e per ogni tipologia il formato in cui sono raccolti i dati, facendo riferimento al capitolo II delle Linee guida per la digitalizzazione del patrimonio culturale e alle linee guida AgID sui formati aperti per i dati e i documenti [7]. L’uso dei formati consigliati dalle linee guida garantisce la migliore esecuzione del processo di digitalizzazione e della valorizzazione del bene. Inoltre, buona pratica per la conservazione a lungo termine di progetti di digitalizzazione, è la generazione di file master (lossless e non compresso) e uno o più file derivati.

7.2.3. Origine dei dati ⓘ

Un aspetto che va sicuramente monitorato e tracciato è l’origine dei dati che ci si trova a trattare. Affinché possano essere documentate la conoscenza delle origini e gli eventuali spostamenti dei dati, è importante indicare chi ha originariamente prodotto i dati e in che modo, quando e dove sono stati prodotti i dati, e se si tratta di dati nuovi o già esistenti. Inoltre, se si tratta di dati esistenti, è opportuno indicarne la provenienza e descriverne le modalità di migrazione (sezione 7.2.5).

7.2.4. Tipologia di beni ⓘ

Per ciò che riguarda un progetto di digitalizzazione, la precisazione della tipologia dei beni a cui si riferiscono gli oggetti digitali può essere di supporto alla documentazione e a una successiva verifica. In particolare, è utile descrivere nel dettaglio tutte le tipologie di beni a cui si riferiscono i dati e per ogni tipologia indicare la quantità di beni oggetto di digitalizzazione, l’intervallo temporale e il luogo geografico di origine dei beni. Queste informazioni potranno essere utili anche a fini statistici e di ricerca.

7.2.5. Migrazione di dati esistenti ⓘ

Nel caso di migrazione o conversione di dati esistenti, è opportuno indicare nel DMP le tipologie di migrazione e conversione e i metodi utilizzati, verificando se ci siano incongruenze tra il vecchio e il nuovo formato, e controllando che non siano più utilizzati formati obsoleti. A corredo di queste informazioni va inoltre affiancata una descrizione dei vari passaggi della migrazione e della conversione, con particolare riferimento alla pulizia dei dati, alla preparazione e rimozione di informazioni duplicate per garantire l’integrità dei dati, alla qualità e alla sicurezza dei dati. In questo modo, sarà possibile tenere traccia delle procedure seguite ed eventualmente ripeterle in caso di necessità. Inoltre, nel DMP è opportuno indicare quali strumenti software vengono utilizzati per compiere queste operazioni e descrivere l’archivio dei file sorgenti.

7.2.6. Quantità di dati prevista ⓘ

È importante stimare fin dall’inizio del progetto la quantità di dati che si prevede di raccogliere, o almeno il loro ordine di grandezza. In base alla quantità di dati indicata, potranno essere previsti diversi profili di configurazione, con riferimento anche al conferimento all’infrastruttura software per i beni culturali.

[7]https://docs.italia.it/italia/daf/lg-patrimonio-pubblico/it/stabile/arch.html#formati-aperti-per-i-dati-e-documenti