Docs Italia beta

Documenti pubblici, digitali.

Piano nazionale di digitalizzazione del patrimonio culturale

image0

2022-2023

Linee guida per la digitalizzazione del patrimonio culturale

Versione 1.0 – giugno 2022

Premessa

Le Linee guida per la digitalizzazione del patrimonio culturale definiscono gli approcci e le procedure per la creazione, la metadatazione e l’archiviazione degli oggetti digitali, ovvero le riproduzioni, eseguite con diverse modalità tecniche e procedure, del patrimonio analogico. Il documento, dal carattere informativo più che prescrittivo, intende fornire una base teorica e tecnica rivolta al personale degli istituti culturali che è incaricato della preparazione e della gestione dei progetti di digitalizzazione.

Queste Linee guida definiscono il progetto di digitalizzazione in relazione alle motivazioni della digitalizzazione, agli attori coinvolti nel processo, alle modalità di operazione, alla selezione dei beni da digitalizzare e alle tempistiche di esecuzione. Forniscono specifiche sui formati dei file da utilizzare, sui metadati, sugli identificativi delle risorse, sulla nomenclatura delle risorse digitali e sui supporti adibiti alla conservazione. Le Linee guida offrono, inoltre, indicazioni relative alla definizione della parte economica e alle procedure amministrative da svolgere, prendendo in considerazione lo sviluppo del progetto dalle prime fasi di progettazione e di affidamento, fino alle fasi di collaudo delle attività di digitalizzazione e di controllo qualità sui risultati delle operazioni.

Resta, tuttavia, indubbio che per una appropriata realizzazione di un’attività di digitalizzazione siano necessarie, da parte dei soggetti coinvolti, ulteriori ricerche su vari aspetti, quali particolari approfondimenti tecnici o procedurali, che intenzionalmente non hanno trovato luogo in questo testo. Trattandosi di Linee guida e non di un manuale tecnico, il lettore non troverà indicazioni esaustive sulla riproduzione digitale di ogni singola tipologia di beni culturali, in quanto le evoluzioni tecnologiche esigono un continuo aggiornamento professionale e metodologico. Allo stesso modo non costituiscono oggetto di questo documento le operazioni di digitalizzazione effettuate per finalità diagnostiche. Gli aspetti gestionali delle infrastrutture per lo storage e della conservazione a lungo termine, il tema dei sistemi di accesso e fruizione, l’argomento delle licenze d’uso e della circolazione delle riproduzioni dei beni culturali, nonché la strutturazione del piano di gestione dei dati sono demandati ad altri allegati tecnici del Piano nazionale di digitalizzazione.

Le Linee guida per la digitalizzazione del patrimonio culturale offrono paradigmi di processo e modelli operativi volti a creare una solida base comune per la corretta impostazione di progetti di digitalizzazione del patrimonio culturale che sappiano essere coerenti con la Visione del Piano nazionale di digitalizzazione e che sappiano inscriversi in un processo di trasformazione digitale di lungo periodo. L’obiettivo del documento è garantire che le attività di digitalizzazione intraprese dai singoli istituti possano essere svolte in modo consapevole, organizzato ed efficace, creando dati di qualità in linea con i più aggiornati standard, in grado di assicurarne l’interoperabilità e la longevità. Proprio per far sì che tali Linee guida possano costituire un valido punto di riferimento, esse saranno oggetto di periodiche revisioni e aggiornamenti a cura dell’Istituto centrale per la digitalizzazione del patrimonio culturale – Digital Library.

Il progetto di digitalizzazione

Perché (scopi e obiettivi della digitalizzazione)

L’individuazione degli scopi e degli obiettivi costituisce la prima azione nella definizione e redazione di un progetto di digitalizzazione. È infatti con essi che devono essere messi in relazione le risorse economiche e umane a disposizione e i tempi prefissati, al fine di giungere ad un prodotto rispondente alle aspettative iniziali. A tal fine, è necessario progettare un modello di lavoro scalabile e modulare, capace di adeguarsi alle varie esigenze, alle diverse situazioni e ai possibili cambiamenti che si possono presentare in corso d’opera.

Gli obiettivi essenziali di un progetto di digitalizzazione possono essere sintetizzati nei seguenti quattro punti:

  1. conservazione degli originali,
  2. fruizione e valorizzazione dei beni,
  3. studio del patrimonio,
  4. recupero di campagne di digitalizzazione pregresse.

Conservazione degli originali

Nelle attività di conservazione degli originali il desiderio e la necessità di preservare opere spesso fragili e sottoposte alle ingiurie del tempo hanno soventemente condotto alla decisione di limitarne la consultazione diretta.

Oggi la salvaguardia e la fruizione – grazie alle diverse attività di digitalizzazione – non costituiscono più termini contrapposti di una dialettica schiacciata sulla polarizzazione degli estremi, ma concetti che si integrano in un nuovo modello di sintesi in cui l’una non esclude l’altra, ma anzi ne potenzia e condivide la natura e le funzioni. Infatti, la possibilità di realizzare copie digitali fedeli agli originali abilita da un lato la preservazione materiale e dall’altro la fruizione virtuale dei medesimi originali.

La “copia digitale” dell’originale, se eseguita correttamente e con finalità di documentazione, assume valenza informativa e conoscitiva paragonabile a quella del bene stesso, rappresentandone caratteristiche materiali e relative allo stato di conservazione.

Nella storia della trasmissione della conoscenza umana i processi di migrazione del messaggio culturale da un vettore all’altro hanno prodotto copie su copie, in un avvicendarsi continuo di antigrafo e apografo, al fine di garantire la continuità e la salvezza del patrimonio attraverso i secoli. L’attenzione è stata incentrata a volte sul contenuto (è il caso della tradizione manoscritta di testi e documenti), a volte sulla forma (è il caso dell’arte statuaria antica), a volte su forma e contenuto (è il caso di riproduzioni che perpetuano un contenuto riproducendone anche le forme).

In questa prospettiva storica di lunga durata si inserisce anche il digitale, che rispetto alle tecniche e alle metodologie del passato utilizzate nell’ambito della replicazione dei messaggi culturali porta con sé un vantaggio: se le copie digitali vengono eseguite con metodo scientifico – vale a dire con un procedimento documentato, verificabile e ripetibile – le caratteristiche e gli elementi oggettivi legate ad esse risultano agevolmente distinguibili da quelli soggettivi. Le caratteristiche e gli elementi oggettivi legati alla riproduzione digitale, infatti, possono essere appropriatamente descritti nei metadati (ad esempio, la scelta della puntina del giradischi, il color management, la scelta dell’ottica, ecc.) e conservati insieme alla copia digitale.

Fruizione e valorizzazione dei beni

Il digitale aiuta ad attuare in maniera più efficace lo spirito dell’art. 9 della Costituzione italiana, amplificando le modalità di fruizione del patrimonio culturale, promuovendo e garantendo in modo attivo lo sviluppo della cultura, della ricerca scientifica e della tecnica. I beni digitalizzati offrono alle più svariate comunità di utenti l’opportunità di una più ampia accessibilità e di una migliore usabilità del patrimonio culturale. La digitalizzazione del patrimonio culturale va intesa in senso ampio, non più come un aspetto accessorio degli istituti culturali, ma come una componente inscindibile a tutti i loro processi interni, nell’ottica di ampio respiro della trasformazione digitale. In questa accezione, la digitalizzazione del patrimonio si configura come un aspetto imprescindibile per ogni attività di gestione del patrimonio stesso. È utile mettere in rilievo, inoltre, che la pubblicazione online delle risorse digitali della cultura consente la creazione di nuove connessioni e correlazioni tra beni, luoghi, discipline, progetti e infrastrutture a livello italiano, europeo e internazionale.

Studio e diagnosi del materiale

La riproduzione digitale del bene ha anche una finalità scientifica legata alla conoscenza del bene stesso. Una risorsa digitale consente di indagare caratteristiche materiali, struttura e stato di conservazione del bene. Essa permette di leggerne la superficie e quanto vi è al di sotto. Per esempio, nel caso di supporti palinsesti, può consentire la lettura degli strati di scrittura, contribuendo al recupero di testi non altrimenti tramandati.

Attraverso questa attività di studio e di diagnosi è possibile simulare le diverse sollecitazioni a cui il bene può essere sottoposto dal trascorrere del tempo o da eventi improvvisi e studiarne le possibili contromisure da adottare. Le tecnologie digitali possono risultare di aiuto, se costantemente applicate nel tempo, anche nel monitoraggio dello stato di conservazione dei beni. Fra le possibilità più significative, infine, c’è quella di operare “restauri digitali” – uno fra tutti la restituzione della cromia originale del bene – laddove non sia possibile od opportuno procedere con un restauro fisico oppure in combinazione con quest’ultimo.

Recupero di campagne di digitalizzazione pregresse

A partire dagli anni Novanta del secolo scorso sono state condotte importanti campagne di digitalizzazione, spesso in assenza di regolamentazione omogenea e coordinata e con esiti qualitativamente difformi. In questo caso occorre valutare preliminarmente l’opportunità di recuperare le risorse prodotte, includendo anche le risorse native digitali e non solo le digitalizzazioni di materiale analogico, rendendole fruibili secondo le specifiche indicate nelle presenti Linee guida: è quindi necessario, preliminarmente all’attività di digitalizzazione, procedere con uno studio di fattibilità. Si faccia riferimento in modo particolare al profilo applicativo di sistema METS-ECO-MIC che disponibile presso il repository di GitHub Allegati PND [1].

In definitiva, le motivazioni per la digitalizzazione di un bene o di un luogo culturale sono molteplici e ognuna di esse contribuisce a soddisfare differenti esigenze in modo complementare. Per questo motivo è quanto mai opportuno immaginare il prodotto digitale che si ricaverà dalla campagna di digitalizzazione come “proiettato nel futuro”, affinché non sia oggetto di una veloce obsolescenza e il suo livello qualitativo possa dimostrarsi adeguato anche per scopi diversi da quello per cui è stato immediatamente realizzato.

[1]https://github.com/icdp-digital-library/allegati-pnd

Che cosa (selezione e trattamento del bene)

La scelta dei beni da digitalizzare è un’attività strettamente legata agli obiettivi della campagna di digitalizzazione. Pertanto, all’interno dei singoli progetti, è opportuno adottare criteri di selezione del materiale commisurati agli obiettivi che si intendono raggiungere.

Requisito indispensabile per la buona riuscita delle attività di digitalizzazione è che i singoli beni siano stati preventivamente descritti secondo le regole specifiche di ciascun dominio. La descrizione del bene è infatti in grado di informare le stesse modalità di digitalizzazione e di fornire indicazioni in merito a come condurre le attività di digitalizzazione nel modo più appropriato (ad esempio, la descrizione seppur speditiva del bene può essere utile per determinare il numero di scatti necessari e i punti di ripresa ottimali per la rappresentazione di un oggetto fisico). Inoltre, l’attività di digitalizzazione rappresenta un momento prezioso in cui i beni vengono estratti dalle loro condizioni conservative normali, movimentati, eventualmente puliti o spolverati, correttamente illuminati: si creano ciò delle condizioni ottimali per una ispezione approfondita del bene che è precondizione necessaria per una corretta descrizione.

Laddove si decida di digitalizzare beni non descritti, sarà opportuno prevedere la descrizione preventiva dei beni da digitalizzare. Alternativamente, e sempre a seconda delle specifiche condizioni di conservazione dei beni, la descrizione può essere effettuata durante il processo di digitalizzazione. In tal caso, occorrerà pianificare attentamente gli aspetti logistici e processuali di cantiere, che prevedono la compresenza di diverse figure professionali presso l’istituto dove avviene la digitalizzazione.

A monte di questi processi, le risorse fisiche oggetto di digitalizzazione devono essere preventivamente inventariate. Ad esempio, in riferimento ai beni del dominio catalografico, questi devono essere dotati di un identificativo fisico apposto sulla superficie del bene, elemento che consente l’identificazione univoca dell’oggetto e il collegamento logico con la descrizione catalografica. Il numero di inventario riferito al soggetto conservatore del bene costituirà così il legame univoco fra il record catalografico che descrive la risorsa fisica e il metadato descrittivo che accompagna le risorse digitali.

La tipologia, la quantità e la collocazione dei beni individuati determineranno chi (enti coinvolti e team di progetto, cfr. par. Chi (enti coinvolti e team di progetto)) dovrà contribuire al processo di digitalizzazione, nonché le modalità (cfr. par. Come) e la logistica (cfr. par. Dove) dell’acquisizione digitale.

I beni da digitalizzare devono essere predisposti in modo da risultare idonei per le diverse fasi dell’attività operativa. Essi devono essere identificati univocamente con un numero d’inventario e devono essere in condizioni conservative compatibili con gli obiettivi previsti. Lo stato di conservazione deve essere documentato, preferibilmente, con una relazione dettagliata (condition report), ed eventuali alterazioni devono essere segnalate e documentate, anche mediante scatti fotografici preventivi.

Una valutazione preliminare può indicare la necessità di interventi propedeutici alla digitalizzazione: dalla rimozione della polvere (spolveratura) fino a interventi più rilevanti di conservazione e restauro preventivo. Questo tipo di analisi può essere inserita nella documentazione progettuale, utile per lo studio della fattibilità di progetto.

Come prescrivono le norme vigenti nel settore dei beni culturali, tutte le pratiche operative che prevedono interventi o azioni dirette sui beni, digitalizzazione compresa, devono essere autorizzate dall’autorità competente ed eseguite da personale qualificato.

Un ulteriore elemento che è necessario considerare nella fase di selezione del materiale da digitalizzare è quello relativo alla presenza di diritto d’autore relativo ai beni digitalizzati o alla presenza di informazioni sensibili: si vedano a proposito le Linee guida per l’acquisizione, la circolazione e il riuso delle riproduzioni dei beni culturali in ambiente digitale allegate al Piano nazionale di digitalizzazione.

Chi (enti coinvolti e team di progetto)

Un progetto di digitalizzazione coinvolge necessariamente diversi soggetti che dovranno lavorare in team per lo svolgimento di una serie di attività: fra queste, le più rilevanti sono la selezione del materiale, la movimentazione (presa e ricollocazione del materiale), la pulizia e l’eventuale condizionamento e/o restauro, la produzione dei dati inventariali e catalografici (se assenti), la riproduzione digitale, la gestione dei dati e dei file.

Considerata la molteplicità di competenze e di professionalità richieste, per i progetti di maggiore rilevanza occorre prevedere, oltre alla necessaria figura del Responsabile unico del procedimento (RUP), una figura con compiti di coordinamento del gruppo di lavoro (project manager).

Nei paragrafi seguenti sono elencate le principali figure che compongono il team ottimale per un progetto di digitalizzazione, e per ciascuna di esse sono indicate le principali competenze richieste, i ruoli e le responsabilità nell’ambito del progetto.

Poiché non in tutti gli istituti e non per tutti i progetti di digitalizzazione è possibile costituire un team di lavoro che contempli tutte le figure professionali qui indicate, è fondamentale salvaguardare l’apporto di competenze. Per sopperire alla carenza di figure professionali specifiche, è consigliabile includere nel team di progetto risorse umane dotate di competenze trasversali, che possano intervenire in modo mirato nell’espletamento di attività accessorie o complessivamente meno rilevanti nell’economia del progetto.

A titolo di esempio, qualora non fosse possibile avere nel team di progetto un restauratore, è necessario che il conservatore abbia conoscenze quanto meno di conservazione preventiva. In altre circostanze, specialmente nel caso di progetti di digitalizzazione di limitate proporzioni o di scarsa complessità esecutiva, la figura dell’Assistente informatico e dell’Operatore tecnico potrebbero non essere strettamente necessarie e le attività connesse potrebbero essere svolte interamente dall’Informatico e dal Responsabile tecnico, rispettivamente. In taluni casi, il responsabile di progetto può coincidere con il conservatore.

Ente coinvolto, partner, sponsor

Un progetto di digitalizzazione può coinvolgere uno o più enti (istituti e luoghi della cultura, centri di ricerca, università, imprese, associazioni ecc.). Nel caso in cui più enti venissero coinvolti all’interno del medesimo progetto di digitalizzazione, uno di essi può svolgere il ruolo di capofila e agire in partenariato con gli altri; l’ente capofila deve assicurare lo svolgimento omogeneo del progetto e l’aderenza alle presenti Linee guida. Si può anche prevedere la partecipazione di sponsor per il raggiungimento degli obiettivi prefissati.

Responsabile unico del procedimento (RUP)

Il Responsabile unico del procedimento è la figura prevista dall’art. 5 della L. 241/1990, i cui compiti sono stabiliti dall’art. 6 della medesima legge e dall’art. 31 del D.Lgs. 50/2016 e s.m.i.

Il Responsabile unico del procedimento controlla l’esecuzione del contratto dotandosi degli strumenti ed eventualmente delle figure previste dalla legislazione appena richiamata. Si tratta di un ruolo interno all’amministrazione.

Responsabile del progetto (Project manager)

Il responsabile del progetto o project manager supervisiona il progetto ed è responsabile della realizzazione dei risultati attesi all’interno degli obiettivi e dei vincoli identificati (tempi, qualità e costi), garantendo l’uso efficace delle risorse assegnate.

Il project manager verifica l’attuazione del piano di progetto redatto insieme al conservatore, in cui si esplicitano obiettivi generali, obiettivi specifici, risultati e attività. Egli supporta la definizione dei documenti da produrre nelle fasi di pianificazione, esecuzione, monitoraggio e controllo del progetto.

In particolare, in collaborazione con il conservatore, il project manager individua gli indicatori, gli strumenti di verifica degli indicatori e le condizioni esterne utili al raggiungimento degli obiettivi, avendo cura di identificare anche i principali rischi ostativi e le adeguate strategie di mitigazione.

In caso di difficoltà procedurali o operative, il project manager fornisce elementi utili alla messa a punto di soluzioni concrete. A questa figura sono richieste buone capacità comunicative per tenere insieme i vari membri del gruppo di lavoro e adeguate conoscenze degli aspetti operativi per poter al meglio individuare punti di forza e di debolezza dell’intero processo.

Può essere una figura professionale interna o esterna all’organizzazione. Il Responsabile Unico del Procedimento può avvalersi di un project manager nell’esercizio delle funzioni previste dalla norma.

Conservatore (esperto di dominio)

Il conservatore (sia esso architetto, archeologo, bibliotecario, archivista, storico dell’arte, demoetnoantropologo, ecc.), inteso qui come conservatore del patrimonio e non come conservatore dei dati, è lo specialista di dominio e ha la migliore conoscenza sui beni oggetto della campagna di digitalizzazione. Ha la responsabilità scientifica delle attività; ha il compito di esplicitare le ragioni per cui la campagna viene realizzata; seleziona, in accordo con il restauratore, il materiale da digitalizzare; redige il quadro logico in cui si chiariscono gli obiettivi generali, gli obiettivi specifici, i risultati e le attività; dà al catalogatore indicazioni sulle più opportune modalità descrittive, segnalando specificità e caratteristiche peculiari dei beni oggetto della campagna; valuta la qualità dell’attività di riproduzione e di descrizione; infine, prepara la documentazione scientifica utile alla promozione degli esiti della campagna.

Restauratore

Il restauratore è il professionista che definisce lo stato di conservazione dei beni da digitalizzare e mette in atto tutte le azioni dirette e indirette utili a limitare i processi di degrado dei beni e a mitigare i fattori di rischio associati alle attività di digitalizzazione, assicurandone la conservazione e salvaguardandone l’integrità fisica.

A tal fine, nell’ambito della campagna di digitalizzazione, il restauratore analizza i dati relativi ai materiali, alla tecnica di esecuzione e allo stato di conservazione dei beni. Sulla base di queste informazioni, il restauratore indica la fattibilità di tutte le azioni direttamente e indirettamente legate al processo di digitalizzazione. In collaborazione con il conservatore, il restauratore verifica lo stato conservativo del materiale da digitalizzare e convalida la scelta dei beni inclusi nel progetto; valuta l’opportunità di effettuare interventi preliminari alla digitalizzazione, come procedere a una preparatoria pulizia e il ricondizionamento dei beni; dà eventuali indicazioni restrittive circa la movimentazione; esprime, a partire dalle proposte dell’operatore tecnico, un parere circa l’impatto sui beni delle tecnologie da usare per la digitalizzazione; ne predispone il restauro, se necessario; sovrintende e coordina la movimentazione del materiale, in collaborazione con gli addetti alla logistica; verifica le condizioni ambientali in cui avviene la digitalizzazione (luce, temperatura, umidità e modalità d’uso delle apparecchiature). Infine, il restauratore ha cura di verificare, nel caso in cui la digitalizzazione avvenga in un luogo esterno all’istituto di conservazione, l’adeguatezza dei mezzi e delle modalità di movimentazione e dei locali presso i quali i beni devono essere trasferiti per le attività di digitalizzazione.

Addetto alla logistica

Per una più efficace gestione dei processi di movimentazione interna e/o esterna dei beni, è opportuno individuare una figura di addetto alla logistica che, tenendo conto delle indicazioni del restauratore, segua tutte le fasi in cui i beni transitano da un luogo all’altro o siano in generale movimentati. L’addetto alla logistica si occupa anche delle modalità di imballaggio e della messa in sicurezza dei beni durante il trasporto.

Responsabile tecnico

Il responsabile tecnico ha il compito di individuare le attrezzature e i flussi di lavoro più efficaci ed efficienti adatti al progetto. Risponde al RUP oppure al project manager. Forma gli operatori tecnici per le specificità del progetto ed è responsabile del corretto funzionamento delle apparecchiature.

Operatore tecnico

Risponde al responsabile tecnico. Esegue la digitalizzazione del materiale e deve possedere adeguata conoscenza della strumentazione utilizzata.

Catalogatore

È la figura professionale a cui sono richiesti specifici requisiti di formazione nel dominio di riferimento (architetto, archeologo, bibliotecario, archivista, storico dell’arte, demoetnoantropologo, ecc.). Ha il compito di produrre i dati descrittivi del materiale da digitalizzare quando assenti e di verificarne la qualità nel caso questi fossero già esistenti.

Possono essere previste più figure di catalogatori operative contemporaneamente per la descrizione più rapida e/o esaustiva dei beni. Il catalogatore si rapporta con l’informatico per la produzione dei metadati.

Informatico

Insieme al conservatore, l’informatico assicura che la produzione dei file digitali avvenga coerentemente con quanto stabilito nel Piano di gestione dei dati (si vedano a tal proposito le Linee guida per la redazione del piano di gestione dei dati (Data Management Plan), allegate al PND. È responsabile della generazione dei metadati descrittivi, tecnici e gestionali, che vanno redatti in base agli standard di metadatazione richiesti nel progetto (cfr. par. Diritti).

Assistente informatico

Si occupa della gestione e del funzionamento delle apparecchiature informatiche e dei software, rapportandosi con i sistemisti per eventuali problemi di rete.

Come

La generazione di un oggetto digitale a partire da un oggetto analogico è un processo tecnico che prevede l’uso di una specifica strumentazione hardware e software. La restituzione digitale può essere bidimensionale e/o tridimensionale a seconda della natura del bene e del mezzo con cui lo si digitalizza. Mentre per alcuni beni la scelta è quasi obbligata (per esempio un originale cartaceo o fotografico viene digitalizzato bidimensionalmente tramite scanner o fotocamera), per altri tipi di beni la scelta va fatta in funzione del risultato atteso. Un oggetto tridimensionale può essere digitalizzato in 2D – attraverso una fotocamera, semplicemente fotografandone ogni lato – o in 3D con l’ausilio di un laser scanner*. Inoltre, questo può anche diventare, attraverso le metodiche della computational photography, un Object VR (altrimenti detto Object 3D o 360), con l’ausilio di una serie di fotografie realizzate appositamente.

Oggetti di cui solitamente si apprezzano le qualità bidimensionali possono essere correttamente digitalizzate sia in 2D che in 3D. Ad esempio, una moneta – o una medaglia – può essere considerata allo stesso tempo come un oggetto bidimensionale (dotato di due facce) o tridimensionale (dotato di spessore e, soprattutto, di rilievo sulle facce), e può essere pertanto acquisita in due o tre dimensioni.

È importante garantire una completa digitalizzazione del bene anche nelle parti in cui apparentemente non vi sono informazioni, intendendo con questo, ad esempio, la scansione di fronte e retro di un positivo fotografico, la ripresa di un quadro compreso il retro (e compresa la cornice laddove non sia possibile smontarla e digitalizzarla a parte), la ripresa di ogni lato compresi quelli superiore e inferiore di un oggetto tridimensionale (per un totale di almeno 6 fotografie se l’oggetto è facilmente maneggiabile, 4 o 5 in caso contrario), la digitalizzazione di entrambe le facciate di un disco a 78 giri di cui sia incisa solo una facciata ecc. In tal senso, la riproduzione di un negativo deve mantenere un piccolo margine in modo da rendere l’intero fotogramma, dato che sui bordi dello stesso possono essere presenti informazioni. Nel caso di riproduzioni di volumi e documenti, manoscritti e a stampa, la digitalizzazione deve comprendere tutto l’oggetto, comprese carte di guardia, carte bianche (sia interpolate sia consecutive), anche se prive di informazioni, e tutte le parti componenti la legatura: i piatti, il dorso, i tagli significativi, capitelli, fermagli, borchie, cantonali; in questi casi l’acquisizione deve comprendere un’area minima dello sfondo scuro a margine dell’oggetto, in modo tale che comunque non venga mai esclusa nessuna parte del bene.

Nella produzione di immagini digitali è buona pratica inserire un riferimento colorimetrico e metrico in una zona a margine del bene. Tali riferimenti possono essere inseriti in tutte le digitalizzazioni prodotte o, come nel caso della digitalizzazione di volumi, solo in alcune di esse.

Le attività di acquisizione digitale devono essere eseguite in ambiente adatto, con illuminazione costante e, laddove si operi in ambienti interni, sempre uguale nelle diverse ore del giorno.

È fondamentale conoscere le molteplici possibilità oggi offerte dalle diverse metodologie e tecnologie di acquisizione in modo da progettare una campagna di digitalizzazione modellata sulle proprie esigenze e aspettative. La definizione degli obiettivi (conservazione, fruizione, diagnosi ecc.) e del target di utenti è un requisito indispensabile su cui basare la scelta della modalità di scansione.

Partendo dalle caratteristiche della strumentazione individuata, si deve tenere conto della quantità di originali che possono essere mediamente digitalizzati in una giornata lavorativa, così da programmare la movimentazione delle opere.

Di seguito si fornisce una sintetica descrizione dei principali strumenti di acquisizione digitale, rammentando che il loro uso può essere combinato e che essi possono a volte essere utilizzati sia per le digitalizzazioni 2D che 3D.

Digitalizzazione 2D

Scanner: tipologie e caratteristiche

Principali strumenti di digitalizzazione di oggetti bidimensionali, gli scanner sono di diversi tipi e offrono un’articolata varietà di soluzioni. È fondamentale, nella scelta delle strumentazioni, tenere conto dell’aspetto conservativo degli originali prima di procedere: le apparecchiature scanner dovranno essere scelte in base al tipo di bene da trattare e avere caratteristiche tecniche e progettuali di fascia professionale, con particolare attenzione alla possibilità di salvare il file nel formato grezzo (RAW).

Scanner piani

Generalmente disponibili sul mercato con formati che vanno dall’A4 all’A2+, gli scanner piani impiegano un gruppo optoelettronico che scorre parallelamente al documento mentre questo rimane immobile su un piano orizzontale. Il gruppo è composto da una lampada fredda che emette luce bianca. Il fascio luminoso, man mano che investe progressivamente il documento, viene raccolto da un sistema di lenti che lo suddivide nei tre componenti fondamentali RGB* (il rosso, il verde e il blu). Queste vengono quindi indirizzate ai sensori che possono essere di due tipi: CCD (Charge Coupled Device) negli apparecchi di maggior pregio, o CIS (Contact Image Sensor), anche se questi ultimi sono sempre meno impiegati e stanno diventando rapidamente desueti.

Tra le più importanti caratteristiche da esaminare nella scelta del modello di scanner più adatto ai propri scopi vi sono i valori di risoluzione* ottica (reale, non interpolata), di densità/gamma dinamica* e, a questa strettamente legati, di profondità di bit*.

Uso consigliato: digitalizzazione di materiale bibliografico o archivistico, digitalizzazione di negativi su lastre di vetro, di stampe e positivi fotografici, di pellicole con formati che non è possibile trattare con lo scanner piano a “tamburo virtuale”.

Scanner planetari

Scanner professionali appositamente progettati per la riproduzione digitale dei volumi rilegati e di fogli sciolti, anche di grandi dimensioni. Questo tipo di scanner garantisce la tutela dell’originale, evitando il contatto diretto ed essendo normalmente dotato di piani basculanti e di luci LED prive di raggi infrarossi e ultravioletti.

Esistono due tipologie di scanner planetario: a sensore* lineare o a sensore a matrice. Per il primo caso, la scansione avviene tramite un passaggio meccanico del sensore sopra il documento da digitalizzare, mentre nel secondo la scansione richiede il tempo di uno scatto fotografico [2].

Gli scanner planetari permettono di acquisire ad alta risoluzione documenti cartacei e pergamenacei anche di grande formato, garantendo alta produttività. I più comuni sono di formato A2 o A1, ma esistono modelli in grado di acquisire fino al formato doppio A0.

Uso consigliato: la digitalizzazione di materiale bibliografico o archivistico; gli scanner planetari sono particolarmente indicati per la digitalizzazione di documenti antichi e delicati (per cui possono essere dotati di piani basculanti o piani a “V” per il trattamento di materiale rilegato).

Scanner per pellicole

Si tratta di apparecchi appositamente dedicati alla scansione di pellicole: l’acquisizione delle immagini non avviene, come nel caso degli scanner tradizionali, a partire dalla luce riflessa, bensì in transilluminazione. La luce viene proiettata dallo scanner attraverso il supporto filmico e catturata da un gruppo optoelettronico, trasformata in formato digitale da un convertitore analogico-digitale e infine inviata al computer collegato allo scanner. Alcuni di questi scanner, soprattutto quelli professionali di alta fascia, usano tre luci LED – una rossa, una verde e una blu – che, oltre a non avere nessun indebolimento di intensità nel tempo, consentono un controllo maggiore sul bilanciamento del colore e la saturazione.

Uso consigliato: digitalizzazione film 135/120/220 e/o diapositive 24x36 (con e senza telaietto).

Scanner a tamburo

Contrariamente agli altri, negli scanner a tamburo il gruppo optoelettronico è fermo rispetto al documento che viene disteso intorno a un rullo rotante. Un fascio di luce bianca viene proiettato sul documento e un sensore – al quale il raggio riflesso viene indirizzato – separa la luce riflessa dal documento nei tre componenti fondamentali RGB. Ciascuna componente viene poi inviata a un fotomoltiplicatore (PMT, Photo Multiplier Tube) che trasforma il raggio luminoso in un segnale elettrico, a sua volta inviato a un convertitore analogico-digitale e da qui al PC.

Questi scanner erano impiegati a livello industriale, soprattutto nelle tipografie, che necessitavano di acquisire immagini ad alta risoluzione. Attualmente si tende a sostituirli sempre più frequentemente con degli scanner piani, che sono molto più semplici da usare e che nelle forme più tecnologicamente progredite hanno ormai raggiunto livelli qualitativi comparabili a quelli degli scanner a tamburo.

Questo strumento è stato citato per offrire una panoramica quanto più esaustiva sulle tecnologie in uso (ieri e oggi) per la digitalizzazione di materiale cartaceo di grande dimensione; è oggi ritenuto uno strumento altamente sconsigliato per l’acquisizione digitale di beni culturali, in quanto produce uno stress meccanico considerevole sull’oggetto da digitalizzare.

Scanner a tamburo virtuale

Particolarmente indicati nella scansione di originali fotografici, gli scanner a tamburo virtuale sono caratterizzati dal fatto che tra il sistema di ripresa (composto da obiettivo e sensore CCD) e originale non c’è contatto, rendendo di fatto impossibile la creazione di disturbi durante la scansione (quali gli “anelli di Newton” o le macchie dovute a polvere e/o graffi).

Inoltre, grazie all’impiego di speciali portapellicola magnetici, l’originale viene mantenuto perfettamente piano, mentre il passaggio durante la scansione su una superficie leggermente incurvata garantisce il mantenimento di una messa a fuoco perfetta sull’intera immagine.

Pertanto, contrariamente a quanto avviene negli scanner tradizionali (che usano piani in vetro o prismi) e quelli tipografici a tamburo (per i quali è necessario utilizzare gel o olio), lo scanner a tamburo virtuale permette di sfruttare il massimo del dettaglio senza che nulla si frapponga o debba essere applicato sulla pellicola originale.

Uso consigliato: digitalizzazione negativi su pellicola, diapositive e diacolor dal 135mm al 4x5».

Tra le più importanti caratteristiche da esaminare nella scelta del modello di scanner più adatto ai propri scopi vi sono i valori di risoluzione ottica (reale, non interpolata), di densità/gamma dinamica (vedi Glossario) e, a questa strettamente legati, di profondità di bit.

Fotocamere: tipologie e caratteristiche

La fotocamera digitale, insieme o in sostituzione allo scanner, rappresenta lo strumento maggiormente idoneo al processo di digitalizzazione. Essa può essere impiegata in diverse occasioni e con le più disparate tipologie di beni, siano essi bi o tridimensionali.

Corpo macchina

È fortemente consigliato l’utilizzo di macchine fotografiche che abbiano sensori di grande dimensione (minimo 43x33 mm, il cosiddetto “medio formato” digitale) aventi una risoluzione spaziale nativa di almeno 8256×6192 pixel* (pari a 51,4 Mp).

Le moderne fotocamere digitali di medio formato mirrorless (cioè senza specchio e pentaprisma) hanno dimensioni ridotte e una maneggevolezza tale da renderle idonee all’uso nelle più disparate condizioni di ripresa. Per molti modelli la risoluzione nativa del sensore è di 11648×8736 pixel (pari a 102 Mp), con file RAW di circa 200 MB cadauno. Attraverso la tecnica del Pixel Shift è possibile arrivare, laddove ve ne sia specifica necessità, ad avere un sensore equivalente a ben 400 MP di risoluzione - senza alcuna interpolazione - generando file RAW DNG di 23264x17448 pixel con un peso intorno ai 1,6 GB.

Per quei progetti di digitalizzazione in cui non è possibile utilizzare una fotocamera con sensore medio formato, si raccomanda l’uso di una DSLR (Digital Single Lens Reflex) o di una mirrorless avente un sensore di dimensioni minime uguali al cosiddetto «Full Frame» (24x36 mm) con una risoluzione nativa non inferiore a 6720x4480 pixel (pari ad un sensore di 30,4 Mp).

Ottica

Viene scelta in base al tipo di soggetto. Sono da prediligere obiettivi luminosi (con ampie aperture di diaframma), privi di distorsioni e aberrazioni ottiche e con alte curve MTF (Modulation Transfer Function) [3]. Inoltre debbono avere una focale (e/o rapporto di ingrandimento) adeguata alla necessità di ripresa, per esempio ottiche macro con rapporto 1:1 per la digitalizzazione di originali fotografici di piccolo formato o beni di dimensioni estremamente ridotte.

Vantaggi nell’impiego della fotocamera

A seconda delle caratteristiche specifiche dei manufatti da digitalizzare, l’utilizzo della macchina fotografica in luogo dello scanner può portare molteplici vantaggi rispetto all’uso dello scanner, tra cui versatilità di impiego, maggiore qualità degli output, tempi di acquisizione più rapidi, maggiori opportunità di sviluppo dei file RAW anche con software di terze parti, gestione del colore più semplice e precisa, assenza di contatto dello strumento con le opere, ridotta occupazione degli spazi operativi, minor impatto in ambiente di conservazione/lavorazione dei beni, maggiore facilità di sostituzione dell’apparecchiatura in caso di guasti durante il processo di digitalizzazione. Nel settore dei beni librari e archivistici gli scanner piani e planetari restano comunque la soluzione più efficace ed impiegata, salvo manufatti dalle caratteristiche particolari, come mappe o carte di grandi dimensioni, ecc.

Laddove vi sia la necessità di riprendere beni bidimensionali, la cui immagine deve essere misurabile ed esente da distorsioni prospettiche e/o anamorfosi volumetrica, si richiede una metodologia di ripresa simile a quella adottata per la documentazione fotografica di tipo architettonico, utilizzando fotocamere od ottiche a corpi mobili, capaci quindi di operare movimenti di decentramento e/o basculaggio.

Esempi di flusso di lavoro

Una volta individuato il corpus di opere da digitalizzare e i relativi mezzi di riproduzione da impiegare (macchina fotografica, scanner), va sviluppato un workflow per rendere i processi di acquisizione efficienti e valutabili. Occorre, cioè, prevedere nel dettaglio i processi di lavorazione in relazione alla tipologia del bene.

A titolo esemplificativo, nel caso di digitalizzazione di documenti rilegati (libro, volume, manoscritto), per una pagina significativa (ad esempio il frontespizio) è richiesta una doppia scansione: la prima deve contenere i riferimenti metrici, colorimetrici e il target test per la riproduzione dei dettagli, la messa a fuoco e la correzione delle distorsioni delle immagini. Questa immagine va eseguita come prima nella serie di scatti, ma va collocata in coda al pacchetto di immagini. La scala millimetrica deve essere posizionata lungo il bordo inferiore con lo “zero” allineato al bordo verticale della carta/pagina. Normalmente la scansione, che procede per documento aperto, produrrà due file separati (due pagine o un verso e un recto) [4]. Infatti quello che di norma, tranne per casi specifici, viene considerato come singolo oggetto digitale fa riferimento al verso o al recto di ciascuna carta per i manoscritti, o alla singola pagina per testi a stampa. In fase di post-produzione, le carte/pagine nella zona della cucitura dovranno essere tagliate con un margine per mostrare anche una piccola parte della pagina a fianco.

La scansione deve portare all’organizzazione della directory del documento nel seguente ordine: piatto anteriore, dorso, contropiatto anteriore, carte di guardia anteriori, corpo del testo, carte di guardia posteriori, contropiatto posteriore, piatto posteriore e, in fondo alla directory, scala cromatica e millimetrica. Nel caso delle pubblicazioni periodiche, invece, la scansione riguarderà i soli fascicoli e non la legatura in volume. Soltanto nel caso di periodici in cui la rilegatura ha motivazioni editoriali, questa dovrà essere oggetto di scansione. Questa eccezione richiede una definizione in fase progettuale.

In caso di presenza di lacerazioni, di fori di tarlo e ossidazione degli inchiostri o qualora le carte/pagine da riprendere fossero più piccole di quelle sottostanti, porre al disotto del foglio in ripresa una carta giapponese (non un comune foglio bianco), di spessore tale che consenta la visibilità delle pagine sottostanti e non interferisca con la lettura del foglio scansionato e di dimensione pari alle misure del documento.

I dispositivi di acquisizione utilizzati dovranno seguire le specifiche tecniche rispondenti ai parametri richiesti nel capitolato tecnico inerenti densità, profondità di bit e risoluzione spaziale (non interpolata).

Per ogni diversa attività di digitalizzazione deve essere realizzato un prototipo; delle verifiche periodiche consentiranno di eliminare eventuali errori di lavorazione.

Workflow con la fotocamera

Occorre definire il set-up della postazione di ripresa (posizionamento della fotocamera, del bene e delle luci). Durante lo scatto la fotocamera deve essere montata su colonna o cavalletto, in bolla. Nel caso di ripresa zenitale con fotocamera su colonna si consiglia l’uso di un inclinometro al fine di assicurare la perfetta planarità tra sensore e soggetto: la ripresa va fatta sempre in asse, con sensore parallelo e centrale rispetto al piano oggetto.

Prima di iniziare la sessione di scatto è fondamentale caratterizzare la coppia fotocamera/ottica usata in relazione alla specifica illuminazione utilizzata sul bene al momento della ripresa (profilazione colore); è pertanto necessario fotografare – sotto le stesse luci – un riferimento colorimetrico quale il ColorChecker di X-Rite (l’unico in grado di poter generare profili .DCP - anche a doppio illuminante - oltre che .ICC).

Per ogni bene o lotto di beni è opportuno effettuare un primo scatto con dei riferimenti: del bene stesso (inventario, denominazione, ecc.), dimensionali (metrici) e, ove necessario, geografici (eventuale US o USM, freccia del NORD). Quindi, si può procedere con gli scatti successivi privi di riferimenti.

Le impostazioni di base da applicare per la fotocamera sono: sensibilità ISO nativa del sensore (le amplificazioni del segnale portano ad una minor qualità dell’immagine); spazio colore* Adobe RGB [5]; registrazione file di tipo RAW non compresso.

Workflow con lo scanner piano e con il planetario

Tutte le workstation di digitalizzazione debbono essere corredate da idoneo piano di appoggio per la movimentazione in sicurezza degli originali da trattare.

Ogni scanner, una volta installato, deve essere configurato e calibrato. Inoltre, a seconda dei formati o delle caratteristiche fisiche del materiale, deve essere settato con frequenza periodica, per non perdere le configurazioni già definite o adeguarle di volta in volta a nuove esigenze.

Per ogni scanner, a inizio lavori, va creato un profilo .ICC di classe input – con l’ausilio degli appositi target colorimetrici (quello di riferimento è il ColorChecker Digital SG) – al fine di assicurare una corretta restituzione cromatica degli originali.

Per ogni originale è richiesto un file RAW DNG. Laddove lo scanner piano o planetario non sia nativamente in grado di generare formati RAW, esso deve essere integrato con un driver di terze parti che consenta la digitalizzazione in RAW.

Interventi di post-produzione

Ogni postazione di trattamento di post-produzione deve essere dotata di monitor avente una lookup table (LUT)* per ogni primario RGB, accessibile da software e con profondità di bit maggiore di 8. Tali monitor, inoltre, dovranno essere opportunamente calibrati per il punto di bianco e la gamma a intervalli regolari con l’uso di uno spettrofotometro o, in subordine, colorimetro al fine di garantire un corretto flusso di gestione del colore tra le diverse apparecchiature usate. È altresì importante approntare sistemi di backup giornaliero del lavoro in corso.

Le eventuali correzioni ai file, minime e solo se necessarie, vanno stabilite all’inizio del progetto. Esse vengono eseguite esclusivamente sul secondo file master, il TIFF* ottenuto dal master RAW DNG, lasciando così quest’ultimo inalterato. In genere, l’immagine non deve subire manipolazioni, se non in relazione ad un miglioramento della sua leggibilità.

Le eventuali correzioni, fatta salva l’applicazione del profilo colore* [6] e il successivo bilanciamento del bianco, devono essere effettuate solo per curve di livelli, luminosità, contrasto, e l’eventuale applicazione di una leggera maschera di contrasto. Il profilo colore, generato con apposito software prima di ogni sessione giornaliera, e il successivo bilanciamento del bianco (linearizzazione dell’asse dei grigi) devono essere applicati, attraverso l’uso di un’automazione, su tutti i file inerenti quella specifica sessione di scatto/scansione.

Di ogni correzione apportata alle immagini deve essere tenuta traccia tramite un file descrittore in formato aperto e modificabile (es. file XMP o METS non protetti).

Laddove la digitalizzazione riguardi originali fotografici negativi si procede, nella realizzazione del secondo master, alla curva di inversione negativo/positivo e al ritaglio* dell’immagine lungo i bordi della finestra di esposizione originale. La profondità di bit dei suddetti master TIFF deve restare la stessa del master RAW.

Infine, in accordo con le politiche di naming e metadatazione stabilite nel progetto, si procede alla rinomina dei file e alla creazione dei metadati per tutti i file prodotti durante la sessione giornaliera.

OCR

La digitalizzazione di documenti che contengono testo può prevedere anche un processo di riconoscimento ottico di scrittura chiamato OCR (Optical Character Recognition). Il processo di base dell’OCR consiste nel riconoscere il contenuto testuale del layout di oggetti digitali trascrivendone i grafi in formati utilizzabili per l’elaborazione dei dati. Il riconoscimento OCR permette di creare degli ipertesti a partire dai contenuti, di incorporarli nei file originali e di renderli disponibili per visualizzatori, software e motori di ricerca. Versioni più evolute di OCR (a es., i sistemi basati su tool captcha o re-captcha) hanno delle funzioni e delle fasi specifiche.

Occorre garantire la massima qualità del processo di OCR per ottimizzare le percentuali di riconoscimento ad almeno il 90% dei caratteri. Nel caso in cui il fornitore utilizzi file di training personalizzati, questi devono essere resi disponibili all’amministrazione.

Un tipico flusso di lavoro OCR può essere riassunto nelle seguenti fasi principali: immagine originale, pre-elaborazione, segmentazione, OCR, post-processing. Durante la fase di “segmentazione” avviene l’analisi dell’immagine del documento e il riconoscimento della struttura della pagina o anche di altri aspetti del testo che possono includere, per esempio, tabelle, immagini, o caratteri speciali. Nella fase successiva, il programma abbina campioni di carattere precedentemente selezionato e ricerca diverse ipotesi di output sulla lettera o simbolo da ipotizzare e codificare. L’analisi e l’elaborazione delle varie ipotesi e varianti ne permette la decisione successiva del testo riconosciuto. Nell’ultima fase, l’output OCR grezzo può essere ulteriormente migliorato, ad esempio, incorporando dizionari o modelli linguistici. Questa fase può essere combinata con la correzione manuale, che di solito avviene dopo la post-elaborazione automatica. Quasi tutte le informazioni acquisite durante l’intero flusso di lavoro possono essere incorporate nell’output finale: le coordinate delle regioni e i loro tipi, le coordinate delle linee, le posizioni dei caratteri. Sono stati proposti diversi formati che possono incorporare la maggior parte o tutte le informazioni sopra citate, ad esempio ALTO [7] e hOCR [8].

È fondamentale che un sistema OCR sia in grado di riconoscere, nei contenuti dei layout «set di grafi stampati nelle varie epoche di differenti alfabeti, sia antichi che moderni. Tuttavia, questi sistemi allo stato dell’arte non sono ancora pienamente appropriati per il riconoscimento di oggetti digitali relativi a manoscritti. Un modo più raffinato di riconoscimento dei caratteri è il cosiddetto ICR (Intelligence Character Recognition). Sebbene OCR e ICR possano sembrare simili, in realtà esistono differenze sostanziali tra i due sistemi di software. L’ICR si qualifica tecnicamente come un OCR, ma è un sistema più specifico, che apprende diversi caratteri e stili di scrittura. Con un ICR, un computer può studiare la scrittura a mano e imparare a riconoscerla per migliorare la precisione e il riconoscimento. In sostanza, si tratta di un’applicazione più intelligente dell’OCR, più coinvolta e più dettagliata.

Nondimeno, la qualità di un sistema di OCR è legata all’estrazione dei caratteri e alla loro selezione e classificazione basata su modelli. Su questo particolare aspetto, hanno particolare rilievo alcuni software sviluppati nell’ambito dell’ICR come Handwritten Text Recognition (HTR), che ha ricevuto un’attenzione crescente come evoluzione dell’OCR e su cui la ricerca si sta particolarmente focalizzando. Attualmente sono in sperimentazione alcuni sistemi in grado di processare i layout con buone percentuali di restituzione in ipertesto dei contenuti (50-80%). A questo va aggiunto le funzionalità evolute di Graphic Matching, che ottengono risultati rilevanti nel riconoscimento sul layout degli oggetti di grafi, parti di lemmi, lemmi o combinazioni di lemmi in frasi.

Normalmente, l’OCR trova applicazione nei file PDF*, nei quali il testo riconosciuto è contestualmente incorporato (embedded). In questo modo, i file diventano ricercabili anche in mancanza di visualizzazione dell’ipertesto in formato elettronico.

Per oggetti digitali in formato immagine, l’utilizzo dei file pdf con OCR embedded (generalmente uno per pagina) ha un fine strumentale e non di mera fruizione. Il layer testuale, embeddato nel singolo pdf, serve a supporto dei file immagine per identificare la posizione delle parole ed evidenziarla tramite il viewer.

La gestione dell’OCR di oggetti digitali prevede anche l’utilizzo di file esterni che gestiscano il riconoscimento dei testi e il posizionamento delle parole all’interno della pagina.

Detto che alcuni sistemi prevedono la possibilità di generare l’OCR “on the fly”, senza l’utilizzo di altri file di supporto (che siano PDF, hOCR, o file xml con schema ALTO) al fine di ottenere migliori risultati nelle procedure di riconoscimento ottico dei caratteri, si consiglia di prediligere l’uso di file PDF con OCR embedded (un file PDF per ciascun file immagine). Alternativamente, è possibile utilizzare file di metadati esterni che gestiscano il riconoscimento del testo e il posizionamento di questo nella pagina da fornire nei formati standard sopra citati, ALTO o hOCR. Questi formati codificano e riportano le informazioni strutturate prodotte nelle fasi ocerizzazione che possono essere esportate e riutilizzate, e sono spesso necessarie per l’elaborazione successiva con altri strumenti. ALTO è un formato XML standardizzato per memorizzare informazioni sul layout e sul contenuto. È un’estensione per l’uso dello schema XML/METS che contiene informazioni fisiche e di contenuto, mentre METS fornisce metadati e informazioni strutturali. hOCR è uno standard aperto di rappresentazione dei dati per il testo formattato ottenuto dal riconoscimento ottico dei caratteri (OCR). hOCR codifica il testo, lo stile, le informazioni sul layout, le metriche di affidabilità del riconoscimento e altre informazioni utilizzando XML, sotto forma di HTML o XHTML. Alcuni strumenti specifici permettono di personalizzare gli output XML hOCR secondo lo schema XML/TEI [9].

Digitalizzazione 3D

Nella presente versione delle Linee guida si è optato fornire indicazioni di alto livello sulla digitalizzazione tridimensionale, che sarà oggetto di specifico approfondimento in future versioni del Piano nazionale di digitalizzazione.

Strumenti e metodologia per la digitalizzazione tridimensionale (laser scanning e fotogrammetria 3D)
Strumentazioni laser scanning

Ogni tecnologia laser può avere diverse modalità di impiego. Oltre alla classica postazione fissa su treppiedi – la più usata per gli scanner a tempo di fase o a tempo di volo – negli ultimi anni si sono sviluppati scanner a brandeggio manuale o che incorporano basi a rotazione, permettendo di risolvere problemi pratici di ripresa soprattutto con oggetti di piccole dimensioni, quali monete e pietre, o a elevata complessità, quali statue, bassorilievi e altorilievi, strumenti musicali.

Rientrano in questa categoria i sistemi integrati per scansioni in movimento (MMS - Mobile Mapping System). Il Mobile Laser Scanning è un sistema di scansione laser che consente l’acquisizione di dati 3D per mezzo di uno o più scanner laser montati su una piattaforma mobile (autoveicoli, imbarcazioni, veicoli su rotaie). L’obiettivo della scansione laser mobile è la registrazione di dati 3D di superfici di oggetti in base ai seguenti importanti requisiti: alta efficienza nei tempi di acquisizione di dati di vaste aree registrazione automatica di dati 3D in un sistema di coordinate comune (GPS), alta risoluzione e precisione dei dati registrati.

Strumentazioni per la fotogrammetria 3D

L’acquisizione fotogrammetrica dei beni culturali deve avere requisiti minimi per poter garantire la precisione dello sviluppo geometrico e della restituzione visiva, sia per dettaglio sia per cromie. Questa pratica, attraverso la procedura di ripresa, porta alla generazione di una nuvola di punti e di un modello 3D, utilizzando l’accoppiamento di almeno tre fotogrammi dove si ritrova lo stesso punto fotografato.

Lo schema di lavoro deve avere come obiettivo l’individuazione del posizionamento delle stazioni di acquisizione in relazione alla grandezza del bene. La pianificazione delle scansioni deve ridurre al minimo il numero di stazioni (qualora sia necessario averne più di una o qualora non si adotti un’unica stazione grazie all’uso di una base girevole su cui è appoggiato il bene) e individuare quali viste possano ottimizzare il tempo di acquisizione e l’accuratezza delle acquisizioni proposte. Occorre assicurare, inoltre, la presenza tra più scansioni di aree di sovrapposizione (pari al 30%), in modo da ricoprire interamente le superfici scansionate.

Gli strumenti basati su principi ottici che sfruttano la triangolazione risultano quelli più idonei per il campo di digitalizzazione dei beni di piccole dimensioni.

In base alle dimensioni e al materiale di cui è composto il bene mobile, si possono utilizzare la tecnica e le strumentazioni più adeguate (e.g. fotogrammetria* con reflex digitale e drone*, acquisizione con due tipologie di scanner, quello a laser o quello a luce strutturata, ecc.).

Una casistica peculiare è quella dei rilievi subacquei, che necessitano di soluzioni fotogrammetriche particolari e/o di laser scanner dedicati. I rilievi subacquei si distinguono principalmente in due approcci differenti: il primo è il rilievo da drone, ideale per il rilievo delle superfici di bacini interni o costieri per la possibilità di scansione sia della superficie dell’acqua che dei fondali e contemporaneamente anche delle linee costiere. Il secondo è il rilievo da postazioni subacquee, che possono essere anche mobili, come imbarcazioni o sottomarini ideali per la precisione di dettagli di fondali.

Post-produzione

Una volta acquisite le informazioni digitali tridimensionali, devono essere effettuate opportune operazioni di post-produzione attraverso lo svolgimento di alcune attività manuali o automatizzate, al fine di elaborare l’informazione digitale acquisita.

Durante le attività di post-produzione, saranno necessarie delle azioni sulla nuvola di punti prima che venga trasformata in mesh 3d. Tali interventi riguardano prevalentemente l’eliminazione del “rumore” dei dati acquisiti, cioè la riduzione della ridondanza di punti e, qualora necessario, la realizzazione del modello tridimensionale texturizzato (per esempio nei formati OBJ* e PLY), attraverso l’utilizzo di immagini che rispondano a caratteristiche di qualità. Tali immagini devono poi essere processate con software dedicati per ottimizzarle, in modo da garantire sia un risultato visivo ottimale sia la possibilità di navigazione attraverso i più comuni browser web.

Elaborazione del dato

L’elaborazione dei dati acquisiti richiede workstation dalle elevate potenzialità in termini di processore, RAM, scheda video e capacità di archiviazione.

Per quanto riguarda la digitalizzazione tridimensionale di manufatti di grandi dimensioni, vista la elevata eterogeneità di tali beni, si consiglia di valutare l’utilizzo di diverse tipologie di tecniche laser scanner e di tecniche fotogrammetriche, da usare in aggiunta o indipendentemente alla tecnologia laser, con macchine fotografiche fisse, teste panoramiche o su drone. La variabilità delle dimensioni dei manufatti e delle necessità di dettagli su scale di approfondimento diverse consente l’uso specifico di laser a tempo di fase o a tempo di volo su postazioni fisse o mobili o su drone, che – unite al dato fotogrammetrico – possono dare grandi risultati di precisione e rapidità d’esecuzione, contribuendo a contenere i costi. La fotogrammetria o l’uso di laser con integrazioni di fotocamere digitali sono indispensabili dove è necessario il dato cromatico. In questo caso l’informazione digitale sarà costituita da un modello tridimensionale digitale a nuvola di punti ad alta densità texturizzata, consultabile ed esportabile. Il risultato ottenuto, elaborato sotto forma di mesh e texturizzato, può essere esportato come modello tridimensionale in formato adatto (per esempio OBJ o 3DS).

Nel caso di beni di piccola dimensione può essere sufficiente la realizzazione di un unico modello tridimensionale. Nel caso di beni di notevoli dimensioni o caratterizzati da geometria complessa la redazione di modelli OBJ interessa solitamente porzioni del bene; pertanto è opportuno procedere con processi di elaborazione distinti per ciascuna porzione del bene, così da unire i singoli modelli ad alto livello di dettaglio in un secondo momento grazie alle azioni di merge e allineamento in un’unica mesh 3d, scalata metricamente, georiferita e - se necessario - texturizzata.

La scelta di utilizzare per la digitalizzazione di manufatti di grandi dimensioni la strumentazione laser scanner 3D permette di estrarre i dati necessari per ottenere la morfologia del manufatto nei punti ritenuti significativi. L’interrogazione delle nuvole di punti, opportunamente calibrate e parametrizzate, permette infatti di visualizzare anche quelle informazioni non facilmente rilevabili a occhio nudo con gli strumenti tradizionali e di mettere in evidenza elementi di particolare criticità.

Anomalie costruttive, discontinuità materiali, aggiunte, sottrazioni o modifiche divengono in questo modo chiaramente leggibili e sono dunque funzionali alla comprensione effettiva del manufatto nella sua complessità, nel suo essere palinsesto di segni stratificati nel corso del tempo.

Scala metrica e georeferenziazione

Le digitalizzazioni con tecniche laser scanner e fotogrammetriche devono essere scalabili metricamente secondo l’unità di misura metrica e georeferenziate con strumentazione topografica di precisione mediante l’acquisizione di poligonali chiuse. Pertanto, occorre stabilire se collocare il dato in un sistema locale di riferimento oppure in un sistema globale o, preferibilmente, in entrambi. Eventualmente la quota altimetrica del sistema locale può essere calcolata da un punto quota noto sul posto, oppure da grafici già rilevati in precedenza. È buona norma che il sistema locale sia georeferenziato, se possibile, al sistema di riferimento geodetico nazionale ETRF2000 [10] o almeno al più diffuso sistema di riferimento geodetico mondiale WGS84.

Range di fedeltà digitale

Nel definire la fedeltà con cui viene digitalizzato un bene entrano in gioco diversi parametri. I principali sono:

  • portata: massima distanza che lo scanner è in grado di misurare;
  • accuratezza: grado di conformità di una quantità misurata rispetto al valore reale;
  • precisione: capacità dello strumento di restituire lo stesso valore in successive misurazioni;
  • dispositivi integrati: possibilità di integrare altri software o dispositivi (fotografia ecc.).

Riguardo la possibilità di una riproduzione fedele dei sistemi di rilievo laser scanner, si deve prima di tutto individuare la tipologia di laser da utilizzare a seconda delle macro-necessità del progetto di acquisizione. Una volta individuate, si possono individuare una serie di standard a seconda dei livelli che si vogliono raggiungere, e dei budget a disposizione. Ad esempio, per una piccola statua si userà un laser a luce strutturata in grado di eliminare buona parte del rumore dell’oggetto, mentre per una serie di stanze adibite a museo si potrebbe usare un laser a differenza di fase in grado di rilevare più ambienti con alta precisione. Questa scelta va effettuata in base a diversi fattori che saranno individuati a monte dell’analisi, quali particolari esigenze conservative o la complessità del bene, al fine di digitalizzare l’opera con la migliore qualità possibile.

Digitalizzazione audio/video

Le numerose modifiche tecnologiche hanno reso i supporti audiovisivi sempre più complessi e soggetti all’obsolescenza dei sistemi. Data la natura, unica e comune a tutti i documenti audiovisivi, di essere leggibili esclusivamente attraverso un apparato di intermediazione specifico per ogni categoria di supporto e per ogni epoca di produzione, è necessario, oltre alla corretta conservazione degli originali, anche una approfondita conoscenza delle macchine necessarie al loro corretto utilizzo. Attualmente si possono individuare alcune categorie di supporti audiovisivi in base agli aspetti tecnici di scrittura e lettura utilizzati:

  • supporti meccanici (cilindri fonografici, dischi ecc.);
  • supporti magnetici (fili metallici, nastri, cassette, video nastri ecc.);
  • supporti ottici (videodischi, CD, DVD, BD ecc.).

All’interno di ognuna di queste categorie esistono numerose varianti che devono essere di volta in volta individuate, riconosciute e considerate per gli opportuni adeguamenti dei processi di digitalizzazione.

Infine, esistono attualmente numerosi documenti audiovisivi “nativi digitali” che non presentano le caratteristiche tecniche richieste per la conservazione e che pertanto devono essere analizzati e convertiti per adeguarli alle specifiche delle presenti Linee guida e della conservazione digitale.

Le linee guida dell’International Association of Sound and Audiovisual Archives raccomandano la rappresentazione digitale del segnale analogico con il metodo PCM (Pulse Code Modulation) lineare (interlacciato per stereo) in un file .WAV o preferibilmente BWF.WAV (EBU Tech 3285) per tutto l’audio a due tracce. L’uso di qualsiasi codifica percettiva (“compressione con perdita”) è fortemente sconsigliato. Si consiglia di digitalizzare tutto l’audio a 96 kHz o superiore e con una profondità di almeno 24 bit.

La conversione da analogico a digitale (A/D) è un processo di precisione, e i convertitori a basso costo integrati nelle schede audio dei personal computer non sono in grado di soddisfare le esigenze dei programmi di conservazione digitale.

Oltre alla corretta conservazione dei supporti audio e video originali, è necessaria anche una approfondita conoscenza degli strumenti di riproduzione ai fini della loro consultazione e digitalizzazione.

Nel processo di digitalizzazione dei supporti audio e video è indispensabile documentare con precisione ogni intervento effettuato sui supporti e tutte le scelte tecniche adottate (pulitura del supporto, presenza e ripristino di giunzioni sui supporti magnetici, marca e tipo del lettore utilizzato, specifiche tecniche del sistema di lettura – tipo di pick-up di lettura dimensioni dello stilo per i dischi, ecc.).

Per la digitalizzazione è opportuno fare riferimento ai seguenti documenti della IASA:

  • IASA-TC 04 (2009, 2nd edition), Guidelines on the Production and Preservation of Digital Audio Objects;
  • IASA-TC 05 (2016), Gestione e archiviazione dei supporti audio e video;
  • IASA-TC 06 (2019), Guidelines for the Preservation of Video Recordings.
Principi generali e standard per la digitalizzazione dei documenti sonori

È importante, ai fini della conservazione dei documenti sonori, che i formati, le risoluzioni, i supporti e i sistemi tecnologici utilizzati rispettino i principi di standard condivisi a livello internazionale e appropriati agli scopi di archiviazione previsti.

Le caratteristiche fondamentali del formato digitale prodotto devono rispecchiare i seguenti parametri:

  • Sampling Rate: la frequenza di campionamento stabilisce il limite massimo della risposta in frequenza del segnale audio; le linee guida internazionali richiamate consigliano l’utilizzo di una frequenza di campionamento minima di 48 kHz con una preferenza per frequenze superiori (96 kHz);
  • risoluzione (Bit Depth): il numero di bit stabilisce l’estensione della codifica della gamma dinamica di un evento o di un brano sonoro; la codifica a 24 bit permette la rappresentazione di ogni evento sonoro udibile;
  • formato file audio: lineare PCM (P*ulse Code Modulation*), interleaved stereo wave (estensione del file .WAV).
Estrazione del segnale dai supporti originali

Nel processo di digitalizzazione occupa una parte importante l’ottimizzazione del recupero del segnale dei supporti originali, e questo per due ordini di motivi:

  1. il supporto originale potrebbe deteriorarsi e la riproduzione futura potrebbe non raggiungere la stessa qualità o addirittura non essere più praticabile;
  2. l’estrazione del segnale potrebbe costituire un’attività onerosa e lunga, tanto da far preferire un’ottimizzazione al primo tentativo.

Altri aspetti importanti di cui tenere conto sono la selezione della copia migliore, la pulitura e il restauro del supporto originale. Il metodo di pulitura più appropriato dipende dal supporto specifico e dalle sue condizioni.

Attrezzature di riproduzione

La riproduzione dei supporti audio e video prevede l’utilizzo di una catena di apparecchiature. La combinazione degli strumenti di riproduzione, cavi di segnale, mixer e altri apparecchi di elaborazione audio e video devono avere specifiche di qualità pari o superiori a quelle delle apparecchiature audio e video digitali, sia per la frequenza di campionamento sia per la risoluzione.

La qualità delle attrezzature per la riproduzione, dei collegamenti audio, dei formati digitali di destinazione deve essere migliore di quella del supporto originale.

È utile tenere presente che tutta l’attrezzatura richiede una manutenzione continua e regolare per mantenerla in buono stato di funzionamento. Tuttavia, poiché le apparecchiature di riproduzione analogica diventano velocemente obsolete, è necessario pianificare l’approvvigionamento dei pezzi di ricambio, considerato che la loro disponibilità è limitata nel tempo.

Sistemi per la conservazione

Infine, per richiamare un principio generale presente nelle linee guida della IASA, occorre tenere presente che «le strategie sulla gestione, l’archiviazione a lungo termine e la conservazione dell’audio e il video codificati digitalmente si basano sulla premessa che non esiste un supporto di memorizzazione definitivo e permanente, né ci sarà nel prossimo futuro. Invece, coloro che gestiscono archivi audio digitali devono pianificare l’implementazione di sistemi di gestione e archiviazione della conservazione progettati per supportare processi che prevedano l’inevitabile cambiamento di formato, supporto o altre tecnologie. L’obiettivo principale nella conservazione digitale è quello di costruire sistemi sostenibili piuttosto che supporti permanenti» [11].

[2]Altre tipologie specifiche di scanner planetari sono: Scanner a piani basculanti; Book scanner; Scanner verticali.
[3]Le curve MTF restituiscono parametri tecnici che permettono di giudicare le qualità di una lente in maniera oggettiva. Tali parametri sono: la risoluzione e il contrasto dell’ottica, il suo astigmatismo e l’aberrazione cromatica laterale, il campo di curvatura e lo spostamento di messa a fuoco. Essi aiutano a comprendere la resa di un obiettivo e in molti casi, a fronte di riproduzioni in cui gli originali hanno un elevato dettaglio fine (per esempio, le incisioni), ne guidano la scelta.
[4]Altre tipologie di documenti cartacei (es. Registri catastali) possono essere scansionati in modo tale da comprendere, all’interno della stessa immagine, tutte le fincature della pagina.
[5]Un altro spazio colore disponibile è sRGB; tuttavia, l’uso di Adobe RGB è preferibile per evitare perdite di informazioni (quali tagli - clipping - nei verdi, rossi e arancioni) che spesso si riscontrano utilizzando sRGB. Adobe RGB è uno spazio colore proprietario il cui utilizzo è comunque consigliato in virtù della sua ampia diffusione; è infatti preinstallato all’interno dei software della maggior parte dei corpi macchina disponibili sul mercato.
[6]Tra i profili colore standard più consolidati e “pronti all’uso”, offerti da varie aziende, è fortemente consigliato l’uso del profilo colore Adobe RGB 1998 (Adobe), o ProPhoto RGB (Kodak), in fase di acquisizione digitale, in quanto offrono un gamut molto largo, progettato per l’utilizzo in fotografia. Questo spazio colore contiene più del 90% dei colori possibili nello spazio CIE L*a*b*, ed il 100% dei colori del mondo reale. Questi spazi colore garantiscono un’accuratezza nel dettaglio del colore che è frutto di anni d’esperienza da parte degli sviluppatori/produttori e del loro impiego da parte degli utilizzatori. Quindi il concetto è: usare lo spazio colore che più e meglio includa e interpreti le informazioni acquisite dalla macchina fotografica. Altro motivo per cui è consigliato l’utilizzo dello spazio colore Adobe RGB o ProPhoto RGB è la ormai larga diffusione su scala mondiale, ragione per cui sulla maggior parte dei mezzi fotografici la scelta del profilo colore da impostare ricade su Adobe RGB o sRGB. Tuttavia, è possibile utilizzare software customizzati per la costruzione di profili colore su dispositivi di acquisizione a patto di garantire i risultati ottenibili con i software di aziende commerciali.
[7]https://www.loc.gov/standards/alto/
[8]Breuel, T.M. (2007). The hOCR microformat for OCR workflow and results. Ninth International Conference on Document Analysis and Recognition. IEEE, 2007, Vol. 2, pp. 1063–1067
[9]

Si segnalano alcuni software open source che possono essere utilizzati per OCR:

OCR4all - https://github.com/OCR4all

Tesseract - https://github.com/tesseract-ocr/tesseract

Per HTR:

EScriptorium - https://escriptorium.fr/

[10]Nel 2011, con Decreto della Presidenza del Consiglio dei Ministri (Adozione del Sistema di riferimento geodetico nazionale, 10.11.2011), per agevolare la fruibilità e lo scambio di dati e di informazioni territoriali fra le amministrazioni centrali, regionali e locali, è stato adottato il Sistema di riferimento geodetico nazionale, costituito dalla realizzazione ETRF2000 del Sistema di riferimento geodetico europeo ETRS89, basato sull’ellissoide GRS80 (sostanzialmente coincidente con il successivo WGS84).
[11]IASA-TC 04 (2009, 2nd edition), Guidelines on the Production and Preservation of Digital Audio Objects, p. 90.

Quando

Digitalizzazione e restauro

Un progetto di digitalizzazione può riguardare sia beni in buono stato di conservazione sia beni che necessitano di interventi di restauro. In questo caso la digitalizzazione ha anche la funzione di documentare lo stato del bene prima e dopo l’attività di restauro e, in accordo con il restauratore, essa può garantirne la fruizione durante le fasi di lavorazione. La sezione dei metadati dovrà descrivere le eventuali conoscenze sul bene emerse con gli interventi di restauro. Deve essere, inoltre, garantito il collegamento con l’oggetto digitalizzato prima del restauro e con la scheda di restauro.

Digitalizzazione e metadatazione/descrizione

Lo scenario ottimale in cui avviare una campagna di digitalizzazione è quello in cui i beni siano già stati ordinati, inventariati, e catalogati. I metadati che descrivono l’oggetto digitale devono garantire il collegamento al sistema descrittivo relativo ai singoli ambiti.

Se il numero delle figure professionali coinvolte nella campagna di digitalizzazione lo consente, si potrà optare per un workflow in cui la metadatazione avviene durante il processo di digitalizzazione.

In ogni caso, per digitalizzare un bene sarà indispensabile avergli assegnato un identificatore univoco (ad esempio il numero di inventario) e accertarsi di aggiornare un elenco o un database di identificativi riconoscibili e facilmente collegabili ad un sistema descrittivo. Per alcuni supporti può essere raccomandabile apporre un’etichetta con un codice univoco (codice a barre, QR code ecc.).

Digitalizzare beni non metadatati e/o descritti è fortemente sconsigliato. Questa eventualità potrebbe essere ammissibile nei seguenti casi:

  1. campagne sperimentali orientate a una descrizione del bene eseguita online da una comunità di riferimento adeguatamente identificata (possibili progetti di crowdsourcing) o alla descrizione del soggetto con l’uso di algoritmi di intelligenza artificiale;
  2. metadatazione non eseguita a causa di una impossibile osservazione diretta del bene: in tale caso lo scopo primario della digitalizzazione consiste proprio nel permettere ai catalogatori di procedere alla descrizione.

Nel caso di recupero di beni digitalizzati in campagne avvenute nel passato occorre in prima istanza fare uno studio di fattibilità per analizzare e valutare la compatibilità con le presenti Linee guida. Tale studio deve prendere in esame le seguenti attività: recupero delle eventuali descrizioni con indicazione degli standard adottati per la descrizione, analisi dei dati disponibili, mapping dei dati, definizione del processo di recupero, analisi delle digitalizzazioni esistenti e dei legami con le schede descrittive, con una valutazione dei formati disponibili e della loro qualità; definizione del processo di recupero delle digitalizzazioni con valutazione dei costi e piano di lavoro previsto.

Dove

La campagna di digitalizzazione può essere eseguita sia all’interno che all’esterno dell’ente conservatore.

È preferibile avere un centro di riproduzione interno o all’ente conservatore o ad altro istituto affine per tipologia di bene e su base territoriale, logisticamente adatto. In tal caso, alcuni requisiti minimi da rispettare possono essere schematizzati nella maniera seguente:

  • sistema di riproduzione adeguato ai beni e agli obiettivi della digitalizzazione;
  • struttura software e hardware adeguata alla gestione del flusso di digitalizzazione (ripresa – descrizione – salvataggio) e costantemente aggiornata;
  • personale formato per l’uso dell’attrezzatura;
  • personale per la movimentazione dei beni;
  • locali idonei all’installazione dei mezzi di riproduzione.

I vantaggi che derivano da questa soluzione sono i seguenti: possibilità di formare il personale (learning by doing), riduzione dei costi di movimentazione e logistica, sicurezza per i materiali da digitalizzare, monitoraggio continuo del processo di riproduzione, ottimizzazione progressiva dei requisiti tecnici della digitalizzazione e scelta della tecnologia più adeguata.

Optare, invece, per un laboratorio esterno offre i seguenti vantaggi: riduzione dei costi di acquisto e manutenzione dell’attrezzatura, accessibilità a tecnologie aggiornate. È cura dell’istituto conservatore prevedere la presenza di un proprio responsabile interno per il monitoraggio, il collaudo tecnico, la consegna, la movimentazione, la logistica e l’assicurazione dei beni. Tuttavia, occorre tener presente che questa soluzione riduce le possibilità di accrescere le competenze interne.

Esistono anche delle soluzioni ibride, che possono contemplare, ad esempio, la messa a disposizione della ditta esterna dei soli locali in cui effettuare la digitalizzazione o anche di parte del personale e/o attrezzatura. Queste soluzioni offrono vantaggi quali movimentazione e logistica semplificate, accrescimento delle competenze interne, maggiore produttività e, nel caso di noleggio, accesso a tecnologie avanzate.

Formati

I formati dei file prodotti in un progetto di digitalizzazione vanno scelti tra quelli che possono maggiormente garantire l’interoperabilità tra i sistemi e la conservazione digitale, adottando, laddove possibile, formati standard internazionali e aperti [12]. Le presenti Linee guida non forniranno una trattazione esaustiva in merito a tutti i formati disponibili per la digitalizzazione del patrimonio culturale, ma si limiteranno ad indicare il formato e le caratteristiche generali più opportune per ciascun dominio.

Il formato per la conservazione a lungo termine deve essere senza perdita di informazione (lossless) e non compresso, preferibilmente di tipo “grezzo” (RAW). Tra questi, per le immagini, il DNG è preferibile in quanto formato “aperto” adottato da molteplici aziende produttrici di fotocamere e software; per i file audio è preferibile il WAVE o broadcast WAVE; per i file video è preferibile il formato AVI, indicato come formato di conservazione da AGID.

L’utilizzo di copie lossy, eventualmente compresse – come JPEG* per le immagini, MPEG per i video e MP3 per gli audio – è possibile prevalentemente per la pubblicazione on-line.

Nel caso di recupero di progetti di digitalizzazione pregressi è opportuno scegliere come formato per la conservazione quello che presenta meno perdita di informazioni e maggiore interoperabilità.

File immagine

Il file master di output consiste in un pacchetto di file comprendente:

  • Il file TIFF 6.0 non compresso a 16 o 48 bit (scala di grigi* o RGB), a seconda della cromia del bene;
  • Il file RAW non compresso, con allegato il file collaterale XMP.

Per la consegna dei file RAW è preferibile il formato DNG. La risoluzione spaziale minima del file master dipende da molteplici fattori quali, ad esempio, la tipologia del sensore della fotocamera o dello scanner, la dimensione del bene, ecc. Per esigenze di conservazione di positivi e negativi fotografici in bianco e nero* è necessario eseguire comunque la digitalizzazione in RGB a 48 bit.

Le specifiche tecniche dei pacchetti dei file master possono essere adattate in base a documentate esigenze specifiche del progetto di digitalizzazione. Alcuni fattori che possono condizionare la scelta del numero dei file componenti il pacchetto “master” e la tipologia del formato di ciascuno di questi file sono la tipologia dei materiali analogici da digitalizzare, le caratteristiche dei macchinari e delle tecniche di digitalizzazione più appropriate in relazione agli oggetti analogici, il numero degli oggetti da digitalizzare nell’ambito del progetto e i costi di storage connessi all’archiviazione digitale dei file master.

Nel caso, ad esempio, della digitalizzazione bidimensionale di documenti cartacei, quali periodici a stampa, come giornali e quotidiani, è possibile richiedere come file master unicamente il file TIFF secondo le specifiche sopra indicate. Infatti, il considerevole numero di oggetti digitali prodotti nell’ambito del progetto di digitalizzazione di ambito bibliotecario si traduce in un maggiore costo di storage del gran numero di file RAW prodotti in fase di digitalizzazione. In ogni caso, la scelta dei componenti del pacchetto dei file master, delle loro caratteristiche e formati deve essere adeguatamente documentata e argomentata nel piano di gestione dei dati (DMP, cfr. Linee guida per la redazione del piano di gestione dei dati).

I file derivati da richiedere dipendono dalla specificità del progetto di digitalizzazione: sono consigliabili file compressi in formato JPG con lato lungo di almeno 3000 pixel, con qualità di compressione non inferiore al 75%, aventi spazio colore sRGB o scala di grigi [13], a seconda della tipologia di scansione effettuata. In alternativa al “classico” JPG può essere richiesto il formato contenitore HEIF (High Efficiency Image Format) o HEIC (High Efficiency Image Coding) [14].

Si segnala anche il formato standard FITS, definito dallo IAU FITS Working Group, Commission B2 Data and Documentation (Definition of the Flexible Image Transport System (FITS)). Il formato FITS è alla base della norma UNI 11845 2022 (Processi di gestione della conservazione a lungo termine di immagini digitali con l’uso del formato FITS), pubblicata nel catalogo nazionale UNI il 20 gennaio 2022, che definisce caratteristiche e requisiti funzionali che un archivio basato sull’uso del formato FITS deve soddisfare per l’idoneità a lungo termine della conservazione delle immagini digitali.

Master RAW

La scelta di conservare il file in formato RAW ha due principali motivazioni:

  1. Rendere il processo di digitalizzazione reversibile, permettendo di risalire al file nativo pre-editing. Nonostante il file TIFF (seppur prodotto a regola d’arte) rappresenti un prodotto di qualità, questo potrebbe non soddisfare esigenze estetiche da parte dell’utente finale (esempi: eliminazione di maschere di contrasto, selezioni dei soggetti, profili colore output, ecc.);
  2. Il file RAW è un file aperto che ci consente di operare sull’immagine acquisita partendo dalla sua genesi fotografica.

Considerando quest’ultima caratteristica, il file RAW consente di risalire a informazioni in merito alle scelte di ripresa fotografica che possono risultare utili in campo di ricerca e studio (per esempio nello studio degli archivi digitali).

Caratteristiche di un file RAW
  1. Profondità di bit. Un file RAW, demosaicizzato in un programma di conversione RAW quando viene salvato in un altro formato (per esempio TIFF) può essere esportato anche a 16 bit per canale. Se invece si decide di generare con lo scatto un file in formato JPEG, questo sarà creato automaticamente dal software della macchina (partendo sempre da una cattura RAW) a 8 bit di profondità, ossia a 256 livelli di luminosità per canale, cioè poco più di 16,7 milioni di colori. Avere a disposizione un file ricco di informazioni (quindi con una maggiore profondità di bit) è molto utile quando l’immagine richiede regolazioni particolarmente profonde e complesse. Una grande profondità in bit permette di intervenire notevolmente sull’immagine senza incappare nella posterizzazione, ossia nella mancanza di una transizione morbida di colori e toni che compromette la qualità complessiva dell’immagine.
  2. Imparzialità del contenuto. RAW in inglese significa «allo stato grezzo»: il RAW contiene tutti i dati provenienti dal sensore, senza esclusioni, senza cioè nessuna compressione. Il file RAW racchiude anche le impostazioni della macchina (ad esempio contrasto, saturazione, temperatura colore, nitidezza, ecc.): per ogni RAW, infatti, la fotocamera crea un file di intestazione contenente le impostazioni della macchina. Questi parametri non cambiano l’immagine, essendo delle pure istruzioni allegate ai dati del file grezzo. Con lo stesso principio vengono salvati anche i metadati, ossia i dati EXIF* relativi alle impostazioni di scatto (ad esempio l’apertura del diaframma utilizzata, la lunghezza focale*, eccetera). Per questo motivo sono in molti a vedere nei file RAW un’analogia con il negativo della fotografia analogica, dal momento che le informazioni raccolte vengono riproposte esattamente come tali.
  3. Flessibilità e controllo delle regolazioni. Il fatto che le impostazioni della macchina non vengano direttamente applicate all’immagine generata (proprio perché non esiste ancora un’immagine ma solamente un insieme di dati) presuppone che ciò avvenga in un secondo momento e apre un mondo di possibilità. In pratica il file grezzo richiede uno «sviluppo», ossia la sua conversione. E lo sviluppo consiste proprio nell’applicare, successivamente allo scatto, tutta una serie di impostazioni senza minimamente inficiare il risultato che si sarebbe ottenuto applicandole al momento stesso dello scatto. Così, durante il processo di sviluppo è possibile applicare, ad esempio, le regolazioni della temperatura del colore senza pregiudicare la qualità dell’immagine (la modifica della temperatura colore durante la conversione RAW dà esattamente gli stessi risultati di uno scatto impostato con una diversa temperatura del colore). Naturalmente questo vale anche per gli altri parametri fondamentali, come ad esempio il controllo della saturazione, del contrasto, della nitidezza e dell’esposizione. In generale quindi è possibile, scattando in RAW, avere un notevole controllo su tutti i parametri di scatto non meccanici (intendendo questi il diaframma, l’otturatore, ecc.) che influiscono sulla resa dell’immagine finale.
[13]Nel caso dei file derivati in formato JPEG è sufficiente l’utilizzo dello spazio colore sRGB in quanto le modalità di fruizione dell’immagine digitale, mediata da un monitor o comunque da un altro dispositivo non professionale, non rendono necessario l’utilizzo di specifiche più performanti.
[14]Si segnala che sono in corso iniziative per la standardizzazione di formati immagine, come ad esempio JPG XL o il JBIG2; in questo documento ci si limita a segnalare la loro esistenza in attesa di verificarne il livello di diffusione e di standardizzazione.

File video

Il file master che deve essere richiesto consiste in un file AVI 2160p 4K. La risoluzione video deve essere 3840x2160px, formato H.264, progressivo VBR (1 passata), destinazione 40,00 Mbps, Max. 40,00 Mbps, audio AAC 48.000 Hz, bitrate 320 kbps, stereo.

I file derivati devono essere 1080p/25 fps. La risoluzione video deve essere 1920x1080 px, formato H.264, 25 fps, progressivo VBR (2 passate), destinazione 5,00 Mbps, Max. 5,00 Mbps, audio AAC 44.100 Hz, bitrate 320 kbps, stereo.

File audio

Il formato audio deve essere o WAV o BWF. Si segnala che il formato BWF ha il vantaggio di poter contenere internamente metadati.

Il file master digitale deve avere una risoluzione di 96 khz campionati a 24 bit.

I file derivati dipendono dalla specificità del progetto di digitalizzazione. Si consiglia di ottenere file compressi in formato MP3 (256 kbit/s o 320 kbit/s) o FLAC (Free Lossless Audio Codex).

File 3D

Le tecnologie 3D applicabili al dominio dei beni culturali sono soggette a una evoluzione molto rapida e sono ancora dipendenti da specifici applicativi.

Future versioni del Piano indicheranno standard, metadati e formati raccomandati. Nell’ambito del presente documento non si prescrive un formato 3D standard, ma se ne segnalano alcuni tra quelli utilizzati in progetti di digitalizzazione sui beni culturali:

  • glTF (formato standard e aperto mantenuto dal Khronos Group);
  • Bundles webGL (per visualizzazioni interattive su browser);
  • STL (molto utilizzato per stampa 3D e prototipazione);
  • Wavefront .OBJ
[12]Per i formati adatti alla conservazione a lungo termine si veda l’Allegato 2 al documento Linee Guida sulla formazione, gestione e conservazione dei documenti informatici - Formati di file e riversamento e s.m.i.

Metadati

Indicazioni generali

Il progetto di digitalizzazione richiede obbligatoriamente la descrizione del bene e la metadatazione degli oggetti digitali.

I metadati sono classificati a seconda delle loro caratteristiche e finalità:

  • descrittivi: per l’identificazione e la rintracciabilità dell’oggetto digitale;
  • amministrativi e gestionali: per le operazioni di gestione degli oggetti digitali; questi si suddividono principalmente in:
    • metadati tecnici: relativi alle caratteristiche intrinseche dei file che compongono gli oggetti digitali e/o la loro produzione;
    • metadati sulla proprietà intellettuale: informazioni relative a copyright e licenze d’uso;
  • strutturali: per descrivere la struttura interna dei documenti (ad esempio, per un libro: introduzione, capitoli, indice) e gestire le relazioni fra le varie parti componenti gli oggetti digitali;
  • di conservazione.

Lo standard METS

Fatta salva la possibilità da parte degli istituti culturali di produrre metadati secondo standard necessari per la gestione delle risorse all’interno dei propri sistemi, nelle presenti Linee guida viene descritto il METS (Metadata Encoding and Transmission Standard) [15], standard di metadatazione ampiamente utilizzato a livello internazionale che occorre utilizzare a livello nazionale per la descrizione e la gestione degli oggetti digitali nei progetti di digitalizzazione. Lo standard METS costituisce il linguaggio di interscambio tra i sistemi afferenti e l’Istituto centrale per la digitalizzazione del patrimonio culturale – Digital Library. Il METS serve per codificare metadati descrittivi, amministrativi e strutturali riguardanti le risorse digitali.

La generazione di metadati METS viene realizzata per mezzo dello sviluppo di specifici software appositamente customizzati a seconda delle necessità del singolo progetto di digitalizzazione. Salvo casi particolari, questa attività viene svolta dai fornitori dei servizi di digitalizzazione.

Un documento METS è costituito da sette sezioni principali:

  1. <metsHdr> Intestazione METS: contiene i metadati che descrivono il documento METS stesso, includendo alcune informazioni quali autore, editore, ecc.;
  2. <dmdSec> Metadati descrittivi: contiene al suo interno i metadati descrittivi, o punta a metadati esterni specifici per ciascun dominio;
  3. <amdSec> Metadati amministrativi: contiene sia informazioni sui file creati, che conservano anche i diritti di proprietà intellettuale, sia metadati riguardanti l’oggetto di origine da cui deriva l’oggetto digitale, sia informazioni sulla provenienza dei file e sulle relazioni degli oggetti digitali;
  4. <fileSec> Sezione file: è una lista di tutti i file contenente le versioni elettroniche dell’oggetto digitale;
  5. <structMap> Mappa strutturale: descrive la struttura gerarchica, fisica o logica, dell’oggetto digitale e collega i file e i metadati loro associati;
  6. <structLInk> Link strutturali: permette di gestire collegamenti ipertestuali tra nodi nella gerarchia definita nella Mappa strutturale;
  7. <behaviour> Comportamento: può essere usato per associare comportamenti (per esempio, la visualizzazione) con il contenuto dell’oggetto METS.
[15]https://www.loc.gov/standards/mets/

Metadati descrittivi

I metadati descrittivi sono utilizzati per l’identificazione degli oggetti digitali e degli oggetti fisici che essi rappresentano, e sono costituiti da descrizioni dei beni analogici e delle risorse digitali. Sono specifici per ogni dominio.

I metadati descrittivi possono essere generati nell’ambito del progetto di digitalizzazione o, più frequentemente, risiedere in uno dei sistemi informativi culturali dedicati. Occorre prevedere la relazione tra i sistemi informativi di dominio e i metadati gestionali relativi agli oggetti digitali.

Nell’ambito di ogni progetto di digitalizzazione devono essere indicati gli standard descrittivi da utilizzare e, in base a specifiche esigenze, è possibile indicare gli strumenti software compatibili con essi.

Dominio archivistico

Gli standard nazionali del dominio archivistico sono pubblicati dall’Istituto centrale per gli Archivi (ICAR) [16] e sono conformi ai modelli internazionali elaborati dall’International Council on Archives (ISAD [G] [17], standard internazionale di descrizione archivistica; ISAAR [CPF`] <https://www.ica.org/en/isaar-cpf-international-standard-archival-authority-record-corporate-bodies-persons-and-families-2nd>`__ [18], standard internazionale per i record d’autorità archivistici di enti, persone e famiglie), dalla Library of Congress (EAD 3 [19], Encoded Archival Description, versione 3) e dalla Staatsbibliothek di Berlino (EAC-CPF [20], Encoded Archival Context for Corporate Bodies, Persons, and Families).

È stata prevista una pagina dedicata agli standard e ai documenti tecnici legati al PND sul sito dell’ICAR (Pagina sito ICAR – Linee Guida per il PND) [21].

Dominio bibliografico

Le normative per la catalogazione in SBN sono pubblicate dall’Istituto centrale per il catalogo unico delle biblioteche italiane e per le informazioni bibliografiche (ICCU). Attualmente sono disponibili le normative comuni a tutte le tipologie di materiale [22], che comprendono anche le norme per la catalogazione delle voci di autorità [23], e quelle specifiche per la catalogazione del materiale moderno [24], del materiale antico [25], del materiale musicale [26] e del materiale grafico [27].

Le normative sono conformi ai seguenti standard e formati nazionali e internazionali:

  • Regole italiane di catalogazione REICA T, a cura della Commissione permanente per la revisione delle regole italiane di catalogazione, Roma, ICCU, 2009 [28];
  • IFLA, International Standard Bibliographic Description, edizione consolidata, edizione italiana a cura dell’Istituto centrale per il catalogo unico delle biblioteche italiane e per le informazioni bibliografiche, Roma, ICCU, 2012;
  • IFLA, Unimarc formats and related documentation [29].

Per la catalogazione semantica gli standard di riferimento sono:

  • Il nuovo soggettario di Firenze;
  • WebDewey edizione italiana (23 edizione in SBN) e versioni precedenti [30].

Per la catalogazione dei manoscritti gli standard di riferimento sono:

  • La Guida a una descrizione uniforme dei manoscritti e al loro censimento, pubblicata dall’ICCU nel 1990 [31] e ormai non più reperibile nella sua versione a stampa. La Guida contiene la scheda di censimento Jemolo-Morelli, che ha costituito la base per l’elaborazione della scheda catalografica di Manus Online (MOL), e le istruzioni per la sua applicazione;
  • Linee Guida per la formulazione e il trattamento in Manus Online (MOL) delle voci di autorità di nomi di persone, di enti, di famiglie e di luoghi, (ICCU, Roma, 2018) [32]. Questo nuovo strumento è il risultato dell’attività del Gruppo di Lavoro per la gestione e la manutenzione dell’Authority File di Manus Online e fornisce le indicazioni metodologiche e le norme per formulare e implementare in modo omogeneo le registrazioni di autorità in MOL, ossia di nomi di persone, di enti, di famiglie e di luoghi.

I medesimi standard possono essere utilizzati anche per la descrizione dei beni sonori e audiovisivi (in particolare ISBD-NBM e IASA Cataloguing Rules) [33].

Lo standard di metadatazione delle risorse digitali finora utilizzato a livello nazionale è il MAG [34]. A questo si aggiunge il METS-SBN, nuovo profilo che consente un’ulteriore interoperabilità fra i sistemi in ambito nazionale e internazionale.

Per ulteriori informazioni circa gli standard di metadatazione digitale di ambito bibliografico e una sintetica raccolta dei documenti sopra citati si consulti la pagina dedicata (Pagina sito ICCU – Linee Guida per il PND) [35].

Dominio catalografico

Per la descrizione dei beni culturali del dominio catalografico si fa riferimento a nove settori disciplinari articolati in: beni archeologici, architettonico-paesaggistici, demoetnoantropologici, fotografici, naturalistici, numismatici, scientifico-tecnologici, storico-artistici, strumenti musicali.

Per questi nove settori disciplinari occorre fare riferimento agli standard nazionali emanati dall’ICCD, i cui tracciati sono disponibili in formato XSD su GitHub [36].

Le norme di compilazione sono disponibili sul sito dell’ICCD [37]. Occorre fare riferimento alle versioni più recenti di tali standard.

Una sintetica raccolta dei principali riferimenti in merito alla descrizione delle risorse del dominio catalografico è disponibile nella pagina dedicata sul sito dell’ICCD (Pagina sito ICCD – Linee Guida per il PND) [38].

[16]Gli standard descrittivi del dominio archivistico sono disponibili presso la sezione standard sito ICAR: https://www.icar.beniculturali.it
[17]https://www.icar.beniculturali.it/standard/standard-internazionali/isad-g
[18]https://www.icar.beniculturali.it/standard/standard-internazionali/isaar-cpf
[19]https://www.loc.gov/ead/
[20]https://eac.staatsbibliothek-berlin.de/
[21]https://www.icar.beniculturali.it/standard/linee-guida-per-il-pnd
[22]https://norme.iccu.sbn.it/index.php?title=Norme_comuni
[23]https://norme.iccu.sbn.it/index.php?title=Norme_comuni/Authority_file
[24]https://norme.iccu.sbn.it/index.php?title=Guida_moderno
[25]https://norme.iccu.sbn.it/index.php?title=Guida_antico
[26]https://norme.iccu.sbn.it/index.php?title=Guida_musica
[27]https://www.iccu.sbn.it/export/sites/iccu/documenti/2012/graficaPDFluglio2012/txt_vs0.pdf
[28]https://norme.iccu.sbn.it/index.php?title=Reicat
[29]https://www.ifla.org/publications/unimarc-formats-and-related-documentation/
[30]https://www.aib.it/pubblicazioni/webdewey-italiana/
[31]https://manus.iccu.sbn.it/upload/GuidaAUnaCatalogazioneUniforme.pdf
[32]https://manus.iccu.sbn.it/norme-catalografiche2
[33]Ulteriori informazioni sugli standard e la documentazione per la creazione, gestione e descrizione delle risorse digitali di ambito bibliotecario si trovano all’indirizzo: http://www.internetculturale.it/it/1132/documentazione
[34]https://www.iccu.sbn.it/it/normative-standard/linee-guida-per-la-digitalizzazione-e-metadati/standard-mag-versione-2.0.1/index.html
[35]Per la manualistica relativa alla catalogazione semantica e a quella di materiale cartografico o audiovisivo, tutte in corso di pubblicazione, consultare le pagine dedicate del sito dell’ICCU.
[36]https://github.com/ICCD-MiBACT/Standard-catalografici/tree/master/schede-di-catalogo
[37]http://www.iccd.beniculturali.it/it/ricercanormative
[38]http://www.iccd.beniculturali.it/it/877/linee-guida-per-il-pnd

Metadati tecnici

I metadati tecnici possono essere interni o esterni al file della risorsa digitale. Quelli “interni” sono informazioni descrittive generate dall’applicativo o dallo strumento che produce il file, e sono memorizzati all’interno del file (per esempio, i file testuali generati da un programma di videoscrittura o i file immagine prodotti da una fotocamera o da uno scanner sono corredati da metadati tecnici interni). Quelli “esterni” sono codificati in un file separato che accompagna il file originale e vengono anche definiti “file sidecar ” (per esempio, i file XMP che accompagnano le diverse tipologie di file RAW prodotti dalle fotocamere). Generalmente, i file sidecar vengono scritti da applicazioni di post-produzione durante la modifica del file originale. Talvolta, come per i metadati tecnici interni, anche il set dei metadati descrittivi può essere rappresentato all’esterno del file.

Exif

I metadati Exif (Exchangeable Image file format) [39] descrivono i parametri tecnici utilizzati al momento dell’acquisizione dell’immagine, ovvero della scansione o dello scatto fotografico. Le informazioni registrate nei metadati Exif possono riguardare:

  • specifiche dell’hardware usato per creare l’immagine (per esempio, modello di fotocamera, ottiche, flash e altra apparecchiatura, con i loro parametri di scatto);
  • data, ora ed eventuale posizione geografica della creazione;
  • nome o altre caratteristiche dell’autore;
  • eventuali licenze d’uso dell’immagine (Copyright*©, *Creative Commons, ecc.);
  • informazioni colorimetriche (spazio-colore, punto di bianco, profilo ICC, ecc.);
  • eventuale proiezione piana di uno spazio curvo (per esempio, equi-rettangolare, altrimenti detta “latitudine/longitudine” o, più impropriamente, “360°”).

IPTC

I metadati IPTC (Information Interchange Model) [40], conosciuti anche come IPTC-NAA-Standard, sono una struttura dati che può essere applicata a file immagine, video e ad alcuni formati audio. In generale sono metadati interni, ma possono essere anche rappresentati come metadati esterni in formato JSON [41] e YAML [42]. Vengono compilati laddove sia necessario garantire un livello minimo di descrizione degli oggetti digitali. Le regole di compilazione e la mappatura vanno descritte nel documento di progettazione.

BWF

I metadati BWF (Broadcast Wave Format), standardizzati dalla European Broadcasting Union (EBU) [43], si usano per i file audio in formato WAVE. Questi consentono la memorizzazione di un numero limitato di dati descrittivi all’interno del file WAVE. Questa scelta permette la conservazione del collegamento tra metadati e audio digitale. Tuttavia, nel caso contrario – metadati e contenuti separati dal file digitale – occorre fare ricorso all’utilizzo dello standard METS.

XMP

Il formato XMP (eXtensible Metadata Platform), creato da Adobe e successivamente standardizzato nella norma ISO 16684-1:2012 [44], è una descrizione del processo di modifica del file per la codifica di informazioni significative su un progetto (titoli e descrizioni, parole chiave ricercabili e informazioni aggiornate sull’autore e sul copyright, e tutte le informazioni sulle azioni di modifica avvenute sul file).

I metadati XMP possono essere interni ed esterni al file. Vengono codificati all’interno del file, come nel caso dei file .pdf o .jpg, o scritti esternamente in file separati, come nel caso in cui occorra descrivere file RAW acquisiti da una fotocamera o scanner.

All’interno del METS, sezione <amdSec>, gli standard adottati per la descrizione di tali caratteristiche tecniche sono:

  • NISO-MIX (NISO Metadata for Images in XML schema - Still images) [45] per le immagini;
  • AUDIO-MD e VIDEO-MD [46] per la codifica dei metadati tecnici dei documenti sonori e audiovisivi.
[39]Exif è stato creato dalla Japan Electronic Industries Development Association (JEIDA). La versione 2.1 è datata 12 giugno 1998, la versione 2.2 è dell’aprile 2002 ed è anche conosciuta come Exif Print. Attualmente Exif non è supportata da aziende od organizzazioni che seguono gli standard, tuttavia è il formato utilizzato da tutti i produttori di fotocamere.
[40]https://iptc.org/
[41]https://iptc.org/std/photometadata/specification/iptc-pmd-techreference_2019.1.json
[42]https://iptc.org/std/photometadata/specification/iptc-pmd-techreference_2019.1.yml
[43]https://www.loc.gov/preservation/digital/formats/fdd/fdd000356.shtml
[44]https://www.iso.org/standard/57421.html
[45]https://www.loc.gov/standards/mix/
[46]https://www.loc.gov/standards/amdvmd/

Metadati dei diritti

Oltre ai metadati tecnici, la sezione <amdSec> deve contenere anche i dati relativi ai diritti applicati agli oggetti digitali, incorporando lo standard METS-Rights.

Lo schema prevede, sotto la sezione principale (RightsDeclarationMD), una sezione (RightsHolder) per indicare il detentore dei diritti di riproduzione e una sezione (Context) per indicare le diverse licenze applicabili.

Le licenze devono essere gestite come contesti METS-Rights e indicate nei metadati. Inoltre, diverse licenze possono essere attribuite ai vari file che costituiscono l’oggetto digitale per differenziarne l’utilizzo in base a parametri che è opportuno definire in fase di progetto.

Per una disamina in merito alle licenze applicabili per le riproduzioni digitali del patrimonio culturale, si vedano le Linee guida per l’acquisizione, la circolazione e il riuso delle riproduzioni dei beni culturali in ambiente digitale.

Metadati strutturali

La mappa strutturale (structMap) descrive, gerarchicamente, la struttura fisica e logica del pacchetto dati.

Se la sezione <fileSec> è utilizzata per rappresentare il rapporto tra i file presenti nel pacchetto e le altre sezioni del METS, la sezione <structMap>, invece, definisce il rapporto tra questi e la parte dedicata alla fruizione. Nella mappa strutturale i singoli media vengono posti in ordine e organizzati logicamente.

Metadati per la conservazione

I metadati possono essere funzionali ad alcune attività di conservazione degli oggetti digitali. Nel caso in cui una risorsa digitale debba essere conservata integra e priva di manomissioni, l’informazione di checksum archiviata come metadato può essere utile a segnalare se essa abbia subito modifiche in un determinato arco temporale.

Qualora i supporti di archiviazione dei file vengano danneggiati o diventino obsoleti, si presenta il rischio della perdita dei dati. In tal caso, i metadati sui supporti (che possono indicare, per esempio, il tipo di supporto e la sua età, o anche le date in cui è stato eseguito l’ultimo refresh dei file) possono essere utili per il recupero dei dati.

Come è noto, anche i formati dei file più diffusi possono diventare obsoleti, e di conseguenza le applicazioni possono non essere più in grado di restituirne il contenuto. Pertanto, nelle strategie di migrazione e di emulazione degli applicativi i metadati sui formati dei file originari e su hardware e software che li supportano possono giocare un ruolo decisivo.

I metadati, infine, possono comprovare l’autenticità della risorsa digitale, documentandone la provenienza e la sua catena di custodia.

Lo standard internazionale di riferimento per la conservazione degli oggetti digitali è PREMIS (Preservation Metadata: Implementation Strategies, versione 3.0), rilasciata nel 2015 dalla Library of Congress [47]. PREMIS definisce i metadati di conservazione come l’informazione usata da un repository allo scopo di supportare il processo di conservazione digitale.

[47]https://www.loc.gov/standards/premis/v3/

Diritti

Nell’ambito di un progetto di digitalizzazione, ciascun istituto deve accertare eventuali diritti d’autore in essere e la loro titolarità. I diritti possono riguardare l’originale o la sua riproduzione, così come la sua metadatazione e la sua descrizione. Molti progetti di digitalizzazione possono, inoltre, riguardare documenti contenenti dati personali e/o sensibili, specialmente nel dominio archivistico.

L’istituto conservatore coinvolto avrà cura di esplicitare in un apposito documento i vincoli derivanti dalla normativa di tutela italiana ed europea in merito a dati personali, diritto d’autore e diritto patrimoniale d’autore, definendo i termini d’uso possibili.

In questa sede è necessario rilevare che le licenze e i termini d’uso legati all’esistenza di uno o più di queste tipologie di diritti vanno esplicitate all’interno dei metadati (ad esempio, nella sezione “metsRights” di un record in formato METS).

Per una più estesa trattazione dell’argomento, si rimanda alle Linee guida per l’acquisizione, la circolazione e il riuso delle riproduzioni dei beni culturali in ambiente digitale.

Nomenclatura degli oggetti digitali

Indicazioni generali

La nomenclatura degli oggetti digitali ha come obiettivo principale l’identificazione univoca dei file nel contesto del progetto di digitalizzazione.

L’utilizzo di una nomenclatura specifica permette di raggiungere tale obiettivo strutturando una sequenza gerarchica di informazioni che possono essere adattate ai vari domini e alle peculiarità dei diversi progetti di digitalizzazione. Essa consente anche di determinare un legame logico stabile fra gli oggetti digitali e le loro descrizioni.

Il modello proposto in queste Linee guida prevede l’individuazione di quattro elementi principali, che possono poi essere eventualmente modificati sulla base di esigenze specifiche relative ai singoli sistemi di gestione delle risorse digitali:

  • Codice istituto [48];
  • Codice oggetto [49];
  • Numero progressivo;
  • Estensione del file.

Un quinto elemento, la nomenclatura, è di carattere opzionale, e può essere previsto per i materiali di ambito bibliografico.

Questi elementi vanno strutturati in una sequenza alfanumerica (stringa) così articolata:

CodiceIstituto+CodiceOggetto+NumeroProgressivo.EstensioneFile

Il carattere “+” segnala la separazione tra le diverse aree di informazione.

[48]Codici identificativi in uso presso gli istituti del MiC che possono essere utilizzati per il Codice istituto possono essere: codice ISIL (ISO 15511), codice ISTAT, codice SBN, codice RISM.
[49]Il codice oggetto riporta l’identificativo univoco assegnato alla descrizione dell’oggetto. Può essere un numero o una sequenza alfanumerica. La suddivisione interna di questo codice può seguire una sintassi specifica per uno specifico sistema informativo o una specifica applicazione.

Vincoli nella nomenclatura

Le stringhe alfanumeriche (CodiceIstituto, CodiceOggetto) non devono contenere il carattere di separazione “+”. Non sono accettati spazi all’interno dei Codici.

Il “Numero progressivo” identifica il singolo file componente una risorsa digitale. Si richiede una codifica con un numero di cifre numeriche a cui è applicato lo zero padding.

Il numero di cifre dipende dal numero massimo di file componenti una risorsa digitale. Negli esempi è riportata una codifica a 5 cifre che permettono di rappresentare fino a 99.999 file collegati ad un singolo oggetto digitale.

Esempi di nomenclatura

Un esempio di ambito archivistico può essere il seguente:

  • Codice Istituto = IT-MC0238 [50]
  • Codice Oggetto = 00000213
  • Numero Progressivo = 00001
  • Estensione del file = .jpg

Pertanto, il nome risultante sarà: IT-MC0238+00000213+00001.jpg

Il codice oggetto in questo caso è un codice progressivo che è stato assegnato dal software di descrizione.

Un altro esempio, con encoding del codice oggetto, può essere il seguente:

  • Codice Istituto = IT-MC0238
  • Codice Oggetto = Anagrafe_Registri_00000213 [51]
  • Numero Progressivo = 00001
  • Estensione del file= .jpg

Pertanto, il nome risultante è: IT-MC0238+Anagrafe_Registri_00000213+00001.jpg

In questo caso il Codice oggetto è una segnatura che è stata indicata per l’oggetto.

Un esempio per gli oggetti digitali collegati a descrizioni bibliografiche può essere il seguente:

  • Codice Istituto = IT-MI0185 [52]
  • Codice Oggetto = BVEE022376 [53]
  • Numero Progressivo = 00001
  • Estensione del file = .jpg

Pertanto, il nome risultante è: IT-MI0185-BVEE022376+00001.jpg

Nel caso di un periodico, nel codice oggetto trovano spazio una serie di informazioni che devono essere segmentate per rendere univoca ed esplicita la nomenclatura del file.

Un possibile esempio di composizione del codice oggetto può risultare dalla giustapposizione del codice BID della testata, dei dati cronologici del fascicolo, del numero del fascicolo, e di eventuali informazioni aggiuntive del fascicolo, separati da “_” (underscore).

Un esempio può essere il seguente:

  • Codice Istituto = IT-MI0185
  • Codice Oggetto = TO00199240_18690503_01 [54]
  • Numero Progressivo = 00001
  • Estensione del file = .jpg

Il nome risultante è: IT-MI0185+TO00199240_18690503_01+0001.jpg

Nel caso dei file multimediali allegati ad una scheda di catalogo, un esempio può essere il seguente:

  • Codice Istituto = S29 (codice assegnato in SIGECweb)
  • Codice Oggetto = 12345678 (codice univoco catalografico dell’entità catalogata nel sistema nazionale)
  • Numero progressivo = 00001
  • Estensione del file = .tiff

Il nome risultante è: S29+12345678+00001.tiff

Nel caso di file sonori, ad esempio di un vinile, un esempio può essere il seguente:

  • Codice Istituto = IT-RM0200 (codice ISIL dell’ICBSA)
  • Codice Oggetto= DDS0253686 (corrisponde al BID)
  • Numero Progressivo = 00001 (per il lato A) o 00002 (per il lato B)
  • Estensione del file = .wav

Il nome risultante è: IT-RM0200+DDS0253686+0001.wav

Per una migliore organizzazione dei contenuti, la struttura gerarchica del file system deve essere coerente con la struttura della nomenclatura dei file. Con la medesima finalità, nel progetto di digitalizzazione si possono rendere esplicite ulteriori regole di articolazione del file system.

Di seguito si riporta un esempio basato su codice istituto e codice oggetto:

  • Codice istituto
    • Codice oggetto (dentro la cartella trovano spazio, indifferentemente, tutti i file digitali prodotti nelle diverse estensioni)

Un altro possibile livello comprende anche l’estensione dei file:

  • Codice istituto
    • Codice oggetto
      • Estensione file (dentro le sottocartelle trovano spazio i file digitali prodotti in una particolare estensione, per esempio cartella “tiff”, cartella “jpg” ecc.)

Le regole seguite per la nomenclatura, in particolare in riferimento a come è strutturato il codice oggetto, vanno rese esplicite e descritte nella documentazione di progettazione, e inserite nei supporti di consegna.

[50]Codice ISIL dell’Archivio di Stato di Macerata.
[51]Segnatura dell’unità modificata per essere URI compliant in cui lo spazio è sostituito dal carattere “_” [underscore].
[52]Codice ISIL della Biblioteca nazionale Braidense.
[53]In questo caso il codice oggetto è un BID SBN (http://id.sbn.it/bid/BVEE022376).
[54]Dove TO00199240 rappresenta il BID dell’unità nel catalogo nazionale; 18690503_01 rappresenta i Dati cronologici del fascicolo.

Voci di costo

Schema

L’analisi delle voci di costo è propedeutica all’identificazione delle spese da affrontare nel corso di un progetto di digitalizzazione.

L’approccio al processo di digitalizzazione va necessariamente innovato rispetto alle pratiche del passato e le presenti Linee guida mirano a fare acquisire maggiore consapevolezza del fatto che un progetto può essere più o meno complesso a seconda degli obiettivi e dei risultati attesi. Per questo motivo le voci di costo vanno identificate puntualmente e distinte a seconda che si decida di procedere con la digitalizzazione interna o con l’affidamento ad esterni di parte del progetto o dell’intero progetto. Nel caso dell’affidamento a esterni, tale analisi può consentire ai fornitori di presentare un’offerta congrua nella fase di proposta.

Le voci di costo di cui tenere conto sono sostanzialmente le seguenti:

  • Individuazione e quantificazione delle risorse da digitalizzare (cfr. par. Che cosa (selezione e trattamento del bene))
  • Risorse umane previste nel progetto di digitalizzazione (cfr. par. Chi (enti coinvolti e team di progetto))
    • RUP
    • Project Manager
    • Conservatore
    • Restauratore
    • Addetto alla logistica
    • Responsabile tecnico
    • Operatore tecnico
    • Catalogatore
    • Informatico
    • Assistente Informatico
  • Formazione degli operatori
  • Attrezzature tecnico-specialistiche / risorse strumentali
  • Materiale per il condizionamento degli originali
  • Trasporto e movimentazione
  • Assicurazione (RCT-RCO - Responsabilità civile verso terzi e verso l’operatore; perdita del materiale; assicurazione sul trasporto “da chiodo a chiodo”)
  • Gestione dell’infrastruttura di storage
  • Storage hardware e/o in cloud degli oggetti digitali
  • Conservazione a lungo termine delle risorse digitali
  • Software di gestione dei workflow di digitalizzazione
  • Software di supporto alla gestione del progetto e della documentazione

Seguendo questo schema, il costo tradizionalmente inteso come riferito alla “digitalizzazione e metadatazione” di una risorsa può essere scorporato in più voci.

Tali voci di costo vanno sempre esplicitate, anche quando il loro importo apparentemente non incide sul singolo progetto (ad esempio, il costo dello storage potrebbe non essere direttamente imputabile al progetto stesso).

Le voci di costo e le relative quantificazioni devono essere ricavate o da precedenti progetti svolti oppure tramite analisi di mercato, e possono essere previste a giornate, per attività o per unità da digitalizzare.

Esempio di schema di voci di costo

RISORSE DA DIGITALIZZARE
  Oggetto unità Tipologia bene Come – dispositivo digitalizzazione
Carte sciolte / pitture      
Carte rilegate      
Oggetti di piccole e medie dimensioni      
Beni di grandi dimensioni      
Supporti audio e video      
Altre tipologie di risorse (compilare)      
RISORSE UMANE
  Unità persona le interno Unità persona le esterno Giorno o persona Costo per unità Costo per giorno Costo totale
RUP            
Project manager            
Conservatore            
Restauratore            
Addetto alla logistica            
Responsabile tecnico            
Operatore tecnico            
Catalogatore            
Informatico            
Assistente informatico            
RISORSE STRUMENTALI
Metodologia Strumentazione Quantità (acquisto) Quantità (esternalizzazione) Quantità (noleggio) Costo totale
Digitalizzazione 2D Fotocamera digitale        
Scanner piani        
Scanner planetario        
Scanner a piani basculanti        
Book scanner        
Scanner verticali        
Scanner per pellicole        
Scanner per pellicole cinematografiche e microfilm        
Scanner a tamburo virtuale        
Digitalizzazione Strumentazioni per la fotogrammetria 3D        
Post-produzione        
Elaborazione del dato        
Georeferenziazione        
Audio / Video Dispositivi di lettura per specifico supporto        
Apparecchiature per la pulizia dei supporti originali e materiale di consumo        
Converititori A/B scheda di acquisizione video        
Workstation e software di acquisizione audio        
BENI DI CONSUMO      
  Tipologia Costo per unità Costo totale
Materiale per il condizionamento degli originali      
Atro      
SERVIZI        
  Tipologia Costo a corpo Costo per unità Costo totale
Trasporto e movimentazione        
Assicurazione        
Gestione dell’infrastruttura di storage     a corpo su base temporale  
Storage hardware e/o in cloud degli oggetti digitali Dischi singoli   Costo a TB  
  NAS   Costo a TB  
  SAN   Costo a TB  
  Cloud   Costo a TB/Annuo  
Conservazione a lungo termine delle risorse digitali     Cost a TB/Annuo  

Dalle tabelle sopra riportate si evince, quindi, che il costo totale di un progetto di digitalizzazione risulta essere condizionato, oltre che dalla quantità e dalla tipologia di risorse analogiche e dalla consequenziale modalità di scansione, dalla integrazione complessiva delle voci di costo dettagliate per le diverse aree (risorse umane, risorse strumentali, beni di consumo, servizi).

Nella tabella relative alle “risorse da digitalizzare” non è volutamente riportato il costo per unità né il costo complessivo in quanto questi sono influenzati dalle variabili riportate nelle altre quattro tabelle (risorse umane, risorse strumentali, beni di consumo, servizi).

Il capitolato

Il capitolato tecnico è il documento che viene allegato al bando di gara, con cui la stazione appaltante individua le prescrizioni tecniche da applicare all’oggetto del contratto d’appalto di lavori, servizi o forniture.

Qui di seguito viene proposto un indice con le voci considerate essenziali all’interno di un capitolato tecnico per un progetto di digitalizzazione. È utile segnalare che l’ordine con cui vengono presentate tali voci non è prescrittivo e non necessariamente occorre inserirle tutte in uno specifico capitolato (per esempio, il trattamento del materiale può essere stato preventivamente eseguito dal personale interno). All’interno di questa proposta di indice di capitolato tecnico non viene affrontata esplicitamente la parte economica dell’oggetto dell’appalto, per la definizione della quale si rimanda in modo più dettagliato al capitolo VII. Voci di costo.

  1. Oggetto della fornitura:
    1. obiettivi e finalità;
    2. Descrizione dei beni (cfr. par. Che cosa (selezione e trattamento del bene)).
  2. Progetto di digitalizzazione:
    1. trattamento dei beni (ed eventuale ricondizionamento);
    2. figure professionali richieste per la costituzione del gruppo di progetto (cfr. par. Chi (enti coinvolti e team di progetto));
    3. formazione specifica per il personale impiegato.
    4. Il processo di digitalizzazione (cfr. par. Come):
      • risorse strumentali e metodologie in relazione alla tipologia
        dei beni [55];
      • Metodologia di scansione.
    5. Caratteristiche tecniche della digitalizzazione:
      • caratteristiche dei file master;
      • caratteristiche dei file derivati;
      • nomenclature e metadati tecnici/gestionali;
      • Metadati descrittivi.
    6. Supporti.
    7. Luogo di lavoro [56] (cfr. par. Dove).
    8. Orario di servizio [57].
    9. Sopralluogo preliminare [58].
    10. Attività e cronoprogramma:
      • attività;
      • cronoprogramma;
      • ruoli e responsabilità (in relazione al cronoprogramma).
    11. Vincoli temporali del progetto:
      • piano della qualità [59];
      • piano di lavoro [60];
      • specifiche di erogazione dei servizi (movimentazione,
        assicurazione, storage - hardware o cloud - backup e disaster recovery, conservazione a lungo termine).
    12. Comunicazioni formali e documentazione.
    13. Strumenti a supporto della fornitura [61].
    14. Verifiche e collaudi (cfr. par. Verifiche e collaudi).
    15. Analisi e gestione del rischio.
    16. Documentazione gestionale.
    17. Titolarità e licenze.
    18. Conformità norme ISO.
    19. Garanzia.
    20. Livelli di servizio.
    21. Penali.

Questo scheletro di base può esser poi declinato a seconda delle caratteristiche specifiche del progetto di digitalizzazione per cui si redige il capitolato.

Nella Pagina del sito dell’ICCD – Linee Guida per il PND [62] si riporta un esempio di capitolato che, pur non rispettando alla lettera l’ordine dell’indice qui proposto, in quanto formulato anteriormente, è comunque coerente con le principali indicazioni elaborate nelle presenti Linee guida.

[55]È utile predisporre l’elenco e la descrizione delle attrezzature previste nel progetto, delle quali si possono indicare anche marca e modello. Inoltre, occorre indicare se le attrezzature utilizzate devono essere consegnate o rimosse al termine della fornitura.
[56]Specificare il luogo di esecuzione delle attività sia per la fase di digitalizzazione sia per le attività di post-produzione. Si possono, inoltre, includere le planimetrie dei luoghi di esecuzione, indicarne le caratteristiche, specificare le dotazioni informatiche e telematiche. In funzione della complessità delle lavorazioni, sarebbe opportuno fare riferimento al ”Documento unico di valutazione dei rischi interferenti“ (DUVRI).
[57]Indicare gli orari di accesso ai locali in cui si svolgono le attività previste dal progetto di digitalizzazione e la loro disponibilità; inoltre, si possono concordare gli orari di disponibilità delle risorse interne all’Amministrazione per una più proficua collaborazione.
[58]Il sopralluogo preliminare da parte dei concorrenti può essere facoltativo o obbligatorio. Nel caso in cui esso è previsto, occorre indicarne le modalità di gestione e predisporre un documento di avvenuto sopralluogo o di rinuncia ad esso.
[59]Nel piano della qualità occorre indicare metodologie e metriche di controllo, descrizione della struttura organizzativa della ditta appaltatrice, responsabilità e azioni, strumenti di supporto e ambienti di sviluppo.
[60]Nel piano di lavoro occorre definire scopo e campo di applicazione, attività di progetto, modalità di gestione, cronoprogramma di progetto, dettaglio dei work packages (WP) di progetto, piano dei collaudi.
[61]Si tratta di indicare, descrivere e approntare il software utile per la gestione del progetto.
[62]http://www.iccd.beniculturali.it/it/877/linee-guida-per-il-pnd

Verifiche e collaudi

Durante un progetto di digitalizzazione è opportuno prevedere delle attività di verifica e di collaudo del lavoro effettuato. Tali attività vanno previste per tutte le fasi del progetto, sin dall’avvio dei lavori, per assicurare che il progetto sia stato correttamente impostato e che venga eseguito in modo tale da minimizzare il rischio di dover intervenire con correttivi in fasi più avanzate.

Collaudo del campione tecnico iniziale (prototipo)

Successivamente alla data di inizio attività e secondo modalità concordate con la stazione appaltante, il fornitore lavora un primo lotto esemplificativo del materiale selezionato. Al termine dell’attività il fornitore consegna il materiale digitalizzato e correttamente trattato secondo tutte le prescrizioni definite. In caso di presenza di errori o anomalie occorre prevedere un ulteriore ciclo di lavorazione fino a collaudo positivo, esente da vizi. Il prototipo validato costituisce riferimento di qualità per il processo di lavorazione complessivo.

Collaudo per stati di avanzamento lavori

Il collaudo è previsto per ogni stato di avanzamento lavori (SAL). La responsabilità del collaudo è del committente. Il processo di collaudo è di solito articolato nella maniera seguente:

  • Individuazione del campione su cui effettuare il collaudo;
  • individuazione dei parametri da testare;
  • applicazione dei parametri di test previsti su tutto il materiale del campione;
  • segnalazione delle anomalie o errori;
  • sospensione del collaudo nel caso in cui dall’esame del campione individuato si riscontri un numero di anomalie/errori tali da non consentire la prosecuzione delle attività di collaudo;
  • risoluzione delle anomalie o errori;
  • verifica della risoluzione delle anomalie o errori.

I parametri di test sugli oggetti digitali possono essere così elencati, a titolo esemplificativo:

  • leggibilità delle immagini prodotte;
  • corretta corrispondenza tra gli originali e le relative riproduzioni digitali;
  • completezza dell’acquisizione rispetto al materiale consegnato;
  • presenza di pagine mancanti o doppie;
  • presenza di elementi estranei o ombre;
  • cropping eccessivo;
  • risoluzione inferiore alle specifiche fornite;
  • scarsa definizione dei dettagli;
  • scarsa qualità del colore;
  • altre interferenze (per esempio, effetto moiré);
  • livello di leggibilità;
  • rispondenza dei supporti e dei loro contenuti ai requisiti tecnici richiesti.

È possibile richiedere che siano forniti sistemi di controllo aggiuntivi, come programmi automatici di individuazione delle immagini difettose, registro dell’attività, ecc.

Devono essere, inoltre, previste verifiche generali relative al processo di digitalizzazione. Per progetti di grosse dimensioni è necessario che queste verifiche siano supportate da un apposito software di verifica opportunamente realizzato o adattato. Nel caso di progetti di dimensioni minori, è necessario indicare nel documento di progettazione e nel capitolato tecnico le modalità di verifica manuale o con tool off the shelf. Si indicano di seguito alcune di queste verifiche:

  • consistenza (delle immagini in ciascuno dei formati previsti);
  • presenza di elementi che compromettono la fedeltà della riproduzione (artefatti* quali, per esempio, riflessi, ombre, presenza di disomogeneità evidenti in termini di luminosità, parti di immagine non perfettamente riprodotte ecc.);
  • ritaglio immagine (corretta inquadratura);
  • presenza del riferimento cromatico e del riferimento millimetrico;
  • risoluzione dell’immagine, mediante analisi del riferimento millimetrico: la valutazione verte sul rapporto fisico del materiale (misurazione su scala centimetrica) e numero di pixel attesi in funzione della risoluzione prevista [63];
  • profondità di colore (24 bit) e corretto profilo colore (Adobe RGB);
  • corretta nomenclatura dei file;
  • verifica formale e sostanziale dei file METS prodotti;
  • collegamento tra metadati METS/XML e immagini (path delle immagini validi);
  • qualità dell’OCR, laddove applicabile.

Per specifici progetti di digitalizzazione, può essere previsto il caricamento dei risultati della digitalizzazione (oggetti digitali e metadati) all’interno di una Teca Digitale. In questo caso è necessario indicare uno specifico criterio di accettazione che preveda il loro corretto caricamento.

[63]È utile fornire un esempio: se la risoluzione prevista è di 300 ppi (pixel per pollice), la misurazione del segmento (che deve essere perfettamente dritto) deve mostrare 300 punti. La misurazione di un pollice (2,54 cm) nei 300 punti può essere compromessa da micro variazioni altimetriche della scala, così come da una scala non particolarmente precisa e definita. In tal senso si consiglia l’uso di una ulteriore scala, solo per la parte prototipale, per effettuare tale misurazione.

Supporti

Al termine delle attività di acquisizione e dei collaudi, tutti i file prodotti (master, derivati, metadati, documentazione di progetto) devono essere archiviati e consegnati in due copie su uno o più dei seguenti supporti o infrastrutture:

  • Infrastruttura cloud messa a disposizione dall’Amministrazione o da altro ente coinvolto nel progetto;
  • Teca digitale messa a disposizione dall’Amministrazione per oggetti digitali e metadati;
  • Hard Disk* (o NAS di capacità adeguata, con mirroring dei dischi).

Gli Hard Disk (HDD e SSD) devono avere le seguenti caratteristiche minime:

  • porte USB: almeno di tipologia 3.2 Gen 2;
  • garanzia di almeno tre anni; la relativa documentazione deve essere fornita in fase di consegna finale, con tutte le indicazioni per usufruirne;
  • MTBF (Mean Time Between Failures) di almeno 1.500.000 ore, con garanzia del fornitore.

Il NAS deve avere le seguenti caratteristiche minime:

  • numero di dischi adeguato allo spazio di memorizzazione e configurazione RAID scelta;
  • CPU dedicata e RAM adeguata alla dimensione dell’apparato;
  • Web Application di gestione;
  • porta LAN RJ-45 1GbE;
  • configurazione RAID 1 con almeno un disco hot spare;
  • unità di tipo hot swap e compatibilità con 3.5» SATA HDD, 2.5» SATA HDD, 2.5» SATA SSD (con MTBF di almeno 1.500.000 ore, con garanzia del fornitore);
  • porte USB esterne: almeno di tipologia 3.2 Gen 1;
  • NAS forniti di un Hard Disk di ricambio;
  • garanzia di almeno tre anni; la relativa documentazione deve essere fornita in fase di consegna finale, con tutte le indicazioni per usufruirne.

I dispositivi di storage possono essere consegnati nel corso dei rilasci, in base alle esigenze del progetto.

Ogni posizione (directory) su Hard Disk, sui NAS e in deve essere identificata univocamente e deve contenere al proprio interno un file indice del contenuto.

Tutte le apparecchiature scelte devono essere consegnate con la documentazione della garanzia e, se possibile, con una relazione sulle motivazioni di scelta del prodotto.

Nel caso di utilizzo di un sistema di memorizzazione in cloud, occorre garantire che il contratto ad un fornitore esterno abbia una continuità pluriennale (almeno tre anni). Inoltre, deve essere esplicitata contrattualmente la politica di migrazione dei dati nel momento della conclusione del contratto di servizio.

È utile richiedere che le immagini di ciascun volume siano memorizzate e organizzate all’interno dei dispositivi di archiviazione in modo tale che ne sia agevole il reperimento anche senza l’ausilio di strumenti di ricerca.

Il nome dei percorsi delle cartelle contenenti le immagini deve essere definito in fase di avvio lavori e deve riportare gli elementi univoci di identificazione del materiale e della descrizione.

Occorre richiedere che nei supporti siano inseriti gli elenchi degli hash di ogni singolo file memorizzato (secondo un algoritmo dichiarato: MD5o SHA1).

Ogni disco fisico deve essere identificato con una apposita etichetta, che ne riporti anche i contenuti e deve essere consegnato in apposita custodia a prova di polvere.

Riferimenti bibliografici

Linee guida e manuali internazionali

U.S. National Archives and Records Administration - NARA (2004). Technical Guidelines for Digitizing Archival Materials for Electronic Access: Creation of Production Master Files – Raster Images [64].

Federal Agency Digital Guidelines Initiative – FADGI Guidelines (2009-2021). [65]_.

International Association of Sound and Audiovisual Archives (2009), Guidelines on the Production and Preservation of Digital Audio Objects, IASA-TC04, Second Edition [66].

National Library of the Netherlands (2012). The Metamorfoze Preservation Imaging Guidelines (2012) [67].

IFLA Rare Book and Special Collections Section (2014). Linee guida per pianificare la digitalizzazione di collezioni di libri rari e manoscritti.

IASA-TC 05 (2016), Gestione e archiviazione dei supporti audio e video [68].

IASA-TC 06 (2019), Guidelines for the Preservation of Video Recordings
[69].

ISO/TS 19264-1:2021 (2021). Photography — Archiving systems — Image quality analysis [70].

European Commission, Expert Group on Digital Cultural Heritage and Europeana (2020). Basic principles and tips for 3D digitisation of tangible cultural heritage for cultural heritage professionals and institutions and other custodians of cultural heritage [71].

[64]https://www.archives.gov/files/preservation/technical/guidelines.pdf
[65]http://www.digitizationguidelines.gov/guidelines/
[66]https://www.iasa-web.org/tc04/audio-preservation
[67]https://www.metamorfoze.nl/sites/default/files/publicatie_documenten/Metamorfoze_Preservation_Imaging_Guidelines_1.0.pdf
[68]https://www.iasa-web.org/tc05-it/gestione-e-archiviazione-dei-supporti-audio-e-video
[69]https://www.iasa-web.org/tc06/guidelines-preservation-video-recordings
[70]https://www.iso.org/standard/79172.html
[71]https://digital-strategy.ec.europa.eu/en/library/basic-principles-and-tips-3d-digitisation-cultural-heritage

Linee guida e manuali nazionali

ICCU (2004). Linee di indirizzo per i progetti di digitalizzazione del materiale fotografico [72].

ICCD, (2005). Normativa per la documentazione multimediale [73].

ICCU (2006). Linee guida per la digitalizzazione di bandi, manifesti e fogli volanti [74].

ICCU (2006). Linee guida per la digitalizzazione del materiale cartografico [75].

Minerva (2008). Technical Guidelines for Digital Cultural Content Creation Programmes, Progetto MINERVA, Versione 2.0 [76].

ICCU, (2010-2020). Internet Culturale – Documentazione tecnica per progetti di digitalizzazione [77].

Istituto Centrale per il Catalogo Unico delle Biblioteche Italiane e per le Informazioni Bibliografiche (2012). Linee guida alla catalogazione in SBN – Materiale grafico [78].

Regione Lombardia (2012). Linee guida per i progetti di digitalizzazione delle Istituzioni culturali della Regione Lombardia, v.1.5 [79].

ICAR (2018). Sistema Archivistico Nazionale. Interoperabilità fra sistemi archivistici: tracciati EAD3, EAC-CPF, SCONS2, ICAR-IMPORT

Regione Piemonte (2018). Ecosistema beni culturali, linee guida per i progetti di digitalizzazione [81]

Ufficio nazionale per i beni culturali ecclesiastici e l’edilizia di culto della Conferenza Episcopale Italiana – CEI (2019). Linee guida per i progetti di digitalizzazione del patrimonio archivistico e librario [82].

Università di Padova, Settore Biblioteca digitale, Gruppo di progetto Phaidra (2011, revisione 2019). Linee guida sulla digitalizzazione

Biblioteca nazionale centrale di Firenze, Nuovo soggettario. Guida al sistema italiano di indicizzazione per soggetto, seconda edizione, Roma, Associazione italiana biblioteche, Firenze, Biblioteca nazionale centrale di Firenze, 2021 [84]

Coordinamento per le fonti orali (2021). Vademecum per il trattamento delle fonti orali [85].

Barbuti, N. (2022). La digitalizzazione dei beni documentali; metodi, tecniche, buone prassi. Milano: Editrice Bibliografica.

Agid: Linee Guida sulla formazione, gestione e conservazione dei documenti informatici - Formati di file e riversamento e s.m.i. [86].

[72]https://www.iccu.sbn.it/export/sites/iccu/documenti/Linee_guida_fotografie.pdf
[73]http://www.iccd.beniculturali.it/getFile.php?id=293
[74]http://www.internetculturale.it/getFile.php?id=44397
[75]https://www.iccu.sbn.it/export/sites/iccu/documenti/linee_guida_digit_cartografia_05_2006.pdf
[76]https://www.minervaeurope.org/publications/MINERVA%20TG%202.0.pdf
[77]https://www.internetculturale.it/it/1132/documentazione
[78]https://www.iccu.sbn.it/export/sites/iccu/documenti/2012/graficaPDFluglio2012/txt_vs0.pdf
[79]https://www.lombardiabeniculturali.it/docs/dolly/Linee_guida_per_progetti_digitalizzazione_luglio12.pdf
[80]https://www.icar.beniculturali.it/fileadmin/risorse/Accordi_e_convenzioni/Interoperabilita_sistemi_archivistici_tracciati_ICAR_20180925.pdf
[81]https://www.memora.piemonte.it/cms/sites/default/files/2021-09/EcosistemaBeniCulturali_LineeGuida_digitalizzazione_V01.pdf
[82]https://bce.chiesacattolica.it/wp-content/uploads/sites/25/Linee_guida_Digitalizzazione_8nov2019.pdf
[83]https://phaidra.cab.unipd.it/static/linee-guida-digitalizzazione.pdf
[84]https://thes.bncf.firenze.sbn.it
[85]https://www.icar.beniculturali.it/attivita-e-progetti/progetti-in-collaborazione/vademecum-per-il-trattamento-delle-fonti-orali
[86]https://www.agid.gov.it/sites/default/files/repository_files/allegato_2_formati_di_file_e_riversamento.pdf

Crediti

Il presente documento è stato prodotto dall’Istituto centrale per la digitalizzazione del patrimonio culturale – Digital Library, con il contributo di:

Francesco Baldi, Laura Ciancio, Alessandro Coco, Alfredo Corrao, Luciano D’Aleo, Costantino Landino, Tiziana Mancinelli, Antonella Negri, Pasquale Orsini, Roberto Palermo, Giovanni Pescarmona, Maurizio Prece, Valentina Rossetti, Marco Scarbaci, Chiara Veninata, Barbara Zonetti.

Si ringraziano tutti coloro che hanno partecipato alla consultazione pubblica, dando il loro contributo con note aperte, commenti e osservazioni. Il report finale della consultazione 2022 è disponibile all’indirizzo https://partecipa.gov.it/processes/piano-nazionale-digitalizzazione-patrimonio-culturale/f/144/ .

Coordinamento: Laura Moro

Appendici

Glossario

Aberrazione
Una lente perfetta dovrebbe riprodurre un punto o un segmento come tali. In generale, invece, e specialmente per le lenti più economiche, ciò non avviene, e un punto può diventare un circolo, e un segmento una piccola curva. Questi difetti sono dovuti al tipo di vetro usato, al fatto che la superficie delle lenti è curva ed al comportamento della luce. Nel 1856 Ludwig von Seidel individuò cinque aberrazioni che si verificano in luce monocromatica: asferica, coma, astigmatismo, curvatura di campo, distorsione.
Aberrazione cromatica
Difetto delle lenti in presenza in luce bianca. L’indice di rifrazione delle lenti è legato alla lunghezza d’onda (colore) della luce. Ciò significa che la stessa lente assume una focale diversa a seconda della radiazione che la attraversa. Quindi il punto di fuoco del rosso o del blu non coinciderà, provocando un’immagine sfocata. Il difetto si compensa combinando due lenti costruite con vetri dotati di diverso indice di rifrazione (obiettivo acromatico) o con l’utilizzo di una lente asferica.
Aberrazione sferica
Il difetto si verifica nelle lenti semplici, in quanto i raggi che passano attraverso i bordi più esterni della lente non vanno a fuoco nello stesso punto di quelli che passano per le zone centrali o l’asse ottico. Il difetto di sfocatura al centro dell’immagine si compensa con la chiusura del diaframma.
Algoritmo
Matrice di calcolo per eseguire una data operazione matematica; nel contesto del presente documento, ad esempio, esistono algoritmi per la compressione di un’immagine o per la codifica di un file.
Artefatti
Difetti dell’immagine creati dallo strumento usato per registrarla (come il sensore delle fotocamere digitali) o per stamparla. Tipicamente, la compressione JPEG crea degli artefatti, che si manifestano come micro rettangoli o quadrati di “grana” colorata.
Bayer (matrice di)

Consiste in un retino composto dai tre colori fondamentali (rosso, verde e blu), collocato sul sensore di ripresa il quale è composto da pixel monocromatici. Tramite tale retino si ottiene la formazione del colore per sintesi additiva.

Bianco e nero, scala di grigi, RGB, RGB true color

Ciascuna di queste terminologie individua una tipologia di scala di colore:

  • Bianco e Nero: 1 bit per ogni pixel. Ogni pixel può essere bianco o nero;
  • Scala di grigi: 8 bit per pixel corrispondono a 256 tonalità di grigio;
  • RGB (Red, Green e Blu): colori primari utilizzati per creare altri colori. 15 o 16 bit per pixel generano da 32.268 a 65.536 diversi colori;
  • RGB TRUE COLOR: 24 bit per pixel generano 16,8 milioni di colori.
Bit per pixel
Il numero dei bit utilizzati in un’immagine digitale per rappresentare il colore di ciascun pixel. Con 1 bit per ogni pixel si ottiene un’immagine a 2 colori, con 2 bit a 4 colori, con 3 bit a 8 colori, e così via. Come regola, con n bit si rappresentano 2n colori. Con 24 bit per pixel si rappresentano 16,7 milioni di colori.
CAD
Acronimo di Computer Aided Design, settore dell’informatica volto all’utilizzo di tecnologie software e computer grafica per supportare le attività di disegno tecnico e di progetto avendo come obiettivo la creazione di un modello bidimensionale e/o tridimensionale del bene.
Compressione

Termine generico per i metodi di compressione dei file d’immagine che implicano una perdita di qualità. Questa appare evidente dopo il suo salvataggio nella versione compressa. Un esempio di un formato “lossy”, che quindi comporta una compressione, è il formato JPEG.

Esistono anche metodi di compressione di un’immagine che rendono i file più piccoli allocando i dati in modo più efficiente o che rimuovono quelli ritenuti estranei senza generare perdita di dettaglio rispetto all’immagine originale. Generalmente si tratta, per il formato TIFF, della compressione LZW*.

DPI e PPI
Punti per pollice (DPI) e pixel per pollice (PPI). Questi valori indicano la risoluzione di un’immagine. DPI indica il numero di punti contenuti in un singolo pollice di un’immagine stampata da una stampante misurando il numero di punti verticali od orizzontali che essa è in grado di risolvere. PPI indica il numero di pixel contenuti in un singolo pollice di un’immagine visualizzata nel monitor di un computer.
Distorsione (ottica)

Aberrazione ottica, tipica di alcuni obiettivi. Viene detta “a barilotto” quando l’immagine di un quadrato e più ingrandita al centro che ai bordi (l’immagine ricorda quella di un piccolo barile).

Viene detta “a cuscinetto” quando un soggetto quadrato viene riprodotto con un maggiore ingrandimento ai bordi rispetto al centro (l’immagine risultante ricorda la forma di un cuscino). Il difetto è dovuto al fatto che l’immagine, formata dai raggi periferici, viene riprodotta con un rapporto diverso da quella riprodotta dai raggi che passano per l’asse ottico dell’obiettivo.

La prima è tipica degli obiettivi grandangolari, la seconda dei teleobiettivi. È più marcata nelle ottiche economiche e negli zoom.

Densità e gamma dinamica (DMAX)

In fotografia, per descrivere la sensazione visiva dell’annerimento fotografico tipico del negativo più o meno esposto alla luce, coerentemente con il meccanismo della visione umana, si usa il concetto di densità (D). La densità è una grandezza logaritmica e i valori vanno da 0 (trasparenza assoluta, trasmittanza della luce al 100%, paragonabile al bianco) a 6 (trasparenza praticamente nulla, trasmittanza della luce al 0, 0001%, paragonabile al nero). Quindi maggiore è la densità, minore è la luminosità; una densità di 3.0 è dieci volte maggiore di una densità di 2.0. Un rapporto opacità/trasparenza di 100:1 equivale ad una densità di 2.0, così come una densità di 3.0 significa un rapporto opacità/trasparenza di 1000:1. Negli stampati si può avere una densità massima di 2, nelle pellicole si può raggiungere e superare invece densità 4.

La gamma dinamica di uno scanner è la capacità che questo ha di leggere e discriminare le diverse densità tonali tra le zone più opache dell’immagine (nere) e quelle più trasparenti (bianche). I valori minimi e massimi di densità che uno specifico scanner è in grado di catturare sono chiamati DMin e DMax. Se la DMin di uno scanner è 0.2, e la DMax 3.1, allora la sua gamma dinamica è 2.9.

La DMax indica il massimo livello di densità in cui si possono distinguere singoli toni dell’immagine, cioè non ancora sopraffatti dal rumore. Una gamma dinamica più ampia di solito si estende verso i toni scuri, il che comporta una maggiore capacità di rilevare dettagli nelle ombre.

In generale, i produttori comunicano dei valori che non sono realmente legati alla vera gamma dinamica, ma che invece sono teorici (ad esempio quando uno scanner riesce sì a rilevare differenze di luminosità nelle ombre ma il CCD, a quei livelli di luminosità, produce così tanto rumore da rendere l’immagine finale inutilizzabile). Per dirla in breve, la DMAX è la densità massima che uno scanner può rilevare, mentre la Gamma Dinamica è la gamma di toni che uno scanner è in grado di differenziare in maniera accettabile. Questa - per le digitalizzazioni a scopo conservativo del bene - non dovrebbe essere inferiore a Dmax 4.0.

Droni
Per eseguire soprattutto digitalizzazioni fotogrammetriche negli ultimi anni si è fatto ricorso particolarmente all’uso dei droni a controllo remoto, con dimensioni e capacità molto diverse tra loro. I droni permettono di monitorare ambienti particolarmente complessi o inaccessibili, di lavorare in completa sicurezza lì dove le condizioni non lo permetterebbero e forniscono all’operatore e conseguentemente alla digitalizzazione angoli e punti di analisi molto variegati.
Exif

EXchangeable Image File, ovvero file di immagine intercambiabile.

Si tratta di un formato di metadati, condiviso da tutti produttori di fotocamere, utilizzato per abbinare a ciascuna immagine digitale un insieme di informazioni aggiuntive. Le informazioni sono generate al momento della registrazione dell’immagine da parte dello scanner o della fotocamera e in essa incorporati. I dati registrati possono essere:

  • Statici: come ad esempio quelli che identificano marca e modello della macchina fotografica;
  • Dinamici; che cambiano di foto in foto, come ad esempio i valori usati per apertura, tempo di esposizione e ISO o la data in cui la foto è stata scattata.
Firmware
È il software residente a bordo di una apparecchiatura fotografica, fotocamera, sistema di memoria o stampante, che consente di svolgere una serie di funzioni tramite i menu di gestione. In diversi casi è possibile aggiornarlo per aumentare le possibilità dell’apparecchio oppure eliminare difetti che si manifestano nel corso della vita dello stesso.
Fotomodellazione / Fotogrammetria
Tecnica che fa uso di fotocamere digitali per l’acquisizione di foto bidimensionali e la restituzione di modelli metrici tridimensionali. La procedura genera una nuvola di punti, che può essere convertita in una superficie poliedrica (mesh) poi rivestita con immagini fotografiche (texture) che consentono di ottenere una visualizzazione fotorealistica del bene rilevato.
Gamma dinamica
Differenza (contrasto) fra i valori più alti e quelli più bassi di un’immagine, ossia fra le alte luci più chiare e le ombre più scure.
Georeferenziazione
Tecnica di attribuzione di coordinate geografiche a un oggetto grafico che viene usata nelle procedure di cartografia computerizzata.
GIF
Graphics Interchange Format. Formato di file utilizzato per salvare (principalmente) file grafici per il Web. Supporta animazioni e può essere usato per creare animazioni compatte (in termini di ingombro su disco) per siti Web. Il formato GIF utilizza un sistema di compressione e non può gestire più di 256 colori. La risoluzione e il numero dei colori dell’immagine lo rendono inadatto alla visualizzazione di fotografie.
GIS
Sigla di Geographical Information System, banca dati relazionale a base cartografica, più o meno automatizzata. Spesso viene prodotta con l’ausilio di dati acquisiti via satellite. In linea generale, a ciascuna minuta porzione di area rappresentata sulla carta geografica e individuata mediante un sistema di coordinate viene correlata, in un GIS, una serie di informazioni che, codificate in forma numerica e quindi grafica, possono essere aggiornate, visualizzate e stampate in tempi rapidissimi. L’aggiornamento, così come l’immagazzinamento delle informazioni sotto forma di dati codificati, viene effettuato nella banca dati, da cui poi si deriva la cartografia. L’impiego del GIS si è rapidamente esteso a molti ambiti, data la flessibilità dello strumento. Molte discipline fanno uso di sistemi informativi geografici concorrendo al loro sviluppo, sebbene i GIS mantengano con la geografia un rapporto evidentemente privilegiato.
GPS
Sigla di Global Positioning System (propriamente “sistema di posizionamento globale”), indicante un sistema computerizzato di copertura planetaria, utilizzato nelle operazioni di rilievo topografico e architettonico-ambientale, che consente di sfruttare i segnali emessi da alcuni satelliti per localizzare cose e persone (fornite di un apposito trasmettitore-ricevitore) sulla superficie terrestre.
Hard disk
Nei calcolatori elettronici, l’hard disk è il disco di memoria magnetica realizzato con materiale rigido e non asportabile, da cui i nomi di disco rigido e disco fisso con cui è anche comunemente definito. L’hard disk può presentarsi anche in versione trasportabile come periferica esterna collegata al calcolatore elettronico tramite apposite porte di connessione.
Informazione digitale
Con tale espressione si considera il documento generato come esito finale della digitalizzazione: esso varia le proprie caratteristiche a seconda della strumentazione utilizzata, dei parametri considerati e della tipologia di riproduzione del bene (bidimensionale e/o tridimensionale).
Istogramma
Rappresentazione grafica unica dei toni dell’immagine digitale su cui si sta lavorando che mostra la distribuzione dei livelli di grigio o di colore. Può essere visualizzato da quasi tutti i programmi di fotoelaborazione, e sugli schermi LCD di molte fotocamere quando nel modo “play”.
JPEG
Sigla di Joint Photographic Experts Group, indica una tecnica di codifica di immagini digitalizzate, allo scopo di ridurne la ridondanza. La codifica JPEG permette di ridurre di molto le dimensioni di un file relativo a un’immagine a colori, fino a rapporti di compressione di 1/16 o maggiori. La tecnica si basa sull’applicazione di opportune medie fra pixel contigui, sia rispetto ai segnali di luminanza sia a quelli di crominanza. La codifica è studiata per immagini fotografiche e per la loro trasmissione efficiente attraverso reti di telecomunicazione, in particolare Internet. Comportando sempre una perdita di informazione (che varia a seconda del rapporto di compressione adottato), è poco adatta a immagini di altissima qualità o di contenuto informativo particolare (come, per esempio, le immagini astronomiche).
JPEG 2000
Formato file derivato dal formato JPEG originale. Utilizza una tecnologia wavelet per comprimere le immagini con un minor grado di deterioramento riscontrabile nel formato JPEG originale.
IPTC
Standard di informazioni sviluppati dall’International Press Telecommunications Council per identificare il testo e le immagini trasmessi. I metadati IPTC comprendono le voci delle descrizioni, le parole chiave, le categorie, i riconoscimenti e le provenienze. I diversi campi IPTC consentono di semplificare il flusso di lavoro e di organizzare i file.
Kelvin (K)
Dal nome del fisico William T. Kelvin, unità di misura della temperatura assoluta il cui zero è posto a –273,16°C. È usata in fotografia per misurare la temperatura di colore della luce.
Laser scanning

Tecnologia utilizzata per il rilievo di oggetti complessi caratterizzata dall’elevata quantità di dati acquisiti in un tempo molto breve, che consente di eseguire il rilievo geometrico del bene con un ragguardevole livello di dettaglio e completezza. Il risultato di uno scanning effettuato con strumentazioni laser è un insieme numerosissimo di punti (chiamato “nuvola di punti”) distribuiti sull’oggetto da rilevare, in funzione del grado di dettaglio che si vuole raggiungere. La finalità è quella di generare un modello digitale tridimensionale più vicino possibile alla realtà dell’oggetto scansionato (chiamato “clone digitale”) da utilizzare per condurre successivi studi.

La tecnologia laser scanner a tempo di volo permette di generare una nuvola di punti tramite il calcolo del tempo impiegato dal raggio laser a percorrere la distanza dall’emettitore al soggetto colpito e viceversa. Questi laser scanner si caratterizzano per l’abilità di acquisire dati molto distanti, arrivando addirittura a 6 km di raggio.

Nei laser scanner a tempo di fase la distanza è calcolata comparando la differenza di fase tra l’onda trasmessa e quella ricevuta. Questi laser scanner si caratterizzano per una velocità di acquisizione molto rapida e per una elevata densità di dato acquisito.

La tecnologia dei laser scanner a luce strutturata proietta un pattern di luce sul modello (es. strisce). Attraverso l’analisi della deformazione dei bordi del pattern proiettato sulla superficie, effettuata con complessi algoritmi, viene ricavata la geometria del modello. In generale, questi scanner processano un’elevata quantità di dati. La ridondanza di informazioni rese disponibili consente una più efficace e accurata ricostruzione e una significativa riduzione del rumore.

OBJ
Formato di file per definire geometrie 3D, è un formato aperto che è stato adottato da tantissimi applicativi per la grafica 3D per l’interscambio di dati con altri programmi. È un formato semplice, con un data-format che rappresenta solamente la geometria 3D, ossia la posizione di ogni vertice, la posizione di ogni coordinata UV per le texture, le normali e le facce che compongono il modello. I vertici sono memorizzati di default in un ordine antiorario rendendo non necessaria la dichiarazione esplicita delle normali. Le coordinate di un OBJ non hanno unità di misura, ma informazioni sulla scala del modello possono essere contenute in una linea di codice commentata.
Lunghezza focale
Distanza compresa tra l’immagine nitida prodotta e la lente, quando è a fuoco un soggetto all’infinito. Nel caso degli obiettivi, è la distanza tra l’immagine sul piano focale ed il punto nodale posteriore dell’obiettivo.
LUT (Look Up Table)
Palette con il numero di colori usati nell’immagine.
LZW (Lempel-Ziv-Welch)
Routine di compressione senza perdita di informazioni incorporata nel formato file TIFF.
PDF
Sigla di Portable Document Format, è un formato di file basato su un linguaggio di descrizione di pagina per rappresentare documenti di testo e immagini in modo indipendente dall’hardware e dal software utilizzati per generarli o per visualizzarli.
Pixel
Nelle tecniche di digitalizzazione delle immagini, è il più piccolo elemento (picture element), distinto per colore, intensità ecc., costituente dell’immagine originale.
Profilo colore
Importante serie di specifiche salvate in un file ottenuto dopo una calibrazione di una periferica (monitor, stampante) oppure fornite dallo stesso produttore dell’apparecchiatura. Serve ad ottenere un comportamento equilibrato nella resa colore per fare in modo che le tonalità siano esattamente le stesse indipendentemente dalla periferica utilizzata per riprodurle.
Profondità di colore

La profondità di colore indica il numero di bit per canale usati per rappresentare il colore di un singolo pixel in un’immagine bitmap. Maggiore è il numero di bit di informazioni per pixel, maggiore è il numero di colori disponibili e più precisa sarà la rappresentazione dell’immagine: un pixel di un’immagine avente profondità di 1 bit può avere solo due valori: bianco o nero; uni pixel di un’immagine con profondità di 8 bit ne avrà invece 28, ovvero 256 possibili valori (le immagini in scala di grigio con profondità di 8 bit hanno 256 possibili valori di grigio, da 0 a 225); le immagini RGB - composte da 3 canali di colore a 8 bit per pixel - hanno quindi 256 valori possibili per ciascun canale, vale a dire più di 16 milioni di valori del colore in totale.

Valori tipici sono 8, 16 o 24 bit per pixel (che si traducono in 1, 2 o 3 byte per pixel), da cui discende la dimensione del file dell’informazione digitalizzata (c.d. peso), che risulta dal prodotto del numero di byte per pixel per il “totale di pixel” dell’immagine. Oltre alle immagini a 8 bit/canale, è possibile avere anche le immagini a 16 o 32 bit/canale. Quelle a 32 bit/canale sono anche definite immagini HDR (High Dynamic Range).

Il sensore di una fotocamera, a seconda della sua qualità, può registrare immagini RAW a 10, 12 o 14 bit.

PSD
Formato di file usato da Adobe Photoshop per salvare le immagini senza unificare i livelli inclusi.
Rapporto di riproduzione
Viene calcolato dividendo l’altezza o la larghezza dell’oggetto originale per quella della sua immagine riprodotta sulla pellicola. In macrofotografia, se sul negativo l’immagine dell’oggetto risulta due volte più grande dell’originale si avrà un rapporto di riproduzione 2:1. Tale valore può anche esprimersi con 2X.
Raw

Prima di comprendere che cos’è esattamente il formato grezzo (RAW) in fotografia e di esaminare nel dettaglio i vantaggi che questo ha rispetto a formati quali JPEG e TIFF, occorre avere chiaro il funzionamento della fotocamera digitale e il procedimento che genera quella che siamo soliti chiamare «fotografia».

Il sensore, vero cuore di ogni fotocamera digitale (in genere un CMOS), svolge lo stesso compito della pellicola: registrare la luce che attraversa l’obiettivo della fotocamera durante l’esposizione. Per eseguire questa funzione, il sensore è composto da milioni di fotodiodi: microscopici componenti in grado di catturare la luce (fotoni) sotto forma di cariche elettriche. L’accuratezza di questa rappresentazione dipende chiaramente dalla fotocamera e dalla profondità in bit di cui è capace.

La maggior parte delle moderne reflex digitali può infatti registrare file d’immagine a 12 o 14 bit per canale. Questo in sostanza significa che se la macchina registra a:

  • 12 bit per canale, ogni canale supporta 4.096 livelli di luminosità (2 elevato alla dodicesima);
  • 14 bit ne supporta 16.384 (2 elevato alla quattordicesima).

Questo si traduce in circa 68 miliardi di colori nel caso di informazioni a 12 bit e circa 4,3 triliardi di colori in caso di informazioni a 14 bit. In realtà, ciò che il sensore cattura tramite i fotodiodi non sono i valori relativi alle diverse tonalità di colori (a eccezione dei sensori prodotti da Foveon, che catturano tutti e tre i valori di colore per ciascun pixel), ma solo i valori di intensità delle cariche elettriche.

Quando un sensore registra la scena inquadrata non «vede» i suoi colori: memorizza l’intensità della luce captata da ogni singolo fotodiodo. Per poter registrare le informazioni sui colori, vengono generalmente posti davanti ai fotodiodi degli speciali filtri (detti filtri di Bayer* o Matrice Bayer) che permettono ai fotodiodi di registrare solo la luce in specifici intervalli di lunghezze d’onda; in questo modo alcuni fotodiodi leggono solo la luce verde (50%), altri solo la luce rossa (25%) e altri ancora solo la luce blu (25%).

Il risultato delle informazioni così raccolte dal sensore non è quindi una «immagine fotografica» ma le informazioni (a 12 o 14 bit) necessarie per assemblarla: il processore della fotocamera, usando i valori dei fotodiodi vicini, con un complesso algoritmo* calcola per ciascun fotodiodo anche gli altri valori che questo non ha registrato. In questo modo il segnale elettrico analogico viene tradotto in una rappresentazione digitale (a colori) della realtà.

Una volta ottenute le informazioni necessarie per generare l’immagine digitale, il percorso di creazione del file si divide, a seconda del tipo di salvataggio si scelga: nella fotocamera in formato RAW oppure JPEG, nello scanner a queste due opzioni si aggiunge quella del formato TIFF. Nel primo caso (formato RAW) la fotocamera genera un file di dati contenente tutti i voltaggi misurati dal sensore, mentre nel secondo caso (formato JPEG) genera già un’immagine digitale vera e propria, pronta all’uso.

È già ora evidente, quindi, che le «immagini» catturate in formato RAW in realtà non assomigliano per niente a delle immagini, ma sono file contenenti una serie di dati e per questo richiedono qualche passaggio supplementare rispetto ai file JPEG/TIFF prima di essere visualizzati. Se si decide di salvare i propri scatti in formato RAW, infatti, per ottenere un’immagine fotografica visibile e utilizzabile è necessario convertire in altri formati di immagine i dati registrati in RAW dal sensore, utilizzando software appositi. Tutto questo avviene dopo lo scatto e al di fuori della macchina.

Nel caso dei JPEG/TIFF, invece, il sensore cattura sempre un RAW, ma il processore della fotocamera o dello scanner provvede a convertirlo all’istante - e irreversibilmente - in un file JPEG o TIFF.

Risoluzione

Per risoluzione di un’immagine si intende comunemente il numero di pixel per pollice (corrispondente a 2,54 centimetri) che essa contiene.

Essa andrebbe però sempre distinta almeno in risoluzione di input e risoluzione di output. Con la prima, espressa da un valore numerico in PPI (pixel per pollice ovvero pixel per inch), si considera la risoluzione spaziale del sensore che cattura la luce, cioè il numero di pixel in esso presenti.

Un sensore di 8688 x 5792 pixel, per esempio, contiene 50.320.896 pixel. Le immagini generate da questo sensore avranno, pertanto, dimensioni in pixel - sul lato lungo e su quello corto - uguali o al massimo (in caso di registrazione con risoluzione inferiore) più piccole. Laddove un’immagine prodotta con quel sensore dovesse presentare misure in pixel maggiori si è di fronte a un’interpolazione dell’immagine. La risoluzione interpolata è quella ottenuta con la creazione artificiosa di pixel attraverso un software ed è assolutamente deprecabile nei processi di digitalizzazione.

La risoluzione di output è quella che mette in relazione l’unità di misura digitale (i pixel) con l’unità di misura fisica (cm o pollici) ed è l’unico valore che conta quando si invia in stampa un’immagine raster. Viene espressa in DPI (dots per inch, punti per pollice) e misura la quantità di pixel utilizzati per coprire la superficie del supporto da stampare.

Il valore di 300 DPI, normalmente ed erroneamente indicato come di “alta definizione o risoluzione” comporta lo stampare 300 pixel ogni pollice ma, per essere certi che questo valore sia applicabile all’intera superficie nostro supporto dobbiamo assicurarci che il file abbia, come risoluzione di input, un numero di pixel sufficienti a far ciò.

La risoluzione di stampa è quindi condizionata da quella del file oltre che dalla distanza di fruizione del supporto stampato: un foglio A4 (20x30 cm) visto a circa 30 cm di distanza necessita sì di almeno 300 DPI per essere percepito come ad alta risoluzione, ma a un foglio A1, la cui distanza ottimale di visione è superiore al metro, basta una risoluzione di 200/220 DPI per essere percepito tale anch’esso.

Sensore
Elemento sensibile alla luce di una fotocamera digitale per la cattura dell’immagine. Il sensore, posto sul piano focale di una fotocamera, trasforma in segnale analogico la luce che lo colpisce. Il segnale viene poi trasformato in codice binario da un convertitore analogico-digitale. Può essere un CCD o un CMOS. Un sensore alternativo è il Foveon, sensore CMOS, costituito da tre strati di pixel, ognuno dedicato ad uno dei tre colori primari.
Spazio colore

Spazio, piano o tridimensionale, all’interno del quale sono rappresentati i tre attributi del colore: tinta, saturazione e luminosità. Lo spazio colore può essere assoluto o relativo. Quelli assoluti (XYZ CIE 1931 e Lab CIE 1976) rappresentano tutti i colori percepibili dall’occhio umano, quelli relativi solo una parte di essi.

La quantità di colore rappresentata dagli spazi colore relativi dipende dalla loro ampiezza. In fotografia i più usati sono, dal più piccolo al più grande:

  • sRGB;
  • Adobe RGB 1998;
  • ProPhoto RGB.

È consigliata l’archiviazione di file con spazi colore ampi così da registrare il maggior numero possibile di tonalità di colore del soggetto originale.

Taglio
Rispetto all’intera area che una strumentazione di acquisizione dell’informazione digitale può coprire, il taglio si definisce come l’area che viene effettivamente digitalizzata.
TIFF
Sigla di Tagged Image File Format, è un formato di immagine di tipo raster, piuttosto diffuso, sviluppato dalla Aldus Corporation e oggi detenuto dalla Adobe. Le specifiche del formato TIFF permettono una notevole flessibilità. Questo è un vantaggio di per sé, ma rende difficile scrivere un interprete pienamente conforme alle specifiche. Ciò comporta che una stessa immagine possa essere visualizzata con colori differenti a seconda dell’interprete che si utilizza. Il TIFF è largamente utilizzato per lo scambio di immagini raster fra stampanti e scanner perché permette di specificare numerose indicazioni aggiuntive come le tabelle di gamut o informazioni sulla calibratura del colore. Il TIFF quindi è utilizzato per far comunicare più macchine all’interno dello stesso studio fotografico o di editing che hanno la stessa calibratura.
Vignettatura

Oscuramento degli angoli del fotogramma. Può verificarsi con i grandangolari usati con diaframma molto aperto o per l’uso di un paraluce o di un filtro inadatto all’obiettivo.

Nel primo caso è molto evidente durante le riprese di superfici uniformi (come il cielo) a causa della caduta di luce che aumenta a fronte di un ampio angolo di campo dell’obiettivo per il maggior tragitto che debbono compiere i raggi che vanno ai bordi del fotogramma. Ciò comporta una sottoesposizione che può arrivare anche a 2 o 3 diaframmi. Il fenomeno (legge del coseno) è presente in tutti i grandangolari indipendentemente dalla qualità dell’obiettivo.

Parametri di acquisizione digitale

Di seguito si forniscono alcune specifiche tecniche significative sulle modalità di acquisizione di diverse tipologie di beni culturali. I parametri per l’acquisizione digitale variano, generalmente, a seconda della dimensione dei beni, con delle ulteriori distinzioni riferite alle loro specificità materiali e compositive.

FOTOGRAFIA DIGITALE - 2D  
Tipologia di bene Range risoluzione spaziale
Beni della dimensione fino a circa 5 cm lato lungo 4000 ppi
Beni della dimensione fino a circa 10 cm lato lungo 2400-2800 ppi
Beni della dimensione fino a 15 cm lato lungo 1600-1400 ppi
Beni della dimensione fino a 20 cm lato lungo 1400-1200 ppi
Beni della dimensione fino a 30 cm lato lungo 600 ppi
Beni della dimensione fino a 60 cm lato lungo 400 ppi
Beni della dimensione fino a 100 cm lato lungo 300 ppi
Beni della dimensione oltre i 100 cm lato lungo Variabile a seconda della destinazione finale dell’immagine

La tabella riporta, per le varie tipologie di beni di differenti dimensioni, indicazioni relative alla risoluzione spaziale.

Per ogni acquisizione digitale la profondità di colore è, in modalità RGB, di 48 bit.

È opportuno calcolare le dimensioni finali delle acquisizioni digitali usando o un foglio di calcolo o delle applicazioni disponibili online.

Per finalità di pubblicazione in rete si raccomanda di produrre file JPEG a 300 dpi, con valore di compressione 85%, con profondità di colore a 24 bit RGB, con ricampionamento (resampling) delle immagini, metodo tramite il quale il “print size” (DPI) del file JPG risulterà identico a quello del file TIFF.

Nel caso di documenti di dimensioni molto piccole, di cui una inferiore ai 10 cm, mantenendo il JPEG 300 dpi, può essere opportuno applicare il parametro relativo alle dimensioni in pixel della risorsa digitale, definendo di default il valore per il lato lungo: 3000 pixel. Tuttavia, una valutazione sull’utilizzo di questa modalità deve essere oggetto delle analisi, da parte di tutte le parti interessate, nella fase pre-prototipale.

SCANSIONE LASER  
Livelli di fedeltà Errore massimo accettabile
Beni mobili

(Errore minore di 5 mm)

Dato colore

Beni immobili

(Errore minore di 10 mm)

Dato colore

FOTOGRAMMETRIA    
Tipologia superficie Peculiarità Risoluzione minima
Superfici murarie piane Omogenee / marmo / meccate o dorate 2 mm/px
  Affrescate 1 mm/px
Superfici murarie curve - volte Omogenee / marmo / dorate 2 mm/px
  Affrescate 1 mm/px
Colonne, bassorilievi Intonaco o stucco / meccate o dorate 5 mm/px
  Pietra non lucidata / marmo / policrome / 2 mm/px
Pavimenti Cotto o gres / pietra grezza / marmo / mosaico 2 mm/px
AUDIO (supporti analogici e digitali)      
Tipologia di supporto originale Formato dell’informazione digitale master Metadati tecnici Altri documenti allegati

Supporti analogici

Incisione meccanica:

cilindri fonografici

dischi macro solco (78 giri, ecc.)

dischi microsolco (Lp, 45 giri, ecc.)

Supporti magnetici: (fili metallici, nastri magnetici a bobina aperta, audio cassette. ecc.)

File PCM (Pulse Code Modulation) 24 bit/96 kHz nel formato wave oppure BWF. Non sono ammissibili formati “proprietari” non aperti.

Dati relativi alla specifica catena di digitalizzazione:

marca e tipo di lettore utilizzato (specificando le caratteristiche geometriche e dimensionali del pick-up utilizzato, velocità di lettura, configurazione delle tracce -MONO/STEREO), applicazione o meno di curve di equalizzazione, marca e tipo di convertitore A/D, ecc.

Per ognuno dei supporti oggetto della digitalizzazione

dovranno essere eseguite la scansione (o la ripresa fotografica)

del supporto

stesso e di ogni altro documento o materiale pertinente al supporto (buste, contenitori,

fogli di

lavorazione, libretti, ecc.)

Supporti digitali

**Dischi ottici e magneto-ottici: **

Cd, Dvd, Minidisc, ecc.

Nastri magnetici digitali:

R-DAT, ADAT, ecc.

Nel caso di supporti che contengono dati digitali o flussi di dati binari (CD-A, R-DAT. ecc.) riferiti ad uno specifico formato digitale, deve essere rispettato il formato di partenza (CD-A = file wave 16 bit 44,1 kHz; R-DAT = 16 bit 44,1 op. 48 kHz, ecc.).

Non sono consentiti interventi di ricampionamento dei dati originali.

Dati relativi alla specifica catena di digitalizzazione:

marca e tipo di lettore utilizzato.

Tipo di interfaccia di out utilizzata (SPDIF, ripping via software, AES/EBU, ottica, ecc.), marca e tipo di convertitore A/D, ecc.

Per ognuno dei supporti oggetto della digitalizzazione

dovranno essere eseguite la scansione (o la ripresa fotografica) del supporto stesso e di ogni altro documento o materiale pertinente al supporto (buste, contenitori, fogli di lavorazione, libretti, ecc.)

VIDEO (supporti analogici e digitali)      
Tipologia di supporto originale

**Formato dell’informazione

digitale master**

Metadati tecnici Altri documenti allegati

Supporti analogici:

U-matic

Betacam

Betacam SP

8mm, Hi8

VHS

S-VHS

Ecc.

Esistono attualmente diversi formati digitali master di archiviazione, la scelta del formato migliore dipende dalle caratteristiche del supporto originale. Per indicazione di dettaglio si rimanda a IASA TC-06

Dati relativi alla specifica catena di digitalizzazione:

marca e tipo di lettore utilizzato.

Marca e tipo di convertitore A/D, ecc.

Per ognuno dei supporti oggetto della digitalizzazione

dovranno essere eseguite la scansione (o la ripresa fotografica) del supporto stesso e di ogni altro documento o materiale pertinente al supporto (buste, contenitori, fogli di lavorazione, libretti, ecc.).

Supporti digitali:

BetacamSX

Digital-S Component

DVCAM

DVC

DVCPRO

DVD

BLU-RAY

Le registrazioni digitali native possono richiedere il rewrapping in un nuovo «wrapper» di file o una combinazione di transcodifica digitale e rewrapping. Per indicazione di dettaglio si rimanda a IASA TC-06.

Dati relativi alla specifica catena di digitalizzazione:

Marca e tipo di lettore utilizzato.

Tipo di interfaccia di out utilizzata

Per ognuno dei supporti oggetto della digitalizzazione

dovranno essere eseguite la scansione (o la ripresa fotografica) del supporto stesso e di ogni altro documento o materiale pertinente al supporto (buste, contenitori, fogli di lavorazione, libretti, ecc.).

Allegati

A corredo del testo delle Linee guida per la Digitalizzazione del patrimonio culturale si fornisce una serie di allegati specifici, accessibili tramite il repository di GitHub Allegati PND. [1]

Presso questa pagina verranno progressivamente messi a disposizione dalla Digital Library documenti disponibili per il download in formato aperto che affrontano diverse tematiche specifiche dei progetti di digitalizzazione, quali il profilo applicativo METS-ECO-MIC, esempi di RDO (Affidamento di servizi per la digitalizzazione del patrimonio), esempi di capitolati tecnici (Digitalizzazione di archivi fotografici e documenti manoscritti e a stampa di biblioteche) ed esempi di piano di spesa. Ulteriore documentazione verrà rilasciata nel corso del tempo e sarà resa disponibile sul repository di GitHub.

[1]https://github.com/icdp-digital-library/allegati-pnd

Future integrazioni alle Linee guida

La futura versione delle Linee guida per la digitalizzazione del patrimonio culturale, che verrà pubblicata entro il 2022, sarà arricchita da sezioni dedicate in modo specifico ai seguenti temi, anche in relazione ai commenti espressi da vari portatori di interesse durante la fase di consultazione del PND:

  1. Procedure tecniche di recupero delle digitalizzazioni pregresse e sommerse e dei nativi digitali;
  2. Classificazione delle competenze necessarie per i progetti di digitalizzazione: questa classificazione sarà utile per individuare quali figure professionali, fra quelle individuate nelle Linee guida, siano strettamente necessarie a seconda delle caratteristiche specifiche del progetto di digitalizzazione considerato. Questa classificazione sarà utile anche per fornire indicazioni sulla composizione del team di lavoro a seconda della rilevanza economica, numerica e cronologica del progetto di digitalizzazione, in un’ottica di semplificazione delle procedure e di maggiore accessibilità da parte dei piccoli istituti;
  3. Esempi concreti dell’intero flusso di lavoro (workflow) di un progetto di digitalizzazione, dalla progettazione, all’esecuzione, alla rendicontazione e controllo. Questi esempi saranno messi a disposizione utilizzando dati provenienti da alcuni progetti pilota selezionati dalla Digital Library, e offriranno casi d’uso concreti utili per mettere in pratica le indicazioni contenute nelle Linee guida;
  4. Approfondimento sulla la digitalizzazione del materiale audiovisivo, con indicazioni tecniche sugli scanner da utilizzare per la digitalizzazione di pellicole cinematografiche e microfilm e degli output previsti;
  5. Approfondimento sulle tecniche di georeferenziazione, GIS (Geographic Information System) e rappresentazione delle coordinate spaziali nei metadati.