Docs Italia beta

Documenti pubblici, digitali.

2.4. Come

La generazione di un oggetto digitale a partire da un oggetto analogico è un processo tecnico che prevede l’uso di una specifica strumentazione hardware e software. La restituzione digitale può essere bidimensionale e/o tridimensionale a seconda della natura del bene e del mezzo con cui lo si digitalizza. Mentre per alcuni beni la scelta è quasi obbligata (per esempio un originale cartaceo o fotografico viene digitalizzato bidimensionalmente tramite scanner o fotocamera), per altri tipi di beni la scelta va fatta in funzione del risultato atteso. Un oggetto tridimensionale può essere digitalizzato in 2D – attraverso una fotocamera, semplicemente fotografandone ogni lato – o in 3D con l’ausilio di un laser scanner*. Inoltre, questo può anche diventare, attraverso le metodiche della computational photography, un Object VR (altrimenti detto Object 3D o 360), con l’ausilio di una serie di fotografie realizzate appositamente.

Oggetti di cui solitamente si apprezzano le qualità bidimensionali possono essere correttamente digitalizzate sia in 2D che in 3D. Ad esempio, una moneta – o una medaglia – può essere considerata allo stesso tempo come un oggetto bidimensionale (dotato di due facce) o tridimensionale (dotato di spessore e, soprattutto, di rilievo sulle facce), e può essere pertanto acquisita in due o tre dimensioni.

È importante garantire una completa digitalizzazione del bene anche nelle parti in cui apparentemente non vi sono informazioni, intendendo con questo, ad esempio, la scansione di fronte e retro di un positivo fotografico, la ripresa di un quadro compreso il retro (e compresa la cornice laddove non sia possibile smontarla e digitalizzarla a parte), la ripresa di ogni lato compresi quelli superiore e inferiore di un oggetto tridimensionale (per un totale di almeno 6 fotografie se l’oggetto è facilmente maneggiabile, 4 o 5 in caso contrario), la digitalizzazione di entrambe le facciate di un disco a 78 giri di cui sia incisa solo una facciata ecc. In tal senso, la riproduzione di un negativo deve mantenere un piccolo margine in modo da rendere l’intero fotogramma, dato che sui bordi dello stesso possono essere presenti informazioni. Nel caso di riproduzioni di volumi e documenti, manoscritti e a stampa, la digitalizzazione deve comprendere tutto l’oggetto, comprese carte di guardia, carte bianche (sia interpolate sia consecutive), anche se prive di informazioni, e tutte le parti componenti la legatura: i piatti, il dorso, i tagli significativi, capitelli, fermagli, borchie, cantonali; in questi casi l’acquisizione deve comprendere un’area minima dello sfondo scuro a margine dell’oggetto, in modo tale che comunque non venga mai esclusa nessuna parte del bene.

Nella produzione di immagini digitali è buona pratica inserire un riferimento colorimetrico e metrico in una zona a margine del bene. Tali riferimenti possono essere inseriti in tutte le digitalizzazioni prodotte o, come nel caso della digitalizzazione di volumi, solo in alcune di esse.

Le attività di acquisizione digitale devono essere eseguite in ambiente adatto, con illuminazione costante e, laddove si operi in ambienti interni, sempre uguale nelle diverse ore del giorno.

È fondamentale conoscere le molteplici possibilità oggi offerte dalle diverse metodologie e tecnologie di acquisizione in modo da progettare una campagna di digitalizzazione modellata sulle proprie esigenze e aspettative. La definizione degli obiettivi (conservazione, fruizione, diagnosi ecc.) e del target di utenti è un requisito indispensabile su cui basare la scelta della modalità di scansione.

Partendo dalle caratteristiche della strumentazione individuata, si deve tenere conto della quantità di originali che possono essere mediamente digitalizzati in una giornata lavorativa, così da programmare la movimentazione delle opere.

Di seguito si fornisce una sintetica descrizione dei principali strumenti di acquisizione digitale, rammentando che il loro uso può essere combinato e che essi possono a volte essere utilizzati sia per le digitalizzazioni 2D che 3D.

2.4.1. Digitalizzazione 2D

2.4.1.1. Scanner: tipologie e caratteristiche

Principali strumenti di digitalizzazione di oggetti bidimensionali, gli scanner sono di diversi tipi e offrono un’articolata varietà di soluzioni. È fondamentale, nella scelta delle strumentazioni, tenere conto dell’aspetto conservativo degli originali prima di procedere: le apparecchiature scanner dovranno essere scelte in base al tipo di bene da trattare e avere caratteristiche tecniche e progettuali di fascia professionale, con particolare attenzione alla possibilità di salvare il file nel formato grezzo (RAW).

2.4.1.1.1. Scanner piani

Generalmente disponibili sul mercato con formati che vanno dall’A4 all’A2+, gli scanner piani impiegano un gruppo optoelettronico che scorre parallelamente al documento mentre questo rimane immobile su un piano orizzontale. Il gruppo è composto da una lampada fredda che emette luce bianca. Il fascio luminoso, man mano che investe progressivamente il documento, viene raccolto da un sistema di lenti che lo suddivide nei tre componenti fondamentali RGB* (il rosso, il verde e il blu). Queste vengono quindi indirizzate ai sensori che possono essere di due tipi: CCD (Charge Coupled Device) negli apparecchi di maggior pregio, o CIS (Contact Image Sensor), anche se questi ultimi sono sempre meno impiegati e stanno diventando rapidamente desueti.

Tra le più importanti caratteristiche da esaminare nella scelta del modello di scanner più adatto ai propri scopi vi sono i valori di risoluzione* ottica (reale, non interpolata), di densità/gamma dinamica* e, a questa strettamente legati, di profondità di bit*.

Uso consigliato: digitalizzazione di materiale bibliografico o archivistico, digitalizzazione di negativi su lastre di vetro, di stampe e positivi fotografici, di pellicole con formati che non è possibile trattare con lo scanner piano a “tamburo virtuale”.

2.4.1.1.2. Scanner planetari

Scanner professionali appositamente progettati per la riproduzione digitale dei volumi rilegati e di fogli sciolti, anche di grandi dimensioni. Questo tipo di scanner garantisce la tutela dell’originale, evitando il contatto diretto ed essendo normalmente dotato di piani basculanti e di luci LED prive di raggi infrarossi e ultravioletti.

Esistono due tipologie di scanner planetario: a sensore* lineare o a sensore a matrice. Per il primo caso, la scansione avviene tramite un passaggio meccanico del sensore sopra il documento da digitalizzare, mentre nel secondo la scansione richiede il tempo di uno scatto fotografico [2].

Gli scanner planetari permettono di acquisire ad alta risoluzione documenti cartacei e pergamenacei anche di grande formato, garantendo alta produttività. I più comuni sono di formato A2 o A1, ma esistono modelli in grado di acquisire fino al formato doppio A0.

Uso consigliato: la digitalizzazione di materiale bibliografico o archivistico; gli scanner planetari sono particolarmente indicati per la digitalizzazione di documenti antichi e delicati (per cui possono essere dotati di piani basculanti o piani a “V” per il trattamento di materiale rilegato).

2.4.1.1.3. Scanner per pellicole

Si tratta di apparecchi appositamente dedicati alla scansione di pellicole: l’acquisizione delle immagini non avviene, come nel caso degli scanner tradizionali, a partire dalla luce riflessa, bensì in transilluminazione. La luce viene proiettata dallo scanner attraverso il supporto filmico e catturata da un gruppo optoelettronico, trasformata in formato digitale da un convertitore analogico-digitale e infine inviata al computer collegato allo scanner. Alcuni di questi scanner, soprattutto quelli professionali di alta fascia, usano tre luci LED – una rossa, una verde e una blu – che, oltre a non avere nessun indebolimento di intensità nel tempo, consentono un controllo maggiore sul bilanciamento del colore e la saturazione.

Uso consigliato: digitalizzazione film 135/120/220 e/o diapositive 24x36 (con e senza telaietto).

2.4.1.1.4. Scanner a tamburo

Contrariamente agli altri, negli scanner a tamburo il gruppo optoelettronico è fermo rispetto al documento che viene disteso intorno a un rullo rotante. Un fascio di luce bianca viene proiettato sul documento e un sensore – al quale il raggio riflesso viene indirizzato – separa la luce riflessa dal documento nei tre componenti fondamentali RGB. Ciascuna componente viene poi inviata a un fotomoltiplicatore (PMT, Photo Multiplier Tube) che trasforma il raggio luminoso in un segnale elettrico, a sua volta inviato a un convertitore analogico-digitale e da qui al PC.

Questi scanner erano impiegati a livello industriale, soprattutto nelle tipografie, che necessitavano di acquisire immagini ad alta risoluzione. Attualmente si tende a sostituirli sempre più frequentemente con degli scanner piani, che sono molto più semplici da usare e che nelle forme più tecnologicamente progredite hanno ormai raggiunto livelli qualitativi comparabili a quelli degli scanner a tamburo.

Questo strumento è stato citato per offrire una panoramica quanto più esaustiva sulle tecnologie in uso (ieri e oggi) per la digitalizzazione di materiale cartaceo di grande dimensione; è oggi ritenuto uno strumento altamente sconsigliato per l’acquisizione digitale di beni culturali, in quanto produce uno stress meccanico considerevole sull’oggetto da digitalizzare.

2.4.1.1.5. Scanner a tamburo virtuale

Particolarmente indicati nella scansione di originali fotografici, gli scanner a tamburo virtuale sono caratterizzati dal fatto che tra il sistema di ripresa (composto da obiettivo e sensore CCD) e originale non c’è contatto, rendendo di fatto impossibile la creazione di disturbi durante la scansione (quali gli “anelli di Newton” o le macchie dovute a polvere e/o graffi).

Inoltre, grazie all’impiego di speciali portapellicola magnetici, l’originale viene mantenuto perfettamente piano, mentre il passaggio durante la scansione su una superficie leggermente incurvata garantisce il mantenimento di una messa a fuoco perfetta sull’intera immagine.

Pertanto, contrariamente a quanto avviene negli scanner tradizionali (che usano piani in vetro o prismi) e quelli tipografici a tamburo (per i quali è necessario utilizzare gel o olio), lo scanner a tamburo virtuale permette di sfruttare il massimo del dettaglio senza che nulla si frapponga o debba essere applicato sulla pellicola originale.

Uso consigliato: digitalizzazione negativi su pellicola, diapositive e diacolor dal 135mm al 4x5».

Tra le più importanti caratteristiche da esaminare nella scelta del modello di scanner più adatto ai propri scopi vi sono i valori di risoluzione ottica (reale, non interpolata), di densità/gamma dinamica (vedi Glossario) e, a questa strettamente legati, di profondità di bit.

2.4.1.2. Fotocamere: tipologie e caratteristiche

La fotocamera digitale, insieme o in sostituzione allo scanner, rappresenta lo strumento maggiormente idoneo al processo di digitalizzazione. Essa può essere impiegata in diverse occasioni e con le più disparate tipologie di beni, siano essi bi o tridimensionali.

2.4.1.2.1. Corpo macchina

È fortemente consigliato l’utilizzo di macchine fotografiche che abbiano sensori di grande dimensione (minimo 43x33 mm, il cosiddetto “medio formato” digitale) aventi una risoluzione spaziale nativa di almeno 8256×6192 pixel* (pari a 51,4 Mp).

Le moderne fotocamere digitali di medio formato mirrorless (cioè senza specchio e pentaprisma) hanno dimensioni ridotte e una maneggevolezza tale da renderle idonee all’uso nelle più disparate condizioni di ripresa. Per molti modelli la risoluzione nativa del sensore è di 11648×8736 pixel (pari a 102 Mp), con file RAW di circa 200 MB cadauno. Attraverso la tecnica del Pixel Shift è possibile arrivare, laddove ve ne sia specifica necessità, ad avere un sensore equivalente a ben 400 MP di risoluzione - senza alcuna interpolazione - generando file RAW DNG di 23264x17448 pixel con un peso intorno ai 1,6 GB.

Per quei progetti di digitalizzazione in cui non è possibile utilizzare una fotocamera con sensore medio formato, si raccomanda l’uso di una DSLR (Digital Single Lens Reflex) o di una mirrorless avente un sensore di dimensioni minime uguali al cosiddetto «Full Frame» (24x36 mm) con una risoluzione nativa non inferiore a 6720x4480 pixel (pari ad un sensore di 30,4 Mp).

2.4.1.2.2. Ottica

Viene scelta in base al tipo di soggetto. Sono da prediligere obiettivi luminosi (con ampie aperture di diaframma), privi di distorsioni e aberrazioni ottiche e con alte curve MTF (Modulation Transfer Function) [3]. Inoltre debbono avere una focale (e/o rapporto di ingrandimento) adeguata alla necessità di ripresa, per esempio ottiche macro con rapporto 1:1 per la digitalizzazione di originali fotografici di piccolo formato o beni di dimensioni estremamente ridotte.

2.4.1.2.3. Vantaggi nell’impiego della fotocamera

A seconda delle caratteristiche specifiche dei manufatti da digitalizzare, l’utilizzo della macchina fotografica in luogo dello scanner può portare molteplici vantaggi rispetto all’uso dello scanner, tra cui versatilità di impiego, maggiore qualità degli output, tempi di acquisizione più rapidi, maggiori opportunità di sviluppo dei file RAW anche con software di terze parti, gestione del colore più semplice e precisa, assenza di contatto dello strumento con le opere, ridotta occupazione degli spazi operativi, minor impatto in ambiente di conservazione/lavorazione dei beni, maggiore facilità di sostituzione dell’apparecchiatura in caso di guasti durante il processo di digitalizzazione. Nel settore dei beni librari e archivistici gli scanner piani e planetari restano comunque la soluzione più efficace ed impiegata, salvo manufatti dalle caratteristiche particolari, come mappe o carte di grandi dimensioni, ecc.

Laddove vi sia la necessità di riprendere beni bidimensionali, la cui immagine deve essere misurabile ed esente da distorsioni prospettiche e/o anamorfosi volumetrica, si richiede una metodologia di ripresa simile a quella adottata per la documentazione fotografica di tipo architettonico, utilizzando fotocamere od ottiche a corpi mobili, capaci quindi di operare movimenti di decentramento e/o basculaggio.

2.4.1.3. Esempi di flusso di lavoro

Una volta individuato il corpus di opere da digitalizzare e i relativi mezzi di riproduzione da impiegare (macchina fotografica, scanner), va sviluppato un workflow per rendere i processi di acquisizione efficienti e valutabili. Occorre, cioè, prevedere nel dettaglio i processi di lavorazione in relazione alla tipologia del bene.

A titolo esemplificativo, nel caso di digitalizzazione di documenti rilegati (libro, volume, manoscritto), per una pagina significativa (ad esempio il frontespizio) è richiesta una doppia scansione: la prima deve contenere i riferimenti metrici, colorimetrici e il target test per la riproduzione dei dettagli, la messa a fuoco e la correzione delle distorsioni delle immagini. Questa immagine va eseguita come prima nella serie di scatti, ma va collocata in coda al pacchetto di immagini. La scala millimetrica deve essere posizionata lungo il bordo inferiore con lo “zero” allineato al bordo verticale della carta/pagina. Normalmente la scansione, che procede per documento aperto, produrrà due file separati (due pagine o un verso e un recto) [4]. Infatti quello che di norma, tranne per casi specifici, viene considerato come singolo oggetto digitale fa riferimento al verso o al recto di ciascuna carta per i manoscritti, o alla singola pagina per testi a stampa. In fase di post-produzione, le carte/pagine nella zona della cucitura dovranno essere tagliate con un margine per mostrare anche una piccola parte della pagina a fianco.

La scansione deve portare all’organizzazione della directory del documento nel seguente ordine: piatto anteriore, dorso, contropiatto anteriore, carte di guardia anteriori, corpo del testo, carte di guardia posteriori, contropiatto posteriore, piatto posteriore e, in fondo alla directory, scala cromatica e millimetrica. Nel caso delle pubblicazioni periodiche, invece, la scansione riguarderà i soli fascicoli e non la legatura in volume. Soltanto nel caso di periodici in cui la rilegatura ha motivazioni editoriali, questa dovrà essere oggetto di scansione. Questa eccezione richiede una definizione in fase progettuale.

In caso di presenza di lacerazioni, di fori di tarlo e ossidazione degli inchiostri o qualora le carte/pagine da riprendere fossero più piccole di quelle sottostanti, porre al disotto del foglio in ripresa una carta giapponese (non un comune foglio bianco), di spessore tale che consenta la visibilità delle pagine sottostanti e non interferisca con la lettura del foglio scansionato e di dimensione pari alle misure del documento.

I dispositivi di acquisizione utilizzati dovranno seguire le specifiche tecniche rispondenti ai parametri richiesti nel capitolato tecnico inerenti densità, profondità di bit e risoluzione spaziale (non interpolata).

Per ogni diversa attività di digitalizzazione deve essere realizzato un prototipo; delle verifiche periodiche consentiranno di eliminare eventuali errori di lavorazione.

2.4.1.3.1. Workflow con la fotocamera

Occorre definire il set-up della postazione di ripresa (posizionamento della fotocamera, del bene e delle luci). Durante lo scatto la fotocamera deve essere montata su colonna o cavalletto, in bolla. Nel caso di ripresa zenitale con fotocamera su colonna si consiglia l’uso di un inclinometro al fine di assicurare la perfetta planarità tra sensore e soggetto: la ripresa va fatta sempre in asse, con sensore parallelo e centrale rispetto al piano oggetto.

Prima di iniziare la sessione di scatto è fondamentale caratterizzare la coppia fotocamera/ottica usata in relazione alla specifica illuminazione utilizzata sul bene al momento della ripresa (profilazione colore); è pertanto necessario fotografare – sotto le stesse luci – un riferimento colorimetrico quale il ColorChecker di X-Rite (l’unico in grado di poter generare profili .DCP - anche a doppio illuminante - oltre che .ICC).

Per ogni bene o lotto di beni è opportuno effettuare un primo scatto con dei riferimenti: del bene stesso (inventario, denominazione, ecc.), dimensionali (metrici) e, ove necessario, geografici (eventuale US o USM, freccia del NORD). Quindi, si può procedere con gli scatti successivi privi di riferimenti.

Le impostazioni di base da applicare per la fotocamera sono: sensibilità ISO nativa del sensore (le amplificazioni del segnale portano ad una minor qualità dell’immagine); spazio colore* Adobe RGB [5]; registrazione file di tipo RAW non compresso.

2.4.1.3.2. Workflow con lo scanner piano e con il planetario

Tutte le workstation di digitalizzazione debbono essere corredate da idoneo piano di appoggio per la movimentazione in sicurezza degli originali da trattare.

Ogni scanner, una volta installato, deve essere configurato e calibrato. Inoltre, a seconda dei formati o delle caratteristiche fisiche del materiale, deve essere settato con frequenza periodica, per non perdere le configurazioni già definite o adeguarle di volta in volta a nuove esigenze.

Per ogni scanner, a inizio lavori, va creato un profilo .ICC di classe input – con l’ausilio degli appositi target colorimetrici (quello di riferimento è il ColorChecker Digital SG) – al fine di assicurare una corretta restituzione cromatica degli originali.

Per ogni originale è richiesto un file RAW DNG. Laddove lo scanner piano o planetario non sia nativamente in grado di generare formati RAW, esso deve essere integrato con un driver di terze parti che consenta la digitalizzazione in RAW.

2.4.1.3.3. Interventi di post-produzione

Ogni postazione di trattamento di post-produzione deve essere dotata di monitor avente una lookup table (LUT)* per ogni primario RGB, accessibile da software e con profondità di bit maggiore di 8. Tali monitor, inoltre, dovranno essere opportunamente calibrati per il punto di bianco e la gamma a intervalli regolari con l’uso di uno spettrofotometro o, in subordine, colorimetro al fine di garantire un corretto flusso di gestione del colore tra le diverse apparecchiature usate. È altresì importante approntare sistemi di backup giornaliero del lavoro in corso.

Le eventuali correzioni ai file, minime e solo se necessarie, vanno stabilite all’inizio del progetto. Esse vengono eseguite esclusivamente sul secondo file master, il TIFF* ottenuto dal master RAW DNG, lasciando così quest’ultimo inalterato. In genere, l’immagine non deve subire manipolazioni, se non in relazione ad un miglioramento della sua leggibilità.

Le eventuali correzioni, fatta salva l’applicazione del profilo colore* [6] e il successivo bilanciamento del bianco, devono essere effettuate solo per curve di livelli, luminosità, contrasto, e l’eventuale applicazione di una leggera maschera di contrasto. Il profilo colore, generato con apposito software prima di ogni sessione giornaliera, e il successivo bilanciamento del bianco (linearizzazione dell’asse dei grigi) devono essere applicati, attraverso l’uso di un’automazione, su tutti i file inerenti quella specifica sessione di scatto/scansione.

Di ogni correzione apportata alle immagini deve essere tenuta traccia tramite un file descrittore in formato aperto e modificabile (es. file XMP o METS non protetti).

Laddove la digitalizzazione riguardi originali fotografici negativi si procede, nella realizzazione del secondo master, alla curva di inversione negativo/positivo e al ritaglio* dell’immagine lungo i bordi della finestra di esposizione originale. La profondità di bit dei suddetti master TIFF deve restare la stessa del master RAW.

Infine, in accordo con le politiche di naming e metadatazione stabilite nel progetto, si procede alla rinomina dei file e alla creazione dei metadati per tutti i file prodotti durante la sessione giornaliera.

2.4.1.3.4. OCR

La digitalizzazione di documenti che contengono testo può prevedere anche un processo di riconoscimento ottico di scrittura chiamato OCR (Optical Character Recognition). Il processo di base dell’OCR consiste nel riconoscere il contenuto testuale del layout di oggetti digitali trascrivendone i grafi in formati utilizzabili per l’elaborazione dei dati. Il riconoscimento OCR permette di creare degli ipertesti a partire dai contenuti, di incorporarli nei file originali e di renderli disponibili per visualizzatori, software e motori di ricerca. Versioni più evolute di OCR (a es., i sistemi basati su tool captcha o re-captcha) hanno delle funzioni e delle fasi specifiche.

Occorre garantire la massima qualità del processo di OCR per ottimizzare le percentuali di riconoscimento ad almeno il 90% dei caratteri. Nel caso in cui il fornitore utilizzi file di training personalizzati, questi devono essere resi disponibili all’amministrazione.

Un tipico flusso di lavoro OCR può essere riassunto nelle seguenti fasi principali: immagine originale, pre-elaborazione, segmentazione, OCR, post-processing. Durante la fase di “segmentazione” avviene l’analisi dell’immagine del documento e il riconoscimento della struttura della pagina o anche di altri aspetti del testo che possono includere, per esempio, tabelle, immagini, o caratteri speciali. Nella fase successiva, il programma abbina campioni di carattere precedentemente selezionato e ricerca diverse ipotesi di output sulla lettera o simbolo da ipotizzare e codificare. L’analisi e l’elaborazione delle varie ipotesi e varianti ne permette la decisione successiva del testo riconosciuto. Nell’ultima fase, l’output OCR grezzo può essere ulteriormente migliorato, ad esempio, incorporando dizionari o modelli linguistici. Questa fase può essere combinata con la correzione manuale, che di solito avviene dopo la post-elaborazione automatica. Quasi tutte le informazioni acquisite durante l’intero flusso di lavoro possono essere incorporate nell’output finale: le coordinate delle regioni e i loro tipi, le coordinate delle linee, le posizioni dei caratteri. Sono stati proposti diversi formati che possono incorporare la maggior parte o tutte le informazioni sopra citate, ad esempio ALTO [7] e hOCR [8].

È fondamentale che un sistema OCR sia in grado di riconoscere, nei contenuti dei layout «set di grafi stampati nelle varie epoche di differenti alfabeti, sia antichi che moderni. Tuttavia, questi sistemi allo stato dell’arte non sono ancora pienamente appropriati per il riconoscimento di oggetti digitali relativi a manoscritti. Un modo più raffinato di riconoscimento dei caratteri è il cosiddetto ICR (Intelligence Character Recognition). Sebbene OCR e ICR possano sembrare simili, in realtà esistono differenze sostanziali tra i due sistemi di software. L’ICR si qualifica tecnicamente come un OCR, ma è un sistema più specifico, che apprende diversi caratteri e stili di scrittura. Con un ICR, un computer può studiare la scrittura a mano e imparare a riconoscerla per migliorare la precisione e il riconoscimento. In sostanza, si tratta di un’applicazione più intelligente dell’OCR, più coinvolta e più dettagliata.

Nondimeno, la qualità di un sistema di OCR è legata all’estrazione dei caratteri e alla loro selezione e classificazione basata su modelli. Su questo particolare aspetto, hanno particolare rilievo alcuni software sviluppati nell’ambito dell’ICR come Handwritten Text Recognition (HTR), che ha ricevuto un’attenzione crescente come evoluzione dell’OCR e su cui la ricerca si sta particolarmente focalizzando. Attualmente sono in sperimentazione alcuni sistemi in grado di processare i layout con buone percentuali di restituzione in ipertesto dei contenuti (50-80%). A questo va aggiunto le funzionalità evolute di Graphic Matching, che ottengono risultati rilevanti nel riconoscimento sul layout degli oggetti di grafi, parti di lemmi, lemmi o combinazioni di lemmi in frasi.

Normalmente, l’OCR trova applicazione nei file PDF*, nei quali il testo riconosciuto è contestualmente incorporato (embedded). In questo modo, i file diventano ricercabili anche in mancanza di visualizzazione dell’ipertesto in formato elettronico.

Per oggetti digitali in formato immagine, l’utilizzo dei file pdf con OCR embedded (generalmente uno per pagina) ha un fine strumentale e non di mera fruizione. Il layer testuale, embeddato nel singolo pdf, serve a supporto dei file immagine per identificare la posizione delle parole ed evidenziarla tramite il viewer.

La gestione dell’OCR di oggetti digitali prevede anche l’utilizzo di file esterni che gestiscano il riconoscimento dei testi e il posizionamento delle parole all’interno della pagina.

Detto che alcuni sistemi prevedono la possibilità di generare l’OCR “on the fly”, senza l’utilizzo di altri file di supporto (che siano PDF, hOCR, o file xml con schema ALTO) al fine di ottenere migliori risultati nelle procedure di riconoscimento ottico dei caratteri, si consiglia di prediligere l’uso di file PDF con OCR embedded (un file PDF per ciascun file immagine). Alternativamente, è possibile utilizzare file di metadati esterni che gestiscano il riconoscimento del testo e il posizionamento di questo nella pagina da fornire nei formati standard sopra citati, ALTO o hOCR. Questi formati codificano e riportano le informazioni strutturate prodotte nelle fasi ocerizzazione che possono essere esportate e riutilizzate, e sono spesso necessarie per l’elaborazione successiva con altri strumenti. ALTO è un formato XML standardizzato per memorizzare informazioni sul layout e sul contenuto. È un’estensione per l’uso dello schema XML/METS che contiene informazioni fisiche e di contenuto, mentre METS fornisce metadati e informazioni strutturali. hOCR è uno standard aperto di rappresentazione dei dati per il testo formattato ottenuto dal riconoscimento ottico dei caratteri (OCR). hOCR codifica il testo, lo stile, le informazioni sul layout, le metriche di affidabilità del riconoscimento e altre informazioni utilizzando XML, sotto forma di HTML o XHTML. Alcuni strumenti specifici permettono di personalizzare gli output XML hOCR secondo lo schema XML/TEI [9].

2.4.2. Digitalizzazione 3D

Nella presente versione delle Linee guida si è optato fornire indicazioni di alto livello sulla digitalizzazione tridimensionale, che sarà oggetto di specifico approfondimento in future versioni del Piano nazionale di digitalizzazione.

2.4.2.1. Strumenti e metodologia per la digitalizzazione tridimensionale (laser scanning e fotogrammetria 3D)

2.4.2.1.1. Strumentazioni laser scanning

Ogni tecnologia laser può avere diverse modalità di impiego. Oltre alla classica postazione fissa su treppiedi – la più usata per gli scanner a tempo di fase o a tempo di volo – negli ultimi anni si sono sviluppati scanner a brandeggio manuale o che incorporano basi a rotazione, permettendo di risolvere problemi pratici di ripresa soprattutto con oggetti di piccole dimensioni, quali monete e pietre, o a elevata complessità, quali statue, bassorilievi e altorilievi, strumenti musicali.

Rientrano in questa categoria i sistemi integrati per scansioni in movimento (MMS - Mobile Mapping System). Il Mobile Laser Scanning è un sistema di scansione laser che consente l’acquisizione di dati 3D per mezzo di uno o più scanner laser montati su una piattaforma mobile (autoveicoli, imbarcazioni, veicoli su rotaie). L’obiettivo della scansione laser mobile è la registrazione di dati 3D di superfici di oggetti in base ai seguenti importanti requisiti: alta efficienza nei tempi di acquisizione di dati di vaste aree registrazione automatica di dati 3D in un sistema di coordinate comune (GPS), alta risoluzione e precisione dei dati registrati.

2.4.2.1.2. Strumentazioni per la fotogrammetria 3D

L’acquisizione fotogrammetrica dei beni culturali deve avere requisiti minimi per poter garantire la precisione dello sviluppo geometrico e della restituzione visiva, sia per dettaglio sia per cromie. Questa pratica, attraverso la procedura di ripresa, porta alla generazione di una nuvola di punti e di un modello 3D, utilizzando l’accoppiamento di almeno tre fotogrammi dove si ritrova lo stesso punto fotografato.

Lo schema di lavoro deve avere come obiettivo l’individuazione del posizionamento delle stazioni di acquisizione in relazione alla grandezza del bene. La pianificazione delle scansioni deve ridurre al minimo il numero di stazioni (qualora sia necessario averne più di una o qualora non si adotti un’unica stazione grazie all’uso di una base girevole su cui è appoggiato il bene) e individuare quali viste possano ottimizzare il tempo di acquisizione e l’accuratezza delle acquisizioni proposte. Occorre assicurare, inoltre, la presenza tra più scansioni di aree di sovrapposizione (pari al 30%), in modo da ricoprire interamente le superfici scansionate.

Gli strumenti basati su principi ottici che sfruttano la triangolazione risultano quelli più idonei per il campo di digitalizzazione dei beni di piccole dimensioni.

In base alle dimensioni e al materiale di cui è composto il bene mobile, si possono utilizzare la tecnica e le strumentazioni più adeguate (e.g. fotogrammetria* con reflex digitale e drone*, acquisizione con due tipologie di scanner, quello a laser o quello a luce strutturata, ecc.).

Una casistica peculiare è quella dei rilievi subacquei, che necessitano di soluzioni fotogrammetriche particolari e/o di laser scanner dedicati. I rilievi subacquei si distinguono principalmente in due approcci differenti: il primo è il rilievo da drone, ideale per il rilievo delle superfici di bacini interni o costieri per la possibilità di scansione sia della superficie dell’acqua che dei fondali e contemporaneamente anche delle linee costiere. Il secondo è il rilievo da postazioni subacquee, che possono essere anche mobili, come imbarcazioni o sottomarini ideali per la precisione di dettagli di fondali.

2.4.2.1.3. Post-produzione

Una volta acquisite le informazioni digitali tridimensionali, devono essere effettuate opportune operazioni di post-produzione attraverso lo svolgimento di alcune attività manuali o automatizzate, al fine di elaborare l’informazione digitale acquisita.

Durante le attività di post-produzione, saranno necessarie delle azioni sulla nuvola di punti prima che venga trasformata in mesh 3d. Tali interventi riguardano prevalentemente l’eliminazione del “rumore” dei dati acquisiti, cioè la riduzione della ridondanza di punti e, qualora necessario, la realizzazione del modello tridimensionale texturizzato (per esempio nei formati OBJ* e PLY), attraverso l’utilizzo di immagini che rispondano a caratteristiche di qualità. Tali immagini devono poi essere processate con software dedicati per ottimizzarle, in modo da garantire sia un risultato visivo ottimale sia la possibilità di navigazione attraverso i più comuni browser web.

2.4.2.1.4. Elaborazione del dato

L’elaborazione dei dati acquisiti richiede workstation dalle elevate potenzialità in termini di processore, RAM, scheda video e capacità di archiviazione.

Per quanto riguarda la digitalizzazione tridimensionale di manufatti di grandi dimensioni, vista la elevata eterogeneità di tali beni, si consiglia di valutare l’utilizzo di diverse tipologie di tecniche laser scanner e di tecniche fotogrammetriche, da usare in aggiunta o indipendentemente alla tecnologia laser, con macchine fotografiche fisse, teste panoramiche o su drone. La variabilità delle dimensioni dei manufatti e delle necessità di dettagli su scale di approfondimento diverse consente l’uso specifico di laser a tempo di fase o a tempo di volo su postazioni fisse o mobili o su drone, che – unite al dato fotogrammetrico – possono dare grandi risultati di precisione e rapidità d’esecuzione, contribuendo a contenere i costi. La fotogrammetria o l’uso di laser con integrazioni di fotocamere digitali sono indispensabili dove è necessario il dato cromatico. In questo caso l’informazione digitale sarà costituita da un modello tridimensionale digitale a nuvola di punti ad alta densità texturizzata, consultabile ed esportabile. Il risultato ottenuto, elaborato sotto forma di mesh e texturizzato, può essere esportato come modello tridimensionale in formato adatto (per esempio OBJ o 3DS).

Nel caso di beni di piccola dimensione può essere sufficiente la realizzazione di un unico modello tridimensionale. Nel caso di beni di notevoli dimensioni o caratterizzati da geometria complessa la redazione di modelli OBJ interessa solitamente porzioni del bene; pertanto è opportuno procedere con processi di elaborazione distinti per ciascuna porzione del bene, così da unire i singoli modelli ad alto livello di dettaglio in un secondo momento grazie alle azioni di merge e allineamento in un’unica mesh 3d, scalata metricamente, georiferita e - se necessario - texturizzata.

La scelta di utilizzare per la digitalizzazione di manufatti di grandi dimensioni la strumentazione laser scanner 3D permette di estrarre i dati necessari per ottenere la morfologia del manufatto nei punti ritenuti significativi. L’interrogazione delle nuvole di punti, opportunamente calibrate e parametrizzate, permette infatti di visualizzare anche quelle informazioni non facilmente rilevabili a occhio nudo con gli strumenti tradizionali e di mettere in evidenza elementi di particolare criticità.

Anomalie costruttive, discontinuità materiali, aggiunte, sottrazioni o modifiche divengono in questo modo chiaramente leggibili e sono dunque funzionali alla comprensione effettiva del manufatto nella sua complessità, nel suo essere palinsesto di segni stratificati nel corso del tempo.

2.4.2.1.5. Scala metrica e georeferenziazione

Le digitalizzazioni con tecniche laser scanner e fotogrammetriche devono essere scalabili metricamente secondo l’unità di misura metrica e georeferenziate con strumentazione topografica di precisione mediante l’acquisizione di poligonali chiuse. Pertanto, occorre stabilire se collocare il dato in un sistema locale di riferimento oppure in un sistema globale o, preferibilmente, in entrambi. Eventualmente la quota altimetrica del sistema locale può essere calcolata da un punto quota noto sul posto, oppure da grafici già rilevati in precedenza. È buona norma che il sistema locale sia georeferenziato, se possibile, al sistema di riferimento geodetico nazionale ETRF2000 [10] o almeno al più diffuso sistema di riferimento geodetico mondiale WGS84.

2.4.2.1.6. Range di fedeltà digitale

Nel definire la fedeltà con cui viene digitalizzato un bene entrano in gioco diversi parametri. I principali sono:

  • portata: massima distanza che lo scanner è in grado di misurare;
  • accuratezza: grado di conformità di una quantità misurata rispetto al valore reale;
  • precisione: capacità dello strumento di restituire lo stesso valore in successive misurazioni;
  • dispositivi integrati: possibilità di integrare altri software o dispositivi (fotografia ecc.).

Riguardo la possibilità di una riproduzione fedele dei sistemi di rilievo laser scanner, si deve prima di tutto individuare la tipologia di laser da utilizzare a seconda delle macro-necessità del progetto di acquisizione. Una volta individuate, si possono individuare una serie di standard a seconda dei livelli che si vogliono raggiungere, e dei budget a disposizione. Ad esempio, per una piccola statua si userà un laser a luce strutturata in grado di eliminare buona parte del rumore dell’oggetto, mentre per una serie di stanze adibite a museo si potrebbe usare un laser a differenza di fase in grado di rilevare più ambienti con alta precisione. Questa scelta va effettuata in base a diversi fattori che saranno individuati a monte dell’analisi, quali particolari esigenze conservative o la complessità del bene, al fine di digitalizzare l’opera con la migliore qualità possibile.

2.4.3. Digitalizzazione audio/video

Le numerose modifiche tecnologiche hanno reso i supporti audiovisivi sempre più complessi e soggetti all’obsolescenza dei sistemi. Data la natura, unica e comune a tutti i documenti audiovisivi, di essere leggibili esclusivamente attraverso un apparato di intermediazione specifico per ogni categoria di supporto e per ogni epoca di produzione, è necessario, oltre alla corretta conservazione degli originali, anche una approfondita conoscenza delle macchine necessarie al loro corretto utilizzo. Attualmente si possono individuare alcune categorie di supporti audiovisivi in base agli aspetti tecnici di scrittura e lettura utilizzati:

  • supporti meccanici (cilindri fonografici, dischi ecc.);
  • supporti magnetici (fili metallici, nastri, cassette, video nastri ecc.);
  • supporti ottici (videodischi, CD, DVD, BD ecc.).

All’interno di ognuna di queste categorie esistono numerose varianti che devono essere di volta in volta individuate, riconosciute e considerate per gli opportuni adeguamenti dei processi di digitalizzazione.

Infine, esistono attualmente numerosi documenti audiovisivi “nativi digitali” che non presentano le caratteristiche tecniche richieste per la conservazione e che pertanto devono essere analizzati e convertiti per adeguarli alle specifiche delle presenti Linee guida e della conservazione digitale.

Le linee guida dell’International Association of Sound and Audiovisual Archives raccomandano la rappresentazione digitale del segnale analogico con il metodo PCM (Pulse Code Modulation) lineare (interlacciato per stereo) in un file .WAV o preferibilmente BWF.WAV (EBU Tech 3285) per tutto l’audio a due tracce. L’uso di qualsiasi codifica percettiva (“compressione con perdita”) è fortemente sconsigliato. Si consiglia di digitalizzare tutto l’audio a 96 kHz o superiore e con una profondità di almeno 24 bit.

La conversione da analogico a digitale (A/D) è un processo di precisione, e i convertitori a basso costo integrati nelle schede audio dei personal computer non sono in grado di soddisfare le esigenze dei programmi di conservazione digitale.

Oltre alla corretta conservazione dei supporti audio e video originali, è necessaria anche una approfondita conoscenza degli strumenti di riproduzione ai fini della loro consultazione e digitalizzazione.

Nel processo di digitalizzazione dei supporti audio e video è indispensabile documentare con precisione ogni intervento effettuato sui supporti e tutte le scelte tecniche adottate (pulitura del supporto, presenza e ripristino di giunzioni sui supporti magnetici, marca e tipo del lettore utilizzato, specifiche tecniche del sistema di lettura – tipo di pick-up di lettura dimensioni dello stilo per i dischi, ecc.).

Per la digitalizzazione è opportuno fare riferimento ai seguenti documenti della IASA:

  • IASA-TC 04 (2009, 2nd edition), Guidelines on the Production and Preservation of Digital Audio Objects;
  • IASA-TC 05 (2016), Gestione e archiviazione dei supporti audio e video;
  • IASA-TC 06 (2019), Guidelines for the Preservation of Video Recordings.

2.4.3.1. Principi generali e standard per la digitalizzazione dei documenti sonori

È importante, ai fini della conservazione dei documenti sonori, che i formati, le risoluzioni, i supporti e i sistemi tecnologici utilizzati rispettino i principi di standard condivisi a livello internazionale e appropriati agli scopi di archiviazione previsti.

Le caratteristiche fondamentali del formato digitale prodotto devono rispecchiare i seguenti parametri:

  • Sampling Rate: la frequenza di campionamento stabilisce il limite massimo della risposta in frequenza del segnale audio; le linee guida internazionali richiamate consigliano l’utilizzo di una frequenza di campionamento minima di 48 kHz con una preferenza per frequenze superiori (96 kHz);
  • risoluzione (Bit Depth): il numero di bit stabilisce l’estensione della codifica della gamma dinamica di un evento o di un brano sonoro; la codifica a 24 bit permette la rappresentazione di ogni evento sonoro udibile;
  • formato file audio: lineare PCM (P*ulse Code Modulation*), interleaved stereo wave (estensione del file .WAV).

2.4.3.2. Estrazione del segnale dai supporti originali

Nel processo di digitalizzazione occupa una parte importante l’ottimizzazione del recupero del segnale dei supporti originali, e questo per due ordini di motivi:

  1. il supporto originale potrebbe deteriorarsi e la riproduzione futura potrebbe non raggiungere la stessa qualità o addirittura non essere più praticabile;
  2. l’estrazione del segnale potrebbe costituire un’attività onerosa e lunga, tanto da far preferire un’ottimizzazione al primo tentativo.

Altri aspetti importanti di cui tenere conto sono la selezione della copia migliore, la pulitura e il restauro del supporto originale. Il metodo di pulitura più appropriato dipende dal supporto specifico e dalle sue condizioni.

2.4.3.3. Attrezzature di riproduzione

La riproduzione dei supporti audio e video prevede l’utilizzo di una catena di apparecchiature. La combinazione degli strumenti di riproduzione, cavi di segnale, mixer e altri apparecchi di elaborazione audio e video devono avere specifiche di qualità pari o superiori a quelle delle apparecchiature audio e video digitali, sia per la frequenza di campionamento sia per la risoluzione.

La qualità delle attrezzature per la riproduzione, dei collegamenti audio, dei formati digitali di destinazione deve essere migliore di quella del supporto originale.

È utile tenere presente che tutta l’attrezzatura richiede una manutenzione continua e regolare per mantenerla in buono stato di funzionamento. Tuttavia, poiché le apparecchiature di riproduzione analogica diventano velocemente obsolete, è necessario pianificare l’approvvigionamento dei pezzi di ricambio, considerato che la loro disponibilità è limitata nel tempo.

2.4.3.4. Sistemi per la conservazione

Infine, per richiamare un principio generale presente nelle linee guida della IASA, occorre tenere presente che «le strategie sulla gestione, l’archiviazione a lungo termine e la conservazione dell’audio e il video codificati digitalmente si basano sulla premessa che non esiste un supporto di memorizzazione definitivo e permanente, né ci sarà nel prossimo futuro. Invece, coloro che gestiscono archivi audio digitali devono pianificare l’implementazione di sistemi di gestione e archiviazione della conservazione progettati per supportare processi che prevedano l’inevitabile cambiamento di formato, supporto o altre tecnologie. L’obiettivo principale nella conservazione digitale è quello di costruire sistemi sostenibili piuttosto che supporti permanenti» [11].

[2]Altre tipologie specifiche di scanner planetari sono: Scanner a piani basculanti; Book scanner; Scanner verticali.
[3]Le curve MTF restituiscono parametri tecnici che permettono di giudicare le qualità di una lente in maniera oggettiva. Tali parametri sono: la risoluzione e il contrasto dell’ottica, il suo astigmatismo e l’aberrazione cromatica laterale, il campo di curvatura e lo spostamento di messa a fuoco. Essi aiutano a comprendere la resa di un obiettivo e in molti casi, a fronte di riproduzioni in cui gli originali hanno un elevato dettaglio fine (per esempio, le incisioni), ne guidano la scelta.
[4]Altre tipologie di documenti cartacei (es. Registri catastali) possono essere scansionati in modo tale da comprendere, all’interno della stessa immagine, tutte le fincature della pagina.
[5]Un altro spazio colore disponibile è sRGB; tuttavia, l’uso di Adobe RGB è preferibile per evitare perdite di informazioni (quali tagli - clipping - nei verdi, rossi e arancioni) che spesso si riscontrano utilizzando sRGB. Adobe RGB è uno spazio colore proprietario il cui utilizzo è comunque consigliato in virtù della sua ampia diffusione; è infatti preinstallato all’interno dei software della maggior parte dei corpi macchina disponibili sul mercato.
[6]Tra i profili colore standard più consolidati e “pronti all’uso”, offerti da varie aziende, è fortemente consigliato l’uso del profilo colore Adobe RGB 1998 (Adobe), o ProPhoto RGB (Kodak), in fase di acquisizione digitale, in quanto offrono un gamut molto largo, progettato per l’utilizzo in fotografia. Questo spazio colore contiene più del 90% dei colori possibili nello spazio CIE L*a*b*, ed il 100% dei colori del mondo reale. Questi spazi colore garantiscono un’accuratezza nel dettaglio del colore che è frutto di anni d’esperienza da parte degli sviluppatori/produttori e del loro impiego da parte degli utilizzatori. Quindi il concetto è: usare lo spazio colore che più e meglio includa e interpreti le informazioni acquisite dalla macchina fotografica. Altro motivo per cui è consigliato l’utilizzo dello spazio colore Adobe RGB o ProPhoto RGB è la ormai larga diffusione su scala mondiale, ragione per cui sulla maggior parte dei mezzi fotografici la scelta del profilo colore da impostare ricade su Adobe RGB o sRGB. Tuttavia, è possibile utilizzare software customizzati per la costruzione di profili colore su dispositivi di acquisizione a patto di garantire i risultati ottenibili con i software di aziende commerciali.
[7]https://www.loc.gov/standards/alto/
[8]Breuel, T.M. (2007). The hOCR microformat for OCR workflow and results. Ninth International Conference on Document Analysis and Recognition. IEEE, 2007, Vol. 2, pp. 1063–1067
[9]

Si segnalano alcuni software open source che possono essere utilizzati per OCR:

OCR4all - https://github.com/OCR4all

Tesseract - https://github.com/tesseract-ocr/tesseract

Per HTR:

EScriptorium - https://escriptorium.fr/

[10]Nel 2011, con Decreto della Presidenza del Consiglio dei Ministri (Adozione del Sistema di riferimento geodetico nazionale, 10.11.2011), per agevolare la fruibilità e lo scambio di dati e di informazioni territoriali fra le amministrazioni centrali, regionali e locali, è stato adottato il Sistema di riferimento geodetico nazionale, costituito dalla realizzazione ETRF2000 del Sistema di riferimento geodetico europeo ETRS89, basato sull’ellissoide GRS80 (sostanzialmente coincidente con il successivo WGS84).
[11]IASA-TC 04 (2009, 2nd edition), Guidelines on the Production and Preservation of Digital Audio Objects, p. 90.