Risultati
222 risultati
-
italia
Acronimi
Anagrafe Nazionale dei Numeri Civici e delle Strade Urbane. ANPR. Anagrafe Nazionale della Popolazione Residente. API. Application Programming Interface. CAD. Codice dell’Amministrazione Digitale. CC. Creative Commons. CMS. Content Management System. CPSV. Core Public Service Vocabulary. CSV. Comma Separated Value. DAF. Data & Analytics Framework. DCAT. Data Catalog Vocabulary. DCAT-AP. Data Catalog Vocabulary - Application Profile. DCAT-AP_IT. Data Catalog Vocabulary - Application Profile ITaliano. D.lgs. Decreto Legislativo. GPS. Global Position System. HTTP. HyperText Transfer Protocol. INSPIRE. INfrastructure for SPatial InfoRmation in Europe. ICT. Information and Communication Technology. IoT. Internet of Things. IPA. Indice della Pubblica Amministrazione. ISA. Interoperability Solutions for public Administration. LOD. Linked Open Data. JSON. JavaScript Object Notation. OD. Open Data. ODI. Open Data Institute. OSM. Open Street Map. OWL. Ontology Web Language. OKFN. Open Knowledge Foundation. PA. Pubblica Amministrazione. PSI. Public Sector Information. RDF. Resource Description Framework. RDFS. RDF Schema. RNDT. Repertorio Nazionale Dati Territoriali. SDMX. Statistical Data and Metadata eXchange. SPARQL. Sparql Protocol And Rdf Query Language. URI. Uniform Resource Identifier. XML. eXtensible Markup Language. WGS. World Geodetic System ...
-
italia
Dati della Pubblica Amministrazione
AZIONE 2: RICORDA E VERIFICA ART. 68 COMMA 3 DEL CAD …. Dato pubblico – dato conoscibile da chiunque. A seguito delle modifiche apportate con il D. Lgs. n.179/2016, il CAD non contempla più, tra le altre, la definizione di dato pubblico. Tuttavia, nel contesto delle presenti linee guida, si ritiene opportuno continuare a fare riferimento al concetto di dato pubblico come precedentemente definito. Formato dei dati di tipo aperto - un formato reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi. Dato aperto - un dato che risponde ai seguenti principi di base:. Disponibile (requisito giuridico) secondo i termini di una licenza che ne permetta l’utilizzo da parte di chiunque, anche per finalità commerciali, in formato disaggregato;. Accessibile (requisito tecnologico) attraverso le tecnologie dell’informazione e della comunicazione, in formato aperto e con i relativi metadati;. Gratuito (requisito economico):. disponibili gratuitamente oppure. disponibili ai costi marginali sostenuti per la loro riproduzione, messa a disposizione e divulgazione. AgID, su proposta dell’amministrazione titolare, determina le tariffe standard e le pubblica sul proprio sito istituzionale. Eccezione: dati per i quali le pubbliche amministrazioni e gli organismi di diritto pubblico generano utili sufficienti per coprire una parte sostanziale dei costi di raccolta, produzione, riproduzione e diffusione. Con decreti dei Ministeri competenti, di concerto con il Ministero dell’economia e delle finanze, sentita AgID, si determinano le tariffe e le modalità di versamento a fronte delle suddette attività. Fig. 1 Figura 1: Tipi di dato pubblico della pubblica amministrazione. Le presenti linee guida si applicano al dato pubblico, ovvero al dato della pubblica amministrazione conoscibile da chiunque e non soggetto a restrizioni temporali (e.g., diritto all’oblio). Si escludono pertanto:. i dati personali, per i quali trovano applicazione le norme del «Codice in materia di protezione dei dati personali» (i.e., D.lgs n. 196/2003 e Linee guida in materia di trattamento di dati personali [1]). In questo caso, si ponga anche attenzione a non esporre quasi-identificatori (e.g., data di nascita, domicilio, residenza, sesso, razza, etnia, composizione nucleo famigliare, status giuridico, ecc.) che possono facilmente re-identificare i soggetti che si intende invece tutelare o che hanno una tutela speciale perché appartenenti a fasce protette (e.g., testimoni giudiziari, profughi, rifugiati, pentiti, ecc.). In ogni caso, si raccomanda di verificare gli artt. 3 e 4 del D. Lgs. 36/2006 per una visione approfondita circa le esclusioni e le norme di salvaguardia. Bibliografia. Garante per la Protezione dei Dati Personali, “Linee guida in materia di trattamento di dati personali, contenuti anche in atti e documenti amministrativi, effettuato per finalità di pubblicità e trasparenza sul web da soggetti pubblici e da altri enti obbligati”, http://194.242.234.211/documents/10160/0/Linee+guida+trasparenza+2014.pdf, 2014 ...
-
italia
Scopo e destinatari
Secondo quanto previsto dal CAD (art. 2, commi 2 e 4) per l’applicazione del Capo V, il presente documento è destinato a tutte le pubbliche amministrazioni, alle società interamente partecipate da enti pubblici o con prevalente capitale pubblico inserite nel conto economico consolidato della pubblica amministrazione, come individuate dall’ISTAT ai sensi dell’art. 1, co. 5, della L. 311/2004. Con riferimento alle disposizioni concernenti l’accesso ai documenti informatici e alla fruibilità delle informazioni digitali di cui al capo V del CAD, il documento è destinato anche ai gestori di servizi pubblici e agli organismi di diritto pubblico. In virtù della duplice valenza tecnico-organizzativa delle linee guida, esse si rivolgono sia a figure professionali delle amministrazioni in possesso di competenze tecnico-informatiche (ad esempio, direttori dei sistemi informativi, responsabili siti Web, funzionari e consulenti tecnici), sia a figure professionali individuabili in quelle aree più amministrative preposte all’organizzazione dei dati (ad esempio, responsabili di basi di dati specifiche, responsabili amministrativi, esperti di dominio) ...
-
italia
Modello per i metadati
Per facilitare ulteriormente i possibili fruitori del dato, e quindi favorire il più ampio riutilizzo dei dati, si raccomanda di considerare anche l’aggiunta di:. metadati che forniscono una descrizione dello schema del dataset da pubblicare. Nel caso di dati espressi secondo il livello 3 del modello per i dati, lo schema rappresenta l’insieme degli attributi elencati; nel caso dei livelli 4 e 5 esso può essere rappresentato dalle ontologie che accompagnano i dati;. metadati che forniscono un riscontro della qualità dei dati esposti e di come tale qualità è misurata e certificata. In quest’ultimo caso, si raccomanda di utilizzare le linee guida del W3C pubblicate dal gruppo di lavoro su «Data on the Web Best Practices: Data Quality Vocabulary”. Avvertimento. Nell’ambito del piano triennale per l’informatica nella PA (2017-2019), è stato individuato un elenco di basi di dati chiave da rendere disponibili secondo il paradigma dei dati aperti. In particolare per queste basi di dati, saranno sviluppate una serie di ontologie/modelli per i dati di riferimento che dovranno essere utilizzati per la definizione della struttura del dato ...
-
italia
Normativa di Riferimento
Molte amministrazioni (regioni e comuni in particolare) hanno affrontato internamente il tema dei dati di tipo aperto definendo delle linee guida per l’individuazione delle basi di dati pubbliche in loro possesso e per le relative modalità di apertura. Le linee guida sono di solito approvate con atti amministrativi quali Deliberazioni di Giunta (come nel caso dei comuni per esempio). Tali deliberazioni hanno valore di indicazione operativa e di processo per l’ente pubblico che se ne dota, ma se un contenuto/obiettivo delle linee guida non viene rispettato/raggiunto, di solito nella pratica non vengono attivate penalità o sanzioni interne. Nella difficoltà di tener conto delle diverse iniziative (e dei relativi aggiornamenti) si è quindi ritenuto di non riportare più, in questa sede, l’elenco analitico-descrittivo delle stesse. Nota. Tuttavia, in generale, al fine di rendere sistemico e omogeneo su scala nazionale il processo di valorizzazione dei dati pubblici, regolamenti locali o interni, inclusi quelli futuri di cui le pubbliche amministrazioni vorranno dotarsi, devono uniformarsi ai principi e alle linee d’azione delle presenti linee guida, nonché alla strategia in materia di dati aperti definita nel piano triennale per l’ICT nella pubblica amministrazione, previsto dalle disposizioni di cui all’art.1, comma 513 e seguenti della legge 28 dicembre 2015, n.208 (Legge di stabilità 2016). Si noti che ai sensi dell’art. 1 comma 517 della legge di stabilità 2016, la mancata osservanza delle disposizioni dei commi 512-516 (e quindi dell’adeguamento al piano triennale), rileva ai fini della responsabilità disciplinare e per danno erariale. Infine, l’articolo 52 comma 4 prevede che le attività volte a garantire l’accesso telematico e il riutilizzo dei dati delle pubbliche amministrazioni rientrano tra i parametri di valutazione delle performance dirigenziale ai sensi dell’articolo 11, comma 9, del d.lgs 27 ottobre 2009, n.150 ...
-
italia
Pubblicazione e dati.gov.it
Nota. AZIONE 15: ASSICURATI CHE I METADATI RELATIVI AI TUOI DATASET SIANO PRESENTI NEL PORTALE NAZIONALE DEI DATI …. Ai sensi dell’articolo 1 comma 8 del D.Lgs. 18 Maggio 2015, n.102, il portale nazionale dei dati aperti (dati.gov.it) è l’unico riferimento per la documentazione e la ricerca di tutti i dati aperti della pubblica amministrazione. Esso, inoltre, è l’unico ad abilitare il colloquio con l’analogo portale europeo . Il portale nazionale dei dati aperti include i metadati, conformi al profilo DCAT-AP_IT, che descrivono i dati aperti delle amministrazioni. Le amministrazioni sono tenute pertanto a inserire e a mantenere aggiornati, attraverso le modalità di alimentazione previste dal catalogo, tali metadati. I dati primari, il cui riferimento è pubblicato sul portale nazionale, rimangono presso il titolare del dato che conserva la responsabilità della loro divulgazione a livello nazionale. Come già precedentemente riportato, i dati geografici devono essere documentati esclusivamente presso il Repertorio Nazionale dei Dati Territoriali (RNDT) che, in maniera automatizzata, si occupa dell’allineamento con il portale nazionale dei dati. L’architettura complessiva dell’attuale portale nazionale dei dati aperti e il suo interfacciamento con analoghi cataloghi delle pubbliche amministrazioni e con il portale europeo sono illustrati in Figura 8. Fig. 8 Figura 8: Architettura di alto livello del portale nazionale dei dati. Come mostrato in figura, esso si basa su DKAN, uno strumento Open Data interamente integrato e gestito nell’ambito di Drupal, che offre funzionalità di catalogazione, pubblicazione e visualizzazione dei dati. Attualmente il front-end del portale ha solo una parte di libero accesso, dove chiunque può ricercare, visionare e riutilizzare i metadati inclusi nel catalogo. Il back-end ha il compito di predisporre i metadati per l’harvesting da parte del portale europeo e prevede una funzionalità di harvesting periodica (con frequenza settimanale) e automatizzata verso i cataloghi dei dati aperti delle altre amministrazioni. Nel portale disponibile online si supporta harvesting basato su API REST (le API sono quelle disponibili CKAN - versione 3. CKAN è una piattaforma di gestione dei dati - Data Management System - disaccoppiata da specifici CMS). Nota. Nel corso del 2017, come previsto dal piano di evoluzione del portale, si renderà disponibile anche un’altra modalità per la documentazione dei dati sul portale nazionale, i.e., un’applicazione Web che consente di inserire i metadati già conformi al profilo DCAT-AP_IT. La tabella seguente fornisce indicazioni di massima sulle modalità di alimentazione adottabili a seconda del proprio contesto. Le modalità tengono anche conto della disponibilità futura dell’applicazione Web suddetta,. Numero di dataset e relativo. aggioramento. Modalità di alimentazione. . . Pochi dataset (nell’ordine delle decine). frequenza di aggiornamento molto ampia. (e.g., annuale, semestrale) oppure anche più. regolare (e.g., trimestrale). Uso del web editor che guida nella definizione. dei metadati, già predisposti per essere. conformi a DCAT-AP_IT. . . Molti dataset (nell’ordine delle centinaia e. oltre) – frequenza di aggiornamento sia ampia,. sia regolare e molto breve (e.g., giornaliera). . . Alimentazione e aggiornamento automatico e. periodico del portale attraverso funzionalità di. harvesting verso i cataloghi dei dati delle. pubbliche amministrazioni. Per tutti i dataset relativi a dati geografici. . . . . . . . . . . Strumenti di alimentazione del catalogo RNDT. Il portale nazionale dei dati sarà alimentato in. maniera trasparente per le amministrazioni e. automatizzata attraverso l’RNDT, grazie alla. futura implementazione da parte di quest’ultimo. dell’estensione GeoDCAT-AP per dati geografici. Governance per la raccolta dei dati dalle PA. Al fine di evitare duplicazioni di dati e di ridurre la complessità della raccolta centrale di informazioni sui dataset presenti nei cataloghi delle amministrazioni, si adotta un modello di governance del processo di alimentazione del catalogo nazionale dati.gov.it. Il modello di governance prevede di avvalersi dei principi di sussidiarietà verticale, già in precedenza menzionati. Nell’ambito locale, il modello attribuisce alle Regioni il ruolo di aggregatori territoriali [9]. In sostanza, la Regione, ove possibile, si coordina con le varie amministrazioni che operano nell’ambito territoriale della Regione stessa, raccogliendo le informazioni sui dataset disponibili in Open Data e assicurando una adeguata frequenza di aggiornamento. Le amministrazioni locali delegano così la Regione all’esposizione dei propri metadati e possono evitare di richiedere direttamente la raccolta degli stessi da parte del portale nazionale; quest’ultimo si interfaccia quindi con i soli cataloghi regionali. Qualora tale modello non possa essere applicato (e.g., mancanza di un catalogo regionale, difficoltà, anche tecniche, di colloquio tra i diversi livelli amministrativi locali), le amministrazioni locali possono riferirsi direttamente al portale nazionale per la raccolta dei propri metadati, secondo le modalità esposte da dati.gov.it. Lo stesso modello può applicarsi nei casi di amministrazioni centrali che svolgono un ruolo di “coordinamento” nei riguardi di altre amministrazioni. In questo caso, si richiede che le amministrazioni comunichino tale situazione al portale nazionale durante la fase di richiesta di harvesting. Note. [9]. Questo ruolo già si evidenzia in alcuni casi come la provincia autonoma di Trento, la regione Lombardia, la regione Emilia Romagna, la regione Toscana, per citare alcuni casi. Evoluzione del portale dati.gov.it. L’evoluzione del portale dati.gov.it, come prevista dal piano triennale, coinvolge diversi aspetti sia tecnici che di contenuto. Dal punto di vista dei contenuti, l’attuale dati.gov.it è il catalogo di dati aperti nazionale. A corredo del catalogo, sul relativo sito Web sono pubblicate ulteriori informazioni sul tema dei dati aperti (e.g., riferimenti normativi e alle linee guida, eventi, operazioni di monitoraggio). Nell’evoluzione del portale, oltre a queste informazioni, si prevede, tra gli altri, di:. estendere la catalogazione ai dati pubblici delle amministrazioni (open data e non open data);. raccontare storie (di successo) dell’uso dei dati;. abilitare la possibilità di creare visualizzazioni dei dati secondo anche le necessità degli utenti;. consentire agli utenti di avviare discussioni e richieste per ciascun dato catalogato. Dal punto di vista tecnico, l’alimentazione del catalogo avverrà secondo le due modailtà precedentemente menzionate, ovvero mediante harvesting, anche di metadati conformi al profilo DCAT-AP_IT resi disponibili secondo lo standard RDF (nelle sue serializzazioni RDF/XMl, RDF/Turtle e JSON-LD) e mediante un’applicazione Web accessibile previa autenticazione a un’apposita area privata riservata alle pubbliche amministrazioni. L’architettura complessiva del catalogo sarà diversa da quella attualmente disponibile. In particolare, l’architettura disaccoppierà la parte di front-end dalla parte di back-end, quest’ultima interamente gestita mediante la piattaforma CKAN e con metadati anche disponibili su SPARQL endpont, esattamente come accade per il portale europeo dei dati. I due livelli front-end e back-end interagiscono grazie a un livello intermedio chiamato front-end server. Per front-end server si intende un’applicazione che espone come unica vista una collezione di servizi RESTful con una rappresentazione dei contenuti di tipo JSON organizzati secondo una filosofia di tipo Resource Oriented Architecture (ROA). La figura 9 illustra l’approccio architetturale che sarà adottato. Fig. 9 Figura 9: Architettura di alto livello del futuro portale nazionale dei dati. Questo modello garantisce di poter estendere il perimetro dei servizi offerti, mantenendo un approccio elastico e sostanzialmente neutro rispetto al contenuto degli stessi servizi. I vantaggi ottenibili sono quindi:. un controllo completo del livello dei “dati” non avendo nessuna dipendenza da un contenitore come ad esempio un CMS;. un front-end autonomo e sviluppato secondo standard quali HTML5, javascript, con una estesa esperienza utente che prescinda dal back-end;. un unico contratto di accesso ai dati fornito ai client, come un unico “schema” JSON da integrare, evitando dipendenze dirette da strutture dati di terze parti (e.g., CKAN);. un maggior controllo centrale su requisiti non funzionali quali sicurezza, anonimizzazione, logging, analisi, etc. Ulteriori elementi di federazione. I meccanismi di alimentazione del portale nazionale abilitano, di fatto, una federazione tra portali di pubbliche amministrazioni. Si possono individuare anche ulteriori modalità di federazione e condivisione. Per esempio, un’amministrazione può mettere a disposizione di altre la propria soluzione Open Data (e.g., un’amministrazione regionale dotata di una piattaforma Open Data la può mettere a disposizione dei comuni della regione, e si raccomanda di farlo). Nell’ambito invece del paradigma Linked Data, si segnala che il W3C ha definito uno standard per federare SPARQL endpoint. Lo standard prevede una sintassi aggiuntiva per SPARQL in grado di considerare, in una stessa “query”, dati provenienti da SPARQL endpoint differenti. Inoltre, lo standard prevede funzioni per cui molteplici SPARQL endpoint gestiscono, in maniera del tutto trasparente per l’utente, l’invio della “query” a più endpoint o la scomposizione della “query” e la ricomposizione dei frammenti del risultato finale. In generale, al meglio delle nostre conoscenze, la federazione di SPARQL endpoint rimane ancora confinata a soluzioni di ricerca ...
-
italia
Riepilogo delle azioni
ASSICURATI CHE I METADATI RELATIVI AI TUOI DATASET SIANO PRESENTI NEL PORTALE NAZIONALE DEI DATI …. Ai sensi dell’articolo 1 comma 8 del D.Lgs. 18 Maggio 2015, n.102, il portale nazionale dei dati aperti (dati.gov.it) è l’unico riferimento per la documentazione e la ricerca di tutti i dati aperti della pubblica amministrazione. Esso, inoltre, è l’unico ad abilitare il colloquio con l’analogo portale europeo . Il portale nazionale dei dati aperti include i metadati, conformi al profilo DCAT-AP_IT, che descrivono i dati aperti delle amministrazioni. Le amministrazioni sono tenute pertanto a inserire e a mantenere aggiornati, attraverso le modalità di alimentazione previste dal catalogo, tali metadati. I dati primari, il cui riferimento è pubblicato sul portale nazionale, rimangono presso il titolare del dato che conserva la responsabilità della loro divulgazione a livello nazionale. Come già precedentemente riportato, i dati geografici devono essere documentati esclusivamente presso il Repertorio Nazionale dei Dati Territoriali (RNDT) che, in maniera automatizzata, si occupa dell’allineamento con il portale nazionale dei dati ...
-
italia
Aspetti organizzativi e qualità dei dati
Nota. AZIONE 9: GARANTISCI LE SEGUENTI DIMENSIONI DI QUALITA” DEI DATI …. Partendo dalle quattro caratteristiche, delle 15 previste dall’ISO/IEC 25012, individuate nella Determinazione Commissariale n. 68/2013 dell’AgID per le banche dati di interesse nazionale critiche, si garantisce il loro costante rispetto in tutto il processo di gestione e pubblicazione dei dati anche aperti. Queste quattro caratteristiche sono:. accuratezza (sintattica e semantica) - il dato, e i suoi attributi, rappresenta correttamente il valore reale del concetto o evento cui si riferisce;. coerenza - il dato, e i suoi attributi, non presenta contraddittorietà rispetto ad altri dati del contesto d’uso dell’amministrazione titolare;. completezza – il dato risulta esaustivo per tutti i suoi valori attesi e rispetto alle entità relative (fonti) che concorrono alla definizione del procedimento;. attualità (o tempestività di aggiornamento) - il dato, e i suoi attributi, è del “giusto tempo” (è aggiornato) rispetto al procedimento cui si riferisce. Il miglioramento della qualità dei dati, e la maggiore diffusione delle tecniche di misurazione, dipende da vari fattori tra cui l’adesione a modelli di qualità condivisi. Il raggiungimento della qualità non è in ogni caso frutto di un impegno sporadico di singole amministrazioni, ma il frutto di una sinergia concertata che, basata su un cambio culturale, si apra a collaborazioni orizzontali che, pur nel rispetto della privacy, consentano un maggior dialogo tra le banche dati e razionalizzazione delle informazioni. Per determinare la bontà dei dati è necessario definire delle misure attraverso le quali quantificare la qualità dei dati. Lo standard ISO/IEC 25012:2008, divenuto norma italiana UNI ISO/IEC 25012:2014, definisce un insieme di caratteristiche specifiche per la caratterizzazione della qualità dei dati: accuratezza, aggiornamento, completezza, consistenza, credibilità, accessibilità, comprensibilità, conformità, efficienza, precisione, riservatezza, tracciabilità, disponibilità, portabilità e ripristinabilità. Di queste caratteristiche, le presenti linee guida richiedono la garanzia di almeno quattro come elencate in azione 9, ovvero accuratezza, coerenza, completezza e attualità (o tempestività di aggiornamento). Il passo successivo è quantificarle in termini di misure, individuando delle soglie che consentano di discriminare la bontà o meno di un dato rispetto alla caratteristica in esame. La fase di valutazione della qualità dei dati è importante in tutti i sistemi informativi indipendentemente dall’apertura dei dati. Con l’adozione di politiche di apertura dei dati, la qualità dei dati assume un ruolo ancora più rilevante in quanto elemento per la certificazione della bontà dei dati forniti e soprattutto dell’appropriatezza rispetto all’utilizzo che del dato si vuole fare. L’ISO/IEC 25024 estende l’ISO/IEC 25012 “Data quality model” del 2008 al campo delle misurazioni, definendo 63 misure di qualità applicabili alle 15 caratteristiche di qualità dei dati, con le relative funzioni di calcolo. Per le quattro caratteristiche di qualità, messe in risalto dalla Determinazione Commissariale dell’Agenzia per l’Italia Digitale n. 68/2013, si riporta nella tabella seguente un insieme esemplificativo di misure, sulle 24 definite nello standard ISO per le stesse caratteristiche, a supporto delle attività di valutazione della qualità dei dati delle amministrazioni. Caratteristiche di qualità. Caratteristiche. Descrizione. Misure e funzioni di misura principali. Completezza. il grado per cui il. dato associato a. un’entità presenta. valori per tutti. gli attributi attesi. e relative istanze. in un certo contesto. Si individuano le i seguenti livelli di completezza:. 1. completezza di schema: 1) percentuale di valori nulli. per concetti e proprietà rispetto al numero totale di valori. attesi;. 2. completezza dei record: 2) numero di dati elementari. associati a un valore non nullo in un record, rispetto al. numero di dati elementari del record per cui può essere. misurata la completezza;. 3. completezza di popolazione: percentuale di valori nulli. rispetto a una popolazione di riferimento. Si noti che non sempre valori mancanti indicano. incompletezza. Per esempio: si supponga di considerare. dati relativi ai musei italiani e ai loro canali di contatto. (telefono ed email). Può capitare che i musei abbiano tutti. un indirizzo email ma non per tutti è presente un numero. di telefono. Accuratezza. Il grado in cui. gli attributi. rappresentano in. maniera corretta il. valore reale del. dato in uno. specifico contesto. Si individuano due tipi di accuratezza:. 1. sintattica: ad esempio Girgia invece che Giorgia. 2. semantica: ad esempio nel caso in cui si utilizzi. Gloria Sani intendendo invece un’altra persona e.g.,. Giorgia Sani. Una misura dell’accuratezza è data dalla ratio tra gli. attributi dei dati che hanno valori accurati. sintatticamente/semanticamente su il numero di attributi. dei dati per i quali è richiesta accuratezza. sintattica/semantica. Coerenza. Il grado in cui gli. attributi del dato. non sono in. contraddizione con. altri dati in uno. specifico contesto. Per poter valutare la coerenza una misura è quella che. consente di identificare le violazioni di regole semantiche. definite su alcuni elementi dei dati. Per esempio, se una persona è “patentata” non può essere. possibile che la sua età sia “17 anni”. Essa può essere calcolata come la ratio tra il numero di. attributi dei dati i cui valori sono semanticamente corretti. nel dataset sul numero di attributi dei dati per i quali. sono state definite delle regole semantiche. Altra misura consiste nel rapporto tra il numero di valori. duplicati per ogni attributo della base dati e il numero. totale degli elementi della base dati. Tempestività. Il grado in cui gli. attributi del dato. sono al «giusto. tempo» rispetto al. contesto di. riferimento. La metrica è basata sull’uso dei metadati che indicano. quando il dato è stato aggiornato l’ultima volta. Sulla base di questi metadati, si distinguono poi:. 1. dati con periodicità di aggiornamento nota: in. questo caso 1) è possibile calcolare la tempestività in. maniera esatta identificando se la data di ultima modifica. del dato rispetto al tempo di misurazione ricade. nell’intervallo della frequenza di aggiornamento;. 2. dati con periodicità di aggiornamento media:. in questo caso è possibile calcolare la tempestività. media con una percentuale di errore. Certificati Open Data ODI. A completamento della suddetta analisi, si ricorda anche un’iniziativa nota dell’Istituto Open Data inglese (ODI) sui certificati Open Data. I certificati sono uno strumento utile per ottenere un’auto-certificazione sulla qualità dei dati prodotti e pubblicati. I certificati sono stati tradotti anche in italiano dal nodo dell’ODI di Trento. Per ottenere il certificato è necessario compilare un questionario online suddiviso in cinque macro- categorie che aiutano a identificare una scala di riutilizzo di un dataset. Queste sono: informazioni descrittive (molte delle quali già richieste dalle presenti linee guida), informazioni legali (che devono aver già trovato risposte positive ed esaustive mediante la “check list” proposta nella fase di analisi giuridica delle fonti), informazioni pratiche (e.g., reperibilità, note metodologiche, ecc.), informazioni tecniche e informazioni sociali. Le risposte alle domande producono un livello di certificazione che si distingue in: (i) “bronze”, che rappresenta una base per iniziare il processo di apertura dei dati; (ii) “silver”, dove il dato è documentato in un formato aperto e machine-readable e gli utilizzatori dei dati possono ricevere maggior supporto; (iii) “gold”, che fornisce le garanzie del livello precedente con ulteriori riguardanti l’aggiornamento costante e un più ampio supporto, (iv) “platinum”, che racchiude le garanzie gold, identificatori univoci dei dati; rappresenta quindi un’eccellente esempio di infrastruttura informativa. Nota. Un analogo concetto ai certificati ODI è applicato nell’ambito del Data & Analytics Framework per i dataset (aperti e non) che esso tratta ...
-
italia
Modello per i dati aperti
Livello 1. Informazione: Dati disponibili tramite una licenza aperta e inclusi in documenti leggibili e interpretabili solo grazie a un significativo intervento umano (e.g., PDF);. Accesso: Prevalentemente umano, necessario anche per dare un senso ai dati inclusi nei documenti;. Servizi: Solo rilevanti interventi umani di estrazione ed elaborazione dei possibili dati consentono di sviluppare servizi con l’informazione disponibile in questo livello. Livello 2. Informazione: Dati disponibili in forma strutturata e con licenza aperta. Tuttavia, i formati sono proprietari (e.g., Excel) e un intervento umano è fortemente necessario per un’elaborazione dei dati;. Accesso: I programmi possono elaborare i dati ma non sono in grado di interpretarli; pertanto è necessario un intervento umano al fine di scrivere programmi ad-hoc per il loro utilizzo;. Servizi: Servizi ad-hoc che devono incorporare i dati per consentire un accesso diretto via Web agli stessi. Livello 3. Informazione: Dati con caratteristiche del livello precedente ma in un formato non proprietario (e.g., CSV, JSON, geoJSON). I dati sono leggibili da un programma ma l’intervento umano è necessario per una qualche elaborazione degli stessi;. Accesso: I programmi possono elaborare i dati ma non sono in grado di interpretarli; pertanto è necessario un intervento umano al fine di scrivere programmi ad-hoc per il loro utilizzo;. Servizi: Servizi ad-hoc che devono incorporare i dati per consentire un accesso diretto via Web agli stessi. Livello 4. Informazione: Dati con caratteristiche del livello precedente ma esposti usando standard W3C quali RDF e SPARQL I dati sono descritti semanticamente tramite metadati e ontologie;. Accesso: I programmi sono in grado di conoscere l’ontologia di riferimento e pertanto di elaborare i dati quasi senza ulteriori interventi umani;. Servizi: Servizi, anche per dispositivi mobili, che sfruttano accessi diretti a Web per reperire i dati di interesse. Livello 5. Informazione: Dati con caratteristiche del livello precedente ma collegati a quelli esposti da altre persone e organizzazioni (i.e., Linked Open Data [2]). I dati sono descritti semanticamente tramite metadati e ontologie. Essi seguono il paradigma RDF (si veda Architettura dell’informazione del settore pubblico), in cui alle “cose” (o entità) è assegnata un URI univoca sul Web. Conseguentemente tale URI può essere utilizzata per effettuare accessi diretti alle informazioni relative a quella entità. I dati sono detti “linked” per la possibilità di referenziarsi (i.e., “collegarsi”) tra loro. Nel referenziarsi, si usano relazioni (“link”) che hanno un preciso significato e spiegano il tipo di legame che intercorre tra le due entità coinvolte nel collegamento. I Linked (Open) Data sono quindi un metodo elegante ed efficace per risolvere problemi di identità e provenienza, semantica, integrazione e interoperabilità. Triple RDF i cui URI non siano utilizzabili da un agente Web per recuperare le informazioni a essi associati, non possono essere considerati pienamente conformi al paradigma Linked Data. Nei caso dei Linked Open Data l’intervento umano si può ridurre al minimo e talvolta addirittura eliminare;. Accesso: II programmi sono in grado di conoscere l’ontologia di riferimento e pertanto di elaborare i dati quasi senza ulteriori interventi umani;. Servizi: Servizi, anche per dispositivi mobili, che sfruttano sia accessi diretti a Web sia l’informazione ulteriore catturata attraverso i link dei dati di interesse, facilitando il mashup di dati. Bibliografia. [2]. https://www.ted.com/talks/tim_berners_lee_on_the_next_web?nolanguage=en%2C ; https://www.w3.org/DesignIssues/LinkedData.html ; http://linkeddatabook.com/editions/1.0/ ; http://linkeddata.org/home ...
-
italia
Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico
Indice dei contenuti ...
-
italia
Executive Summary
Il presente documento di linee guida aggiorna il precedente, già pubblicato dall’Agenzia nel corso del 2016, con alcuni elementi di novità che sono elencati, in dettaglio, nella sezione revisioni. Il documento mira a fornire indicazioni puntuali sui passi da seguire per mettere in piedi un processo standardizzato di gestione del dato (aperto) presso le pubbliche amministrazioni. Pertanto, la principale struttura ad azioni, già introdotta lo scorso anno, è rimasta invariata e anzi rafforzata dall’introduzione di una sezione di riepilogo delle stesse, per una più rapida consultazione delle linee guida. È opinione abbastanza diffusa, soprattutto tra le comunità e gli addetti ai lavori, che, nonostante gli sforzi profusi negli scorsi anni a livello centrale come a livello locale, i risultati della valorizzazione del patrimonio informativo pubblico siano ancora troppo spesso confinati a iniziative virtuose isolate di alcune amministrazioni. Il principio dell’open data by default, introdotto nel 2012 con la modifica dell’articolo 52 del Codice dell’Amministrazione, per cui “i dati e i documenti che le amministrazioni titolari pubblicano senza l’espressa adozione di una licenza si intendono rilasciati come dati di tipo aperto”, a oggi non può più considerarsi sufficiente. Tuttavia, da allora altri importanti cambiamenti normativi sono intervenuti soprattutto per quel che riguarda il recepimento della nuova direttiva Europea 2013/37/UE, detta PSI 2.0, che impone alle amministrazioni azioni finalizzate al riutilizzo dei dati pubblici anche per fini commerciali. Il patrimonio informativo pubblico è comunque vasto e articolato, con diverse tipologie di dati che devono essere considerate in una strategia complessiva di valorizzazione. Il “Piano Triennale per l’informatica nella Pubblica Amministrazione (2017-2019)» pone particolare attenzione al tema delle infrastrutture immateriali e delle basi di dati prevedendo, tra le altre, azioni specifiche attinenti a: i) basi di dati di interesse nazionale, ii) rilascio di dati pubblici secondo il paradigma dell’Open Data e loro riutilizzo, iii) definizione di vocabolari controllati e modelli per i dati, e, in ultimo, iv) creazione del Data & Analytics Framework, ossia una piattaforma creata per valorizzare il patrimonio informativo pubblico nazionale attraverso lo sviluppo e la semplificazione dell’interoperabilità dei dati pubblici tra amministrazioni e la standardizzazione e promozione degli Open Data. La strategia suggerisce quindi un percorso che passa dall’individuazione di basi di dati di interesse nazionale, ovvero altamente affidabili ed essenziali per un elevato numero di procedimenti amministrativi (altrimenti dette base register secondo la terminologia prevista nell’ambito dell’European Interoperability Framework), all’apertura, secondo l’Open Data, della gran parte dei dati prodotti dalle amministrazioni, nel rispetto degli ambiti di applicazione previsti dalle norme, alla definizione di vocabolari controllati e modelli per i dati da rendere disponibili in un apposito registro consultabile da chiunque, fino alla messa a disposizione del Data & Analytics Framework che offre, tra gli altri, un servizio di Open Data as a Service (ODasS) certificati. Nel contesto dei dati aperti, la strategia complessiva include inoltre:. l’individuazione di un gruppo ristretto di basi di dati chiave che concorrono a descrivere fenomeni a livello nazionale in maniera standardizzata e per cui la disponibilità secondo i principi dell’Open Data diventa strategica. Tali elementi costituiscono anche la base di riferimento per diverse azioni di monitoraggio che devono essere intraprese per dar seguito sia agli impegni assunti nell’ambito del piano triennale, sia a quelli presi nell’ambito dell’accordo di partenariato 2014-2020, per l’impiego dei fondi strutturali e di investimento europei, sia alle disposizioni dell’articolo 52 del Codice dell’Amministrazione Digitale e della suddetta Direttiva PSI 2.0. In questo scenario, il presente documento introduce ulteriori raccomandazioni per la definizione di dataset e distribuzioni, rese necessarie anche osservando la pratica delle amministrazioni nell’uso del profilo di metadatazione DCAT-AP_IT. Inoltre, il documento espone un rinnovato scenario per il portale dati.gov.it, nonché un modello di governance per l’alimentazione dello stesso, emerso anche a seguito della messa in produzione di una nuova versione del portale all’inizio del 2017. Infine, l’aggiornamento delle linee guida mira a porre l’accento su un processo di standardizzazione dei dati pubblici, che passa anche attraverso la definizione di modelli per i dati condivisi a livello nazionale, già in parte introdotti con l’architettura di riferimento per l’informazione del settore pubblico. In questa nuova versione delle linee guida alcuni modelli per i dati sono riferiti al suddetto insieme di basi di dati chiave, che saranno rilasciate secondo il paradigma degli Open Data seguendo un percorso di qualità, grazie anche all’uso del Data & Analytics Framework ...
-
italia
Aspetti legali e di costo
Nota. AZIONE 13: DEFINISCI GLI ASPETTI DI COSTO PER I DATI …. Premesse le azioni di condivisione dei dati tra pubbliche amministrazioni per finalità istituzionali (art. 50 del CAD), che avvengono esclusivamente a titolo gratuito, nel caso dell’Open Data si suggerisce azioni volte a renderli disponibili esclusivamente a titolo gratuito. Tuttavia, è prevista la possibilità di richiedere per il riutilizzo dei dati un corrispettivo specifico, limitato ai costi sostenuti effettivamente per la riproduzione, messa a disposizione e divulgazione dei dati. In tali casi, come previsto dall’art. 7 del D.Lgs 24 gennaio 2006, n. 36, AgID determina, su proposta motivata del titolare del dato, le tariffe standard da applicare, pubblicandole sul proprio sito istituzionale. Nel pieno rispetto dei principi di trasparenza e verificabilità, tali tariffe sono determinate sulla base del “Metodo dei costi marginali” esplicitato nella Comunicazione della Commissione 2014/C - 240/01 contenente, tra gli altri, gli orientamenti sulla tariffazione. In linea con quanto previsto dalla direttiva comunitaria, il citato articolo 7 del D. Lgs. 36/2006 prevede inoltre casi specifici per i quali è possibile determinare tariffe superiori ai costi marginali in deroga al principio generale di rendere disponibili i dati gratuitamente o a costi marginali, ovvero:. alle biblioteche, comprese quelle universitarie, di musei e archivi;. alle amministrazioni e agli organismi di diritto pubblico che devono generare utili per coprire una parte sostanziale dei costi inerenti allo svolgimento dei propri compiti di servizio pubblico;. ai casi eccezionali relativi a documenti per i quali le pubbliche amministrazioni e gli organismi di diritto pubblico sono tenuti a generare utili sufficienti per coprire una parte sostanziale dei costi di raccolta, produzione, riproduzione e diffusione. In tutti i tre casi, i Ministeri competenti, di concerto con il Ministero dell’economia e delle finanze, sentita AgID, determinano, con appositi decreti, i criteri generali per le tariffe e le relative modalità di versamento, mantenendo aggiornate le stesse ogni due anni. Nel primo caso, l’importo delle tariffe comprende i costi di raccolta, produzione, riproduzione, diffusione, conservazione e gestione dei diritti, maggiorati, nel caso di riutilizzo per fini commerciali, di un congruo utile da determinarsi in relazione alle spese per investimenti sostenute nel triennio precedente. Negli altri due casi l’importo delle tariffe comprende i costi di raccolta, produzione, riproduzione, diffusione, maggiorati di un congruo utile, da determinarsi con appositi decreti, nei casi di riutilizzo per fini commerciali e in relazione alle spese per investimenti sostenute nel triennio precedente. Nei tre casi di cui sopra, in presenza di riutilizzo dei dati per scopi non commerciali è prevista una tariffa differenziata da determinarsi con le modalità suddette secondo il criterio della copertura dei soli costi effettivi sostenuti dalle amministrazioni. Alla data di pubblicazione delle presenti linee guida, non si riscontrano ancora casi specifici di applicazione dei suddetti principi di tariffazione. Nota. Nei casi eccezionali di applicazione di tariffe superiori ai costi marginali, va tenuto conto delle indicazioni contenute nella Comunicazione della Commissione 2014/C - 240/01, “Metodo del recupero dei costi”. Inoltre, è possibile avvalersi di metodi di analisi dei costi (e.g., Activity Based Costing, che assegna costi ai prodotti, servizi, progetti e compiti sulla base sia delle attività svolte per gli stessi sia delle risorse consumate per tali attività) che siano oggettivi, trasparenti e verificabili. A seguito di tale analisi, l’amministrazione può considerare un modello di business per la determinazione delle tariffe. Un elenco non esaustivo di possibili modelli di business è riportato nelle linee guida per la valorizzazione del patrimonio informativo pubblico (anno 2014). Questi modelli sono stati presentati nel progetto europeo Share-PSI 2.0, nell’ambito del workshop “A Self Sustaining Business Model for Open Data” e possono ancora essere considerati un riferimento per gli scopi del presente aggiornamento delle linee guida ...