Open Data: cosa sono, come sfruttarli e stato dell’arte in Italia

Si parla sempre più spesso di Open Data, ma cosa sono in realtà? Ecco un articolo di approfondimento sui dati aperti, sul loro riutilizzo e sulle licenze indispensabili per la loro pubblicazione.

di Marina Bassi Project Officer Area Ricerca, Advisory e Formazione FPA

Gli Open Data, o dati aperti, sono dati accessibili a tutti, messi a disposizione da Pubbliche Amministrazioni o aziende private che possono essere riutilizzati per diversi scopi.

In questo articolo andremo a vedere cosa sono nello specifico gli Open Data, a cosa servono e alcuni casi interessanti di riutilizzo.

Cosa sono gli open data e a cosa servono

Concezione e storia degli Open Data

L’approccio alla cosiddetta governance della cosa pubblica si è affermato a livello internazionale nel 2009. Nello stesso giorno del suo insediamento e come primo atto, il presidente degli Stati Uniti Barack Obama ha, infatti, pubblicato un memorandum sulla trasparenza e l’Open Government indirizzato ai dirigenti della sua amministrazione.

Il testo si apre con questa affermazione:

La mia amministrazione si impegna a dare vita a un grado di apertura (openness) nel governo senza precedenti. Lavoreremo assieme per assicurare la fiducia pubblica e per stabilire un sistema basato sulla trasparenza, sulla partecipazione pubblica e sulla collaborazione. L’apertura rafforzerà la nostra democrazia e promuoverà l’efficienza e l’efficacia dell’amministrazione.

Al Memorandum hanno fatto seguito, poco più di un anno dopo, la Open Government Directive dell’8 dicembre del 2009, incentrata sui principi di Trasparenza, Partecipazione e Collaborazione, che prescrive compiti, processi e modelli organizzativi che gli enti pubblici sono chiamati a seguire, e la Open Government Initiativeche raccoglie le iniziative per l’Open Government dell’amministrazione federale americana in un sito progettato per favorire la partecipazione e i feedback dei visitatori.

Sull’esempio americano molti Paesi si sono avvicinati al tema dell’Open Government, avviando il processo di cambiamento dello scenario pubblico, verso una maggiore trasparenza e vicinanza ai cittadini.

Organizzazioni internazionali

Nel 2010 due rapporti internazionali hanno presentato e raccomandato il modello Open Government come chiave per lo sviluppo del settore pubblico e del tessuto produttivo: il rapporto dell’OCSE “Towards smarter and more transparent government” e il Rapporto UN sullo stato di eGovernment nel mondo ha raccomandato l’adozione di modelli amministrativi aperti.

Unione Europea

In Europa, è la Dichiarazione di Malmo sulle politiche di eGovernment del 2009 a proporre un primo percorso di apertura delle amministrazioni europee in 5 anni.

Italia

Nel 2011, è stata lanciata l’iniziativa internazionale Open Government Partnership per l’impegno concreto da parte dei governi per promuovere la trasparenza, responsabilizzare i cittadini, combattere la corruzione e rafforzare la governance attraverso la tecnologia. L’Italia ha aderito all’iniziativa nel settembre 2011 e, nell’aprile del 2012, ha presentato un Piano d’azione nazionale contenente le principali iniziative che il Governo ha assunto in materia di Open Government, aggiornato nel 2014 con il Secondo piano d’azione.

Riuso dei dati aperti (riuso commerciale, accountability, Data Visualization)

L’Unione europea stima  che la crescente disponibilità di dati aperti resi disponibili dai 27 Paesi membri possa portare nel 2020 un ritorno economico di 75,7 miliardi di euro, creando quasi 25.000 nuovi posti di lavoro collegati al settore dell’analisi dei dati entro lo stesso anno.

Le imprese possono beneficiare dalla nuova conoscenza che deriva dai dati aperti migliorando i propri modelli di business o individuandone di nuovi. Sono già molti servizi innovativi basati sui dati aperti della PA che gli utenti utilizzano ogni giorno sui propri smartphone. Grazie ai dati aperti sviluppatori, giornalisti, università e centri di ricerca hanno a disposizione strumenti informativi sempre più solidi e affidabili per comprendere la portata dei fenomeni in atto e svolgere al meglio il proprio lavoro.

Inoltre, il libero accesso alle informazioni pubbliche da parte di tutti consente di creare un clima di trasparenza diffusa che migliora la qualità del dibattito sulle politiche pubbliche e – contestualmente – rende più efficiente la macchina amministrativa. In questo senso, si può parlare di Open data per l’Accountability.

Singoli cittadini, associazioni di categoria, università e centri di ricerca hanno, grazie alla disponibilità di dati pubblici aperti, nuove modalità di verificare che la PA agisca nella piena correttezza delle regole.

Sono molti gli esempi italiani sul tema:

  • Open Coesione. Iniziativa  sulle politiche di coesione in Italia che promuove l’efficacia degli interventi attraverso la pubblicazione dei dati sui progetti finanziati e una diffusa partecipazione civica;
  • OpenBilanci. Piattaforma  che rende navigabili, confrontabili e scaricabili i bilanci di tutti i 8.100 Comuni italiani degli ultimi dodici anni;
  • Confiscati bene. Progetto  partecipativo per favorire la trasparenza, il riuso e la valorizzazione dei beni confiscati alle mafie, attraverso la raccolta, l’analisi dei dati e il monitoraggio degli stessi beni confiscati.

Da tempo, poi, è stato abbandonato il concetto di uso dei dati per la sola trasparenza amministrativa, in favore di un riuso commerciale dei dati aperti, cioè la possibilità che le imprese utilizzano i dati aperti della PA al fine di generare prodotti e servizi per creare valore sociale ed economico. Attraverso il riuso dei dati aperti la PA può contribuire alla creazione di nuove economie e insieme rafforzare quella già esistenti. Per quanto le possibilità di riuso dei dati siano infinite e dipendano solo dalla creatività degli sviluppatori, è possibile tracciare una prima distinzione tra le diverse forme di riuso:

  • Sviluppo di Applicazioni, che riusando dati pubblici offrono servizi innovativi ai propri utenti (es. Moovit );
  • Data journalism o Giornalismo basato sui dati, dove giornalisti riusano i dati aggregati di fonte pubblica per raccontare una storia (es. InfoData  de Il Sole 24 ore);
  • Enrichment, soggetti che già gestiscono servizi basati sui dati e che grazie ai dati pubblici possono rafforzare il proprio business (es. Immobiliare.it o Zillow.com ; Società di assicurazioni, ecc.).

Dati pubblici nella PA, Open Government e normativa degli Open Data in Italia

Come accennato, i tre pilastri di questo nuovo approccio alla gestione della cosa pubblica sono trasparenza, partecipazione e collaborazione.

Trasparenza

Le istituzioni sono tenute a fornire ai cittadini dati e informazioni sulle decisioni prese e sul proprio operato. La vera trasparenza richiede che queste informazioni debbano essere fruibili cioè di facile accesso, comprensibili ed utilizzabili. L’obiettivo è creare un sistema di fiducia all’interno della comunità locale nei confronti dell’operato e delle scelte compiute dagli enti.

Partecipazione

I processi decisionali vanno aperti al contributo dei cittadini ed in generale dell’intelligenza collettiva generata dal basso. Si tratta di uno dei nodi centrali del modello, la cui finalità è il miglioramento della qualità delle scelte politico-amministrative degli enti pubblici, attraverso la proposta di interventi che siano effettivamente legati alle esigenze e necessità dei cittadini e la riduzione del conflitto.

Collaborazione

Nel modello aperto, le istituzioni non sono intese come strutture a sé stanti, ma soggetti inseriti all’interno di una rete collaborativa e partecipata. Pertanto, i singoli enti sono chiamati ad utilizzare strumenti e metodi innovativi che puntino a migliorare la collaborazione, tanto tra i vari livelli dell’amministrazione, quanto tra enti differenti.

La governance – condizionata da trasparenza, partecipazione e collaborazione – diventa un processo condivisoche consente di individuare e definire le reali esigenze dei cittadini (oltre che di dar loro risposte) e quindi rafforzarne la fiducia nelle istituzioni.

Puntando su questi tre concetti, un’amministrazione può mettere in pratica una forma di relazione del tutto nuova con i suoi interlocutori (cittadini ed imprese). Una relazione che muta la struttura e la natura stessa dell’amministrazione dall’interno, richiedendo un rinnovamento radicale di modelli, processi e strumenti con i quali la PA ha strutturato fino ad oggi il confronto ed il rapporto con il cittadino e con le altre strutture pubbliche. Un processo lento e complesso, quello dell’Open Government, che necessita di un forte endorsement politico.

Perché Open Government? Una risposta alla crisi

L’open Government è probabilmente la migliore risposta alla crisi che i sistemi pubblici di tutto il mondo affrontano da diversi anni. Crisi che, cominciata come economica, nel giro di qualche anno è diventata soprattutto crisi della fiducia. A risorse continuamente calanti corrispondono, infatti, nuovi, molteplici e gravi bisogni rapidamente emergenti, che rischiano di restare senza risposta ed alimentare una spirale di sfiducia e conflitto.

Ciononostante, in Italia e nel mondo si percepiscono segnali di una nuova partecipazione e di un nuovo interesse verso i beni comuni. Posizioni che si esprimono con diverse forme di partecipazione politica, con il volontariato, con l’impegno sociale, con le manifestazioni spontanee spesso mediate dai social network, con l’hacking civico (una pratica indotta dal senso civico che presuppone una certa dimestichezza con le tecnologie digitali, atta a utilizzare dati pubblici, liberati, per sviluppare applicazioni che portino benefici tangibili alla collettività).

Ambito di applicazione dell’Open Government

Open Government può essere la via per ri-progettare una pubblica amministrazione aperta, in grado di dare gambe all’innovazione emergente e speranza a cittadini e imprese.

Quattro sono i campi in cui il concetto di apertura può essere declinato per cambiare le amministrazioni:

  • Innovazione istituzionale. La prima cosa che va ripensata nel nuovo modello è la geografia delle istituzioni. Ciò vuol dire ripensare e ridisegnare il perimetro dell’azione pubblica alla luce della reale utilità per i cittadini e le imprese di ogni istituzione, amministrazione, unità operativa o ufficio;
  • Innovazione organizzativa. La strategia open ci parla di un’amministrazione aperta sin dalla sua organizzazione interna. I principi quindi della trasparenza, della valutazione organizzativa e individuale, dell’ascolto dei cittadini e delle imprese, della responsabilità sociale sono gli stessi strumenti necessari per poter ricostituire quell’orgoglio del lavoro pubblico che in questi ultimi anni si è andato perdendo. Ma sono anche quelli necessari a mettere in pratica un nuovo dialogo con il cittadino;
  • Innovazione tecnologica e giuridica. L’approccio open vuole una PA che sia costruita come una rete di amministrazioni interconnesse e interoperanti. Le tecnologie della rete permettono oggi alla PA una nuova organizzazione e abilitano le grandi operazioni di apertura, partecipazione e risparmio di risorse, ma vanno affrontate correttamente anche dal punto di vista normativo;
  • Innovazione culturale. Ovviamente nessuno di questi cambiamenti è possibile se non è accompagnato da un cambiamento di approccio. Il modello gerarchico e top down che ancora oggi contraddistingue in parte gli enti pubblici, deve essere sostituito da un modello orizzontale e partecipativo, in cui il processo decisionale è il risultato del dialogo e della collaborazione tra istituzioni e privati.

Open Data come strumento del modello di Open Government

Non si può fare una reale politica orientata all’Open Government senza mettere a disposizione del cittadino e della comunità economica e sociale i dati in possesso della pubblica amministrazione. Per attuare i principi di trasparenza, partecipazione e collaborazione propri della dottrina dell’Open Government è necessario mettere il cittadino nelle condizioni di disporre degli strumenti conoscitivi indispensabili per poter prendere decisioni o comunque valutare le decisioni prese dall’amministrazione. Questi strumenti sono essenzialmente i dati.

In questo senso, la finalità dei dati aperti è duplice:

  • Da un lato, mettono il cittadino nelle condizioni di conoscere le informazioni che gli sono indispensabili per essere consapevole delle decisioni pubbliche e per supportarlo nelle sue scelte;
  • Dall’altra parte, consentono al sistema economico di sviluppare servizi che si basino sulle informazioni messe a disposizione dalla pubblica amministrazione, con vantaggi complessivi per tutti gli attori del sistema.

Molte persone e molte organizzazioni raccolgono, per svolgere i loro compiti, una vasta gamma di dati diversi. Tra questi soggetti, i dati raccolti e prodotti dagli enti pubblici (public sector information – PSI) sono particolarmente importanti non solo per la loro quantità e l’autorevolezza della fonte, ma anche e soprattutto perché la maggior parte di quei dati sono pubblici per legge, cioè sono prodotti a partire da risorse pubbliche e dovrebbero, quindi, essere restituiti di default come valore a cittadini e imprese.

Oltre ad avere un valore intrinseco (il costo di produzione dell’attività correlata), i dati, quando vengono resi disponibili, creano un valore ulteriore. In particolare, in termini di:

  • Trasparenza e controllo democratico;
  • Partecipazione;
  • Miglioramento o creazione di prodotti e servizi privati;
  • Innovazione;
  • Miglioramento dell’efficienza dei servizi pubblici;
  • Miglioramento dell’efficacia dei servizi pubblici;
  • Misurazione dell’impatto delle politiche pubbliche;
  • Estrazione di nuova conoscenza dalla combinazione di diverse fonti di dati e dall’identificazione di regolarità che emergono dall’analisi di grandi masse di dati;
  • Creazione di valore economico.

Normativa vigente e full Open Data

Il concetto di apertura dei dati va ben oltre quello di trasparenza. I dati pubblici hanno un potenziale enorme, che però non può esprimersi a pieno se i dati non vengono veramente aperti (full open data).

Per fare ciò non basta pubblicarli, ma occorre anche eliminare qualunque limitazione (giuridica, finanziaria o tecnologica) al loro riutilizzo da parte di altri. Nell’Art. 68 del Codice dell’Amministrazione Digitale (CAD), modificato dal D. Lgs. 217/2017, viene sancito al comma 1-ter che i dati si intendono open se:

a) sono disponibili secondo i termini di una licenza che ne permetta l’utilizzo da parte di chiunque, anche per finalità commerciali, in formato disaggregato;

b) sono accessibili attraverso le tecnologie dell’informazione e della comunicazione, […] sono adatti all’utilizzo automatico da parte di programmi per elaboratori e sono provvisti dei relativi metadati (una serie di istruzioni e descrizioni che aiutano a leggere e ad interpretare correttamente i dati).

A far da corollario a quanto detto finora, il Manifesto per l’Open Government mette in luce che per definirsi tali gli open data devono essere:

  • Completi. Devono comprendere tutte le componenti che consentano di esportarli, utilizzarli online e offline, integrarli e aggregarli con altre risorse e diffonderli in rete;
  • Primari. Devono essere presentati in maniera sufficientemente disgregata, per poter essere utilizzati dagli utenti per integrarli e aggregarli con altri dati e contenuti in formato digitale;
  • Tempestivi. Devono esser resi pubblici tanto velocemente quanto è necessario per preservarne il valore;
  • Accessibili. Devono essere trasmissibili e interscambiabili tra tutti gli utenti in rete direttamente attraverso i protocolli Internet, senza alcuna sottoscrizione di contratto, pagamento, registrazione o richiesta ufficiale;
  • Leggibili da computer. Machine-readable, ovvero processabili in automatico dal personal computer;
  • Non proprietari. Gli utenti devono poter utilizzare e processare i dati attraverso programmi, applicazioni e interfacce non proprietarie;
  • Liberi da licenze che ne limitino l’uso. Ai dati non possono sottendere copyright o diritti intellettuali, né tantomeno brevetti che possano limitarne l’accesso e soprattutto l’utilizzo e il riuso degli utenti. Inoltre, i dati sono “aperti” se viene garantita agli utenti qualsiasi modalità di utilizzo, anche a scopi commerciali;
  • Riutilizzabili. Gli utenti devono essere messi in condizione di riutilizzare e integrare i dati, sino a creare nuove risorse, applicazioni, programmi e servizi di pubblica utilità per la comunità di utenti;
  • Ricercabili. Gli utenti devono poter ricercare con facilità e immediatezza dati e informazioni mediante strumenti di ricerca ad hoc, come database, cataloghi e motori di ricerca;
  • Permanenti. Le peculiarità sino ad ora descritte devono caratterizzare i dati nel corso del loro intero ciclo di vita sul web.

Nel momento in cui mette a disposizione del cittadino, delle imprese e degli altri utenti dati con tali caratteristiche, la PA getta le basi per realizzare l’Open Government in quanto pone al centro del suo operato trasparenza, collaborazione e partecipazione mentre si apre al dialogo ed al confronto diretto con i privati.

Il percorso normativo in Italia

La PA produce, gestisce e conserva un enorme patrimonio di dati. Parte di questi dati pubblici vengono prodotti come fine ultimo dell’azione amministrativa (es. ISTAT) e parte sono invece un prodotto secondario rispetto ai servizi pubblici offerti (es. Dati sul traposto pubblico).

Attraverso il paradigma del governo aperto, la PA può mettere questo patrimonio informativo pubblico a disposizione di tutti i soggetti esterni, che siano imprese, cittadini, associazioni di categoria, contribuendo allo sviluppo economico e sociale del Paese.

Il legislatore – consapevole dei vantaggi e della opportunità create dai dati aperti– ha introdotto a più riprese e a diversi livelli l’open data come prassi amministrativa.

I principali riferimenti in questo senso sono:

  • PSI – Public Sector Information, la direttiva Europea sull’informazione del settore pubblico favorisce il riutilizzo dei dati delle pubbliche amministrazioni Europee. In particolare, la direttiva obbliga le amministrazioni a rendere disponibili, per il riutilizzo sia per scopi commerciali sia non commerciali, i dati in loro possesso, nel rispetto comunque della normativa in materia di protezione dei dati personali. La direttiva estende tale disposizione anche a istituzioni culturali quali biblioteche, comprese quelle universitarie, musei e archivi, in precedenza escluse;
  • CAD – Codice dell’Amministrazione digitale, Fornisce la definizione normativa di riferimento per formato di dato aperto e per dato aperto, elencando inoltre le caratteristiche principali;
  • D. Lgs. N° 101/2018 attuativo del GDPR – General Data Protection Regulation, visto in quest’ottica non solo come iniziativa di tutela degli utenti europei, ma soprattutto come interessante esempio di regolamentazione di uno specifico settore economico basato sui dati da parte di un soggetto pubblico (UE).

Open Data: definizione, caratteristiche, licenze, formati

Una definizione

Con l’espressione dati aperti si fa riferimento alle informazioni detenute, prodotte e aggiornate dalle Pubbliche amministrazioni rese disponibili gratuitamente per chiunque abbia interesse a riusarle.

Tutti i dati detenuti dagli enti pubblici non soggetti a vincolo di privacy possono essere esposti in formato aperto, attraverso l’attribuzione di una licenza aperta che ne permetta il riuso e la scelta di un formato tecnologico che sia a sua volta aperto e standardizzato.

L’accesso ai dati governativi aperti permette ai cittadini, per esempio, di conoscere gli orari dei mezzi pubblici per organizzare al meglio i propri spostamenti; i dettagli dei bilanci approvati dai Comuni; la qualità dell’aria che respiriamo ogni giorno. Più in generale la disponibilità di dati aperti abilita la possibilità di trasformare la conoscenza detenuta dalle pubbliche amministrazioni in servizi immediatamente utilizzabili dai cittadini.

Le licenze nella PA italiana (Con il contributo di Morena Ragone)

Negli ultimi anni il CAD ha visto riformati alcuni articoli (prima con il d. lgs. n. 97/2016, poi con il d. lgs. n. 217/2017), e l’inserimento della definizione di dati di tipo aperto – attualmente si trova nell’art. 1, comma 1, lett. l-ter. Per cui siamo in presenza di un dato di tipo aperto se ricorrono le seguenti tre condizioni:
a. “sono disponibili secondo i termini di una licenza o di una previsione normativa che ne permetta l’utilizzo da parte di chiunque, anche per finalità’ commerciali, in formato disaggregato” (elemento giuridico);
b. “sono accessibili attraverso le tecnologie dell’informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, in formati aperti ai sensi della lettera l-bis), sono adatti all’utilizzo automatico da parte di programmi per elaboratori e sono provvisti dei relativi metadati” (elemento tecnico);
c. “sono resi disponibili gratuitamente attraverso le tecnologie dell’informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione salvo quanto previsto dall’articolo 7 del decreto legislativo 24 gennaio 2006, n. 36” (elemento economico).

I tre elementi devono essere tutti compresenti affinché si possa realmente parlare di dato aperto.

Nelle Linee Guida sulla Valorizzazione del Patrimonio Informatico Pubblico (2017) si precisa, a riguardo, che “si ritiene opportuno fare riferimento ad una licenza unica aperta, che garantisca libertà di riutilizzo, che sia internazionalmente riconosciuta e che consenta di attribuire la paternità dei dataset (attribuire la fonte). Pertanto, si suggerisce l’adozione generalizzata della licenza CC-BY nella sua versione 4.0, presupponendo altresì l’attribuzione automatica di tale licenza nel caso di applicazione del principio “Open Data by default”, espresso nelle disposizioni contenute nell’articolo 52 del CAD”.

È altresì specificato che “considerando la definizione Open Data fornita dal CAD e dall’Open Knowledge Foundation (OKFN), per cui un dato è aperto se è “liberamente usabile, riutilizzabile e ri-distribuibile da chiunque per qualsiasi scopo, soggetto al massimo alla richiesta di attribuzione e condivisione allo stesso modo”, le sole licenze ammesse per abilitare l’effettivo paradigma dell’Open Data sono tutte le licenze che consentono lavori derivati, anche per finalità commerciali.

Va da sé che, pertanto, tutte le licenze che riportano clausole “Non Commerciale – NC” e/o “Non Derivati – ND”, o qualsiasi altra clausola che ne limita la possibilità di riutilizzo, non possono essere licenze valide per i dati aperti. Inoltre, l’art. 52, comma 2 del CAD dispone che “i dati e i documenti che i soggetti di cui all’articolo 2, comma 2, pubblicano, con qualsiasi modalità, senza l’espressa adozione di una licenza di cui all’articolo 2, comma 1, lettera h), del decreto legislativo 24 gennaio 2006, n. 36, si intendono rilasciati come dati di tipo aperto ai sensi dell’articolo 1, comma 1, lettere l-bis) e l-ter), del presente Codice, ad eccezione dei casi in cui la pubblicazione riguardi dati personali del presente Codice”.

Tale principio, conosciuto come “open data by default”, pur fondamentale nel percorso di apertura dell’informazione pubblica, non è stato considerato di facile applicazione, dal momento che, spesso, il contratto di licenza, pur presente, non è correttamente collegato al dataset, e risulta di difficile reperibilità.

Le licenze degli Open Data

I formati: scala a cinque stelle di Tim Berners-Lee

Per garantire che i dati siano letti e interpretati da applicazioni informatiche, le informazioni devono essere rappresentate attraverso formati strutturati, cioè in tabelle organizzate in righe e colonne e aggregati tra loro secondo uno schema logico.

Rispetto ai formati per i dati governativi aperti è pratica comune, riconsulta a livello internazionale, fare riferimento alla scala a cinque stelle di Tim Berners-Lee che valuta la qualità dei formati utilizzati:

  • Una stella – Il dato è disponibile sul web (in qualsiasi formato come Word o PDF), ma rilasciato con una licenza aperta affinché possa essere considerato open;
  • Due stelle – Il dato è disponibile in un formato strutturato che può essere interpretato da un software (ad esempio un foglio di calcolo Microsoft Excel);
  • Tre stelle – Il dato è in un formato strutturato, come per il livello a due stelle però questo formato non è proprietario, ma è a sua volta libero e standardizzato (ad esempio un file in formato CSV);
  • Quattro stelle – Oltre a rispettare tutti i criteri precedenti, il dato fa uso di standard aperti (come RDF e SPARQL) per identificare le informazioni che possano essere identificate in maniera puntuale o aggregata attraverso una URI, cioè un link univoco che punta direttamente alla risorsa;
  • Cinque stelle – Il dato rispetta tutti gli altri criteri e inoltre contiene collegamenti ad altri dati al fine di fornire un contesto alle proprie informazioni. In questo caso si può effettivamente parlare di Linked Open Data.

Come funzionano gli Open Data. Qualità, disponibilità, reperibilità e meta-datazione

Non tutte le informazioni e i dati rilasciati dalle pubbliche amministrazioni sui propri siti web possono essere considerati dati aperti. Uno o un insieme di dati può essere considerato aperto se risponde ad alcune determinate caratteristiche volte ad incentivarne il riuso da parte di chiunque.

I dati aperti devono essere resi disponibili sul web in maniera gratuita e indicizzati dai motori di ricerca. Deve quindi essere possibile a chiunque abbia una connessione internet arrivare a individuare e scaricare i dataset.

I metadati

Con il termine metadato si intende l’informazione che descrive un insieme di dati. Nel caso specifico dei metadati descrittivi, essi costituiscono un livello di informazioni che corredano i dati, ne esplicitano alcune caratteristiche e ne rendono più semplice l’identificazione.

Per agevolare la reperibilità dei dati e la loro interoperabilità, è importante utilizzare elementi descrittivi come titolo, descrizione, link, indicazione della licenza, periodo di validità, ente gestore, formato, ecc…

Per i dati rilasciati in formato aperto, la PA italiana può fare riferimento al profilo di metadatazione DCAT-AP_IT, rilasciato dall’Agenzia per l’Italia digitale. Il profilo è conforme alla specifica di DCAT-AP definita in ambito europeo, consentendo a tutti i dataset aperti rilasciati dalle pubbliche amministrazioni d’europee di essere facilmente aggregabili.

Qualità dei dati

Per quanto esistano criteri condivisi e standard, la qualità di una insieme di dati non ha delle caratteristiche perfettamente oggettive. Nel caso dei dataset è più utile vedere la qualità come l’adeguatezza dei dati al processo in cui vengono utilizzati.

Qualità del dataset

Per dataset si intende in insieme di dati strutturati in forma relazionale, cioè una tabella dove il contenuto di una singola e messo in relazione a tutte le altre celle da una funziona logica. Ogni colonna della tabella in questione, quindi, rappresenta una particolare variabile, e ogni riga corrisponde ad un determinato aspetto dei valori riportati. Gli elementi di di cui tenere conto per assicurare la qualità di un dataset esposto in formato aperto da una PA sono:

  • L’attribuzione di una licenza aperta;
  • La meta-datazione secondo il profilo di metadati DCAT-AP_IT ;
  • La descrizione del dataset deve essere quanto più chiara e oggettiva possibile;
  • Il formato del file deve essere aperto e standardizzato.
Qualità database

Dove in questo caso specifico si intende la struttura che contiene le informazioni. Per essere considerato di qualità sarà opportuno tenere conto dei seguenti aspetti:

  • Deve essere completo, cioè per ogni record dovrebbero essere compilati tutti i campi;
  • Deve essere corretto cioè si raggiunge limitando il più possibile gli errori;
  • Deve essere coerente, cioè le informazioni riportate non devono contraddirsi;
  • Deve, per quanto possibile, usare classificazioni standard;
  • Non deve riportare errori di formattazione.
Qualità delle informazioni

Qui si fa riferimento alle informazioni contenute nel dataset, per le quali valgono le caratteristiche di qualità proprio dell’informazione statistica:

  • rilevanza: riflette la capacità di una informazione di soddisfare i bisogni cognitivi;
  • accuratezza: grado con cui l’informazione descrive correttamente il fenomeno;
  • tempestività: ritardo con cui l’informazione è diffusa rispetto al periodo di riferimento;
  • puntualità: fa riferimento all’esistenza di un calendario di rilascio dell’informazione;
  • accessibilità: riflette la facilità di fruizione dell’informazione;
  • interpretabilità: riflette la facilità di comprensione delle caratteristiche del dato;
  • coerenza: capacità delle diverse fonti di fornire informazioni non contraddittorie;
  • confrontabilità: possibilità̀ di paragonare l’informazione nel tempo e nello spazio;
  • credibilità: si riferisce alla fiducia che gli utilizzatori pongono nel soggetto che l’ha prodotta.

Nel caso di dati prodotti da una PA, quest’ultimo è di particolare rilevanza, in quanto l’istituzione che mantiene i dati ne certifica contestualmente la credibilità. Aspetto che può anche essere letto come un richiamo alla responsabilità da parte di una pubblica amministrazione che espone dati.

Esperienze di riuso dei dati in Italia

Rispetto alle opportunità che la disponibilità dei dati governativi creano una volta esposti in formato aperto, è opportuno chiarire che per i dati aperti vale la stessa regola valida per qualunque altro bene di consumo: è un incornicio di domanda e offerta.

Maggiore sarà la qualità dei dati aperti messi esposti dalla PA e più altre saranno le probabilità che i dati vengano riusati per creare servizi innovativi. Allo stesso tempo però va anche preso in considerazione il contesto a cui le informazioni contenute nei dataset fanno riferimento: nei territori in cui esistono molte professionalità capaci di riusare i dati la domanda sarà più alta e, di conseguenza, l’offerta di dati pubblici finirà per essere più qualificata, sollecitando la pubblica amministrazione ad esporre più dati e di maggiore qualità in un meccanismo virtuoso.

Negli Stati Uniti, ad esempio, il governo riceve forti e constanti pressioni da parte di grandi player del digitale (Google, ecc.) e da associazioni di categoria per liberare nuovi dati. Sotto questo aspetto l’Italia presenta una situazione differente, manca ancora una sollecitazione vera da parte delle imprese italiane verso PA, così come le associazioni di categoria fanno fatica a trovare nei dati aperti uno stimolo per migliorare le loro attività.

Elementi di contesto rispetto al riuso dei dati aperti in Italia sono stati ben fotografati da Open data 200 , studio sistematico sulle imprese italiane che utilizzano open data nelle loro attività al fine di generare prodotti e servizi e creare valore sociale ed economico.

Partendo da questa analisi e guardando a quello che sta accadendo nel nostro Paese su questo fronte è possibile individuare delle prassi emergenti sul riuso dei dati aperti esposti dalla PA italiana:

  • Aziende straniere che creano servizi sui dati italiani: è il caso di Google Map o di Moovit , statunitense la prima e israeliana la seconda, che offrono servizi basati sui dati del trasporto pubblico esposti da città italiane.
  • Aziende italiane che riusano dati aperti della PA per fornire servizi agli utenti: Voglioilruolo.it  partendo dai dati pubblici dei provveditorati premette agli aspiranti docenti di scuole dell’obbligo di avere un’idea più chiara di come guadagnare il punteggio necessario per diventare effettivamente di professore di ruolo.
  • Aziende italiane che arricchiscono dati aperti per fornire servizi ad altre aziende e ad Enti pubblici, ad esempio: SYNAPTA , start up Torinese che ha realizzato è ContrattiPubblici.org , un portale che sfruttando la tecnologia della linked data curation rende sostenibile (tecnicamente ed economicamente) il knowledge graph della trasparenza della Pubblica Amministrazione; Spaziodati  che tra le altre cose realizza progetti di mashup tra dati aziendali e sorgenti di fonte pubblica per abilitare nuove dimensioni di analisi aziendali; Kode  che sviluppa modelli predittivi, visualizzazioni grafiche e tool di analisi realizzati per i propri clienti basando le proprie ricerche anche su dati di fonte pubblica.

Applicazioni degli open data: alcuni esempi

Open Data Lazio (ODL)

Progetto della Regione Lazio, realizzato per LazioCrea con la collaborazione di Sinergis e Depp, finalizzato ad aprire e valorizzare il patrimonio informativo pubblico del Lazio. Il progetto  ha avuto l’obiettivo di dare piena attuazione al principio dell’Open Government (trasparenza, collaborazione e partecipazione) e ha visto, oltre al rilascio del portale e dei siti verticali Open Spesa, Open Sanità e Open Progetti, la realizzazione di iniziative di formazione e accompagnamento sul tema delle amministrazioni territoriali (Accademia Open Data Lazio) e di attività di coinvolgimento e comunicazione sul territorio, attraverso il Data Lab Lazio Tour.

Open Data Campania (ODC)

Attualmente in fase di realizzazione, è il progetto  di Regione Campania, realizzato da Almaviva, Almawave, Indra e Pwc, in collaborazione con FPA, il cui scopo è di consolidare quanto realizzato in ambito Open Data a livello regionale e incrementare la disponibilità dei dati pubblici in capo alle Direzioni Generali, pubblicandoli sul proprio Portale Open Data implementando automatismi di pubblicazione che alleggeriranno il carico. Anche in questo caso il progetto prevede la realizzazione di iniziative di empowerment dei dipendenti pubblici coinvolti nel processo di apertura dei dati e di engagement del territorio in tutte le fasi del processo (dalla definizione delle priorità di liberazione alla promozione di pratiche di riuso).