Progetto OpenInps per Apps4Italy

a4i

  

Sardinia Open Data partecipa al concorso nazionale Apps4Italy con il progetto OpenInps.

L’INPS ha aperto i propri dati in merito al “Progetto Open Data”, orientato all’aumento della trasparenza e della qualità dei servizi al cittadino agevolando e semplificando la divulgazione delle informazioni e dei dati tramite il web, a tutti gli utenti che ne abbiano necessità.
L’istituto ha quindi aperto i suoi archivi pubblicando in una sezione del suo sito web 108 file di dati sotto licenza IODL 2.0. I dati resi disponibili sono tra i più importanti e preziosi attualmente disponibili in Italia, un patrimonio spesso indispensabile per tutti coloro che vogliono portare avanti indagini sociali che abbiano come tema la povertà, il mercato del lavoro, la disabilità e via dicendo.
Nonostante sia da assolutamente ammirare la lungimiranza, l’enorme sforzo e l’imponente mole di lavoro che c’è dietro questa operazione, allo stato attuale il livello di apertura non è da considerarsi pienamente soddisfacente a causa di diversi motivi.

  1.  I dati son rilasciati attraverso dei fogli di calcolo in formato proprietario xls. Seppure è vero che ormai per la lettura e rielaborazione di questo formato non sia più necessario disporre di un software proprietario, la diffusione dei dati attraverso questa modalità rappresenta comunque una discriminante e una limitazione dal punto di vista dell’apertura.
  2. I dati si presentano in maniera estremamente eterogenea e son strutturati spesso mediante disposizioni che rendono difficoltoso se non impossibile il concetto di machine readability. Questo è il caso di molti file che contengono complicate tabelle di contingenza, dove vengono incrociate più variabili, spesso anche incompatibili tra loro e con colonne marginali che offrono delle informazioni talvolta ridondanti.
  3. In molti file sono presenti celle unite, lunghe intestazioni, annotazioni, mentre al contrario, in altri casi i nomi dei campi risultano essere troppo generici.
  4. Qualora si volesse disporre dell’intero patrimonioc informativo liberato dall’Istituto, risulta essere necessario scaricare i file singolarmente, volta per volta, venendo poi costretti a compiere vari passaggi tra le diverse pagine e sottopagine della sezione del sito.

Consapevoli che nell’ottica Open Data il riutilizzo offerto dalle licenze aperte deve essere visto anche come uno stimolo a dare un contributo, un aiuto per migliorare la qualità delle informazioni disponibili,
il nostro lavoro in team ha avuto come finalità cercare di ‘“aggiungere una stellina” ai dataset rilasciati dall’INPS, perseguendo i seguenti obiettivi:

  • convertire il formato dei files da proprietario ad uno aperto (csv)
  • strutturare le informazioni nella maniera più disaggregata e “raw” possibile, attraverso l’applicazione di un unico standard definito
  • correlare tutte le informazioni con i relativi metadati
  • permettere un download di tutto il materiale in maniera completa, semplice,immediata e rapida

Il frutto di questo lavoro, come detto, è stato presentato al concorso nazionale Apps4Italy ed è liberamente scaricabile in questo link.