Nasce InsulaR, la comunità cagliaritana di utilizzatori di R.

insularÈ nata da poche settimane InsulaR, la comunità cagliaritana deidicata a  “R”, il famoso e potentissimo software libero per la realizzazione di analisi statistiche. Sulle pagine di questo blog ospitiamo uno dei primi post scritti da uno dei i fondatori di InsulaR e nostro collaboratore in diverse iniziative,  Davide Massidda che ci spiega lo stretto rapporto, necessario ma non ancora concreto, tra open data e scienza .

La scienza oggi: molti “data” poco “open”

Quando si parla di “open data” ci si riferisce a una pratica di condivisione dei dati che ne consenta il libero accesso, in maniera semplice, veloce e senza limitazioni. Il detentore dei dati rilascia gli stessi in modo tale da poter essere rielaborati liberamente da chiunque così da poter essere riutilizzati per altri scopi, e quindi generare nuove conoscenze ed aprire nuove strade di sviluppo sociale ed economico. Continua a leggere

Sabato 23 febbraio Open Data Day a Cagliari!

Sabato 23 febbraio  avrà luogo la terza edizione dell’International Open Data Day , la giornata mondiale dedicata agli Open Data.

Per l’occasione Sardinia Open Data ha organizzato un evento anche a Cagliari, in collaborazione con il Circolo Giustisti Telematici, il GULCH e il patrocinio del Comune di Cagliari, del Comune di Sestu, del Dipartimento di Ingegneria Elettrica ed Elettronica (Diee) dell’Università degli Studi di Cagliari e del Centro di Competenza Regionale ICT della Sardegna.

L’incontro comincerà alle 9:30 presso la MEM, mediateca del mediterraneo e sarà composto da due momenti: la mattina una serie di interventi divulgativi che introdurranno l’argomento e daranno un quadro di insieme sulla situazione attuale in Sardegna e in Italia.

La sera ci sarà da divertirsi all’Hackathon, alle 15:00 presso i locali del Dipartimento di Ingegneria Elettrica ed Elettronica, dove ci sporcheremo finalmente le mani coi dati in sessioni di scraping, elaborazione, mappatura e quant’altro!

Qui il programma completo.

Verso gli OSM Mapping Meetings di Sardinia Open Data: 2# Il webmapping – OSM e altri sistemi

articoloLa nostra associazione promuove progetti di mappatura collettiva per OpenStreetMap, attraverso il coordinamento di un gruppo di volontari al fine di aiutare la mappatura di un territorio appartenente alle zone disagiate del nostro pianeta. Chiunque volesse partecipare al progetto, può ottenere maggiori informazioni visitando questa pagina.

L’importanza di ricostruire un territorio attraverso sistemi di mapping nel web rappresenta un’esigenza primaria. E’ importante mappare una data area per conoscerne le risorse, siano esse ambientali, energetiche, produttive. E’ importante analizzare un territorio per pianificare al meglio un intervento umanitario, individuando i nodi di debolezza e di forza dello stesso. Continua a leggere

Progetto OpenInps per Apps4Italy

a4i

  

Sardinia Open Data partecipa al concorso nazionale Apps4Italy con il progetto OpenInps.

L’INPS ha aperto i propri dati in merito al “Progetto Open Data”, orientato all’aumento della trasparenza e della qualità dei servizi al cittadino agevolando e semplificando la divulgazione delle informazioni e dei dati tramite il web, a tutti gli utenti che ne abbiano necessità.
L’istituto ha quindi aperto i suoi archivi pubblicando in una sezione del suo sito web 108 file di dati sotto licenza IODL 2.0. I dati resi disponibili sono tra i più importanti e preziosi attualmente disponibili in Italia, un patrimonio spesso indispensabile per tutti coloro che vogliono portare avanti indagini sociali che abbiano come tema la povertà, il mercato del lavoro, la disabilità e via dicendo.
Nonostante sia da assolutamente ammirare la lungimiranza, l’enorme sforzo e l’imponente mole di lavoro che c’è dietro questa operazione, allo stato attuale il livello di apertura non è da considerarsi pienamente soddisfacente a causa di diversi motivi.

  1.  I dati son rilasciati attraverso dei fogli di calcolo in formato proprietario xls. Seppure è vero che ormai per la lettura e rielaborazione di questo formato non sia più necessario disporre di un software proprietario, la diffusione dei dati attraverso questa modalità rappresenta comunque una discriminante e una limitazione dal punto di vista dell’apertura.
  2. I dati si presentano in maniera estremamente eterogenea e son strutturati spesso mediante disposizioni che rendono difficoltoso se non impossibile il concetto di machine readability. Questo è il caso di molti file che contengono complicate tabelle di contingenza, dove vengono incrociate più variabili, spesso anche incompatibili tra loro e con colonne marginali che offrono delle informazioni talvolta ridondanti.
  3. In molti file sono presenti celle unite, lunghe intestazioni, annotazioni, mentre al contrario, in altri casi i nomi dei campi risultano essere troppo generici.
  4. Qualora si volesse disporre dell’intero patrimonioc informativo liberato dall’Istituto, risulta essere necessario scaricare i file singolarmente, volta per volta, venendo poi costretti a compiere vari passaggi tra le diverse pagine e sottopagine della sezione del sito.

Consapevoli che nell’ottica Open Data il riutilizzo offerto dalle licenze aperte deve essere visto anche come uno stimolo a dare un contributo, un aiuto per migliorare la qualità delle informazioni disponibili,
il nostro lavoro in team ha avuto come finalità cercare di ‘“aggiungere una stellina” ai dataset rilasciati dall’INPS, perseguendo i seguenti obiettivi:

  • convertire il formato dei files da proprietario ad uno aperto (csv)
  • strutturare le informazioni nella maniera più disaggregata e “raw” possibile, attraverso l’applicazione di un unico standard definito
  • correlare tutte le informazioni con i relativi metadati
  • permettere un download di tutto il materiale in maniera completa, semplice,immediata e rapida

Il frutto di questo lavoro, come detto, è stato presentato al concorso nazionale Apps4Italy ed è liberamente scaricabile in questo link.