accesskey_mod_content

Dades.gob inicia la publicació de guies pràctiques per a l'ús adequat dels formats i els mitjans d'accés a dades obertes

"Notícia disponible únicament amb finalitats històriques i d'hemeroteca. La informació i enllaços mostrats es corresponen amb els quals estaven operatius a la data de la seva publicació. No es garanteix que continuïn actius actualment".

31 març 2020

Publicada la primera de les guies elaborades per l'equip del portal Datos.gob.es dirigides a orientar als editors en l'ús adequat dels formats i els mitjans d'accés més utilitzats a dades obertes. La sèrie s'inicia posant el focus en el format CSV.

A pesar que cada vegada disposem de més fonts de dades al nostre abast, que es prevegi que el seu impacte econòmic abast xifres rècord en els propers anys(Obre en nova finestra) i que les dades són més assequibles que mai, les possibilitats de reutilitzar-los encara són bastant limitades. L'explicació a aquest fenomen radica que els potencials usuaris d'aquestes dades han de fer front moltes vegades a múltiples barreres que dificulten el seu accés i el seu ús.

I és que les facetes en les quals poden existir problemes de qualitat que dificultin la reutilització de les dades són múltiples: metadades escassament descriptives i estandarditzats, elecció de llicència, l'elecció del format, l'ús inadequat dels formats o deficiències en les pròpies dades. Per això, són moltes les iniciatives que intenten mesurar la qualitat dels conjunts de dades sobre la base de les seves metadades: data i freqüència d'actualització, llicència, formats emprats,… com ocorre, per exemple, en el  quadre de comandament de qualitat de les metadades(Obre en nova finestra)  present al Portal Europeu de dades o en la dimensió qualitat de el  Open Data Maturity Index(Obre en nova finestra) .

Però aquestes anàlisis resulten insuficients atès que la majoria de les vegades les deficiències de qualitat solament poden ser identificades després de començar el procés de reutilització. El treball que preciar els processos de depuració i preparació es converteixen així en una càrrega important que en molts casos és inassumible per a l'usuari de dades obertes. Aquest fet produeix frustració i perduda d'interès per part del sector reutilitzador en les dades ofertes pels organismes públics, afectant a la credibilitat de les institucions publicadores i rebaixant considerablement les expectatives de tornada i generació de valor a partir de la reutilització de dades obertes.

Aquests problemes potencials poden ser atallats atès que, en bona mesura, s'ha observat que són deguts al fet que el publicador desconeix com expressar les dades de forma correcta en el format triat.

La iniciativa de Dades.gov

Per tot això, i amb l'objectiu de contribuir a la millora de la qualitat de les dades obertes, l'equip del portal  datos.gob.es(Obre en nova finestra)  ha decidit crear una col·lecció de guies dirigides a orientar als publicadors en l'ús adequat dels formats i els mitjans d'accés a dades obertes més utilitzats en l'àmbit de les dades obertes.

La col·lecció de guies s'inicia posant el focus en el format CSV. L'elecció d'aquest format es basa en la seva popularitat en l'àmbit de les dades obertes, en la seva senzillesa i en el lleuger que resulta a l'hora d'expressar dades en forma de taula. És el format més comú als catàlegs de dades obertes, convivint amb altres formats com a XLS o XLSX que podrien expressar-se també com CSV. A més, és un format que podem denominar  híbrid(Obre en nova finestra)  perquè combina la facilitat del seu processament automatitzat amb la possibilitat de ser explorat directament per persones amb un simple editor de text.

Aquesta  Guia(Obre en nova finestra)  comprèn les característiques bàsiques d'aquest tipus de format i un compendio de pautes per publicar correctament en dades tabulars, especialment en CSV. Les pautes van acompanyades de suggeriments d'eines gratuïtes que destaquen per la seva facilitat per treballar amb arxius CSV i les funcionalitats extres que aporten. A més, està també disponible un resum de les pautes present en la guia en forma de  Cheet Sheet(Obre en nova finestra)  (costella o fulla de trucs) per facilitar el seu ús i consulta.

La “Guia pràctica per a la publicació de dades tabulars en arxius CSV” està disponible en  PDF(Obre en nova finestra)  i  PPXT(Obre en nova finestra) .

Font original de la notícia(Obre en nova finestra)

  • Govern obert