accesskey_mod_content

Dades.gob inicia la publicació de guies pràctiques per a l'ús adequat dels formats i els mitjans d'accés a dades obertes

"Notícia disponible únicament amb finalitats històriques i d'hemeroteca. La informació i enllaços mostrats es corresponen amb els quals estaven operatius a la data de la seua publicació. No es garantix que continuen actius actualment".

31 març 2020

Publicada la primera de les guies elaborades per l'equip del portal Datos.gob.es dirigides a orientar als editors en l'ús adequat dels formats i els mitjans d'accés més utilitzats a dades obertes. La sèrie s'inicia posant el focus en el format CSV.

A pesar que cada vegada disposem de més fonts de dades al nostre abast, que es preveja que el seu impacte econòmic abast xifres rècord en els pròxims anys(Obri en nova finestra) i que les dades són més assequibles que mai, les possibilitats de reutilitzar-los encara són bastant limitades. L'explicació a este fenomen radica que els potencials usuaris d'eixes dades han de fer front moltes vegades a múltiples barreres que dificulten el seu accés i el seu ús.

I és que les facetes en les quals poden existir problemes de qualitat que dificulten la reutilització de les dades són múltiples: metadades escassament descriptives i estandarditzats, elecció de llicència, l'elecció del format, l'ús inadequat dels formats o deficiències en les pròpies dades. Per açò, són moltes les iniciatives que intenten mesurar la qualitat dels conjunts de dades sobre la base de les seues metadades: data i freqüència d'actualització, llicència, formats emprats,… com ocorre, per exemple, en el  quadre de comandament de qualitat de les metadades(Obri en nova finestra)  present en el Portal Europeu de dades o en la dimensió qualitat de el  Open Data Maturity Index(Obri en nova finestra) .

Però estes anàlisis resulten insuficients atés que la majoria de les vegades les deficiències de qualitat solament poden ser identificades després de començar el procés de reutilització. El treball que preen els processos de depuració i preparació es convertixen així en una càrrega important que en molts casos és inassumible per a l'usuari de dades obertes. Este fet produïx frustració i perduda d'interés per part del sector reutilisador en les dades oferides pels organismes públics, afectant a la credibilitat de les institucions publicadores i rebaixant considerablement les expectatives de tornada i generació de valor a partir de la reutilització de dades obertes.

Estos problemes potencials poden ser atallats atés que, en bona mesura, s'ha observat que són deguts al fet que el publicador desconeix com expressar les dades de forma correcta en el format triat.

La iniciativa de Dades.gov

Per tot açò, i amb l'objectiu de contribuir a la millora de la qualitat de les dades obertes, l'equip del portal  datos.gob.es(Obri en nova finestra)  ha decidit crear una col·lecció de guies dirigides a orientar als publicadors en l'ús adequat dels formats i els mitjans d'accés a dades obertes més utilitzats en l'àmbit de les dades obertes.

La col·lecció de guies s'inicia posant el focus en el format CSV. L'elecció d'este format es basa en la seua popularitat en l'àmbit de les dades obertes, en la seua senzillesa i en el lleuger que resulta a l'hora d'expressar dades en forma de taula. És el format més comú en els catàlegs de dades obertes, convivint amb altres formats com a XLS o XLSX que podrien expressar-se també com CSV. A més, és un format que podem denominar  híbrid(Obri en nova finestra)  perquè combina la facilitat del seu processament automatitzat amb la possibilitat de ser explorat directament per persones amb un simple editor de text.

Esta  Guia(Obri en nova finestra)  comprèn les característiques bàsiques d'este tipus de format i un compendi de pautes per a publicar correctament en dades tabulars, especialment en CSV. Les pautes van acompanyades de suggeriments de ferramentes gratuïtes que destaquen per la seua facilitat per a treballar amb arxius CSV i les funcionalitats extres que aporten. A més, està també disponible un resum de les pautes present en la guia en forma de  Cheet Sheet(Obri en nova finestra)  (xulla o fulla de trucs) per a facilitar el seu ús i consulta.

La “Guia pràctica per a la publicació de dades tabulars en arxius CSV” està disponible en  PDF(Obri en nova finestra)  i  PPXT(Obri en nova finestra) .

Font original de la notícia(Obri en nova finestra)

  • Govern obert