accesskey_mod_content

Datos.gob inicia a publicación de guías prácticas para o uso adecuado dos formatos e os medios de acceso a datos abertos

"Noticia dispoñible unicamente con fins históricos e de hemeroteca. A información e ligazóns mostradas correspóndense cos que estaban operativos á data da súa publicación. Non se garante que continúen activos actualmente".

31 marzo 2020

Publicada a primeira das guías elaboradas polo equipo do portal Datos.gob.es dirixidas a orientar aos editores no uso adecuado dos formatos e os medios de acceso máis utilizados a datos abertos. A serie iníciase pondo o foco no formato CSV.

A pesar de que cada vez dispomos de máis fontes de datos ao noso alcance, de que se prevexa que o seu impacto económico alcance cifras marca nos próximos anos(Abre en nova xanela) e de que os datos son máis alcanzables que nunca, as posibilidades de reutilizalos aínda son bastante limitadas. A explicación a este fenómeno radica en que os potenciais usuarios deses datos teñen que facer fronte moitas veces a múltiples barreiras que dificultan o seu acceso e o seu uso.

E é que as facetas nas que poden existir problemas de calidade que dificulten a reutilización dos datos son múltiples: metadatos escasamente descritivos e estandarizados, elección de licenza, a elección do formato, o uso inadecuado dos formatos ou deficiencias nos propios datos. Por iso, son moitas as iniciativas que tentan medir a calidade dos conxuntos de datos con base nos seus metadatos: data e frecuencia de actualización, licenza, formatos empregados,… como ocorre, por exemplo, en o  cadro de mando de calidade dos metadatos(Abre en nova xanela)  presente no Portal Europeo de datos ou na dimensión calidade de o  Open Data Maturity Index(Abre en nova xanela) .

Pero estas análises resultan insuficientes dado que a maioría das veces as deficiencias de calidade só poden ser identificadas despois de comezar o proceso de reutilización. O traballo que prezan os procesos de depuración e preparación convértense así nunha carga importante que en moitos casos é inasumible para o usuario de datos abertos. Este feito produce frustración e perdida de interese por parte do sector reutilizador nos datos ofrecidos polos organismos públicos, afectando á credibilidade das institucións publicadoras e rebaixando considerablemente as expectativas de retorno e xeración de valor a partir da reutilización de datos abertos.

Estes problemas potenciais poden ser atallados dado que, en boa medida, observouse que son debidos a que o publicador descoñece como expresar os datos de forma correcta no formato elixido.

A iniciativa de Datos.gob

Por todo iso, e co obxectivo de contribuír á mellora da calidade dos datos abertos, o equipo do portal  datos.gob.es(Abre en nova xanela)  decidiu crear unha colección de guías dirixidas a orientar aos publicadores no uso adecuado dos formatos e os medios de acceso a datos abertos máis utilizados no ámbito dos datos abertos.

A colección de guías iníciase pondo o foco no formato CSV. A elección deste formato baséase na súa popularidade no ámbito dos datos abertos, na súa sinxeleza e no lixeiro que resulta á hora de expresar datos en forma de táboa. É o formato máis común nos catálogos de datos abertos, convivindo con outros formatos como XLS ou XLSX que poderían expresarse tamén como CSV. Ademais, é un formato que podemos denominar  híbrido(Abre en nova xanela)  porque combina a facilidade do seu procesamento automatizado coa posibilidade de ser explorado directamente por persoas cun simple editor de texto.

Esta  Guía(Abre en nova xanela)  comprende as características básicas deste tipo de formato e un compendio de pautas para publicar correctamente en datos tabulares, especialmente en CSV. As pautas van acompañadas de suxestións de ferramentas gratuítas que destacan pola súa facilidade para traballar con arquivos CSV e as funcionalidades extras que achegan. Ademais, está tamén dispoñible un resumo das pautas presente na guía en forma de  Cheet Sheet(Abre en nova xanela)  (chuleta ou folla de trucos) para facilitar o seu uso e consulta.

A “Guía práctica para a publicación de datos tabulares en arquivos CSV” está dispoñible en  PDF(Abre en nova xanela)  e  PPXT(Abre en nova xanela) .

Fonte orixinal da noticia(Abre en nova xanela)

  • Goberno aberto