accesskey_mod_content

Datos.gob inicia la publicación de guías prácticas para el uso adecuado de los formatos y los medios de acceso a datos abiertos

31 marzo 2020

Publicada la primera de las guías elaboradas por el equipo del portal Datos.gob.es dirigidas a orientar a los editores en el uso adecuado de los formatos y los medios de acceso más utilizados a datos abiertos. La serie se inicia poniendo el foco en el formato CSV.

A pesar de que cada vez disponemos de más fuentes de datos a nuestro alcance, de que se prevea que su impacto económico alcance cifras récord en los próximos años(Abre en nueva ventana) y de que los datos son más asequibles que nunca, las posibilidades de reutilizarlos todavía son bastante limitadas. La explicación a este fenómeno radica en que los potenciales usuarios de esos datos tienen que hacer frente muchas veces a múltiples barreras que dificultan su acceso y su uso.

Y es que las facetas en las que pueden existir problemas de calidad que dificulten la reutilización de los datos son múltiples: metadatos escasamente descriptivos y estandarizados, elección de licencia, la elección del formato, el uso inadecuado de los formatos o deficiencias en los propios datos. Por ello, son muchas las iniciativas que intentan medir la calidad de los conjuntos de datos en base a sus metadatos: fecha y frecuencia de actualización, licencia, formatos empleados,… como ocurre, por ejemplo, en el  cuadro de mando de calidad de los metadatos(Abre en nueva ventana)  presente en el Portal Europeo de datos o en la dimensión calidad del  Open Data Maturity Index(Abre en nueva ventana) .

Pero estos análisis resultan insuficientes dado que la mayoría de las veces las deficiencias de calidad solo pueden ser identificadas después de comenzar el proceso de reutilización. El trabajo que precian los procesos de depuración y preparación se convierten así en una carga importante que en muchos casos es inasumible para el usuario de datos abiertos. Este hecho produce frustración y perdida de interés por parte del sector reutilizador en los datos ofrecidos por los organismos públicos, afectando a la credibilidad de las instituciones publicadoras y rebajando considerablemente las expectativas de retorno y generación de valor a partir de la reutilización de datos abiertos.

Estos problemas potenciales pueden ser atajados dado que, en buena medida, se ha observado que son debidos a que el publicador desconoce cómo expresar los datos de forma correcta en el formato elegido.

La iniciativa de Datos.gob

Por todo ello, y con el objetivo de contribuir a la mejora de la calidad de los datos abiertos, el equipo del portal  datos.gob.es(Abre en nueva ventana)  ha decidido crear una colección de guías dirigidas a orientar a los publicadores en el uso adecuado de los formatos y los medios de acceso a datos abiertos más utilizados en el ámbito de los datos abiertos.

La colección de guías se inicia poniendo el foco en el formato CSV. La elección de este formato se basa en su popularidad en el ámbito de los datos abiertos, en su sencillez y en lo ligero que resulta a la hora de expresar datos en forma de tabla. Es el formato más común en los catálogos de datos abiertos, conviviendo con otros formatos como XLS o XLSX que podrían expresarse también como CSV. Además, es un formato que podemos denominar  híbrido(Abre en nueva ventana)  porque combina la facilidad de su procesamiento automatizado con la posibilidad de ser explorado directamente por personas con un simple editor de texto.

Esta  Guía(Abre en nueva ventana)  comprende las características básicas de este tipo de formato y un compendio de pautas para publicar correctamente en datos tabulares, especialmente en CSV. Las pautas van acompañadas de sugerencias de herramientas gratuitas que destacan por su facilidad para trabajar con archivos CSV y las funcionalidades extras que aportan. Además, está también disponible un resumen de las pautas presente en la guía en forma de  Cheet Sheet(Abre en nueva ventana)  (chuleta u hoja de trucos) para facilitar su uso y consulta.

La “Guía práctica para la publicación de datos tabulares en archivos CSV” está disponible en  PDF(Abre en nueva ventana)  y  PPXT(Abre en nueva ventana) .

Fuente original de la noticia(Abre en nueva ventana)

  • Gobierno abierto