A pesar de que cada vez disponemos de más fuentes de datos a nuestro alcance, de que se prevea que su impacto económico alcance cifras récord en los próximos años y de que los datos son más asequibles que nunca, las posibilidades de reutilizarlos todavía son bastante limitadas. La explicación a este fenómeno radica en que los potenciales usuarios de esos datos tienen que hacer frente muchas veces a múltiples barreras que dificultan su acceso y su uso.
Y es que las facetas en las que pueden existir problemas de calidad que dificulten la reutilización de los datos son múltiples: metadatos escasamente descriptivos y estandarizados, elección de licencia, la elección del formato, el uso inadecuado de los formatos o deficiencias en los propios datos. Por ello, son muchas las iniciativas que intentan medir la calidad de los conjuntos de datos en base a sus metadatos: fecha y frecuencia de actualización, licencia, formatos empleados,… como ocurre, por ejemplo, en el cuadro de mando de calidad de los metadatos presente en el Portal Europeo de datos o en la dimensión calidad del Open Data Maturity Index .
Pero estos análisis resultan insuficientes dado que la mayoría de las veces las deficiencias de calidad solo pueden ser identificadas después de comenzar el proceso de reutilización. El trabajo que precian los procesos de depuración y preparación se convierten así en una carga importante que en muchos casos es inasumible para el usuario de datos abiertos. Este hecho produce frustración y perdida de interés por parte del sector reutilizador en los datos ofrecidos por los organismos públicos, afectando a la credibilidad de las instituciones publicadoras y rebajando considerablemente las expectativas de retorno y generación de valor a partir de la reutilización de datos abiertos.
Estos problemas potenciales pueden ser atajados dado que, en buena medida, se ha observado que son debidos a que el publicador desconoce cómo expresar los datos de forma correcta en el formato elegido.