A pesar que cada vegada disposem de més fonts de dades al nostre abast, que es prevegi que el seu impacte econòmic abast xifres rècord en els propers anys i que les dades són més assequibles que mai, les possibilitats de reutilitzar-los encara són bastant limitades. L'explicació a aquest fenomen radica que els potencials usuaris d'aquestes dades han de fer front moltes vegades a múltiples barreres que dificulten el seu accés i el seu ús.
I és que les facetes en les quals poden existir problemes de qualitat que dificultin la reutilització de les dades són múltiples: metadades escassament descriptives i estandarditzats, elecció de llicència, l'elecció del format, l'ús inadequat dels formats o deficiències en les pròpies dades. Per això, són moltes les iniciatives que intenten mesurar la qualitat dels conjunts de dades sobre la base de les seves metadades: data i freqüència d'actualització, llicència, formats emprats,… com ocorre, per exemple, en el quadre de comandament de qualitat de les metadades present al Portal Europeu de dades o en la dimensió qualitat de el Open Data Maturity Index .
Però aquestes anàlisis resulten insuficients atès que la majoria de les vegades les deficiències de qualitat solament poden ser identificades després de començar el procés de reutilització. El treball que preciar els processos de depuració i preparació es converteixen així en una càrrega important que en molts casos és inassumible per a l'usuari de dades obertes. Aquest fet produeix frustració i perduda d'interès per part del sector reutilitzador en les dades ofertes pels organismes públics, afectant a la credibilitat de les institucions publicadores i rebaixant considerablement les expectatives de tornada i generació de valor a partir de la reutilització de dades obertes.
Aquests problemes potencials poden ser atallats atès que, en bona mesura, s'ha observat que són deguts al fet que el publicador desconeix com expressar les dades de forma correcta en el format triat.