accesskey_mod_content

Publicat l'anàlisi de qualitat de les metadades del portal Dades.gov

  • Escoltar
  • Imprimir PDF
  • Compartir

"Notícia disponible únicament amb finalitats històriques i d'hemeroteca. La informació i enllaços mostrats es corresponen amb els quals estaven operatius a la data de la seua publicació. No es garantix que continuen actius actualment".

12 juny 2017

El portal Dades.gob ha publicat l'anàlisi de qualitat de les metadades associades als conjunts de dades del catàleg realitzat durant el passat mes d'abril.  

Oferir una mesura objectiva de la qualitat del catàleg de  datos.gob.es(Obri en nova finestra) , obtindre amb major profunditat coneixement de l'estat del catàleg, contrastar les opinions rebudes respecte de la qualitat del mateix i definir les línies d'acció que milloren les dades que s'oferixen en l'actualitat són els quatre objectius d'aquesta anàlisi.

Entre els principals resultats obtinguts en este estudi de qualitat, destaca que el 94% de conjunts de dades tenen, almenys, una distribució procesable per màquines, el 43% dels conjunts de dades especifiquen amb quina freqüència s'actualitzen, el 30% dels conjunts de dades es disposen baix una  Licencia Creative Commons.

A data d'hui, el portal datos.gob.es oferix un total de 14.717 conjunts de dades –una xifra que canvia dia a dia-. L'informe mesura la qualitat de les metadades –aplicant fins a huit variables-, l'actualització de les dades publicades i les llicències o condicions d'ús d'aquestes dades. Així mateix, analitza les distribucions dels conjunts de dades –a través de sis variables- i al costat de l'anàlisi qualitativa s'inclouen també una sèrie de propostes i línies d'actuació.

Metadatos, temàtiques, actualització i llicències

El 96,5% de les distribucions de datos.gob.es estan accessibles i el 89% són procesables per màquines,  açò suposa que el 94% de conjunts de dades tenen, almenys, una distribució procesable per màquines i el 77% dels conjunts de dades estan en formats estructurats i oberts. Només el 6% dels conjunts de dades de datos.gob.es estan en formats no estructurats.

Estes són algunes dels mesuraments al costat de que el 43% dels conjunts de dades reflectixen amb quina freqüència s'actualitzen i el 100% dels conjunts de dades tant la seua data de creació com la data de la seua última actualització.

Quant a les llicències, el 64% dels conjunts de dades estan subjectes a unes condicions d'ús redactades per l'organisme publicador, el 30,32% dels conjunts de dades disposen de Licencia Creative Commons i el 4,75% Licencia Open Definition

En la majoria dels casos, els datasets de datos.gob.es s'oferixen baix les condicions generals de posada a la disposició de dades que regula el  Reial decret 1495/2011, de 24 d'octubre(Obri en nova finestra) , pel qual es desenvolupa la Llei 37/2007, de 16 de novembre, sobre reutilització de la informació del sector públic per a l'àmbit del sector públic estatal. La citació de la font i la no desnaturalització de les dades són dos condicions fonamentals.

En esta anàlisi qualitativa, s'han analitzat els deu organismes publicadors amb més datasets (les Comunitats de País Basc i Aragó i el CSIC encapçalen el ránking seguits pels Ajuntaments de Màlaga i Gijón, Diputació Foral de Guipúscoa, Xunta de Galícia, Junta de Castella i Lleó, Generalitat Valenciana i Ajuntament de Madrid), les deu temàtiques amb més datasets (sector públic, societat i benestar, economia, demografia, medi ambient, educació, cultura i oci hisenda, ocupació i salut), així com les deu etiquetes més utilitzades, la cobertura geogràfica dels datasets (81,5% d'ús) i els idiomes dels datasets (96,6% d'ús).  Així mateix, també es detalla la freqüència d'actualització. 

Distribuciones i disponibilitat de les dades

Un altre dels indicadors que s'han tingut en compte per a mesurar la qualitat de les dades obertes és el nombre de distribucions per codi error. De les 44.279 distribucions dels 13.644 conjunts de dades analitzades, el 3,4% de les distribucions reflectixen codi error –hi ha 13 tipus diferents de codi error-. El més freqüent és el codi error 401 -recurs web requerix autenticació d'usuari-, seguit del 404 -recurs web no oposat- .

Respecte a la caracterització de les distribucions, l'informe ha analitzat la qualitat de 13.644 conjunts de dades, 44.279 distribucions de dades i 62 formats diferents. La mitjana benvolguda és que per cada conjunt de dades hi ha una mitjana de tres distribucions. Segons el nombre de formats, el 52% dels datasets - conjunts de dades – estan disponibles en un format reutilitzable, el 21% en dos formats reutilitzables i el 8% en cinc formats reutilitzables.

Propostes i línies d'actuació

L'informe proposa una sèrie de línies d'actuació com, per exemple, promoure l'ús de llicències tipus i disposar d'un text de condicions de reutilització en una URL única que els organismes puguen utilitzar a manera de llicència tipus, ja que l'usuari en consultar el catàleg de dades pot arribar a trobar fins a 168 URL diferents de condicions d'ús o llicències.

També es proposa seguir incentivant la publicació de dades per part de les comunitats autònomes i de l'Estat, així com contactar amb els organismes responsables per a animar-los a actualitzar la informació publicada.

Per a l'elaboració d'esta anàlisi, la metodologia emprada ha consistit a  determinar els indicadors objectius que permeten mesurar de forma automàtica tots els conjunts de dades presents en datos.gob.es sobre els següents aspectes:

  • Disponibilitat de la informació
  • Metadatos aportats
  • Actualització
  • Llicència
  • Formatos de les distribucions

Font original de la notícia(Obri en nova finestra)