accesskey_mod_content

Publicat l'anàlisi de qualitat de les metadades del portal Dades.gov

  • Escoltar
  • Imprimir PDF
  • Compartir

"Notícia disponible únicament amb finalitats històriques i d'hemeroteca. La informació i enllaços mostrats es corresponen amb els quals estaven operatius a la data de la seva publicació. No es garanteix que continuïn actius actualment".

12 juny 2017

El portal Dades.gob ha publicat l'anàlisi de qualitat de les metadades associades als conjunts de dades del catàleg realitzat durant el passat mes d'abril.  

Oferir una mesura objectiva de la qualitat del catàleg de  datos.gob.es(Obre en nova finestra) , obtenir amb major profunditat coneixement de l'estat del catàleg, contrastar les opinions rebudes pel que fa a la qualitat del mateix i definir les línies d'acció que millorin les dades que s'ofereixen en l'actualitat són els quatre objectius d'aquesta anàlisi.

Entre els principals resultats obtinguts en aquest estudi de qualitat, destaca que el 94% de conjunts de dades tenen, almenys, una distribució procesable per màquines, el 43% dels conjunts de dades especifiquen amb quina freqüència s'actualitzen, el 30% dels conjunts de dades es disposen sota una  Llicència Creative Commons.

A data d'avui, el portal datos.gob.es ofereix un total de 14.717 conjunts de dades –una xifra que canvia dia a dia-. L'informe mesura la qualitat de les metadades –aplicant fins a vuit variables-, l'actualització de les dades publicades i les llicències o condicions d'ús d'aquestes dades. Així mateix, analitza les distribucions dels conjunts de dades –a través de sis variables- i al costat de l'anàlisi qualitativa s'inclouen també una sèrie de propostes i línies d'actuació.

Metadades, temàtiques, actualització i llicències

El 96,5% de les distribucions de datos.gob.es estan accessibles i el 89% són procesables per màquines,  això suposa que el 94% de conjunts de dades tenen, almenys, una distribució procesable per màquines i el 77% dels conjunts de dades estan en formats estructurats i oberts. Només el 6% dels conjunts de dades de datos.gob.es estan en formats no estructurats.

Aquestes són algunes dels mesuraments al costat de que el 43% dels conjunts de dades reflecteixen amb quina freqüència s'actualitzen i el 100% dels conjunts de dades tant la seva data de creació com la data de la seva última actualització.

Quant a les llicències, el 64% dels conjunts de dades estan subjectes a unes condicions d'ús redactades per l'organisme publicador, el 30,32% dels conjunts de dades disposen de Llicència Creative Commons i el 4,75% Llicència Open Definition

En la majoria dels casos, els datasets de datos.gob.es s'ofereixen sota les condicions generals de posada a la disposició de dades que regula el  Reial decret 1495/2011, de 24 d'octubre(Obre en nova finestra) , pel qual es desenvolupa la Llei 37/2007, de 16 de novembre, sobre reutilització de la informació del sector públic per a l'àmbit del sector públic estatal. La citació de la font i la no desnaturalització de les dades són dues condicions fonamentals.

En aquesta anàlisi qualitativa, s'han analitzat els deu organismes publicadors amb més datasets (les Comunitats de País Basc i Aragó i el CSIC encapçalen el ránking seguits pels Ajuntaments de Màlaga i Gijón, Diputació Foral de Guipúscoa, Xunta de Galícia, Junta de Castella i Lleó, Generalitat Valenciana i Ajuntament de Madrid), les deu temàtiques amb més datasets (sector públic, societat i benestar, economia, demografia, medi ambient, educació, cultura i oci hisenda, ocupació i salut), així com les deu etiquetes més utilitzades, la cobertura geogràfica dels datasets (81,5% d'ús) i els idiomes dels datasets (96,6% d'ús).  Així mateix, també es detalla la freqüència d'actualització. 

Distribucions i disponibilitat de les dades

Un altre dels indicadors que s'han tingut en compte per mesurar la qualitat de les dades obertes és el nombre de distribucions per codi error. De les 44.279 distribucions dels 13.644 conjunts de dades analitzades, el 3,4% de les distribucions reflecteixen codi error –hi ha 13 tipus diferents de codi error-. El més freqüent és el codi error 401 -recurs web requereix autenticació d'usuari-, seguit del 404 -recurs web no oposat- .

Respecte a la caracterització de les distribucions, l'informe ha analitzat la qualitat de 13.644 conjunts de dades, 44.279 distribucions de dades i 62 formats diferents. La mitjana benvolguda és que per cada conjunt de dades hi ha una mitjana de tres distribucions. Segons el nombre de formats, el 52% dels datasets - conjunts de dades – estan disponibles en un format reutilitzable, el 21% en dos formats reutilitzables i el 8% en cinc formats reutilitzables.

Propostes i línies d'actuació

L'informe proposa una sèrie de línies d'actuació com, per exemple, promoure l'ús de llicències tipus i disposar d'un text de condicions de reutilització en una URL única que els organismes puguin utilitzar a manera de llicència tipus, ja que l'usuari en consultar el catàleg de dades pot arribar a trobar fins a 168 URL diferents de condicions d'ús o llicències.

També es proposa seguir incentivant la publicació de dades per part de les comunitats autònomes i de l'Estat, així com contactar amb els organismes responsables per animar-los a actualitzar la informació publicada.

Per a l'elaboració d'aquesta anàlisi, la metodologia emprada ha consistit a  determinar els indicadors objectius que permetin mesurar de forma automàtica tots els conjunts de dades presents en datos.gob.es sobre els següents aspectes:

  • Disponibilitat de la informació
  • Metadades aportades
  • Actualització
  • Llicència
  • Formats de les distribucions

Font original de la notícia(Obre en nova finestra)