accesskey_mod_content

Publicado a análise de calidade dos metadatos do portal Datos.gob

  • Escoitar
  • Imprimir PDF
  • Compartir

"Noticia dispoñible unicamente con fins históricos e de hemeroteca. A información e ligazóns mostradas correspóndense cos que estaban operativos á data da súa publicación. Non se garante que continúen activos actualmente".

12 xuño 2017

O portal Datos.gob publicou a análise de calidade dos metadatos asociados aos conxuntos de datos do catálogo realizado durante o pasado mes de abril.  

Ofrecer unha medida obxectiva da calidade do catálogo de  datos.gob.es(Abre en nova xanela) , obter con maior profundidade coñecemento do estado do catálogo, contrastar as opinións recibidas con respecto á calidade do mesmo e definir as liñas de acción que melloren os datos que se ofrecen na actualidade son o catro obxectivos do este análise.

Entre os principais resultados obtidos neste estudo de calidade, destaca que o 94% de conxuntos de datos teñen, polo menos, unha distribución procesable por máquinas, o 43% dos conxuntos de datos especifican con que frecuencia actualízanse, o 30% dos conxuntos de datos disponse baixo unha  Licencia Creative Commons.

A data de hoxe, o portal datos.gob.es ofrece un total de 14.717 conxuntos de datos –unha cifra que cambia día a día-. O informe mide a calidade dos metadatos –aplicando ata oito variables-, a actualización dos datos publicados e as licenzas ou condicións de uso dos este datos. Así mesmo, analiza as distribucións dos conxuntos de datos –a través de seis variables- e xunto á análise cualitativa inclúense tamén unha serie de propostas e liñas de actuación.

Metadatos, temáticas, actualización e licenzas

O 96,5% das distribucións de datos.gob.es están accesibles e o 89% son procesables por máquinas,  isto supón que o 94% de conxuntos de datos teñen, polo menos, unha distribución procesable por máquinas e o 77% dos conxuntos de datos están en formatos estruturados e abertos. Só o 6% dos conxuntos de datos de datos.gob.es están en formatos non estruturados.

Estas son algunhas das medicións xunto a que o 43% dos conxuntos de datos reflicten con que frecuencia actualízanse e o 100% dos conxuntos de datos tanto a súa data de creación como a data da súa última actualización.

Canto ás licenzas, o 64% dos conxuntos de datos están suxeitos a unhas condicións de uso redactadas polo organismo publicador, o 30,32% dos conxuntos de datos dispoñen de Licencia Creative Commons e o 4,75% Licencia Open Definition

Na maioría dos casos, os datasets de datos.gob.es ofrécense baixo as condicións xerais de posta a disposición de datos que regula o  Real Decreto 1495/2011, do 24 de outubro(Abre en nova xanela) , polo que se desenvolve a Lei 37/2007, do 16 de novembro, sobre reutilización da información do sector público para o ámbito do sector público estatal. A citación da fonte e a non desnaturalización dos datos son dúas condicións fundamentais.

Nesta análise cualitativa, analizáronse o dez organismos publicadores con máis datasets (as Comunidades de País Vasco e Aragón e o CSIC encabezan o ranking seguidos polos Concellos de Málaga e Xixón, Deputación Foral de Guipúzcoa, Xunta de Galicia, Xunta de Castela e León, Generalitat Valenciana e Concello de Madrid), o dez temáticas con máis datasets (sector público, sociedade e benestar, economía, demografía, medio ambiente, educación, cultura e lecer facenda, emprego e saúde), así como o dez etiquetas máis utilizadas, a cobertura xeográfica dos datasets (81,5% de uso) e os idiomas dos datasets (96,6% de uso).  Así mesmo, tamén se detalla a frecuencia de actualización. 

Distribuciones e dispoñibilidade dos datos

Outro dos indicadores que se tiveron en conta para medir a calidade dos datos abertos é o número de distribucións por código erro. Das 44.279 distribucións dos 13.644 conxuntos de datos analizados, o 3,4% das distribucións reflicten código erro –hai 13 tipos diferentes de código erro-. O máis frecuente é o código erro 401 -recurso web require autenticación de usuario-, seguido do 404 -recurso web non atopado- .

Respecto da caracterización das distribucións, o informe analizou a calidade de 13.644 conxuntos de datos, 44.279 distribucións de datos e 62 formatos diferentes. A media estimada é que por cada conxunto de datos hai unha media de tres distribucións. Segundo o número de formatos, o 52% dos datasets - conxuntos de datos – están dispoñibles nun formato reutilizable, o 21% en dous formatos reutilizables e o 8% en cinco formatos reutilizables.

Propostas e liñas de actuación

O informe propón unha serie de liñas de actuación como, por exemplo, promover o uso de licenzas tipo e dispor dun texto de condicións de reutilización nun URL única que os organismos poidan utilizar a modo de licenza tipo, xa que o usuario ao consultar o catálogo de datos pode chegar a atopar ata 168 URLs diferentes de condicións de uso ou licenzas.

Tamén se propón seguir incentivando a publicación de datos por parte das comunidades autónomas e do Estado, así como contactar cos organismos responsables para animarlles a actualizar a información publicada.

Para a elaboración desta análise, a metodoloxía empregada ha consistido en  determinar os indicadores obxectivos que permitan medir de forma automática todos os conxuntos de datos presentes en datos.gob.es sobre os seguintes aspectos:

  • Dispoñibilidade da información
  • Metadatos achegados
  • Actualización
  • Licenza
  • Formatos das distribucións

Fonte orixinal da noticia(Abre en nova xanela)