accesskey_mod_content

A Unión Europea amplía as categorías a considerar datos de alto valor

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

05 decembro 2023

O concepto de datos de alto valor (High-Value datasets) foi introducido polo Parlamento Europeo e o Consello da Unión Europea hai 4 anos, na Directiva (UE) 2019/1024.

O concepto de datos datos de alto valor(Abre en nova xanela)  (High-Value datasets) foi introducido polo Parlamento Europeo e o Consello da Unión Europea hai 4 anos, na Directiva (UE) 2019/1024(Abre en nova xanela) . Nela definíanse como unha serie de conxuntos de datos cun gran potencial para xerar “beneficios para a sociedade, o medio ambiente e a economía”. Por iso, os estados membro debían impulsar a súa apertura de maneira gratuíta, en formatos legibles por máquinas, a través de APIs, en forma de descarga masiva e descritos de forma exhaustiva mediante metadatos.  

De maneira inicial, a directiva propuña no seu anexo seis categorías temáticas a considerar como de alto valor: datos geoespaciales, observación da terra e ambiental, meteorolóxicos, estatísticos, rexistros empresariais e datos sobre redes de transporte. Estas categorías categorías foron detalladas(Abre en nova xanela) posteriormente nun regulamento de execución(Abre en nova xanela) publicado en decembro de 2022. Ademais, para facilitar a súa apertura, en xuño de 2023 editouse un documento con pautas pautas sobre como usar DCAT-AP para a súa publicación(Abre en nova xanela) .

Novas categorías de datos a considerar de alto valor

Estas categorías iniciais sempre estiveron abertas á súa ampliación. Neste sentido, a Comisión Europea acaba de publicar o informe "Identification of data themes for the extensions of public sector High-Value Datasets"(Abre en nova xanela)  onde se inclúen sete novas categorías que se estuda considerar como datos de alto valor:

  • Perda climática: Fai referencia aos datos relacionados cos enfoques e accións necesarios para evitar, minimizar e abordar os danos asociados ao cambio climático. Exemplos de conxuntos de datos desta categoría son as perdas económicas e non económicas derivadas dos fenómenos meteorolóxicos extremos ou os cambios de evolución lenta, como o aumento do nivel do mar ou a desertificación. Tamén inclúe datos relacionados cos sistemas de alerta temperá ante desastres naturais, a repercusión das medidas de mitigación ou datos de investigación sobre a atribución de fenómenos extremos ao cambio climático. 

  • Enerxía: Esta categoría inclúe estatísticas completas sobre a produción, transporte, comercio e consumo final de fontes de enerxía primarias e secundarias, tanto renovables como non renovables. Algúns exemplos de conxuntos de datos a considerar son os indicadores de prezos e consumo ou a información sobre seguridade enerxética.  

  • Finanzas: Trátase de información sobre a situación das empresas privadas e as administracións públicas, que pode utilizarse para avaliar o rendemento empresarial ou a sustentabilidade económica, así como para definir estratexias de gasto e investimento. Inclúe conxuntos de datos sobre rexistros de empresas, estados financeiros, fusións e adquisicións, así como informes financeiros anuais. 

  • Goberno e administración pública: Esta temática incluye aquellos datos que los servicios y empresas públicas recopilan para informar y mejorar la acción de gobierno y la administración de una unidad territorial específica, ya sea un estado, una región o un municipio. Incluye datos relativos al gobierno (por ejemplo, actas de reuniones), los ciudadanos (censos o registro en los servicios públicos) y las infraestructuras gubernamentales. Estos datos se reutilizan posteriormente para fundamentar la elaboración de políticas, prestar servicios públicos, optimizar los recursos y la asignación presupuestaria, así como proporcionar información procesable y transparente a ciudadanos y empresas. 

  • Saúde: Este concepto identifica los conjuntos de datos que cubren el bienestar físico, y mental de la población, haciendo referencia tanto a aspectos objetivos como subjetivos de la salud de las personas. También incluye indicadores clave sobre el funcionamiento de los sistemas de asistencia sanitaria y la seguridad en el trabajo. Algunos ejemplos son los datos relativos a la Covid-19, la equidad sanitaria o el listado de servicios prestados por los centros sanitarios. 

  • Xustiza e asuntos xurídicos:  Identifica conxuntos de datos que permiten reforzar a capacidade de resposta, a rendición de contas e a interoperabilidade dos sistemas xudiciais da UE, cubrindo ámbitos como a aplicación da xustiza, o sistema xurídico ou a seguridade pública, é dicir, aquela que garante a protección dos cidadáns. Os conxuntos de datos sobre xustiza e asuntos xurídicos inclúen documentación de xurisprudencia nacional ou internacional, decisións de tribunais e fiscais xerais, así como actos xurídicos e o seu contido. 

  • Datos lingüísticos: Fai referencia a expresións escritas ou orais que están na base da intelixencia artificial, o procesamento da linguaxe natural e o desenvolvemento de servizos relacionados. A Comisión ofrece unha definición bastante ampla desta categoría de datos, todos eles agrupados baixo a denominación de "datos lingüísticos multimodales". Poden incluír repositorios de coleccións de textos, corpus de linguas faladas, recursos de audio, ou gravacións de vídeo. 

Imaxes das novas categorías que poderían engadirse á lista de datos de alto valor

Para realizar esta selección, os autores do informe levaron a cabo unha investigación documental, así como consultas a administracións públicas, expertos en datos e empresas privadas mediante unha serie de talleres e enquisas. Ademais desta avaliación, o equipo do estudo cartografió e analizou o ecosistema normativo ao redor de cada categoría, así como as iniciativas políticas relacionadas coa súa armonización e posta en común, especialmente en relación coa creación de Espazos Espazos Comúns Europeos de Datos(Abre en nova xanela)

Potencial para as Pemes e as plataformas dixitais

Además de definir estas categorías, el estudio también ofrece una estimación de alto nivel sobre el impacto das novas categorías nas pequenas e medianas empresas, así como nas grandes plataformas dixitais. Unha das conclusións do estudo é que a relación custo-beneficio da apertura de datos é similar en todos os novos temas, destacando especialmente aqueles relativos ás categorías "Finanzas" e "Goberno e administración pública".  

Baseándose nos conxuntos de datos dispoñibles publicamente, tamén se realizou unha estimación do grao de madurez actual dos datos pertencentes ás novas categorías, segundo a súa cobertura territorial e o seu grao de apertura (tendo en conta se estaban abertos en formatos leíbles por máquinas, con metadatos adecuados, etc.). Para maximizar a relación custo-beneficio global, o estudo suxire seleccionar para cada categoría temática unha aproximación distinta: con base no seu nivel de madurez, recoméndase indicar un maior ou menor número de criterios obrigatorios para a súa publicación, asegurándose así o evitar solapamientos entre os novos temas e cos datos de alto valor xa existentes. 

Estudo completo nesta ligazón(Abre en nova xanela)

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público