accesskey_mod_content

A Unión Europea amplía as categorías a considerar datos de alto valor

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

05 decembro 2023

O concepto de datos de alto valor (High-Value datasets) foi introducido polo Parlamento Europeo e o Consello da Unión Europea hai 4 anos, na Directiva (UE) 2019/1024.

O concepto de datos datos de alto valor(Abre en nova xanela)  (High-Value datasets) foi introducido polo Parlamento Europeo e o Consello da Unión Europea hai 4 anos, na Directiva (UE) 2019/1024(Abre en nova xanela) . Nela definíanse como unha serie de conxuntos de datos cun gran potencial para xerar “beneficios para a sociedade, o medio ambiente e a economía”. Por iso, os estados membro debían impulsar a súa apertura de maneira gratuíta, en formatos legibles por máquinas, a través de APIs, en forma de descarga masiva e descritos de forma exhaustiva mediante metadatos.  

De maneira inicial, a directiva propuña no seu anexo seis categorías temáticas a considerar como de alto valor: datos geoespaciales, observación da terra e ambiental, meteorolóxicos, estatísticos, rexistros empresariais e datos sobre redes de transporte. Estas categorías categorías foron detalladas(Abre en nova xanela) posteriormente nun regulamento de execución(Abre en nova xanela) publicado en decembro de 2022. Ademais, para facilitar a súa apertura, en xuño de 2023 editouse un documento con pautas pautas sobre como usar DCAT-AP para a súa publicación(Abre en nova xanela) .

Novas categorías de datos a considerar de alto valor

Estas categorías iniciais sempre estiveron abertas á súa ampliación. Neste sentido, a Comisión Europea acaba de publicar o informe "Identification of data themes for the extensions of public sector High-Value Datasets"(Abre en nova xanela)  onde se inclúen sete novas categorías que se estuda considerar como datos de alto valor:

  • Perda climática: Fai referencia aos datos relacionados cos enfoques e accións necesarios para evitar, minimizar e abordar os danos asociados ao cambio climático. Exemplos de conxuntos de datos desta categoría son as perdas económicas e non económicas derivadas dos fenómenos meteorolóxicos extremos ou os cambios de evolución lenta, como o aumento do nivel do mar ou a desertificación. Tamén inclúe datos relacionados cos sistemas de alerta temperá ante desastres naturais, a repercusión das medidas de mitigación ou datos de investigación sobre a atribución de fenómenos extremos ao cambio climático. 

  • Enerxía: Esta categoría inclúe estatísticas completas sobre a produción, transporte, comercio e consumo final de fontes de enerxía primarias e secundarias, tanto renovables como non renovables. Algúns exemplos de conxuntos de datos a considerar son os indicadores de prezos e consumo ou a información sobre seguridade enerxética.  

  • Finanzas: Trátase de información sobre a situación das empresas privadas e as administracións públicas, que pode utilizarse para avaliar o rendemento empresarial ou a sustentabilidade económica, así como para definir estratexias de gasto e investimento. Inclúe conxuntos de datos sobre rexistros de empresas, estados financeiros, fusións e adquisicións, así como informes financeiros anuais. 

  • Goberno e administración pública: Esta temática inclúe aqueles datos que os servizos e empresas públicas recompilan para informar e mellorar a acción de goberno e a administración dunha unidade territorial específica, xa sexa un estado, unha rexión ou un municipio. Inclúe datos relativos ao goberno (por exemplo, actas de reunións), os cidadáns (censos ou rexistro nos servizos públicos) e as infraestruturas gobernamentais. Estes datos reutilízanse posteriormente para fundamentar a elaboración de políticas, prestar servizos públicos, optimizar os recursos e a asignación orzamentaria, así como proporcionar información procesable e transparente a cidadáns e empresas. 

  • Saúde: Este concepto identifica os conxuntos de datos que cobren o benestar físico, e mental da poboación, facendo referencia tanto a aspectos obxectivos como subxectivos da saúde das persoas. Tamén inclúe indicadores clave sobre o funcionamento dos sistemas de asistencia sanitaria e a seguridade no traballo. Algúns exemplos son os datos relativos á Covid-19, a equidade sanitaria ou a listaxe de servizos prestados polos centros sanitarios. 

  • Xustiza e asuntos xurídicos:  Identifica conxuntos de datos que permiten reforzar a capacidade de resposta, a rendición de contas e a interoperabilidade dos sistemas xudiciais da UE, cubrindo ámbitos como a aplicación da xustiza, o sistema xurídico ou a seguridade pública, é dicir, aquela que garante a protección dos cidadáns. Os conxuntos de datos sobre xustiza e asuntos xurídicos inclúen documentación de xurisprudencia nacional ou internacional, decisións de tribunais e fiscais xerais, así como actos xurídicos e o seu contido. 

  • Datos lingüísticos: Fai referencia a expresións escritas ou orais que están na base da intelixencia artificial, o procesamento da linguaxe natural e o desenvolvemento de servizos relacionados. A Comisión ofrece unha definición bastante ampla desta categoría de datos, todos eles agrupados baixo a denominación de "datos lingüísticos multimodales". Poden incluír repositorios de coleccións de textos, corpus de linguas faladas, recursos de audio, ou gravacións de vídeo. 

Imaxes das novas categorías que poderían engadirse á lista de datos de alto valor

Para realizar esta selección, os autores do informe levaron a cabo unha investigación documental, así como consultas a administracións públicas, expertos en datos e empresas privadas mediante unha serie de talleres e enquisas. Ademais desta avaliación, o equipo do estudo cartografió e analizou o ecosistema normativo ao redor de cada categoría, así como as iniciativas políticas relacionadas coa súa armonización e posta en común, especialmente en relación coa creación de Espazos Espazos Comúns Europeos de Datos(Abre en nova xanela)

Potencial para as Pemes e as plataformas dixitais

Ademais de definir estas categorías, o estudo tamén ofrece unha estimación de alto nivel sobre o impacto das novas categorías nas pequenas e medianas empresas, así como nas grandes plataformas dixitais. Unha das conclusións do estudo é que a relación custo-beneficio da apertura de datos é similar en todos os novos temas, destacando especialmente aqueles relativos ás categorías "Finanzas" e "Goberno e administración pública".  

Baseándose nos conxuntos de datos dispoñibles publicamente, tamén se realizou unha estimación do grao de madurez actual dos datos pertencentes ás novas categorías, segundo a súa cobertura territorial e o seu grao de apertura (tendo en conta se estaban abertos en formatos leíbles por máquinas, con metadatos adecuados, etc.). Para maximizar a relación custo-beneficio global, o estudo suxire seleccionar para cada categoría temática unha aproximación distinta: con base no seu nivel de madurez, recoméndase indicar un maior ou menor número de criterios obrigatorios para a súa publicación, asegurándose así o evitar solapamientos entre os novos temas e cos datos de alto valor xa existentes. 

Estudo completo nesta ligazón(Abre en nova xanela)

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público