accesskey_mod_content

La Unió Europea amplia les categories a considerar dades d'alt valor

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

05 desembre 2023

El concepte de dades d'alt valor (High-Value datasets) va ser introduït pel Parlament Europeu i el Consell de la Unió Europea fa 4 anys, en la Directiva (UE) 2019/1024.

El concepte de dades d'alt valor(Obri en nova finestra)  (High-Value datasets) va ser introduït pel Parlament Europeu i el Consell de la Unió Europea fa 4 anys, en Directiva (UE) 2019/1024(Obri en nova finestra) . En ella es definien com una sèrie de conjunts de dades amb un gran potencial per a generar “beneficis per a la societat, el medi ambient i l'economia”. Per açò, els estats membre havien d'impulsar la seua obertura de manera gratuïta, en formats llegibles per màquines, a través d'APIs, en forma de descàrrega massiva i descrits de forma exhaustiva mitjançant metadades.  

De manera inicial, la directiva proposava en el seu annex sis categories temàtiques a considerar com d'alt valor: dades geoespacials, observació de la terra i mediambientals, meteorològics, estadístics, registres empresarials i dades sobre xarxes de transport. Estes categories van ser detallades(Obri en nova finestra) posteriorment en reglament d'execució(Obri en nova finestra) publicat al desembre de 2022. A més, per a facilitar la seua obertura, al juny de 2023 es va editar un document amb pautes sobre com usar DCAT-AP para la seua publicació(Obri en nova finestra) .

Noves categories de dades a considerar d'alt valor

Estes categories inicials sempre van estar obertes a la seua ampliació. En este sentit, la Comissió Europea acaba de publicar l'informe "Identification of data themes for the extensions of public sector High-Value Datasets"(Obri en nova finestra)  on s'inclouen set noves categories que s'estudia considerar com a dades d'alt valor:

  • Pèrdua climàtica: Fa referència a les dades relacionades amb els enfocaments i accions necessaris per a evitar, minimitzar i abordar els danys associats al canvi climàtic. Exemples de conjunts de dades d'esta categoria són les pèrdues econòmiques i no econòmiques derivades dels fenòmens meteorològics extrems o els canvis d'evolució lenta, com l'augment del nivell del mar o la desertificació. També inclou dades relacionades amb els sistemes d'alerta primerenca davant desastres naturals, la repercussió de les mesures de mitigació o dades d'investigació sobre l'atribució de fenòmens extrems al canvi climàtic. 

  • Energia: Esta categoria inclou estadístiques completes sobre la producció, transport, comerç i consum final de fonts d'energia primàries i secundàries, tant renovables com no renovables. Alguns exemples de conjunts de dades a considerar són els indicadors de preus i consum o la informació sobre seguretat energètica.  

  • Finances: Se tracta d'informació sobre la situació de les empreses privades i les administracions públiques, que pot utilitzar-se per a avaluar el rendiment empresarial o la sostenibilitat econòmica, així com per a definir estratègies de gasto i inversió. Inclou conjunts de dades sobre registres d'empreses, estats financers, fusions i adquisicions, així com informes financers anuals. 

  • Govern i administració pública: Esta temàtica inclou aquelles dades que els servicis i empreses públiques recopilen per a informar i millorar l'acció de govern i l'administració d'una unitat territorial específica, ja siga un estat, una regió o un municipi. Inclou dades relatives al govern (per exemple, actes de reunions), els ciutadans (censos o registre en els servicis públics) i les infraestructures governamentals. Estes dades es reutilitzen posteriorment per a fonamentar l'elaboració de polítiques, prestar servicis públics, optimitzar els recursos i l'assignació pressupostària, així com proporcionar informació procesable i transparent a ciutadans i empreses. 

  • Salut: Este concepte identifica els conjunts de dades que cobrixen el benestar físic, i mental de la població, fent referència tant a aspectes objectius com a subjectius de la salut de les persones. També inclou indicadors clau sobre el funcionament dels sistemes d'assistència sanitària i la seguretat en el treball. Alguns exemples són les dades relatives a la Covid-19, l'equitat sanitària o el llistat de servicis prestats pels centres sanitaris. 

  • Justícia i assumptes jurídics:  Identifica conjunts de dades que permeten reforçar la capacitat de resposta, la rendició de comptes i la interoperabilitat dels sistemes judicials de la UE, cobrint àmbits com l'aplicació de la justícia, el sistema jurídic o la seguretat pública, és a dir, aquella que garantix la protecció dels ciutadans. Els conjunts de dades sobre justícia i assumptes jurídics inclouen documentació de jurisprudència nacional o internacional, decisions de tribunals i fiscals generals, així com actes jurídics i el seu contingut. 

  • Dades lingüístiques: Fa referència a expressions escrites o orals que estan en la base de la intel·ligència artificial, el processament del llenguatge natural i el desenvolupament de servicis relacionats. La Comissió oferix una definició prou àmplia d'esta categoria de dades, tots ells agrupats baix la denominació de "dades lingüístiques multimodales". Poden incloure repositoris de col·leccions de textos, corpus de llengües parlades, recursos d'àudio, o gravacions de vídeo. 

Imatges de les noves categories que podrien afegir-se a la llista de dades d'alt valor

Per a realitzar esta selecció, els autors de l'informe van dur a terme una investigació documental, així com consultes a administracions públiques, experts en dades i empreses privades mitjançant una sèrie de tallers i enquestes. A més d'esta avaluació, l'equip de l'estudi va cartografiar i va analitzar l'ecosistema normatiu entorn de/entorn de cada categoria, així com les iniciatives polítiques relacionades amb la seua harmonització i posada en comú, especialment en relació amb la creació d'Espais Espais Comuns Europeus de Dades(Obri en nova finestra)

Potencial para las PYMEs i les plataformes digitals

A més de definir estes categories, l'estudi també oferix una estimació d'alt nivell sobre el impacte de les noves categories en les xicotetes i mitges empreses, així com en les grans plataformes digitals. Una de les conclusions de l'estudi és que la relació cost-beneficie de l'obertura de dades és similar en tots els nous temes, destacant especialment aquells relatius a les categories "Finances" i "Govern i administració pública".  

Basant-se en els conjunts de dades disponibles públicament, també es va realitzar una estimació del grau de maduresa actual de les dades pertanyents a les noves categories, segons la seua cobertura territorial i el seu grau d'obertura (tenint en compte si estaven oberts en formats leíbles per màquines, amb metadades adequades, etc.). Per a maximitzar la relació cost-beneficie global, l'estudi suggerix seleccionar per a cada categoria temàtica una aproximació diferent: sobre la base del seu nivell de maduresa, es recomana indicar un major o menor nombre de criteris obligatoris per a la seua publicació, assegurant-se així l'evitar solapamientos entre els nous temes i amb les dades d'alt valor ja existents. 

Estudi complet en este enllaç(Obri en nova finestra)

Font original de la notícia(Obri en nova finestra)

  • Informació i dades del sector públic