accesskey_mod_content

Datos abertos e IA: unha relación simbiótica para o progreso

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

"Noticia dispoñible unicamente con fins históricos e de hemeroteca. A información e ligazóns mostradas correspóndense cos que estaban operativos á data da súa publicación. Non se garante que continúen activos actualmente".

13 xuño 2023

Dado que os sistemas de Intelixencia Artificial (IA) son modelos matemáticos complexos adestrados en datos, é posible combinar ambos os aspectos para liberar o potencial deste poderoso dúo

Estes sistemas están deseñados para procesar e analizar grandes volumes de datos co fin de recoñecer patróns e facer predicións. Os sistemas de IA son cada vez máis precisos e sofisticados debido, en parte, aos avances nas técnicas e algoritmos utilizados para a IA, o acceso a unha maior potencia de procesamento informático e a maior dispoñibilidade de datos.

Con estes desenvolvementos tecnolóxicos, o uso da IA é cada vez máis común en todos os sectores de Europa. A figura 1 mostra como en 2021 a porcentaxe de empresas que utilizan tecnoloxías de IA variaba entre os países de Europa. Para fomentar o uso da IA en toda Europa, a UE puxo en marcha a  Estratexia Europea de IA(Abre en nova xanela)  co obxectivo de impulsar a investigación e a capacidade industrial, garantindo ao mesmo tempo a seguridade e os dereitos fundamentais.

Empresas da UE que utilizan tecnoloxía de IA, 2021

Os datos son un compoñente crítico dos sistemas de IA. Esta historia destaca a conexión entre os datos abertos e o rendemento dos sistemas de IA. Con casos de uso da vida real, esta historia mostra como estes dous temas están interrelacionados e dependen o un do outro para fomentar a  transición dixital de Europa(Abre en nova xanela) .

Como os datos abertos e a IA están estreitamente relacionados

Os datos abertos e a IA teñen o potencial de apoiar e mellorar as capacidades de cada un. Por unha banda, os datos abertos poden mellorar os sistemas de IA. En xeral, expor os sistemas de IA a un maior volume e variedade de datos aumenta a posibilidade de que o sistema devolva predicións precisas e útiles. Como tal, os datos abertos poden ser unha subministración de grandes cantidades de información diversa para os sistemas de IA. Desta maneira, a dispoñibilidade de datos abertos contribúe a un mellor rendemento da IA. Por ejemplo, un sistema de IA adestrado para predicir os  patróns de consumo dos(Abre en nova xanela)  consumidores en Europa probablemente funcionará mellor se inclúe unha selección representativa de transaccións de bens e servizos por parte de consumidores en diferentes países, municipios e grupos de ingresos.

Doutra banda A IA pode desbloquear valor adicional dos datos abertos. A IA pode analizar grandes volumes de datos e identificar tendencias e patróns que poderían non ser revelados a través doutras técnicas de análises. Os datos abertos conteñen información rica e patróns complexos dos que se poden derivar coñecementos. Como unha poderosa ferramenta de análise, a IA pode aproveitar o valor dos datos abertos. Por exemplo, un sistema de IA adestrado para predicir  incendios forestais(Abre en nova xanela)  pode buscar patróns a través de datos meteorolóxicos, imaxes satelitales e tendencias históricas que as comparacións estatísticas estándar non poden identificar.

A IA pode beneficiarse da amplitude dos datos abertos

Os datos abertos abarcan unha ampla gama de áreas temáticas. Esta variedade de datos amplía os posibles casos de uso para os que se poden desenvolver sistemas de IA, o que fai posibles novos produtos e servizos impulsados por IA. Estes casos de uso só pódense desenvolver se os datos relevantes están dispoñibles e son de fácil acceso. A libre dispoñibilidade de diversos conxuntos de datos, como a través de datos abertos, é esencial para impulsar a innovación e brindar novas oportunidades económicas. A esperanza é que os sistemas innovadores de IA poidan usarse para axudar a resolver os desafíos que enfronta a sociedade, creando valor socioeconómico.

O diverso conxunto de información que os datos abertos poden proporcionar aos sistemas de IA especialmente pode permitir aplicacións multidisciplinarias que combinan datos sobre varios temas para obter novos coñecementos. Por exemplo, un conxunto de datos meteorolóxicos pódese utilizar para facer predicións meteorolóxicas. Pero combinado con datos sobre xenética de sementes, características do chan e condicións ambientais, pódese adestrar un sistema de IA para ter un bo coñecemento contextual de as  variables que afectan a produción agrícola(Abre en nova xanela) . Este sistema podería utilizarse para axudar á toma de decisións para aumentar o rendemento dos cultivos, previr enfermidades das plantas ou optimizar outras decisións comerciais.

A IA pode beneficiarse da profundidade dos datos abertos

Aínda que a amplitude das áreas temáticas cubertas polos datos abertos permite amplos casos de uso para os sistemas de IA, ter unha gran cantidade de datos abertos dispoñibles nun caso de uso específico permite que os sistemas de IA funcionen mellor. Tomemos, por exemplo, un sistema de IA desenvolvido para recoñecer edificios residenciais. Se a IA adéstrase só con imaxes capturadas no verán de mansións no campo, o modelo terá un mal desempeño cando se lle pida que recoñeza un apartamento da cidade como un edificio residencial. Por tanto, o modelo debe ser adestrado nun conxunto integral de exemplos para comprender as variacións do que se considera un edificio residencial (neste caso, factores como o estilo arquitectónico, o tamaño do edificio e a contorna circundante poden ser relevantes).

Os datos que representan exhaustivamente o tema expoñen os sistemas de IA a unha gama máis ampla de escenarios e variacións. En última instancia, isto permite que os modelos de IA funcionen mellor en situacións do mundo real e xeneralicen o seu coñecemento cando se enfrontan a novos datos (como unha imaxe dunha casa individual que o modelo non viu antes). Os sistemas de IA adestrados con datos non representativos ou incompletos corren o risco de facer predicións nesgadas e ser pouco confiables.

A IA de alta calidade baséase en datos abertos de alta calidade

A integridade dos datos abertos contribúe á capacidade de os sistemas de IA para xeneralizar a exemplos non vistos unha vez que se implementan na operación do "mundo real", pero tamén contribúe ao concepto de calidade dos datos. Algunhas características da calidade dos datos inclúen a integridade, relevancia, consistencia, uniformidade e confiabilidad dos datos para o caso de uso que se está desenvolvendo. A Figura 2 mostra a relación entre seis dimensións de calidade de datos e o rendemento de tres tipos de algoritmos de IA de un  artigo  de investigadores da Universidade de Potsdam. Por exemplo, a figura mostra que a integridade (sen datos faltantes) e a precisión das características (sen datos erróneos) teñen un forte efecto no rendemento do tres algoritmos de IA. Doutra banda, os algoritmos de agrupación ven menos afectados pola precisión do obxectivo (sen etiquetaxe incorrecta dos datos), a unicidade (sen datos redundantes ou duplicados) e o equilibrio de clases (ter grupos igualmente representados).

Efectos das dimensións de calidade de datos na aprendizaxe automática

Varias iniciativas de datos abertos no campo científico demostran o impacto dos repositorios abertos con catálogos estruturados de datos e formatos de datos estandarizados. Por exemplo, o goberno alemán financia unha infraestrutura nacional de datos de investigación que inclúe un consorcio (chamado  NFDI4Chem(Abre en nova xanela) ) que fai que os datos químicos póidanse atopar, accesibles, interoperables e reutilizables mediante o establecemento das mellores prácticas, incluídas as estruturas químicas legibles por máquina. Estas bases de datos adoitan incluír un proceso de revisión de calidade ou un método de curación para garantir a calidade e confiabilidad dos datos.

Unha maior demanda de datos abertos para novos produtos e servizos podería alentar a publicación de máis conxuntos de datos e melloras na calidade dos datos. Por tanto, é prometedor ver en o  Informe de Madurez de Datos Abertos 2022(Abre en nova xanela)  como os países europeos están a traballar para mellorar a calidade dos datos publicados nos seus portais nacionais de datos abertos.

Os datos abertos permiten aplicacións de IA no mundo real

Hai varios exemplos de datos abertos que se utilizan en sistemas de IA para aplicacións novas en Europa.

Como primeiro exemplo, a aplicación croata  CROZ RenEUwable(Abre en nova xanela)  combina datos climáticos e enerxéticos nun modelo de aprendizaxe automática que proporciona ás cidadáns recomendacións persoais para adoptar decisións máis sustentables sobre enerxía. A aplicación impulsada por IA, que gañou EU Datathon 2022(Abre en nova xanela)  en a categoría de 'Un Pacto Verde Europeo', baséase en datos abertos seleccionados polo equipo en función da calidade, integridade, consistencia, puntualidade e usabilidade.

Outro exemplo é un proxecto para a  Administración de Catastro e Topografía(Abre en nova xanela)  de Luxemburgo que ilustra o uso da IA para analizar imaxes aéreas gardadas en bases de  datos xeográficas(Abre en nova xanela) . A figura 3 mostra unha serie anual de tales fotografías aéreas. Estas bases de datos deben actualizarse e manterse continuamente, con novas imaxes aéreas engadidas cada ano. Esta tarefa inclúe a identificación de todos os edificios recentemente construídos, demolidos ou actualizados. Realizar dita inspección manualmente é moi laborioso, polo que o goberno luxemburgués lanzou un proxecto para desenvolver unha proba de concepto dunha ferramenta baseada en IA que poida identificar automaticamente os cambios nos edificios. O proxecto produciu resultados satisfactorios e un obxectivo para as versións posteriores é incluír outros obxectos topográficos como carreiros para camiñar.

Cambios paisaxísticos en Beaufort, Luxemburgo, 2001-2022

Como exemplo final de caso de uso, a Comisión Europea lanzou a Iniciativa Europea de  Imaxes do Cancro(Abre en nova xanela)  para aproveitar os datos e as tecnoloxías dixitais, como a IA, para combater o cancro. Esta iniciativa ten como obxectivo crear un  conxunto de datos aberto(Abre en nova xanela)  que vincule todos os recursos e bases de datos existentes en toda Europa, traballando cara a unha infraestrutura máis aberta, dispoñible e fácil de usar para as imaxes do cancro. Espérase que a infraestrutura se complete en decembro de 2023, despois do cal os provedores de datos poderán conectarse á plataforma.

Conclusión

O potencial dos sistemas de IA na sociedade é enorme. Cando se combinan con datos abertos, fanse posibles novas oportunidades tanto para obter novos coñecementos dos datos abertos como para impulsar os sistemas de IA para novos usos. A libre dispoñibilidade de datos abertos proporcionados a todos os cidadáns sen límites na súa reutilización permite a as empresas implementar estes datos nos seus sistemas de IA. Os novos casos de uso están apoiados pola diversidade de datos abertos tanto na súa amplitude potencial, que ofrecería múltiples casos de uso para sistemas de IA, como na súa profundidade potencial, que ofrecería unha representación profunda dun caso de uso específico. As iniciativas políticas que promoven o intercambio de determinados conxuntos de datos apoian a diversidade dos datos abertos en Europa.

Aumentar o acceso a datos abertos de alta calidade é unha prioridade para desbloquear a sinerxia entre os datos abertos e a IA. As melloras adicionais na calidade dos datos están apoiadas por políticas e iniciativas comunitarias que imponen estándares de calidad y métodos de curación en datos abiertos. Data.europa.eu contribúe a este obxectivo mediante, entre outros medios, o seu  panel de control de calidade(Abre en nova xanela)  de metadatos que pretende axudar aos provedores de datos e portais de datos nacionais a avaliar os seus metadatos en función de diversos indicadores, como a accesibilidade e a reutilización.

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público
  • Intelixencia Artificial e Blockchain