accesskey_mod_content

Datos abertos e IA: unha relación simbiótica para o progreso

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

"Noticia dispoñible unicamente con fins históricos e de hemeroteca. A información e ligazóns mostradas correspóndense cos que estaban operativos á data da súa publicación. Non se garante que continúen activos actualmente".

13 xuño 2023

Dado que los sistemas de Inteligencia Artificial (IA) son modelos matemáticos complejos entrenados en datos, es posible combinar ambos aspectos para liberar el potencial de este poderoso dúo

Estes sistemas están deseñados para procesar e analizar grandes volumes de datos co fin de recoñecer patróns e facer predicións. Os sistemas de IA son cada vez máis precisos e sofisticados debido, en parte, aos avances nas técnicas e algoritmos utilizados para a IA, o acceso a unha maior potencia de procesamento informático e a maior dispoñibilidade de datos.

Con estes desenvolvementos tecnolóxicos, o uso da IA é cada vez máis común en todos os sectores de Europa. A figura 1 mostra como en 2021 a porcentaxe de empresas que utilizan tecnoloxías de IA variaba entre os países de Europa. Para fomentar o uso da IA en toda Europa, a UE puxo en marcha a  Estratexia Europea de IA(Abre en nova xanela)  co obxectivo de impulsar a investigación e a capacidade industrial, garantindo ao mesmo tempo a seguridade e os dereitos fundamentais.

Empresas da UE que utilizan tecnoloxía de IA, 2021

Os datos son un compoñente crítico dos sistemas de IA. Esta historia destaca a conexión entre os datos abertos e o rendemento dos sistemas de IA. Con casos de uso da vida real, esta historia mostra como estes dous temas están interrelacionados e dependen o un do outro para fomentar a  transición dixital de Europa(Abre en nova xanela) .

Como os datos abertos e a IA están estreitamente relacionados

Os datos abertos e a IA teñen o potencial de apoiar e mellorar as capacidades de cada un. Por unha banda, os datos abertos poden mellorar os sistemas de IA. En xeral, expor os sistemas de IA a un maior volume e variedade de datos aumenta a posibilidade de que o sistema devolva predicións precisas e útiles. Como tal, os datos abertos poden ser unha subministración de grandes cantidades de información diversa para os sistemas de IA. Desta maneira, a dispoñibilidade de datos abertos contribúe a un mellor rendemento da IA. Por ejemplo, un sistema de IA adestrado para predicir os  patróns de consumo dos(Abre en nova xanela)  consumidores en Europa probablemente funcionará mellor se inclúe unha selección representativa de transaccións de bens e servizos por parte de consumidores en diferentes países, municipios e grupos de ingresos.

Doutra banda A IA pode desbloquear valor adicional dos datos abertos. A IA pode analizar grandes volumes de datos e identificar tendencias e patróns que poderían non ser revelados a través doutras técnicas de análises. Os datos abertos conteñen información rica e patróns complexos dos que se poden derivar coñecementos. Como unha poderosa ferramenta de análise, a IA pode aproveitar o valor dos datos abertos. Por exemplo, un sistema de IA adestrado para predicir  incendios forestais(Abre en nova xanela)  puede buscar patrones a través de datos meteorológicos, imágenes satelitales y tendencias históricas que las comparaciones estadísticas estándar no pueden identificar.

A IA pode beneficiarse da amplitude dos datos abertos

Os datos abertos abarcan unha ampla gama de áreas temáticas. Esta variedade de datos amplía os posibles casos de uso para os que se poden desenvolver sistemas de IA, o que fai posibles novos produtos e servizos impulsados por IA. Estes casos de uso só pódense desenvolver se os datos relevantes están dispoñibles e son de fácil acceso. A libre dispoñibilidade de diversos conxuntos de datos, como a través de datos abertos, é esencial para impulsar a innovación e brindar novas oportunidades económicas. A esperanza é que os sistemas innovadores de IA poidan usarse para axudar a resolver os desafíos que enfronta a sociedade, creando valor socioeconómico.

El diverso conjunto de información que los datos abiertos pueden proporcionar a los sistemas de IA especialmente puede permitir aplicaciones multidisciplinarias que combinan datos sobre varios temas para obtener nuevos conocimientos. Por ejemplo, un conjunto de datos meteorológicos se puede utilizar para hacer predicciones meteorológicas. Pero combinado con datos sobre genética de semillas, características del suelo y condiciones ambientales, se puede entrenar un sistema de IA para tener un buen conocimiento contextual de las  variables que afectan a produción agrícola(Abre en nova xanela) . Este sistema podería utilizarse para axudar á toma de decisións para aumentar o rendemento dos cultivos, previr enfermidades das plantas ou optimizar outras decisións comerciais.

A IA pode beneficiarse da profundidade dos datos abertos

Aínda que a amplitude das áreas temáticas cubertas polos datos abertos permite amplos casos de uso para os sistemas de IA, ter unha gran cantidade de datos abertos dispoñibles nun caso de uso específico permite que os sistemas de IA funcionen mellor. Tomemos, por exemplo, un sistema de IA desenvolvido para recoñecer edificios residenciais. Se a IA adéstrase só con imaxes capturadas no verán de mansións no campo, o modelo terá un mal desempeño cando se lle pida que recoñeza un apartamento da cidade como un edificio residencial. Por tanto, o modelo debe ser adestrado nun conxunto integral de exemplos para comprender as variacións do que se considera un edificio residencial (neste caso, factores como o estilo arquitectónico, o tamaño do edificio e a contorna circundante poden ser relevantes).

Os datos que representan exhaustivamente o tema expoñen os sistemas de IA a unha gama máis ampla de escenarios e variacións. En última instancia, isto permite que os modelos de IA funcionen mellor en situacións do mundo real e xeneralicen o seu coñecemento cando se enfrontan a novos datos (como unha imaxe dunha casa individual que o modelo non viu antes). Os sistemas de IA adestrados con datos non representativos ou incompletos corren o risco de facer predicións nesgadas e ser pouco confiables.

La IA de alta calidad se basa en datos abiertos de alta calidad

A integridade dos datos abertos contribúe á capacidade de os sistemas de IA para xeneralizar a exemplos non vistos unha vez que se implementan na operación do "mundo real", pero tamén contribúe ao concepto de calidade dos datos. Algunhas características da calidade dos datos inclúen a integridade, relevancia, consistencia, uniformidade e confiabilidad dos datos para o caso de uso que se está desenvolvendo. A Figura 2 mostra a relación entre seis dimensións de calidade de datos e o rendemento de tres tipos de algoritmos de IA de un  artigo  de investigadores de la Universidad de Potsdam. Por ejemplo, la figura muestra que la integridad (sin datos faltantes) y la precisión de las características (sin datos erróneos) tienen un fuerte efecto en el rendimiento de los tres algoritmos de IA. Por otro lado, los algoritmos de agrupación se ven menos afectados por la precisión del objetivo (sin etiquetado incorrecto de los datos), la unicidad (sin datos redundantes o duplicados) y el equilibrio de clases (tener grupos igualmente representados).

Efectos das dimensións de calidade de datos na aprendizaxe automática

Varias iniciativas de datos abertos en el campo científico demuestran el impacto de los repositorios abiertos con catálogos estructurados de datos y formatos de datos estandarizados. Por ejemplo, el gobierno alemán financia una infraestructura nacional de datos de investigación que incluye un consorcio (llamado  NFDI4Chem(Abre en nova xanela) ) que hace que los datos químicos se puedan encontrar, accesibles, interoperables y reutilizables mediante el establecimiento de las mejores prácticas, incluidas las estructuras químicas legibles por máquina. Estas bases de datos suelen incluir un proceso de revisión de calidad o un método de curación para garantizar la calidad y confiabilidad de los datos.

Unha maior demanda de datos abertos para novos produtos e servizos podería alentar a publicación de máis conxuntos de datos e melloras na calidade dos datos. Por tanto, é prometedor ver en o  Informe de Madurez de Datos Abertos 2022(Abre en nova xanela)  cómo los países europeos están trabajando para mejorar la calidad de los datos publicados en sus portales nacionales de datos abiertos.

Os datos abertos permiten aplicacións de IA no mundo real

Hai varios exemplos de datos abertos que se utilizan en sistemas de IA para aplicacións novas en Europa.

Como primeiro exemplo, a aplicación croata  CROZ RenEUwable(Abre en nova xanela)  combina datos climáticos y energéticos en un modelo de aprendizaje automático que proporciona a los ciudadanos recomendaciones personales para adoptar decisiones más sostenibles sobre energía. La aplicación impulsada por IA, que ganó EU Datathon 2022(Abre en nova xanela)  en a categoría de 'Un Pacto Verde Europeo', baséase en datos abertos seleccionados polo equipo en función da calidade, integridade, consistencia, puntualidade e usabilidade.

Outro exemplo é un proxecto para a  Administración de Catastro e Topografía(Abre en nova xanela)  de Luxemburgo que ilustra o uso da IA para analizar imaxes aéreas gardadas en bases de  datos xeográficas(Abre en nova xanela) . A figura 3 mostra unha serie anual de tales fotografías aéreas. Estas bases de datos deben actualizarse e manterse continuamente, con novas imaxes aéreas engadidas cada ano. Esta tarefa inclúe a identificación de todos os edificios recentemente construídos, demolidos ou actualizados. Realizar dita inspección manualmente é moi laborioso, polo que o goberno luxemburgués lanzou un proxecto para desenvolver unha proba de concepto dunha ferramenta baseada en IA que poida identificar automaticamente os cambios nos edificios. O proxecto produciu resultados satisfactorios e un obxectivo para as versións posteriores é incluír outros obxectos topográficos como carreiros para camiñar.

Cambios paisaxísticos en Beaufort, Luxemburgo, 2001-2022

Como ejemplo final de caso de uso, la Comisión Europea lanzó la Iniciativa Europea de  Imaxes do Cancro(Abre en nova xanela)  para aproveitar os datos e as tecnoloxías dixitais, como a IA, para combater o cancro. Esta iniciativa ten como obxectivo crear un  conxunto de datos aberto(Abre en nova xanela)  que vincule todos os recursos e bases de datos existentes en toda Europa, traballando cara a unha infraestrutura máis aberta, dispoñible e fácil de usar para as imaxes do cancro. Espérase que a infraestrutura se complete en decembro de 2023, despois do cal os provedores de datos poderán conectarse á plataforma.

Conclusión

O potencial dos sistemas de IA na sociedade é enorme. Cando se combinan con datos abertos, fanse posibles novas oportunidades tanto para obter novos coñecementos dos datos abertos como para impulsar os sistemas de IA para novos usos. A libre dispoñibilidade de datos abertos proporcionados a todos os cidadáns sen límites na súa reutilización permite a as empresas implementar estes datos nos seus sistemas de IA. Os novos casos de uso están apoiados pola diversidade de datos abertos tanto na súa amplitude potencial, que ofrecería múltiples casos de uso para sistemas de IA, como na súa profundidade potencial, que ofrecería unha representación profunda dun caso de uso específico. As iniciativas políticas que promoven o intercambio de determinados conxuntos de datos apoian a diversidade dos datos abertos en Europa.

Aumentar el acceso a datos abiertos de alta calidad es una prioridad para desbloquear la sinergia entre los datos abiertos y la IA. Las mejoras adicionales en la calidad de los datos están respaldadas por políticas e iniciativas comunitarias que impoñen estándares de calidade e métodos de curación en datos abertos. Data.europa.eu contribúe a este obxectivo mediante, entre outros medios, o seu  panel de control de calidade(Abre en nova xanela)  de metadatos que pretende axudar aos provedores de datos e portais de datos nacionais a avaliar os seus metadatos en función de diversos indicadores, como a accesibilidade e a reutilización.

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público
  • Intelixencia Artificial e Blockchain