accesskey_mod_content

Datos oberts i IA: una relació simbiòtica per al progrés

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

"Noticia disponible únicamente con fines históricos y de hemeroteca. La información y enlaces mostrados se corresponden con los que estaban operativos a la fecha de su publicación. No se garantiza que continúen activos actualmente".

13 juny 2023

Atés que els sistemes d'Intel·ligència Artificial (IA) són models matemàtics complexos entrenats en dades, és possible combinar tots dos aspectes per a alliberar el potencial d'este poderós duo

Estos sistemes estan dissenyats per a processar i analitzar grans volums de dades amb la finalitat de reconéixer patrons i fer prediccions. Els sistemes de IA són cada vegada més precisos i sofisticats hagut de, en part, als avanços en les tècniques i algoritmes utilitzats per a la IA, l'accés a una major potència de processament informàtic i la major disponibilitat de dades.

Con estos desarrollos tecnológicos, el uso de la IA es cada vez más común en todos los sectores de Europa. La figura 1 muestra cómo en 2021 el porcentaje de empresas que utilizan tecnologías de IA variaba entre los países de Europa. Para fomentar el uso de la IA en toda Europa, la UE puso en marcha la  Estratègia Europea de IA(Obri en nova finestra)  con el objetivo de impulsar la investigación y la capacidad industrial, garantizando al mismo tiempo la seguridad y los derechos fundamentales.

Empreses de la UE que utilitzen tecnologia de IA, 2021

Los datos son un componente crítico de los sistemas de IA. Esta historia destaca la conexión entre los datos abiertos y el rendimiento de los sistemas de IA. Con casos de uso de la vida real, esta historia muestra cómo estos dos temas están interrelacionados y dependen el uno del otro para fomentar la  transició digital d'Europa(Obri en nova finestra) .

Com les dades obertes i la IA estan estretament relacionats

Les dades obertes i la IA tenen el potencial de recolzar i millorar les capacitats de cadascun. D'una banda, les dades obertes poden millorar els sistemes de IA. En general, exposar els sistemes de IA a un major volum i varietat de dades augmenta la possibilitat que el sistema retorne prediccions precises i útils. Com a tal, les dades obertes poden ser un subministrament de grans quantitats d'informació diversa per als sistemes de IA. D'esta manera, la disponibilitat de dades obertes contribuïx a un millor rendiment de la IA. Por ejemplo, un sistema de IA entrenat per a predir els  patrons de consum dels(Obri en nova finestra)  consumidors en Europa probablemente funcionará mejor si incluye una selección representativa de transacciones de bienes y servicios por parte de consumidores en diferentes países, municipios y grupos de ingresos.

D'altra banda La IA pot desbloquejar valor addicional de les dades obertes. La IA pot analitzar grans volums de dades i identificar tendències i patrons que podrien no haver sigut revelats a través d'altres tècniques d'anàlisis. Les dades obertes contenen informació rica i patrons complexos dels quals es poden derivar coneixements. Com una poderosa ferramenta d'anàlisi, la IA pot aprofitar el valor de les dades obertes. Per exemple, un sistema de IA entrenat per a predir  incendis forestals(Obri en nova finestra)  puede buscar patrones a través de datos meteorológicos, imágenes satelitales y tendencias históricas que las comparaciones estadísticas estándar no pueden identificar.

La IA pot beneficiar-se de l'amplitud de les dades obertes

Los datos abiertos abarcan una amplia gama de áreas temáticas. Esta variedad de datos amplía los posibles casos de uso para los que se pueden desarrollar sistemas de IA, lo que hace posibles nuevos productos y servicios impulsados por IA. Estos casos de uso solo se pueden desarrollar si los datos relevantes están disponibles y son de fácil acceso. La libre disponibilidad de diversos conjuntos de datos, como a través de datos abiertos, es esencial para impulsar la innovación y brindar nuevas oportunidades económicas. La esperanza es que los sistemas innovadores de IA puedan usarse para ayudar a resolver los desafíos que enfrenta la sociedad, creando valor socioeconómico.

El divers conjunt d'informació que les dades obertes poden proporcionar als sistemes de IA especialment pot permetre aplicacions multidisciplinàries que combinen dades sobre diversos temes per a obtindre nous coneixements. Per exemple, un conjunt de dades meteorològiques es pot utilitzar per a fer prediccions meteorològiques. Però combinat amb dades sobre genètica de llavors, característiques del sòl i condicions ambientals, es pot entrenar un sistema de IA per a tindre un bon coneixement contextual de les  variables que afecten la producció agrícola(Obri en nova finestra) . Dicho sistema podría utilizarse para ayudar a la toma de decisiones para aumentar el rendimiento de los cultivos, prevenir enfermedades de las plantas u optimizar otras decisiones comerciales.

La IA pot beneficiar-se de la profunditat de les dades obertes

Si bien la amplitud de las áreas temáticas cubiertas por los datos abiertos permite amplios casos de uso para los sistemas de IA, tener una gran cantidad de datos abiertos disponibles en un caso de uso específico permite que los sistemas de IA funcionen mejor. Tomemos, por ejemplo, un sistema de IA desarrollado para reconocer edificios residenciales. Si la IA se entrena solo con imágenes capturadas en el verano de mansiones en el campo, el modelo tendrá un mal desempeño cuando se le pida que reconozca un apartamento de la ciudad como un edificio residencial. Por lo tanto, el modelo debe ser entrenado en un conjunto integral de ejemplos para comprender las variaciones de lo que se considera un edificio residencial (en este caso, factores como el estilo arquitectónico, el tamaño del edificio y el entorno circundante pueden ser relevantes).

Les dades que representen exhaustivament el tema exposen els sistemes de IA a una gamma més àmplia d'escenaris i variacions. En última instància, açò permet que els models de IA funcionen millor en situacions del món real i generalitzen el seu coneixement quan s'enfronten a noves dades (com una imatge d'una casa individual que el model no ha vist abans). Els sistemes de IA entrenats amb dades no representatives o incomplets corren el risc de fer prediccions esbiaixades i ser poc confiables.

La IA d'alta qualitat es basa en dades obertes d'alta qualitat

La integritat de les dades obertes contribuïx a la capacitat dels sistemes de IA per a generalitzar a exemples no vistos una vegada que s'implementen en l'operació del "món real", però també contribuïx al concepte de qualitat de les dades. Algunes característiques de la calidad de los datos incluyen la integridad, relevancia, consistencia, uniformidad y confiabilidad de los datos para el caso de uso que se está desarrollando. La Figura 2 muestra la relación entre seis dimensiones de calidad de datos y el rendimiento de tres tipos de algoritmos de IA de un  article  de investigadors de la Universitat de Potsdam. Per exemple, la figura mostra que la integritat (sense dades faltantes) i la precisió de les característiques (sense dades errònies) tenen un fort efecte en el rendiment dels tres algoritmes de IA. D'altra banda, els algoritmes d'agrupació es veuen menys afectats per la precisió de l'objectiu (sense etiquetatge incorrecte de les dades), la unicitat (sense dades redundants o duplicats) i l'equilibri de classes (tindre grups igualment representats).

Efectes de les dimensions de qualitat de dades en l'aprenentatge automàtic

Diverses iniciatives de dades obertes en el camp científic demostren l'impacte dels repositoris oberts amb catàlegs estructurats de dades i formats de dades estandarditzades. Per exemple, el govern alemany finança una infraestructura nacional de dades d'investigació que inclou un consorci (anomenat  NFDI4Chem(Obri en nova finestra) ) que fa que les dades químiques es puguen trobar, accessibles, interoperables i reutilitzables mitjançant l'establiment de les millors pràctiques, incloses les estructures químiques llegibles per màquina. Estes bases de dades solen incloure un procés de revisió de qualitat o un mètode de curació per a garantir la qualitat i confiabilitat de les dades.

Una mayor demanda de datos abiertos para nuevos productos y servicios podría alentar la publicación de más conjuntos de datos y mejoras en la calidad de los datos. Per tant, és prometedor veure en el  Informe de Maduresa de Dades Obertes 2022(Obri en nova finestra)  com els països europeus estan treballant per a millorar la qualitat de les dades publicades en els seus portals nacionals de dades obertes.

Les dades obertes permeten aplicacions de IA en el món real

Hi ha diversos exemples de datos abiertos que se utilizan en sistemas de IA para aplicaciones novedosas en Europa.

Com a primer exemple, l'aplicació croata  CROZ RenEUwable(Obri en nova finestra)  combina dades climàtiques i energètics en un model d'aprenentatge automàtic que proporciona als ciutadans recomanacions personals per a adoptar decisions més sostenibles sobre energia. L'aplicació impulsada per IA, que va guanyar el  EU Datathon 2022(Obri en nova finestra)  en la categoria de 'Un Pacte Verd Europeu', es basa en dades obertes seleccionades per l'equip en funció de la qualitat, integritat, consistència, puntualitat i usabilitat.

Un altre exemple és un projecte per a la  Administració de Cadastre i Topografia(Obri en nova finestra)  de Luxemburg que il·lustra l'ús de la IA per a analitzar imatges aèries guardades en bases de  dades geogràfiques(Obri en nova finestra) . La figura 3 mostra una sèrie anual de tals fotografies aèries. Estes bases de dades han d'actualitzar-se i mantindre's contínuament, amb noves imatges aèries afegides cada any. Esta tasca inclou la identificació de tots els edificis recentment construïts, demolits o actualitzats. Realitzar aquesta inspecció manualment és molt laboriós, per la qual cosa el govern luxemburgués va llançar un projecte per a desenvolupar una prova de concepte d'una ferramenta basada en IA que puga identificar automàticament els canvis en els edificis. El projecte va produir resultats satisfactoris i un objectiu per a les versions posteriors és incloure altres objectes topogràfics com a senderes per a caminar.

Canvis paisatgístics en Beaufort, Luxemburg, 2001-2022

Com a  exemplefinal de cas d'ús, la Comissió Europea va llançar la Iniciativa Europea de  Imatges del Càncer(Obri en nova finestra)  per a aprofitar els datos y las tecnologías digitales, como la IA, para combatir el cáncer. Esta iniciativa tiene como objetivo crear un  conjunt de dades obert(Obri en nova finestra)  que vincule tots els recursos i bases de dades existents en tota Europa, treballant cap a una infraestructura més oberta, disponible i fàcil d'usar per a les imatges del càncer. S'espera que la infraestructura es complete al desembre de 2023, després de la qual cosa els proveïdors de dades podran connectar-se a la plataforma.

Conclusió

El potencial dels sistemes de IA en la societat és enorme. Quan es combinen amb dades obertes, es fan possibles noves oportunitats tant per a obtindre nous coneixements de les dades obertes com per a impulsar els sistemes de IA per a nous usos. La lliure disponibilitat de dades obertes proporcionades a tots els ciutadans sense límits en la seua reutilització permet a les empreses implementar estes dades en els seus sistemes de IA. Els nous casos d'ús estan recolzats per la diversitat de dades obertes tant en la seua amplitud potencial, que oferiria múltiples casos d'ús per a sistemes de IA, com en la seua profunditat potencial, que oferiria una representació profunda d'un cas d'ús específic. Les iniciatives polítiques que promouen l'intercanvi de determinats conjunts de dades recolzen la diversitat de les dades obertes a Europa.

Augmentar l'accés a dades obertes d'alta qualitat és una prioritat per a desbloquejar la sinergia entre les dades obertes i la IA. Les millores addicionals en la qualitat de les dades estan recolzades per políticas e iniciativas comunitarias que imponen estándares de calidad y métodos de curación en datos abiertos. Data.europa.eu contribuïx a este objectiu mitjançant, entre altres mitjans, el seu  panell de control de qualitat(Obri en nova finestra)  de metadades que pretén ajudar als proveïdors de dades i portals de dades nacionals a avaluar les seues metadades en funció de diversos indicadors, com l'accessibilitat i la reutilització.

Font original de la notícia(Obri en nova finestra)

  • Informació i dades del sector públic
  • Intel·ligència Artificial i Blockchain