"Notícia disponible únicament amb finalitats històriques i d'hemeroteca. La informació i enllaços mostrats es corresponen amb els quals estaven operatius a la data de la seua publicació. No es garantix que continuen actius actualment".
Estos sistemes estan dissenyats per a processar i analitzar grans volums de dades amb la finalitat de reconéixer patrons i fer prediccions. Els sistemes de IA són cada vegada més precisos i sofisticats hagut de, en part, als avanços en les tècniques i algoritmes utilitzats per a la IA, l'accés a una major potència de processament informàtic i la major disponibilitat de dades.
Amb estos desenvolupaments tecnològics, l'ús de la IA és cada vegada més comuna en tots els sectors d'Europa. La figura 1 mostra com en 2021 el percentatge d'empreses que utilitzen tecnologies de IA variava entre els països d'Europa. Per a fomentar l'ús de la IA en tota Europa, la UE va posar en marxa la Estratègia Europea de IA amb l'objectiu d'impulsar la investigació i la capacitat industrial, garantint al mateix temps la seguretat i els drets fonamentals.
Les dades són un component crític dels sistemes de IA. Esta història destaca la connexió entre les dades obertes i el rendiment dels sistemes de IA. Amb casos d'ús de la vida real, esta història mostra com estos dos temes estan interrelacionats i depenen l'u de l'altre per a fomentar la transició digital d'Europa .
Com les dades obertes i la IA estan estretament relacionats
Les dades obertes i la IA tenen el potencial de recolzar i millorar les capacitats de cadascun. D'una banda, les dades obertes poden millorar els sistemes de IA. En general, exposar els sistemes de IA a un major volum i varietat de dades augmenta la possibilitat que el sistema retorne prediccions precises i útils. Com a tal, les dades obertes poden ser un subministrament de grans quantitats d'informació diversa per als sistemes de IA. D'esta manera, la disponibilitat de dades obertes contribuïx a un millor rendiment de la IA. Per exemple, un sistema de IA entrenat per a predir els patrons de consum dels consumidors a Europa probablement funcionarà millor si inclou una selecció representativa de transaccions de béns i servicis per part de consumidors en diferents països, municipis i grups d'ingressos.
D'altra banda La IA pot desbloquejar valor addicional de les dades obertes. La IA pot analitzar grans volums de dades i identificar tendències i patrons que podrien no haver sigut revelats a través d'altres tècniques d'anàlisis. Les dades obertes contenen informació rica i patrons complexos dels quals es poden derivar coneixements. Com una poderosa ferramenta d'anàlisi, la IA pot aprofitar el valor de les dades obertes. Per exemple, un sistema de IA entrenat per a predir incendis forestals pot buscar patrons a través de dades meteorològiques, imatges satelitales i tendències històriques que les comparacions estadístiques estàndard no poden identificar.
La IA pot beneficiar-se de l'amplitud de les dades obertes
Les dades obertes abasten una àmplia gamma d'àrees temàtiques. Esta varietat de dades amplia els possibles casos d'ús per als quals es poden desenvolupar sistemes de IA, la qual cosa fa possibles nous productes i servicis impulsats per IA. Estos casos d'ús solament es poden desenvolupar si les dades rellevants estan disponibles i són de fàcil accés. La lliure disponibilitat de diversos conjunts de dades, com a través de dades obertes, és essencial per a impulsar la innovació i brindar noves oportunitats econòmiques. L'esperança és que els sistemes innovadors de IA puguen usar-se per a ajudar a resoldre els desafiaments que enfronta la societat, creant valor socioeconòmic.
El divers conjunt d'informació que les dades obertes poden proporcionar als sistemes de IA especialment pot permetre aplicacions multidisciplinàries que combinen dades sobre diversos temes per a obtindre nous coneixements. Per exemple, un conjunt de dades meteorològiques es pot utilitzar per a fer prediccions meteorològiques. Però combinat amb dades sobre genètica de llavors, característiques del sòl i condicions ambientals, es pot entrenar un sistema de IA per a tindre un bon coneixement contextual de les variables que afecten la producció agrícola . Aquest sistema podria utilitzar-se per a ajudar a la presa de decisions per a augmentar el rendiment dels cultius, previndre malalties de les plantes o optimitzar altres decisions comercials.
La IA pot beneficiar-se de la profunditat de les dades obertes
Si bé l'amplitud de les àrees temàtiques cobertes per les dades obertes permet amplis casos d'ús per als sistemes de IA, tindre una gran quantitat de dades obertes disponibles en un cas d'ús específic permet que els sistemes de IA funcionen millor. Prenguem, per exemple, un sistema de IA desenvolupat per a reconéixer edificis residencials. Si la IA s'entrena solament amb imatges capturades en l'estiu de mansions en el camp, el model tindrà un mal acompliment quan se li demane que reconega un apartament de la ciutat com un edifici residencial. Per tant, el model ha de ser entrenat en un conjunt integral d'exemples per a comprendre les variacions del que es considera un edifici residencial (en este cas, factors com l'estil arquitectònic, la grandària de l'edifici i l'entorn circumdant poden ser rellevants).
Les dades que representen exhaustivament el tema exposen els sistemes de IA a una gamma més àmplia d'escenaris i variacions. En última instància, açò permet que els models de IA funcionen millor en situacions del món real i generalitzen el seu coneixement quan s'enfronten a noves dades (com una imatge d'una casa individual que el model no ha vist abans). Els sistemes de IA entrenats amb dades no representatives o incomplets corren el risc de fer prediccions esbiaixades i ser poc confiables.
La IA d'alta qualitat es basa en dades obertes d'alta qualitat
La integritat de les dades obertes contribuïx a la capacitat dels sistemes de IA per a generalitzar a exemples no vistos una vegada que s'implementen en l'operació del "món real", però també contribuïx al concepte de qualitat de les dades. Algunes característiques de la qualitat de les dades inclouen la integritat, rellevància, consistència, uniformitat i confiabilitat de les dades per al cas d'ús que s'està desenvolupant. La Figura 2 mostra la relació entre sis dimensions de qualitat de dades i el rendiment de tres tipus d'algoritmes de IA d'un article de investigadors de la Universitat de Potsdam. Per exemple, la figura mostra que la integritat (sense dades faltantes) i la precisió de les característiques (sense dades errònies) tenen un fort efecte en el rendiment dels tres algoritmes de IA. D'altra banda, els algoritmes d'agrupació es veuen menys afectats per la precisió de l'objectiu (sense etiquetatge incorrecte de les dades), la unicitat (sense dades redundants o duplicats) i l'equilibri de classes (tindre grups igualment representats).
Diverses iniciatives de dades obertes en el camp científic demostren l'impacte dels repositoris oberts amb catàlegs estructurats de dades i formats de dades estandarditzades. Per exemple, el govern alemany finança una infraestructura nacional de dades d'investigació que inclou un consorci (anomenat NFDI4Chem ) que fa que les dades químiques es puguen trobar, accessibles, interoperables i reutilitzables mitjançant l'establiment de les millors pràctiques, incloses les estructures químiques llegibles per màquina. Estes bases de dades solen incloure un procés de revisió de qualitat o un mètode de curació per a garantir la qualitat i confiabilitat de les dades.
Una major demanda de dades obertes per a nous productes i servicis podria encoratjar la publicació de més conjunts de dades i millores en la qualitat de les dades. Per tant, és prometedor veure en el Informe de Maduresa de Dades Obertes 2022 com els països europeus estan treballant per a millorar la qualitat de les dades publicades en els seus portals nacionals de dades obertes.
Les dades obertes permeten aplicacions de IA en el món real
Hi ha diversos exemples de dades obertes que s'utilitzen en sistemes de IA per a aplicacions noves a Europa.
Com a primer exemple, l'aplicació croata CROZ RenEUwable combina dades climàtiques i energètics en un model d'aprenentatge automàtic que proporciona als ciutadans recomanacions personals per a adoptar decisions més sostenibles sobre energia. L'aplicació impulsada per IA, que va guanyar el EU Datathon 2022 en la categoria de 'Un Pacte Verd Europeu', es basa en dades obertes seleccionades per l'equip en funció de la qualitat, integritat, consistència, puntualitat i usabilitat.
Un altre exemple és un projecte per a la Administració de Cadastre i Topografia de Luxemburg que il·lustra l'ús de la IA per a analitzar imatges aèries guardades en bases de dades geogràfiques . La figura 3 mostra una sèrie anual de tals fotografies aèries. Estes bases de dades han d'actualitzar-se i mantindre's contínuament, amb noves imatges aèries afegides cada any. Esta tasca inclou la identificació de tots els edificis recentment construïts, demolits o actualitzats. Realitzar aquesta inspecció manualment és molt laboriós, per la qual cosa el govern luxemburgués lanzó un proyecto para desarrollar una prueba de concepto de una herramienta basada en IA que pueda identificar automáticamente los cambios en los edificios. El proyecto produjo resultados satisfactorios y un objetivo para las versiones posteriores es incluir otros objetos topográficos como senderos para caminar.
Com a exemplefinal de cas d'ús, la Comissió Europea va llançar la Iniciativa Europea de Imatges del Càncer per a aprofitar les dades i les tecnologies digitals, com la IA, per a combatre el càncer. Esta iniciativa té com a objectiu crear un conjunt de dades obert que vincule tots els recursos i bases de dades existents en tota Europa, treballant cap a una infraestructura més oberta, disponible i fàcil d'usar per a les imatges del càncer. S'espera que la infraestructura es complete al desembre de 2023, després de la qual cosa els proveïdors de dades podran connectar-se a la plataforma.
Conclusió
El potencial dels sistemes de IA en la societat és enorme. Quan es combinen amb dades obertes, es fan possibles noves oportunitats tant per a obtindre nous coneixements de les dades obertes com per a impulsar els sistemes de IA per a nous usos. La lliure disponibilitat de dades obertes proporcionades a tots els ciutadans sense límits en la seua reutilització permet a les empreses implementar estes dades en els seus sistemes de IA. Los nuevos casos de uso están respaldados por la diversidad de datos abiertos tanto en su amplitud potencial, que ofrecería múltiples casos de uso para sistemas de IA, como en su profundidad potencial, que ofrecería una representación profunda de un caso de uso específico. Las iniciativas políticas que promueven el intercambio de determinados conjuntos de datos apoyan la diversidad de los datos abiertos en Europa.
Augmentar l'accés a dades obertes d'alta qualitat és una prioritat per a desbloquejar la sinergia entre les dades obertes i la IA. Les millores addicionals en la qualitat de les dades estan recolzades per políticas e iniciativas comunitarias que imponen estándares de calidad y métodos de curación en datos abiertos. Data.europa.eu contribuïx a este objectiu mitjançant, entre altres mitjans, el seu panell de control de qualitat de metadades que pretén ajudar als proveïdors de dades i portals de dades nacionals a avaluar les seues metadades en funció de diversos indicadors, com l'accessibilitat i la reutilització.
Font original de la notícia
- Informació i dades del sector públic
- Intel·ligència Artificial i Blockchain