accesskey_mod_content

Reutilización i govern de dades en la nova Estratègia Nacional d'Intel·ligència Artificial espanyola

  • Escoltar
  • Imprimir PDF
  • Compartir

18 juliol 2024

Amb l'objectiu de fomentar la creació de models de leguaje especialitzats i facilitar el desenvolupament d'aplicacions per a l'àmbit públic, l'Estratègia preveu un model de governança uniforme per a les dades, inclosos els corpus documentals de l'AGE, assegurant els estàndards de seguretat, qualitat, interoperabilitat i reutilització.

La  Estratègia d'Intel·ligència Artificial 2024  és el pla integral que estableix un marc per accelerar el desenvolupament i expansió de la intel·ligència artificial (IA) a Espanya. Aquesta estratègia va ser aprovada, a proposta de el  Ministeri per a la Transformació Digital i de la Funció Pública , pel Consell de Ministres el 14 de Maig de 2024 i ve a reforçar i accelerar la  Estratègia Nacional d'Intel·ligència Artificial  (ENIA), que va començar a desplegar-se en 2020.

La  vertiginosa evolució de les tecnologies associades a la Intel·ligència Artificial  d'aquests últims anys justifica per si sola, aquest reforç. Per exemple, segons el  AI Index Report de 2024 de la Universitat de Stanford , la inversió en IA s'ha multiplicat per 9 des de 2022. El cost d'entrenament dels models ha augmentat dràsticament, però a canvi la IA està impulsant el progrés en ciència, en medicina i en la  productivitat laboral en general . Per raons com aquestes, es pretén aprofitar al màxim l'impacte de la IA en l'economia i recollir els elements positius del treball en curs.

La nova estratègia s'articula entorn de/entorn de tres eixos principals, que es desenvoluparan a través de vuit línies d'acció. Aquests eixos són:

  • Reforçar les palanques claus per al desenvolupament de la IA. Aquest eix se centra a potenciar la inversió en supercomputación, generar capacitats d'emmagatzematge en condicions de sostenibilitat, desenvolupar models i dades que constitueixin una infraestructura pública de la IA i fomentar el talent especialitzat en IA.
  • Facilitar l'expansió de la IA en el sector públic i privat, fomentant la innovació i la ciberseguretat. Aquest eix té com a objectius incorporar la IA en els processos governamentals i empresarials, amb una èmfasi especial en les pimes, i desenvolupar un marc de ciberseguretat robust.
  • Fomentar una IA transparent, ètica i humanística. Aquest eix se centra a assegurar que el desenvolupament i ús de la IA a Espanya sigui responsable i respectuós amb els drets humans, la igualtat, la privadesa i la no discriminació.

La següent infografia resumeixen els principals punts d'aquesta estratègia:

Infografia L'ESTRATÈGIA DE LA INTEL·LIGÈNCIA ARTIFICIAL 2024

L'Estratègia d'Intel·ligència Artificial 2024 d'Espanya és un document molt ambiciós que cerca posicionar al nostre país com a líder en Intel·ligència Artificial, expandint l'ús de la IA robusta i responsable en el conjunt de l'economia i en l'administració pública. Amb això es podrà contribuir al fet que multiples àrees, com són la  cultura  o el  dissenyo de ciutats , puguin beneficiar-se d'aquests progressos.

L'obertura i l'accés a dades de qualitat són també fonamentals per a l'èxit d'aquesta estratègia, ja que són part de la  matèria primera necessària per entrenar i avaluar models de IA que siguin , a més, inclusius i socialment justs perquè beneficiïn a tota la societat. Molt relacionades amb les dades obertes, l'estratègia dedica palanques específiques a l'impuls de la IA en el sector públic i a el desenvolupament de corpus i models de llenguatge fundacionals i especialitzats. Això inclou a més el desenvolupament de serveis comuns basats en models de IA i la implementació d'un model de governança de dades per assegurar la seguretat, qualitat, interoperabilitat i reutilització de les dades manejades per l'Administració General de l'Estat (AGE).

Els models fundacionals ( LLMs ) són models de gran envergadura que s'entrenaran a partir de grans corpus de dades en castellà i llengües cooficials, garantint així la seva aplicabilitat en una àmplia varietat de contextos lingüístics i culturals. Els models especialitzats (SLMs), de menor grandària, es desenvoluparan amb l'objectiu d'abordar amb una menor demanda de recursos computacionals necessitats específiques dins de sectors particulars.

Governança comuna de dades de l'AGE

La governança de dades obertes tindrà un paper crucial en la realització dels objectius plantejats, para, per exemple, aconseguir un desenvolupament eficient de models de leguaje especialitzats. Amb l'objectiu de fomentar la creació d'aquests models i facilitar el desenvolupament d'aplicacions per a l'àmbit públic, l'estratègia preveu un model de governança uniforme per a les dades, inclosos els corpus documentals de l'Administració General de l'Estat, assegurant els estàndards de seguretat, qualitat,  interoperabilitat i reutilització de totes les dades .

Aquesta iniciativa inclou la creació de un  espai de dades unificat  que permeti explotar conjunts de dades sectorials específiques per resoldre casos d'ús concrets de cada organisme. La governança de dades garantirà l'anonimització i privadesa de la informació, així com el respecte a la normativa vigent durant tot el cicle de vida de les dades.

Es desenvoluparà una estructura organitzativa orientada a la dada, amb la  Direcció general de la Dada  com a element vertebrador. A més, s'impulsarà la Plataforma de dades de l'AGE, la generació de catàlegs de metadades dels departaments, el mapa d'intercanvis de dades i el foment de la interoperabilitat. Tot això amb la finalitat de facilitar el desplegament d'iniciatives de IA de major qualitat i utilitat.

Desenvolupar corpus i models de llenguatge fundacionals i especialitzats

Dins de la palanca número tres, el document reconeix que la base fonamental per a l'entrenament dels models de llenguatge són la quantitat i qualitat de les dades disponibles, així com les llicències d'ús que habiliten la possibilitat d'utilitzar-los.

L'estratègia posa una èmfasi especial en la  creació de corpus lingüístics que siguin representatius i diversificats , incloent el castellà i les llengües cooficials com el català, basc, gallec i valencià. Aquests corpus no solament han de ser extensos, sinó també reflectir la varietat i riquesa cultural de les llengües, la qual cosa permetrà desenvolupar models més precisos i adaptats a les necessitats locals.

Per aconseguir-ho, es preveu la col·laboració amb institucions acadèmiques i de recerca, així com amb la indústria, per recopilar, netejar i etiquetar grans volums de dades textuals. A més, s'implementaran polítiques que facilitin l'accés a aquestes dades a través de llicències obertes que promoguin la seva reutilització i compartició.

La creació de models fundacionals s'enfoca a desenvolupar algorismes d'intel·ligència artificial, entrenats sobre la base d'aquests corpus lingüístics que reflecteixin la cultura i tradicions de les nostres llengües. Aquests models es crearan en el marc del projecte ALIA, estenent  el treball iniciat amb la pionera MARIA , i estaran dissenyats per ser adaptables a una varietat de tasques de processament del llenguatge natural. També es prioritzarà, sempre que sigui possible, que aquests models siguin accessibles públicament, permetent el seu ús tant en el sector públic com en el privat per generar el màxim valor econòmic possible.

En definitiva, l'Estratègia Nacional d'Intel·ligència Artificial 2024 d'Espanya és un ambiciós pla que cerca posicionar al país com un líder europeu en el desenvolupament i ús de tecnologies de IA responsable, així com assegurar que aquests avanços tecnològics es realitzin de manera sostenible, beneficiant a tota la societat. El ús de dades obertes i la governança de les dades del sector públic contribueixen també a aquesta estratègia, proporcionant bases fonamentals per al desenvolupament de models de IA avançats, ètics i eficients que milloraran els serveis públics i  impulsaran el creixement econòmic . I, en definitiva, la competitivitat d'Espanya en un escenari global en el qual tots els països estan fent un esforç important per impulsar la IA i recollir aquests beneficis.

  • Intel·ligència Artificial i Blockchain
  • Informació i dades del sector públic