accesskey_mod_content

Reutilización i govern de dades en la nova Estratègia Nacional d'Intel·ligència Artificial espanyola

  • Escoltar
  • Imprimir PDF
  • Compartir

18 juliol 2024

Amb l'objectiu de fomentar la creació de models de leguaje especialitzats i facilitar el desenvolupament d'aplicacions per a l'àmbit públic, l'Estratègia preveu un model de governança uniforme per a les dades, inclosos els corpus documentals de l'AGE, assegurant els estàndards de seguretat, qualitat, interoperabilitat i reutilització.

La  Estratègia d'Intel·ligència Artificial 2024  és el pla integral que establix un marc per a accelerar el desenvolupament i expansió de la intel·ligència artificial (IA) a Espanya. Esta estratègia va ser aprovada, a proposta de el  Ministeri per a la Transformació Digital i de la Funció Pública , pel Consell de Ministres el 14 de Maig de 2024 i vé a reforçar i accelerar la  Estratègia Nacional d'Intel·ligència Artificial  (ENIA), que va començar a desplegar-se en 2020.

La  vertiginosa evolució de les tecnologies associades a la Intel·ligència Artificial  d'estos últims anys justifica per si sola, este reforç. Per exemple, segons el  AI Index Report de 2024 de la Universitat de Stanford , la inversió en IA s'ha multiplicat per 9 des de 2022. El cost d'entrenament dels models ha augmentat dràsticament, però a canvi la IA està impulsant el progrés en ciència, en medicina i en la  productivitat laboral en general . Per raons com estes, es pretén aprofitar al màxim l'impacte de la IA en l'economia i arreplegar els elements positius del treball en curs.

La nova estratègia s'articula entorn de/entorn de tres eixos principals, que es desenvoluparan a través de huit línies d'acció. Estos eixos són:

  • Reforçar les palanques claus per al desenvolupament de la IA. Este eix se centra a potenciar la inversió en supercomputación, generar capacitats d'emmagatzematge en condicions de sostenibilitat, desenvolupar models i dades que constituïsquen una infraestructura pública de la IA i fomentar el talent especialitzat en IA.
  • Facilitar l'expansió de la IA en el sector públic i privat, fomentant la innovació i la ciberseguretat. Este eix té com a objectius incorporar la IA en els processos governamentals i empresarials, amb una èmfasi especial en les pimes, i desenvolupar un marc de ciberseguretat robust.
  • Fomentar una IA transparent, ètica i humanística. Este eix se centra a assegurar que el desenvolupament i ús de la IA a Espanya siga responsable i respectuós amb els drets humans, la igualtat, la privacitat i la no discriminació.

La següent infografia resumixen els principals punts d'esta estratègia:

Infografia L'ESTRATÈGIA DE LA INTEL·LIGÈNCIA ARTIFICIAL 2024

L'Estratègia d'Intel·ligència Artificial 2024 d'Espanya és un document molt ambiciós que busca posicionar al nostre país com a líder en Intel·ligència Artificial, expandint l'ús de la IA robusta i responsable en el conjunt de l'economia i en l'administració pública. Amb açò es podrà contribuir al fet que multiples àrees, com són la  cultura  o el  dissenye de ciutats , puguen beneficiar-se d'estos progressos.

L'obertura i l'accés a dades de qualitat són també fonamentals per a l'èxit d'esta estratègia, ja que són part de la  matèria primera necessària per a entrenar i avaluar models de IA que siguen , a més, inclusius i socialment justs perquè beneficien a tota la societat. Molt relacionades amb les dades obertes, l'estratègia dedica palanques específiques a l'impuls de la IA en el sector públic i a el desenvolupament de corpus i models de llenguatge fundacionals i especialitzats. Açò inclou a més el desenvolupament de servicis comuns basats en models de IA i la implementació d'un model de governança de dades per a assegurar la seguretat, qualitat, interoperabilitat i reutilització de les dades manejades per l'Administració General de l'Estat (AGE).

Els models fundacionals ( LLMs ) són models de gran envergadura que s'entrenaran a partir de grans corpus de dades en castellà i llengües cooficials, garantint així la seua aplicabilitat en una àmplia varietat de contextos lingüístics i culturals. Els models especialitzats (SLMs), de menor grandària, es desenvoluparan amb l'objectiu d'abordar amb una menor demanda de recursos computacionals necessitats específiques dins de sectors particulars.

Governança comuna de dades de l'AGE

La governança de dades obertes tindrà un paper crucial en la realització dels objectius plantejats, para, per exemple, aconseguir un desenvolupament eficient de models de leguaje especialitzats. Amb l'objectiu de fomentar la creació d'estos models i facilitar el desenvolupament d'aplicacions per a l'àmbit públic, l'estratègia preveu un model de governança uniforme per a les dades, inclosos els corpus documentals de l'Administració General de l'Estat, assegurant els estàndards de seguretat, qualitat,  interoperabilitat i reutilització de totes les dades .

Esta iniciativa inclou la creació de un  espai de dades unificat  que permeta explotar conjunts de dades sectorials específiques per a resoldre casos d'ús concrets de cada organisme. La governança de dades garantirà l'anonimització i privacitat de la informació, així com el respecte a la normativa vigent durant tot el cicle de vida de les dades.

Es desenvoluparà una estructura organitzativa orientada a la dada, amb la  Direcció general de la Dada  com a element vertebrador. A més, s'impulsarà la Plataforma de dades de l'AGE, la generació de catàlegs de metadades dels departaments, el mapa d'intercanvis de dades i el foment de la interoperabilitat. Tot açò amb la finalitat de facilitar el desplegament d'iniciatives de IA de major qualitat i utilitat.

Desenvolupar corpus i models de llenguatge fundacionals i especialitzats

Dins de la palanca número tres, el document reconeix que la base fonamental per a l'entrenament dels models de llenguatge són la quantitat i qualitat de les dades disponibles, així com les llicències d'ús que habiliten la possibilitat d'utilitzar-los.

L'estratègia posa una èmfasi especial en la  creació de corpus lingüístics que siguen representatius i diversificats , incloent el castellà i les llengües cooficials com el català, basc, gallec i valencià. Estos corpus no solament han de ser extensos, sinó també reflectir la varietat i riquesa cultural de les llengües, la qual cosa permetrà desenvolupar models més precisos i adaptats a les necessitats locals.

Per a aconseguir-ho, es preveu la col·laboració amb institucions acadèmiques i d'investigació, així com amb la indústria, per a recopilar, netejar i etiquetar grans volums de dades textuals. A més, s'implementaran polítiques que faciliten l'accés a estes dades a través de llicències obertes que promoguen la seua reutilització i compartició.

La creació de models fundacionals s'enfoca a desenvolupar algoritmes d'intel·ligència artificial, entrenats sobre la base d'estos corpus lingüístics que reflectisquen la cultura i tradicions de les nostres llengües. Estos models es crearan en el marc del projecte ALIA, estenent  el treball iniciat amb la pionera MARIA , i estaran dissenyats per a ser adaptables a una varietat de tasques de processament del llenguatge natural. També es prioritzarà, sempre que siga possible, que estos models siguen accessibles públicament, permetent el seu ús tant en el sector públic com en el privat per a generar el màxim valor econòmic possible.

En definitiva, l'Estratègia Nacional d'Intel·ligència Artificial 2024 d'Espanya és un ambiciós pla que busca posicionar al país com un líder europeu en el desenvolupament i ús de tecnologies de IA responsable, així com assegurar que estos avanços tecnològics es realitzen de manera sostenible, beneficiant a tota la societat. El ús de dades obertes i la governança de les dades del sector públic contribuïxen també a esta estratègia, proporcionant bases fonamentals per al desenvolupament de models de IA avançats, ètics i eficients que milloraran els servicis públics i  impulsaran el creixement econòmic . I, en definitiva, la competitivitat d'Espanya en un escenari global en el qual tots els països estan fent un esforç important per impulsar la IA i arreplegar estos beneficis.

  • Intel·ligència Artificial i Blockchain
  • Informació i dades del sector públic