accesskey_mod_content

Reutilización i govern de dades en la nova Estratègia Nacional d'Intel·ligència Artificial espanyola

  • Escoltar
  • Imprimir PDF
  • Compartir

18 juliol 2024

Con el objetivo de fomentar la creación de modelos de leguaje especializados y facilitar el desarrollo de aplicaciones para el ámbito público, la Estrategia prevé un modelo de gobernanza uniforme para los datos, incluidos los corpus documentales de la AGE, asegurando los estándares de seguridad, calidad, interoperabilidad y reutilización.

La  Estratègia d'Intel·ligència Artificial 2024  es el plan integral que establece un marco para acelerar el desarrollo y expansión de la inteligencia artificial (IA) en España. Esta estrategia fue aprobada, a propuesta del  Ministeri per a la Transformació Digital i de la Funció Pública , pel Consell de Ministres el 14 de Maig de 2024 i ve a reforçar i accelerar la  Estratègia Nacional d'Intel·ligència Artificial  (ENIA), que va començar a desplegar-se en 2020.

La  vertiginosa evolució de les tecnologies associades a la Intel·ligència Artificial  d'aquests últims anys justifica per si sola, aquest reforç. Per exemple, segons el  AI Index Report de 2024 de la Universitat de Stanford , la inversión en IA se ha multiplicado por 9 desde 2022. El coste de entrenamiento de los modelos ha aumentado drásticamente, pero a cambio la IA está impulsando el progreso en ciencia, en medicina y en la  productivitat laboral en general . Per raons com aquestes, es pretén aprofitar al màxim l'impacte de la IA en l'economia i recollir els elements positius del treball en curs.

La nova estratègia s'articula entorn de/entorn de tres eixos principals, que es desenvoluparan a través de vuit línies d'acció. Aquests eixos són:

  • Reforçar les palanques claus per al desenvolupament de la IA. Aquest eix se centra a potenciar la inversió en supercomputación, generar capacitats d'emmagatzematge en condicions de sostenibilitat, desenvolupar models i dades que constitueixin una infraestructura pública de la IA i fomentar el talent especialitzat en IA.
  • Facilitar l'expansió de la IA en el sector públic i privat, fomentant la innovació i la ciberseguretat. Aquest eix té com a objectius incorporar la IA en els processos governamentals i empresarials, amb una èmfasi especial en les pimes, i desenvolupar un marc de ciberseguretat robust.
  • Fomentar una IA transparent, ètica i humanística. Aquest eix se centra a assegurar que el desenvolupament i ús de la IA a Espanya sigui responsable i respectuós amb els drets humans, la igualtat, la privadesa i la no discriminació.

La següent infografia resumeixen els principals punts d'aquesta estratègia:

Infografia L'ESTRATÈGIA DE LA INTEL·LIGÈNCIA ARTIFICIAL 2024

La Estrategia de Inteligencia Artificial 2024 de España es un documento muy ambicioso que busca posicionar a nuestro país como líder en Inteligencia Artificial, expandiendo el uso de la IA robusta y responsable en el conjunto de la economía y en la administración pública. Con ello se podrá contribuir a que multiples áreas, como son la  cultura  o el  dissenyo de ciutats , puguin beneficiar-se d'aquests progressos.

L'obertura i l'accés a dades de qualitat són també fonamentals per a l'èxit d'aquesta estratègia, ja que són part de la  matèria primera necessària per entrenar i avaluar models de IA que siguin , a més, inclusius i socialment justs perquè beneficiïn a tota la societat. Molt relacionades amb les dades obertes, l'estratègia dedica palanques específiques a l'impuls de la IA en el sector públic i a el desenvolupament de corpus i models de llenguatge fundacionals i especialitzats. Això inclou a més el desenvolupament de serveis comuns basats en models de IA i la implementació d'un model de governança de dades per assegurar la seguretat, qualitat, interoperabilitat i reutilització de les dades manejades per l'Administració General de l'Estat (AGE).

Els models fundacionals ( LLMs ) són models de gran envergadura que s'entrenaran a partir de grans corpus de dades en castellà i llengües cooficials, garantint així la seva aplicabilitat en una àmplia varietat de contextos lingüístics i culturals. Els models especialitzats (SLMs), de menor grandària, es desenvoluparan amb l'objectiu d'abordar amb una menor demanda de recursos computacionals necessitats específiques dins de sectors particulars.

Governança comuna de dades de l'AGE

La governança de dades obertes tindrà un paper crucial en la realització dels objectius plantejats, para, per exemple, aconseguir un desenvolupament eficient de models de leguaje especialitzats. Amb l'objectiu de fomentar la creació d'aquests models i facilitar el desenvolupament d'aplicacions per a l'àmbit públic, l'estratègia preveu un model de governança uniforme per a les dades, inclosos els corpus documentals de l'Administració General de l'Estat, assegurant els estàndards de seguretat, qualitat,  interoperabilitat i reutilització de totes les dades .

Aquesta iniciativa inclou la creació de un  espai de dades unificat  que permeti explotar conjunts de dades sectorials específiques per resoldre casos d'ús concrets de cada organisme. La governança de dades garantirà l'anonimització i privadesa de la informació, així com el respecte a la normativa vigent durant tot el cicle de vida de les dades.

Es desenvoluparà una estructura organitzativa orientada a la dada, amb la  Direcció general de la Dada  como elemento vertebrador. Además, se impulsará la Plataforma de datos de la AGE, la generación de catálogos de metadatos de los departamentos, el mapa de intercambios de datos y el fomento de la interoperabilidad. Todo ello con el fin de facilitar el despliegue de iniciativas de IA de mayor calidad y utilidad.

Desenvolupar corpus i models de llenguatge fundacionals i especialitzats

Dins de la palanca número tres, el document reconeix que la base fonamental per a l'entrenament dels models de llenguatge són la quantitat i qualitat de les dades disponibles, així com les llicències d'ús que habiliten la possibilitat d'utilitzar-los.

L'estratègia posa una èmfasi especial en la  creació de corpus lingüístics que siguin representatius i diversificats , incluyendo el castellano y las lenguas cooficiales como el catalán, euskera, gallego y valenciano. Estos corpus no solo deben ser extensos, sino también reflejar la variedad y riqueza cultural de las lenguas, lo que permitirá desarrollar modelos más precisos y adaptados a las necesidades locales.

Per aconseguir-ho, es preveu la col·laboració amb institucions acadèmiques i de recerca, així com amb la indústria, per recopilar, netejar i etiquetar grans volums de dades textuals. A més, s'implementaran polítiques que facilitin l'accés a aquestes dades a través de llicències obertes que promoguin la seva reutilització i compartició.

La creació de models fundacionals s'enfoca a desenvolupar algorismes d'intel·ligència artificial, entrenats sobre la base d'aquests corpus lingüístics que reflecteixin la cultura i tradicions de les nostres llengües. Aquests models es crearan en el marc del projecte ALIA, estenent  el treball iniciat amb la pionera MARIA , i estaran dissenyats per ser adaptables a una varietat de tasques de processament del llenguatge natural. També es prioritzarà, sempre que sigui possible, que aquests models siguin accessibles públicament, permetent el seu ús tant en el sector públic com en el privat per generar el màxim valor econòmic possible.

En definitiva, l'Estratègia Nacional d'Intel·ligència Artificial 2024 d'Espanya és un ambiciós pla que cerca posicionar al país com un líder europeu en el desenvolupament i ús de tecnologies de IA responsable, així com assegurar que aquests avanços tecnològics es realitzin de manera sostenible, beneficiant a tota la societat. El ús de dades obertes i la governança de les dades del sector públic contribueixen també a aquesta estratègia, proporcionant bases fonamentals per al desenvolupament de models de IA avançats, ètics i eficients que milloraran els serveis públics i  impulsaran el creixement econòmic . I, en definitiva, la competitivitat d'Espanya en un escenari global en el qual tots els països estan fent un esforç important per impulsar la IA i recollir aquests beneficis.

  • Intel·ligència Artificial i Blockchain
  • Informació i dades del sector públic