accesskey_mod_content

Coneix el projecte ILENIA: Impuls de les llengües en Intel·ligència Artificial

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

30 juliol 2024

El projecte ILENIA (Impuls de les llengües en Intel·ligència Artificial) és una iniciativa estratègica per a l'impuls de les llengües cooficials en l'àmbit tecnològic i digital.

Quins objectius persegueix?

El projecte ILENIA té per objecte impulsar a Espanya la nova economia digital basada en el llenguatge natural, aprofitant el potencial de l'espanyol i de la resta de llengües oficials com a factor de creixement econòmic i de competitivitat internacional en àrees tals com la intel·ligència artificial, la traducció, l'ensenyament, la producció i divulgació cultural, la recerca i la ciència.

ILENIA és un projecte comú i coordinat entre les diferents llengües oficials de l'estat l'objectiu últim del qual és el desenvolupament de recursos multilingües, especialment models multilingües de text, veu i traducció automàtica que donin resposta a les necessitats de la societat i estiguin en línia amb la tecnologia actual, en la qual el multilingüisme i la transferència entre llengües juguen un paper primordial.

Com s'articula?

El projecte ILENIA s'articula entorn de/entorn de quatre projectes: AINA en català, el projecte NÓS en gallec, el projecte GAITU en basc, i el projecte VIVES en valencià, com a iniciatives de referència pel PERTE de la Nova Economia de la Llengua en el desenvolupament de l'economia digital.

En aquesta línia, se cerca afavorir les sinergies entre les diferents iniciatives i multiplicar així el seu impacte en la societat per aconseguir l'objectiu estatal de recolzar a les indústries en la seva transformació digital, liderant el desenvolupament i la integració de la intel·ligència artificial en el teixit productiu, l'economia i la societat, segons estableix la  Estratègia Nacional d'Intel·ligència Artificial :

  • AINA és un projecte d'intel·ligència artificial que té per objectiu generar corpus i models informàtics de la llengua catalana perquè les empreses que creen aplicacions basades en intel·ligència artificial (IA), com a assistents de veu, cercadors d'Internet, traductors i correctors automàtics, agents conversacionals, etc., puguin fer-ho fàcilment en català.
  • El Projecte GAITU és una iniciativa tractora de l'administració basca que, a través de tecnologia de la llengua de qualitat en basca, pretén desenvolupar i oferir serveis lingüístics bàsics i transversals per utilitzar-los en totes les administracions públiques i, en definitiva, per oferir millors serveis públics a la ciutadania. El pla d'acció recull els projectes concrets que utilitzen tecnologia lingüística i que s'estan desenvolupant en diferents àrees estratègiques del Govern Basc.
  • El Projecte NÓS pretén crear els recursos digitals i lingüístics necessaris per facilitar el desenvolupament d'aplicacions basades en intel·ligència artificial (IA) i tecnologies del llenguatge (TL) tals com a assistents de veu, traductors automàtics i agents conversacionals en gallec, permetent col·locar el gallec en l'avantguarda de les tecnologies intel·ligents, especialment en aquelles àrees relacionades amb les tecnologies lingüístiques i, en general, en la societat i en l'economia de la intel·ligència artificial.
  • El Pla VIVES de tecnologies del llenguatge té com a objecte la creació de corpus massius a través de campanyes d'adquisició de dades de veu i textos, de la participació ciutadana i dels recursos existents en l'administració pública valenciana.

Com es coordina?

El pressupost total assignat al projecte ascendeix a 7 milions d'euros que s'han distribuït a les principals universitats i centres de recerca que prèviament han estat preses com a referent per cadascuna de les comunitats autònomes participants, havent acreditat el mandat per a cadascun dels projectes com a entitats de referència regional per a l'execució dels mateixos.

Aquests centres són:

  • El Consorci Barcelona Supercomputing Center-Centre Nacional de Supercomputación (BSC-CNS), coordinador d'ILENIA i responsable de NEL-AINA. Se li ha atorgat un finançament de 3 milions d'euros.
  • La Universitat d'Alacant, a través de el Centre d'Intel·ligència Digital (CENID), responsable de VIVES. Se li ha atorgat un finançament de 500.000 €.
  • La Universitat del País Basc, a través de el Centre Basc de Tecnologia de la Llengua (HiTZ), responsable de NEL-GAITU. Se li ha assignat un finançament de 2 milions d'euros.
  • La Universitat de Santiago de Compostel·la, responsable de NÓS. Se li ha assignat un finançament de dos milions d'euros.

Les ajudes adjudicades consisteixen a dotar als projectes anteriorment assenyalats d'eines i recursos bàsics suficients (corpus multimodales, dades anotades, models de llenguatge neuronal, motors de traducció, reconeixedors del parla, entre uns altres), perquè la seva inclusió en les aplicacions d'intel·ligència artificial i tecnologies del llenguatge sigui rendible i atractiva per a l'Administració i les empreses del sector, tant a nivell local com a global.

La infraestructura lingüística generada:

  • Permetrà donar un salt qualitatiu en la digitalització de l'Administració pública.
  • Facilitarà la digitalització i la internacionalització de les empreses.
  • Farà més competitiva a la indústria de l'àmbit, beneficiant-se de les oportunitats que ofereix actualment la intel·ligència artificial i les tecnologies del llenguatge.
  • Generarà nous llocs de treballs qualificats.

La durada del projecte NEL/ILENIA és de 36 mesos i coordinació general es duu a terme per part de el Barcelona Supercomputing Center-Centre Nacional de Supercomputación (BSC-CNS).

Resultats

En la tasca de desenvolupament de recursos lingüístics, ILENIA treballa amb dades de text i de veu que rep a través de diferents veus. Els models de llenguatge són clau per al desenvolupament de noves apps, així que es treballa en la generació i actualització d'aquests models, ja siguin mico o multilingües o multimodales.

ILENIA col·labora en la implementació i inclusió de mòduls i biblioteques per al català, el basc, el valencià i el gallec, en entorns i plataformes de referència.

La generació dels models coneguts com Large Language Model (LLM) és un procés progressiu que permet avançar ràpidament en la creació de nous models, reduint el cost i els recursos per entrenar-los. Ja es pot accedir als enllaços de les dades i metadades publicades fins ara per ILENIA a través dels enllaços disponibles en la plataforma Hugging Face.

Estan disponibles a la pàgina web del projecte que, de fet, ha estat traduïda a les quatre llengües disponibles, parcialment, amb els models de traducció generats en el marc del projecte.

Font original de la notícia(Obre en nova finestra)

  • Intel·ligència Artificial i Blockchain
  • Informació i dades del sector públic