Coneix el projecte ILENIA: Impuls de les llengües en Intel·ligència Artificial

30 juliol 2024

El projecte ILENIA (Impuls de les llengües en Intel·ligència Artificial) és una iniciativa estratègica per a l'impuls de les llengües cooficials en l'àmbit tecnològic i digital.

El projecte ILENIA (Impuls de les llengües en Intel·ligència Artificial ), que compta amb un finançament de 7 milions d'euros, està emmarcat en component 16 “Estratègia Nacional d'Intel·ligència Artificial” del Pla de Recuperació, Transformació i Resiliència , en l'eix 11 de l'Agenda Agenda Espanya Digital 2026 i en PERTE Nova economia de la llengua.

Quins objectius persegueix?

El projecte ILENIA té per objecte impulsar a Espanya la nova economia digital basada en el llenguatge natural, aprofitant el potencial de l'espanyol i de la resta de llengües oficials com a factor de creixement econòmic i de competitivitat internacional en àrees tals com la intel·ligència artificial, la traducció, l'ensenyament, la producció i divulgació cultural, la recerca i la ciència.

ILENIA és un projecte comú i coordinat entre les diferents llengües oficials de l'estat l'objectiu últim del qual és el desenvolupament de recursos multilingües, especialment models multilingües de text, veu i traducció automàtica que donin resposta a les necessitats de la societat i estiguin en línia amb la tecnologia actual, en la qual el multilingüisme i la transferència entre llengües juguen un paper primordial.

Com s'articula?

El projecte ILENIA s'articula entorn de/entorn de quatre projectes: AINA en català, el projecte NÓS en gallec, el projecte GAITU en basc, i el projecte VIVES en valenciano, como iniciativas de referencia para el PERTE de la Nueva Economía de la Lengua en el desarrollo de la economía digital.

En aquesta línia, se cerca afavorir les sinergies entre les diferents iniciatives i multiplicar així el seu impacte en la societat per aconseguir l'objectiu estatal de recolzar a les indústries en la seva transformació digital, liderant el desenvolupament i la integració de la intel·ligència artificial en el teixit productiu, l'economia i la societat, segons estableix la Estratègia Nacional d'Intel·ligència Artificial :

AINA és un projecte d'intel·ligència artificial que té per objectiu generar corpus i models informàtics de la llengua catalana perquè les empreses que creen aplicacions basades en intel·ligència artificial (IA), com a assistents de veu, cercadors d'Internet, traductors i correctors automàtics, agents conversacionals, etc., puguin fer-ho fàcilment en català.
El Projecte GAITU es una iniciativa tractora de la administración vasca que, a través de tecnología de la lengua de calidad en euskera, pretende desarrollar y ofrecer servicios lingüísticos básicos y transversales para utilizarlos en todas las administraciones públicas y, en definitiva, para ofrecer mejores servicios públicos a la ciudadanía. El plan de acción recoge los proyectos concretos que utilizan tecnología lingüística y que se están desarrollando en diferentes áreas estratégicas del Gobierno Vasco.
El Projecte NÓS pretén crear els recursos digitals i lingüístics necessaris per facilitar el desenvolupament d'aplicacions basades en intel·ligència artificial (IA) i tecnologies del llenguatge (TL) tals com a assistents de veu, traductors automàtics i agents conversacionals en gallec, permetent col·locar el gallec en l'avantguarda de les tecnologies intel·ligents, especialment en aquelles àrees relacionades amb les tecnologies lingüístiques i, en general, en la societat i en l'economia de la intel·ligència artificial.
El Pla VIVES de tecnologies del llenguatge té com a objecte la creació de corpus massius a través de campanyes d'adquisició de dades de veu i textos, de la participació ciutadana i dels recursos existents en l'administració pública valenciana.

Com es coordina?

El pressupost total assignat al projecte ascendeix a 7 milions d'euros que s'han distribuït a les principals universitats i centres de recerca que prèviament han estat preses com a referent per cadascuna de les comunitats autònomes participants, havent acreditat el mandat per a cadascun dels projectes com a entitats de referència regional per a l'execució dels mateixos.

Aquests centres són:

El Consorci Barcelona Supercomputing Center-Centre Nacional de Supercomputación (BSC-CNS), coordinador d'ILENIA i responsable de NEL-AINA. Se li ha atorgat un finançament de 3 milions d'euros.
La Universitat d'Alacant, a través de el Centre d'Intel·ligència Digital (CENID), responsable de VIVES. Se li ha atorgat un finançament de 500.000 €.
La Universitat del País Basc, a través de el Centre Basc de Tecnologia de la Llengua (HiTZ), responsable de NEL-GAITU. Se li ha assignat un finançament de 2 milions d'euros.
La Universitat de Santiago de Compostel·la, responsable de NÓS. Se li ha assignat un finançament de dos milions d'euros.

Les ajudes adjudicades consisteixen a dotar als projectes anteriorment assenyalats d'eines i recursos bàsics suficients (corpus multimodales, dades anotades, models de llenguatge neuronal, motors de traducció, reconeixedors del parla, entre uns altres), perquè la seva inclusió en les aplicacions d'intel·ligència artificial i tecnologies del llenguatge sigui rendible i atractiva per a l'Administració i les empreses del sector, tant a nivell local com a global.

La infraestructura lingüística generada:

Permetrà donar un salt qualitatiu en la digitalització de l'Administració pública.
Facilitarà la digitalització i la internacionalització de les empreses.
Farà més competitiva a la indústria de l'àmbit, beneficiant-se de les oportunitats que ofereix actualment la intel·ligència artificial i les tecnologies del llenguatge.
Generarà nous llocs de treballs qualificats.

La durada del projecte NEL/ILENIA és de 36 mesos i coordinació general es duu a terme per part de el Barcelona Supercomputing Center-Centre Nacional de Supercomputación (BSC-CNS).

Resultats

En la tasca de desenvolupament de recursos lingüístics, ILENIA treballa amb dades de text i de veu que rep a través de diferents veus. Els models de llenguatge són clau per al desenvolupament de noves apps, així que es treballa en la generació i actualització d'aquests models, ja siguin mico o multilingües o multimodales.

ILENIA col·labora en la implementació i inclusió de mòduls i biblioteques per al català, el basc, el valencià i el gallec, en entorns i plataformes de referència.

La generació dels models coneguts com Large Language Model (LLM) és un procés progressiu que permet avançar ràpidament en la creació de nous models, reduint el cost i els recursos per entrenar-los. Ja es pot accedir als enllaços de les dades i metadades publicades fins ara per ILENIA a través dels enllaços disponibles en la plataforma Hugging Face.

Estan disponibles a la pàgina web del projecte que, de fet, ha estat traduïda a les quatre llengües disponibles, parcialment, amb els models de traducció generats en el marc del projecte.

Font original de la notícia (Obre en nova finestra)

Intel·ligència Artificial i Blockchain
Informació i dades del sector públic