El projecte ILENIA (Impuls de les llengües en Intel·ligència Artificial ), que compta amb un finançament de 7 milions d'euros, està emmarcat en component 16 “Estratègia Nacional d'Intel·ligència Artificial” del Pla de Recuperació, Transformació i Resiliència , en l'eix 11 de l'Agenda Agenda Espanya Digital 2026 i en PERTE Nova economia de la llengua.
Coneix el projecte ILENIA: Impuls de les llengües en Intel·ligència Artificial
30 juliol 2024
El projecte ILENIA (Impuls de les llengües en Intel·ligència Artificial) és una iniciativa estratègica per a l'impuls de les llengües cooficials en l'àmbit tecnològic i digital.
Quins objectius persegueix?
El projecte ILENIA té per objecte impulsar a Espanya la nova economia digital basada en el llenguatge natural, aprofitant el potencial de l'espanyol i de la resta de llengües oficials com a factor de creixement econòmic i de competitivitat internacional en àrees tals com la intel·ligència artificial, la traducció, l'ensenyament, la producció i divulgació cultural, la recerca i la ciència.
ILENIA és un projecte comú i coordinat entre les diferents llengües oficials de l'estat l'objectiu últim del qual és el desenvolupament de recursos multilingües, especialment models multilingües de text, veu i traducció automàtica que donin resposta a les necessitats de la societat i estiguin en línia amb la tecnologia actual, en la qual el multilingüisme i la transferència entre llengües juguen un paper primordial.
Com s'articula?
El projecte ILENIA s'articula entorn de/entorn de quatre projectes: AINA en català, el projecte NÓS en gallec, el projecte GAITU en basc, i el projecte VIVES en valencià, com a iniciatives de referència pel PERTE de la Nova Economia de la Llengua en el desenvolupament de l'economia digital.
En aquesta línia, se cerca afavorir les sinergies entre les diferents iniciatives i multiplicar així el seu impacte en la societat per aconseguir l'objectiu estatal de recolzar a les indústries en la seva transformació digital, liderant el desenvolupament i la integració de la intel·ligència artificial en el teixit productiu, l'economia i la societat, segons estableix la Estratègia Nacional d'Intel·ligència Artificial :
- AINA és un projecte d'intel·ligència artificial que té per objectiu generar corpus i models informàtics de la llengua catalana perquè les empreses que creen aplicacions basades en intel·ligència artificial (IA), com a assistents de veu, cercadors d'Internet, traductors i correctors automàtics, agents conversacionals, etc., puguin fer-ho fàcilment en català.
- El Projecte GAITU és una iniciativa tractora de l'administració basca que, a través de tecnologia de la llengua de qualitat en basca, pretén desenvolupar i oferir serveis lingüístics bàsics i transversals per utilitzar-los en totes les administracions públiques i, en definitiva, per oferir millors serveis públics a la ciutadania. El pla d'acció recull els projectes concrets que utilitzen tecnologia lingüística i que s'estan desenvolupant en diferents àrees estratègiques del Govern Basc.
- El Projecte NÓS pretén crear els recursos digitals i lingüístics necessaris per facilitar el desenvolupament d'aplicacions basades en intel·ligència artificial (IA) i tecnologies del llenguatge (TL) tals com a assistents de veu, traductors automàtics i agents conversacionals en gallec, permetent col·locar el gallec en l'avantguarda de les tecnologies intel·ligents, especialment en aquelles àrees relacionades amb les tecnologies lingüístiques i, en general, en la societat i en l'economia de la intel·ligència artificial.
- El Pla VIVES de tecnologies del llenguatge té com a objecte la creació de corpus massius a través de campanyes d'adquisició de dades de veu i textos, de la participació ciutadana i dels recursos existents en l'administració pública valenciana.
Com es coordina?
El pressupost total assignat al projecte ascendeix a 7 milions d'euros que s'han distribuït a les principals universitats i centres de recerca que prèviament han estat preses com a referent per cadascuna de les comunitats autònomes participants, havent acreditat el mandat per a cadascun dels projectes com a entitats de referència regional per a l'execució dels mateixos.
Aquests centres són:
- El Consorci Barcelona Supercomputing Center-Centre Nacional de Supercomputación (BSC-CNS), coordinador d'ILENIA i responsable de NEL-AINA. Se li ha atorgat un finançament de 3 milions d'euros.
- La Universitat d'Alacant, a través de el Centre d'Intel·ligència Digital (CENID), responsable de VIVES. Se li ha atorgat un finançament de 500.000 €.
- La Universitat del País Basc, a través de el Centre Basc de Tecnologia de la Llengua (HiTZ), responsable de NEL-GAITU. Se li ha assignat un finançament de 2 milions d'euros.
- La Universitat de Santiago de Compostel·la, responsable de NÓS. Se li ha assignat un finançament de dos milions d'euros.
Les ajudes adjudicades consisteixen a dotar als projectes anteriorment assenyalats d'eines i recursos bàsics suficients (corpus multimodales, dades anotades, models de llenguatge neuronal, motors de traducció, reconeixedors del parla, entre uns altres), perquè la seva inclusió en les aplicacions d'intel·ligència artificial i tecnologies del llenguatge sigui rendible i atractiva per a l'Administració i les empreses del sector, tant a nivell local com a global.
La infraestructura lingüística generada:
- Permetrà donar un salt qualitatiu en la digitalització de l'Administració pública.
- Facilitarà la digitalització i la internacionalització de les empreses.
- Farà més competitiva a la indústria de l'àmbit, beneficiant-se de les oportunitats que ofereix actualment la intel·ligència artificial i les tecnologies del llenguatge.
- Generarà nous llocs de treballs qualificats.
La durada del projecte NEL/ILENIA és de 36 mesos i coordinació general es duu a terme per part de el Barcelona Supercomputing Center-Centre Nacional de Supercomputación (BSC-CNS).
Resultats
En la tasca de desenvolupament de recursos lingüístics, ILENIA treballa amb dades de text i de veu que rep a través de diferents veus. Els models de llenguatge són clau per al desenvolupament de noves apps, així que es treballa en la generació i actualització d'aquests models, ja siguin mico o multilingües o multimodales.
ILENIA col·labora en la implementació i inclusió de mòduls i biblioteques per al català, el basc, el valencià i el gallec, en entorns i plataformes de referència.
La generació dels models coneguts com Large Language Model (LLM) és un procés progressiu que permet avançar ràpidament en la creació de nous models, reduint el cost i els recursos per entrenar-los. Ja es pot accedir als enllaços de les dades i metadades publicades fins ara per ILENIA a través dels enllaços disponibles en la plataforma Hugging Face.
Estan disponibles a la pàgina web del projecte que, de fet, ha estat traduïda a les quatre llengües disponibles, parcialment, amb els models de traducció generats en el marc del projecte.
- Intel·ligència Artificial i Blockchain
- Informació i dades del sector públic