accesskey_mod_content

Coneix el projecte ILENIA: Impuls de les llengües en Intel·ligència Artificial

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

30 juliol 2024

El projecte ILENIA (Impuls de les llengües en Intel·ligència Artificial) és una iniciativa estratègica per a l'impuls de les llengües cooficials en l'àmbit tecnològic i digital.

Quins objectius perseguix?

El projecte ILENIA té per objecte impulsar a Espanya la nova economia digital basada en el llenguatge natural, aprofitant el potencial de l'espanyol i de la resta de llengües oficials com a factor de creixement econòmic i de competitivitat internacional en àrees tals com la intel·ligència artificial, la traducció, l'ensenyament, la producció i divulgació cultural, la investigació i la ciència.

ILENIA és un projecte comú i coordinat entre les diferents llengües oficials de l'estat l'objectiu últim del qual és el desenvolupament de recursos multilingües, especialment models multilingües de text, veu i traducció automàtica que donen resposta a les necessitats de la societat i estiguen en línia amb la tecnologia actual, en la qual el multilingüisme i la transferència entre llengües juguen un paper primordial.

Com s'articula?

El projecte ILENIA s'articula entorn de/entorn de quatre projectes: AINA en català, el projecte NÓS en gallec, el projecte GAITU en basc, i el projecte VIVES en valencià, com a iniciatives de referència per al PERTE de la Nova Economia de la Llengua en el desenvolupament de l'economia digital.

En esta línia, es busca afavorir les sinergies entre les diferents iniciatives i multiplicar així el seu impacte en la societat per a aconseguir l'objectiu estatal de recolzar a les indústries en la seua transformació digital, liderant el desenvolupament i la integració de la intel·ligència artificial en el teixit productiu, l'economia i la societat, segons establix la  Estratègia Nacional d'Intel·ligència Artificial :

  • AINA és un projecte d'intel·ligència artificial que té per objectiu generar corpus i models informàtics de la llengua catalana perquè les empreses que creen aplicacions basades en intel·ligència artificial (IA), com a assistents de veu, buscadors d'Internet, traductors i correctors automàtics, agents conversacionals, etc., puguen fer-ho fàcilment en català.
  • El Projecte GAITU és una iniciativa tractora de l'administració basca que, a través de tecnologia de la llengua de qualitat en basca, pretén desenvolupar i oferir servicis lingüístics bàsics i transversals per a utilitzar-los en totes les administracions públiques i, en definitiva, per a oferir millors servicis públics a la ciutadania. El pla d'acció arreplega els projectes concrets que utilitzen tecnologia lingüística i que s'estan desenvolupant en diferents àrees estratègiques del Govern Basc.
  • El Projecte NÓS pretén crear els recursos digitals i lingüístics necessaris per a facilitar el desenvolupament d'aplicacions basades en intel·ligència artificial (IA) i tecnologies del llenguatge (TL) tals com a assistents de veu, traductors automàtics i agents conversacionals en gallec, permetent col·locar el gallec en l'avantguarda de les tecnologies intel·ligents, especialment en aquelles àrees relacionades amb les tecnologies lingüístiques i, en general, en la societat i en l'economia de la intel·ligència artificial.
  • El Pla VIVES de tecnologies del llenguatge té com a objecte la creació de corpus massius a través de campanyes d'adquisició de dades de veu i textos, de la participació ciutadana i dels recursos existents en l'administració pública valenciana.

Com es coordina?

El pressupost total assignat al projecte ascendix a 7 milions d'euros que s'han distribuït a les principals universitats i centres d'investigació que prèviament han sigut preses com a referent per cadascuna de les comunitats autònomes participants, havent acreditat el mandat per a cadascun dels projectes com a entitats de referència regional per a l'execució dels mateixos.

Estos centres són:

  • El Consorci Barcelona Supercomputing Center-Centre Nacional de Supercomputación (BSC-CNS), coordinador d'ILENIA i responsable de NEL-AINA. Se li ha atorgat un finançament de 3 milions d'euros.
  • La Universitat d'Alacant, a través de el Centre d'Intel·ligència Digital (CENID), responsable de VIVES. Se li ha atorgat un finançament de 500.000 €.
  • La Universitat del País Basc, a través de el Centre Basc de Tecnologia de la Llengua (HiTZ), responsable de NEL-GAITU. Se li ha assignat un finançament de 2 milions d'euros.
  • La Universitat de Santiago de Compostel·la, responsable de NÓS. Se li ha assignat un finançament de dos milions d'euros.

Les ajudes adjudicades consistixen a dotar als projectes anteriorment assenyalats de ferramentes i recursos bàsics suficients (corpus multimodales, dades anotades, models de llenguatge neuronal, motors de traducció, reconeixedors del parla, entre uns altres), perquè la seua inclusió en les aplicacions d'intel·ligència artificial i tecnologies del llenguatge siga rendible i atractiva per a l'Administració i les empreses del sector, tant a nivell local com a global.

La infraestructura lingüística generada:

  • Permetrà donar un salt qualitatiu en la digitalització de l'Administració pública.
  • Facilitarà la digitalització i la internacionalització de les empreses.
  • Farà més competitiva a la indústria de l'àmbit, beneficiant-se de les oportunitats que oferix actualment la intel·ligència artificial i les tecnologies del llenguatge.
  • Generarà nous llocs de treballs qualificats.

La durada del projecte NEL/ILENIA és de 36 mesos i coordinació general es duu a terme per part de el Barcelona Supercomputing Center-Centre Nacional de Supercomputación (BSC-CNS).

Resultats

En la tasca de desenvolupament de recursos lingüístics, ILENIA treballa amb dades de text i de veu que rep a través de diferents veus. Els models de llenguatge són clau per al desenvolupament de noves apps, així que es treballa en la generació i actualització d'estos models, ja siguen mico o multilingües o multimodales.

ILENIA col·labora en la implementació i inclusió de mòduls i biblioteques per al català, el basc, el valencià i el gallec, en entorns i plataformes de referència.

La generació dels models coneguts com Large Language Model (LLM) és un procés progressiu que permet avançar ràpidament en la creació de nous models, reduint el cost i els recursos per a entrenar-los. Ja es pot accedir als enllaços de les dades i metadades publicades fins ara per ILENIA a través dels enllaços disponibles en la plataforma Hugging Face.

Estan disponibles en la pàgina web del projecte que, de fet, ha sigut traduïda a les quatre llengües disponibles, parcialment, amb els models de traducció generats en el marc del projecte.

Font original de la notícia(Obri en nova finestra)

  • Intel·ligència Artificial i Blockchain
  • Informació i dades del sector públic