O proxecto ILENIA (Impulso das linguas en Intelixencia Intelixencia Artificial ), que conta cun financiamento de 7 millóns de euros, está enmarcado no compoñente 16 “Estratexia Nacional de Intelixencia Artificial” do Plan de Recuperación, Transformación e Resiliencia , no eixo 11 da Axenda España Dixital 2026 e no PERTE Nova economía da lingua.
Coñece o proxecto ILENIA: Impulso das linguas en Intelixencia Artificial
30 xullo 2024
O proxecto ILENIA (Impulso das linguas en Intelixencia Artificial) é unha iniciativa estratéxica para o impulso das linguas cooficiais no ámbito tecnolóxico e dixital.
Que obxectivos persegue?
O proxecto ILENIA ten por obxecto impulsar en España a nova economía dixital baseada na linguaxe natural, aproveitando o potencial do español e do resto de linguas oficiais como factor de crecemento económico e de competitividade internacional en áreas tales como a intelixencia artificial, a tradución, o ensino, a produción e divulgación cultural, a investigación e a ciencia.
ILENIA é un proxecto común e coordinado entre as diferentes linguas oficiais do estado cuxo obxectivo último é o desenvolvemento de recursos multilingües, en especial modelos multilingües de texto, voz e tradución automática que dean resposta ás necesidades da sociedade e estean en liña coa tecnoloxía actual, na que o multilingüismo e a transferencia entre linguas xogan un papel primordial.
Como se articula?
O proxecto ILENIA articúlase ao redor de catro proxectos: AINA en catalán, o proxecto NÓS en galego, o proxecto GAITU en eúscaro, e o proxecto VIVES en valenciano, como iniciativas de referencia para o PERTE da Nova Economía da Lingua no desenvolvemento da economía dixital.
Nesta liña, búscase favorecer as sinerxias entre as distintas iniciativas e multiplicar así o seu impacto na sociedade para lograr o obxectivo estatal de apoiar ás industrias na súa transformación dixital, liderando o desenvolvemento e a integración da intelixencia artificial no tecido produtivo, a economía e a sociedade, segundo establece a Estratexia Nacional de Intelixencia Artificial :
- AINA é un proxecto de intelixencia artificial que ten por obxectivo xerar corpus e modelos informáticos da lingua catalá para que as empresas que crean aplicacións baseadas en intelixencia artificial (IA), como asistentes de voz, buscadores de Internet, tradutores e correctores automáticos, axentes conversacionales, etc., poidan facelo facilmente en catalán.
- O Proxecto GAITU é unha iniciativa tractora da administración vasca que, a través de tecnoloxía da lingua de calidade en eúscaro, pretende desenvolver e ofrecer servizos lingüísticos básicos e transversais para utilizalos en todas as administracións públicas e, en definitiva, para ofrecer mellores servizos públicos á cidadanía. O plan de acción recolle os proxectos concretos que utilizan tecnoloxía lingüística e que se están desenvolvendo en diferentes áreas estratéxicas do Goberno Vasco.
- O Proxecto NÓS pretende crear os recursos dixitais e lingüísticos necesarios para facilitar o desenvolvemento de aplicacións baseadas en intelixencia artificial (IA) e tecnoloxías da linguaxe (TL) tales como asistentes de voz, tradutores automáticos e axentes conversacionales en galego, permitindo colocar o galego na vangarda das tecnoloxías intelixentes, especialmente naquelas áreas relacionadas coas tecnoloxías lingüísticas e, en xeral, na sociedade e na economía da intelixencia artificial.
- O Plan VIVES de tecnoloxías da linguaxe ten como obxecto a creación de corpus masivos a través de campañas de adquisición de datos de voz e textos, da participación cidadá e dos recursos existentes na administración pública valenciana.
Como se coordina?
O orzamento total asignado ao proxecto ascende a 7 millóns de euros que se distribuíron ás principais universidades e centros de investigación que previamente foron tomadas como referente por cada unha das comunidades autónomas participantes, acreditando o mandato para cada un dos proxectos como entidades de referencia rexional para a execución dos mesmos.
Estes centros son:
- O Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), coordinador de ILENIA e responsable de NEL-AINA. Outorgóuselle un financiamento de 3 millóns de euros.
- A Universidade de Alacante, a través de o Centro de Intelixencia Dixital (CENID), responsable de VIVES. Outorgóuselle un financiamento de 500.000 €.
- A Universidade do País Vasco, a través do Centro Vasco de Tecnoloxía da Lingua (HiTZ), responsable de NEL-GAITU. Asignóuselle un financiamento de 2 millóns de euros.
- A Universidade de Santiago de Compostela, responsable de NÓS. Se le ha asignado una financiación de dos millones de euros.
As axudas adxudicadas consisten en dotar aos proxectos anteriormente sinalados de ferramentas e recursos básicos suficientes (corpus multimodales, datos anotados, modelos de linguaxe neuronal, motores de tradución, reconocedores da fala, entre outros), para que a súa inclusión nas aplicacións de intelixencia artificial e tecnoloxías da linguaxe sexa rendible e atractiva para a Administración e as empresas do sector, tanto a nivel local como global.
A infraestrutura lingüística xerada:
- Permitirá dar un salto cualitativo na dixitalización da Administración pública.
- Facilitará a dixitalización e a internacionalización das empresas.
- Fará máis competitiva á industria do ámbito, beneficiándose das oportunidades que ofrece actualmente a intelixencia artificial e as tecnoloxías da linguaxe.
- Xerará novos postos de traballos cualificados.
A duración do proxecto NEL/ILENIA é de 36 meses e coordinación xeral leva a cabo por parte de o Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS).
Resultados
Na tarefa de desenvolvemento de recursos lingüísticos, ILENIA traballa con datos de texto e de voz que recibe a través de distintas voces. Os modelos de linguaxe son clave para o desenvolvemento de novas apps, así que se traballa na xeración e actualización destes modelos, xa sexan mono ou multilingües ou multimodales.
ILENIA colabora na implementación e inclusión de módulos e bibliotecas para o catalán, o eúscaro, o valenciano e o galego, en contornas e plataformas de referencia.
A xeración dos modelos coñecidos como Large Language Model (LLM) é un proceso progresivo que permite avanzar rapidamente na creación de novos modelos, reducindo o custo e os recursos para adestralos. Xa se pode acceder ás ligazóns de os datos e metadatos publicados ata agora por ILENIA a través das ligazóns dispoñibles na plataforma Hugging Face.
Están dispoñibles na páxina web do proxecto que, de feito, foi traducida ao catro linguas dispoñibles, parcialmente, cos modelos de tradución xerados no marco do proxecto.
- Intelixencia Artificial e Blockchain
- Información e datos do sector público