accesskey_mod_content

Coñece o proxecto ILENIA: Impulso das linguas en Intelixencia Artificial

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

30 xullo 2024

O proxecto ILENIA (Impulso das linguas en Intelixencia Artificial) é unha iniciativa estratéxica para o impulso das linguas cooficiais no ámbito tecnolóxico e dixital.

Que obxectivos persegue?

O proxecto ILENIA ten por obxecto impulsar en España a nova economía dixital baseada na linguaxe natural, aproveitando o potencial do español e do resto de linguas oficiais como factor de crecemento económico e de competitividade internacional en áreas tales como a intelixencia artificial, a tradución, o ensino, a produción e divulgación cultural, a investigación e a ciencia.

ILENIA é un proxecto común e coordinado entre as diferentes linguas oficiais do estado cuxo obxectivo último é o desenvolvemento de recursos multilingües, en especial modelos multilingües de texto, voz e tradución automática que dean resposta ás necesidades da sociedade e estean en liña coa tecnoloxía actual, na que o multilingüismo e a transferencia entre linguas xogan un papel primordial.

Como se articula?

O proxecto ILENIA articúlase ao redor de catro proxectos: AINA en catalán, o proxecto NÓS en galego, o proxecto GAITU en eúscaro, e o proxecto VIVES en valenciano, como iniciativas de referencia para o PERTE da Nova Economía da Lingua no desenvolvemento da economía dixital.

Nesta liña, búscase favorecer as sinerxias entre as distintas iniciativas e multiplicar así o seu impacto na sociedade para lograr o obxectivo estatal de apoiar ás industrias na súa transformación dixital, liderando o desenvolvemento e a integración da intelixencia artificial no tecido produtivo, a economía e a sociedade, segundo establece a  Estratexia Nacional de Intelixencia Artificial :

  • AINA é un proxecto de intelixencia artificial que ten por obxectivo xerar corpus e modelos informáticos da lingua catalá para que as empresas que crean aplicacións baseadas en intelixencia artificial (IA), como asistentes de voz, buscadores de Internet, tradutores e correctores automáticos, axentes conversacionales, etc., poidan facelo facilmente en catalán.
  • O Proxecto GAITU é unha iniciativa tractora da administración vasca que, a través de tecnoloxía da lingua de calidade en eúscaro, pretende desenvolver e ofrecer servizos lingüísticos básicos e transversais para utilizalos en todas as administracións públicas e, en definitiva, para ofrecer mellores servizos públicos á cidadanía. O plan de acción recolle os proxectos concretos que utilizan tecnoloxía lingüística e que se están desenvolvendo en diferentes áreas estratéxicas do Goberno Vasco.
  • O Proxecto NÓS pretende crear os recursos dixitais e lingüísticos necesarios para facilitar o desenvolvemento de aplicacións baseadas en intelixencia artificial (IA) e tecnoloxías da linguaxe (TL) tales como asistentes de voz, tradutores automáticos e axentes conversacionales en galego, permitindo colocar o galego na vangarda das tecnoloxías intelixentes, especialmente naquelas áreas relacionadas coas tecnoloxías lingüísticas e, en xeral, na sociedade e na economía da intelixencia artificial.
  • O Plan VIVES de tecnoloxías da linguaxe ten como obxecto a creación de corpus masivos a través de campañas de adquisición de datos de voz e textos, da participación cidadá e dos recursos existentes na administración pública valenciana.

Como se coordina?

O orzamento total asignado ao proxecto ascende a 7 millóns de euros que se distribuíron ás principais universidades e centros de investigación que previamente foron tomadas como referente por cada unha das comunidades autónomas participantes, acreditando o mandato para cada un dos proxectos como entidades de referencia rexional para a execución dos mesmos.

Estes centros son:

  • O Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), coordinador de ILENIA e responsable de NEL-AINA. Outorgóuselle un financiamento de 3 millóns de euros.
  • A Universidade de Alacante, a través de o Centro de Intelixencia Dixital (CENID), responsable de VIVES. Outorgóuselle un financiamento de 500.000 €.
  • A Universidade do País Vasco, a través do Centro Vasco de Tecnoloxía da Lingua (HiTZ), responsable de NEL-GAITU. Asignóuselle un financiamento de 2 millóns de euros.
  • A Universidade de Santiago de Compostela, responsable de NÓS. Asignóuselle un financiamento de dous millóns de euros.

As axudas adxudicadas consisten en dotar aos proxectos anteriormente sinalados de ferramentas e recursos básicos suficientes (corpus multimodales, datos anotados, modelos de linguaxe neuronal, motores de tradución, reconocedores da fala, entre outros), para que a súa inclusión nas aplicacións de intelixencia artificial e tecnoloxías da linguaxe sexa rendible e atractiva para a Administración e as empresas do sector, tanto a nivel local como global.

A infraestrutura lingüística xerada:

  • Permitirá dar un salto cualitativo na dixitalización da Administración pública.
  • Facilitará a dixitalización e a internacionalización das empresas.
  • Fará máis competitiva á industria do ámbito, beneficiándose das oportunidades que ofrece actualmente a intelixencia artificial e as tecnoloxías da linguaxe.
  • Xerará novos postos de traballos cualificados.

A duración do proxecto NEL/ILENIA é de 36 meses e coordinación xeral leva a cabo por parte de o Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS).

Resultados

Na tarefa de desenvolvemento de recursos lingüísticos, ILENIA traballa con datos de texto  e de voz que recibe a través de distintas voces. Os modelos de linguaxe son clave para o desenvolvemento de novas apps, así que se traballa na xeración e actualización destes modelos, xa sexan mono ou multilingües ou multimodales.

ILENIA colabora na implementación e inclusión de módulos e bibliotecas para o catalán, o eúscaro, o valenciano e o galego, en contornas e plataformas de referencia.

A xeración dos modelos coñecidos como Large Language Model (LLM) es un proceso progresivo que permite avanzar rápidamente en la creación de novos modelos, reducindo o custo e os recursos para adestralos. Xa se pode acceder ás ligazóns de os datos e metadatos publicados ata agora por ILENIA a través das ligazóns dispoñibles na plataforma Hugging Face.

Están dispoñibles na páxina web do proxecto que, de feito, foi traducida ao catro linguas dispoñibles, parcialmente, cos modelos de tradución xerados no marco do proxecto.

Fonte orixinal da noticia(Abre en nova xanela)

  • Intelixencia Artificial e Blockchain
  • Información e datos do sector público