accesskey_mod_content

Reutilización e goberno de datos na nova Estratexia Nacional de Intelixencia Artificial española

  • Escoitar
  • Imprimir PDF
  • Compartir

18 xullo 2024

Co obxectivo de fomentar a creación de modelos de leguaje especializados e facilitar o desenvolvemento de aplicacións para o ámbito público, a Estratexia prevé un modelo de gobernación uniforme para os datos, incluídos os corpus documentais da AGE, asegurando os estándares de seguridade, calidade, interoperabilidade e reutilización.

Estratexia de Intelixencia Artificial 2024  é o plan integral que establece un marco para acelerar o desenvolvemento e expansión da intelixencia artificial (IA) en España. Esta estratexia foi aprobada, a proposta de o  Ministerio para a Transformación Dixital e da Función Pública , por el Consejo de Ministros el 14 de Mayo de 2024 y viene a reforzar y acelerar la  Estratexia Nacional de Intelixencia Artificial  (ENIA), que comezou a despregarse en 2020.

vertixinosa evolución das tecnoloxías asociadas á Intelixencia Artificial  destes últimos anos xustifica por si soa, este reforzo. Por exemplo, segundo a  AI Index Report de 2024 da Universidade de Stanford , la inversión en IA se ha multiplicado por 9 desde 2022. El coste de entrenamiento de los modelos ha aumentado drásticamente, pero a cambio la IA está impulsando el progreso en ciencia, en medicina y en la  produtividade laboral en xeral . Por razóns como estas, preténdese aproveitar ao máximo o impacto da IA na economía e recoller os elementos positivos do traballo en curso.

La nueva estrategia se articula en torno a tres ejes principales, que se desarrollarán a través de ocho líneas de acción. Estos ejes son:

  • Reforzar as pancas craves para o desenvolvemento da IA. Este eixo céntrase en potenciar o investimento en supercomputación, xerar capacidades de almacenamento en condicións de sustentabilidade, desenvolver modelos e datos que constitúan unha infraestrutura pública da IA e fomentar o talento especializado en IA.
  • Facilitar a expansión da IA no sector público e privado, fomentando a innovación e a ciberseguridade. Este eixo ten como obxectivos incorporar a IA nos procesos gobernamentais e empresariais, cunha énfase especial nas pemes, e desenvolver un marco de ciberseguridade robusto.
  • Fomentar unha IA transparente, ética e humanística. Este eixo céntrase en asegurar que o desenvolvemento e uso da IA en España sexa responsable e respectuoso cos dereitos humanos, a igualdade, a privacidade e a non discriminación.

A seguinte infografía resumen os principais puntos desta estratexia:

Infografía A ESTRATEXIA DA INTELIXENCIA ARTIFICIAL 2024

La Estrategia de Inteligencia Artificial 2024 de España es un documento muy ambicioso que busca posicionar a nuestro país como líder en Inteligencia Artificial, expandiendo el uso de la IA robusta y responsable en el conjunto de la economía y en la administración pública. Con ello se podrá contribuir a que multiples áreas, como son la  cultura  ou o  deseño de cidades , poidan beneficiarse destes progresos.

A apertura e o acceso a datos de calidade son tamén fundamentais para o éxito desta estratexia, xa que son parte de a  materia prima necesaria para adestrar e avaliar modelos de IA que sexan , ademais, inclusivos e socialmente xustos para que beneficien a toda a sociedade. Moi relacionadas cos datos abertos, a estratexia dedica pancas específicas ao impulso da IA no sector público e a o desenvolvemento de corpus e modelos de linguaxe fundacionais e especializados. Isto inclúe ademais o desenvolvemento de servizos comúns baseados en modelos de IA e a implementación dun modelo de gobernación de datos para asegurar a seguridade, calidade, interoperabilidade e reutilización dos datos manexados pola Administración Xeral do Estado (AGE).

Os modelos fundacionais ( LLMs ) son modelos de gran envergadura que se adestrarán a partir de grandes corpus de datos en castelán e linguas cooficiais, garantindo así a súa aplicabilidade nunha ampla variedade de contextos lingüísticos e culturais. Os modelos especializados (SLMs), de menor tamaño, desenvolveranse co obxectivo de abordar cunha menor demanda de recursos computacionales necesidades específicas dentro de sectores particulares.

Gobernación común de datos da AGE

A gobernación de datos abertos terá un papel crucial na realización dos obxectivos expostos, para, por exemplo, conseguir un desenvolvemento eficiente de modelos de leguaje especializados. Co obxectivo de fomentar a creación destes modelos e facilitar o desenvolvemento de aplicacións para o ámbito público, a estratexia prevé un modelo de gobernación uniforme para os datos, incluídos os corpus documentais da Administración Xeral do Estado, asegurando os estándares de seguridade, calidade,  interoperabilidade e reutilización de todos os datos .

Esta iniciativa inclúe a creación de un  espazo de datos unificado  que permita explotar conxuntos de datos sectoriais específicos para resolver casos de uso concretos de cada organismo. A gobernación de datos garantirá a anonimización e privacidade da información, así como o respecto á normativa vixente durante todo o ciclo de vida dos datos.

Desenvolverase unha estrutura organizativa orientada ao dato, con a  Dirección Xeral do Dato  como elemento vertebrador. Ademais, impulsarase a Plataforma de datos da AGE, a xeración de catálogos de metadatos dos departamentos, o mapa de intercambios de datos e o fomento da interoperabilidade. Todo iso co fin de facilitar o despregamento de iniciativas de IA de maior calidade e utilidade.

Desenvolver corpus e modelos de linguaxe fundacionais e especializados

Dentro da panca número tres, o documento recoñece que a base fundamental para o adestramento dos modelos de linguaxe son a cantidade e calidade dos datos dispoñibles, así como as licenzas de uso que habilitan a posibilidade de utilizalos.

A estratexia pon unha énfase especial en a  creación de corpus lingüísticos que sexan representativos e diversificados , incluíndo o castelán e as linguas cooficiais como o catalán, eúscaro, galego e valenciano. Estes corpus non só deben ser extensos, senón tamén reflectir a variedade e riqueza cultural das linguas, o que permitirá desenvolver modelos máis precisos e adaptados ás necesidades locais.

Para logralo, prevese a colaboración con institucións académicas e de investigación, así como coa industria, para recompilar, limpar e etiquetar grandes volumes de datos textuais. Ademais, implementaranse políticas que faciliten o acceso a estes datos a través de licenzas abertas que promovan a súa reutilización e compartición.

A creación de modelos fundacionais enfócase en desenvolver algoritmos de intelixencia artificial, adestrados sobre a base destes corpus lingüísticos que reflictan a cultura e tradicións das nosas linguas. Estes modelos crearanse no marco do proxecto ALIA, estendendo  o traballo iniciado coa pioneira MarIA , e estarán deseñados para ser adaptables a unha variedade de tarefas de procesamento da linguaxe natural. Tamén se priorizará, sempre que sexa posible, que estes modelos sexan accesibles publicamente, permitindo o seu uso tanto no sector público como no privado para xerar o máximo valor económico posible.

En definitiva, a Estratexia Nacional de Intelixencia Artificial 2024 de España é un ambicioso plan que busca situar ao país como un líder europeo no desenvolvemento e uso de tecnoloxías de IA responsable, así como asegurar que estes avances tecnolóxicos realícense de maneira sustentable, beneficiando a toda a sociedade. O uso de datos abertos e a gobernación dos datos do sector público contribúen tamén a esta estratexia, proporcionando bases fundamentais para o desenvolvemento de modelos de IA avanzados, éticos e eficientes que mellorarán os servizos públicos e  impulsarán o crecemento económico . E, en definitiva, a competitividade de España nun escenario global no que todos os países están a facer un esforzo importante por impulsar a IA e recoller estes beneficios.

  • Intelixencia Artificial e Blockchain
  • Información e datos do sector público