accesskey_mod_content

Reutilización y gobierno de datos en la nueva Estrategia Nacional de Inteligencia Artificial española

  • Escuchar
  • Imprimir PDF
  • Compartir

18 julio 2024

Con el objetivo de fomentar la creación de modelos de leguaje especializados y facilitar el desarrollo de aplicaciones para el ámbito público, la Estrategia prevé un modelo de gobernanza uniforme para los datos, incluidos los corpus documentales de la AGE, asegurando los estándares de seguridad, calidad, interoperabilidad y reutilización.

La  Estrategia de Inteligencia Artificial 2024  es el plan integral que establece un marco para acelerar el desarrollo y expansión de la inteligencia artificial (IA) en España. Esta estrategia fue aprobada, a propuesta del  Ministerio para la Transformación Digital y de la Función Pública , por el Consejo de Ministros el 14 de Mayo de 2024 y viene a reforzar y acelerar la  Estrategia Nacional de Inteligencia Artificial  (ENIA), que comenzó a desplegarse en 2020.

La  vertiginosa evolución de las tecnologías asociadas a la Inteligencia Artificial  de estos últimos años justifica por sí sola, este refuerzo. Por ejemplo, según el  AI Index Report de 2024 de la Universidad de Stanford , la inversión en IA se ha multiplicado por 9 desde 2022. El coste de entrenamiento de los modelos ha aumentado drásticamente, pero a cambio la IA está impulsando el progreso en ciencia, en medicina y en la  productividad laboral en general . Por razones como estas, se pretende aprovechar al máximo el impacto de la IA en la economía y recoger los elementos positivos del trabajo en curso.

La nueva estrategia se articula en torno a tres ejes principales, que se desarrollarán a través de ocho líneas de acción. Estos ejes son:

  • Reforzar las palancas claves para el desarrollo de la IA. Este eje se centra en potenciar la inversión en supercomputación, generar capacidades de almacenamiento en condiciones de sostenibilidad, desarrollar modelos y datos que constituyan una infraestructura pública de la IA y fomentar el talento especializado en IA.
  • Facilitar la expansión de la IA en el sector público y privado, fomentando la innovación y la ciberseguridad. Este eje tiene como objetivos incorporar la IA en los procesos gubernamentales y empresariales, con un énfasis especial en las pymes, y desarrollar un marco de ciberseguridad robusto.
  • Fomentar una IA transparente, ética y humanística. Este eje se centra en asegurar que el desarrollo y uso de la IA en España sea responsable y respetuoso con los derechos humanos, la igualdad, la privacidad y la no discriminación.

La siguiente infografía resumen los principales puntos de esta estrategia:

Infografía LA ESTRATEGIA DE LA INTELIGENCIA ARTIFICIAL 2024

La Estrategia de Inteligencia Artificial 2024 de España es un documento muy ambicioso que busca posicionar a nuestro país como líder en Inteligencia Artificial, expandiendo el uso de la IA robusta y responsable en el conjunto de la economía y en la administración pública. Con ello se podrá contribuir a que multiples áreas, como son la  cultura  o el  diseño de ciudades , puedan beneficiarse de estos progresos.

La apertura y el acceso a datos de calidad son también fundamentales para el éxito de esta estrategia, ya que son parte de la  materia prima necesaria para entrenar y evaluar modelos de IA que sean , además, inclusivos y socialmente justos para que beneficien a toda la sociedad. Muy relacionadas con los datos abiertos, la estrategia dedica palancas específicas al impulso de la IA en el sector público y al desarrollo de corpus y modelos de lenguaje fundacionales y especializados. Esto incluye además el desarrollo de servicios comunes basados en modelos de IA y la implementación de un modelo de gobernanza de datos para asegurar la seguridad, calidad, interoperabilidad y reutilización de los datos manejados por la Administración General del Estado (AGE).

Los modelos fundacionales ( LLMs ) son modelos de gran envergadura que se entrenarán a partir de grandes corpus de datos en castellano y lenguas cooficiales, garantizando así su aplicabilidad en una amplia variedad de contextos lingüísticos y culturales. Los modelos especializados (SLMs), de menor tamaño, se desarrollarán con el objetivo de abordar con una menor demanda de recursos computacionales necesidades específicas dentro de sectores particulares.

Gobernanza común de datos de la AGE

La gobernanza de datos abiertos tendrá un papel crucial en la realización de los objetivos planteados, para, por ejemplo, conseguir un desarrollo eficiente de modelos de leguaje especializados. Con el objetivo de fomentar la creación de estos modelos y facilitar el desarrollo de aplicaciones para el ámbito público, la estrategia prevé un modelo de gobernanza uniforme para los datos, incluidos los corpus documentales de la Administración General del Estado, asegurando los estándares de seguridad, calidad,  interoperabilidad y reutilización de todos los datos .

Esta iniciativa incluye la creación de un  espacio de datos unificado  que permita explotar conjuntos de datos sectoriales específicos para resolver casos de uso concretos de cada organismo. La gobernanza de datos garantizará la anonimización y privacidad de la información, así como el respeto a la normativa vigente durante todo el ciclo de vida de los datos.

Se desarrollará una estructura organizativa orientada al dato, con la  Dirección General del Dato  como elemento vertebrador. Además, se impulsará la Plataforma de datos de la AGE, la generación de catálogos de metadatos de los departamentos, el mapa de intercambios de datos y el fomento de la interoperabilidad. Todo ello con el fin de facilitar el despliegue de iniciativas de IA de mayor calidad y utilidad.

Desarrollar corpus y modelos de lenguaje fundacionales y especializados

Dentro de la palanca número tres, el documento reconoce que la base fundamental para el entrenamiento de los modelos de lenguaje son la cantidad y calidad de los datos disponibles, así como las licencias de uso que habilitan la posibilidad de utilizarlos.

La estrategia pone un énfasis especial en la  creación de corpus lingüísticos que sean representativos y diversificados , incluyendo el castellano y las lenguas cooficiales como el catalán, euskera, gallego y valenciano. Estos corpus no solo deben ser extensos, sino también reflejar la variedad y riqueza cultural de las lenguas, lo que permitirá desarrollar modelos más precisos y adaptados a las necesidades locales.

Para lograrlo, se prevé la colaboración con instituciones académicas y de investigación, así como con la industria, para recopilar, limpiar y etiquetar grandes volúmenes de datos textuales. Además, se implementarán políticas que faciliten el acceso a estos datos a través de licencias abiertas que promuevan su reutilización y compartición.

La creación de modelos fundacionales se enfoca en desarrollar algoritmos de inteligencia artificial, entrenados sobre la base de estos corpus lingüísticos que reflejen la cultura y tradiciones de nuestras lenguas. Estos modelos se crearán en el marco del proyecto ALIA, extendiendo  el trabajo iniciado con la pionera MarIA , y estarán diseñados para ser adaptables a una variedad de tareas de procesamiento del lenguaje natural. También se priorizará, siempre que sea posible, que estos modelos sean accesibles públicamente, permitiendo su uso tanto en el sector público como en el privado para generar el máximo valor económico posible.

En definitiva, la Estrategia Nacional de Inteligencia Artificial 2024 de España es un ambicioso plan que busca posicionar al país como un líder europeo en el desarrollo y uso de tecnologías de IA responsable, así como asegurar que estos avances tecnológicos se realicen de manera sostenible, beneficiando a toda la sociedad. El uso de datos abiertos y la gobernanza de los datos del sector público contribuyen también a esta estrategia, proporcionando bases fundamentales para el desarrollo de modelos de IA avanzados, éticos y eficientes que mejorarán los servicios públicos e  impulsarán el crecimiento económico . Y, en definitiva, la competitividad de España en un escenario global en el que todos los países están haciendo un esfuerzo importante por impulsar la IA y recoger estos beneficios.

  • Inteligencia Artificial y Blockchain
  • Información y datos del sector público