Estás en:
Portal da Administración Electrónica >
Actualidade >
Noticias >
Como debe ser a gobernación de datos nos modelos de IA open source

Como debe ser a gobernación de datos nos modelos de IA open source

18 febreiro 2025

A intelixencia artificial (IA) de código aberto é unha oportunidade para democratizar a innovación e evitar a concentración de poder na industria tecnolóxica.

A intelixencia artificial (IA) de código aberto é unha oportunidade para democratizar a innovación e evitar a concentración de poder na industria tecnolóxica. Con todo, o seu desenvolvemento depende en gran medida da dispoñibilidade de conxuntos de datos de alta calidade e da implementación de marcos sólidos de gobernación de datos. Un informe recente de Open Open Future (Abre en nova xanela) e a Open Source Initiative (OSI) analiza os desafíos e oportunidades nesta intersección, propondo solucións para unha gobernación de datos equitativa e responsable. Podes ler aquí o informe completo.

Neste post, analízanse as ideas máis relevantes do documento, así como os consellos que ofrece para garantir unha correcta e efectiva gobernación de datos na intelixencia artificial open source e aproveitar todas as súas vantaxes.

Os retos da gobernación de datos na IA

A pesar da gran cantidade de datos dispoñibles na web, o seu acceso e uso para adestrar modelos de IA expoñen importantes desafíos éticos, legais e técnicos. Por exemplo:

Equilibrio entre apertura e dereitos: en liña co Regulamento de Gobernación de Datos (DGA), débese garantir un acceso amplo aos datos sen comprometer dereitos de propiedade intelectual, privacidade e equidade.
Falta de transparencia e estándares de apertura: é importante que os modelos etiquetaxes como “abertos” cumpran con criterios claros de transparencia no uso de datos.
Rumbos estruturais: moitos conxuntos de datos reflicten rumbos lingüísticos, xeográficos e socioeconómicos que poden perpetuar desigualdades nos sistemas de IA.
Sustentabilidade ambiental: el uso intensivo de recursos para entrenar modelos de IA plantea desafíos de sostenibilidad que deben abordarse con prácticas máis eficientes .
Involucrar a máis actores: actualmente, os desenvolvedores e as grandes corporacións dominan a conversación sobre IA, deixando fóra a comunidades afectadas e organizacións públicas.

Unha vez identificados os retos, o informe propón unha estratexia para alcanzar o obxectivo principal: unha gobernación de datos adecuada nos modelos de IA de código abertos. Este enfoque está baseado en dous alicerces fundamentais.

Cara a unha novo paradigma de gobernación de datos

Na actualidade, o acceso e a xestión dos datos para adestrar modelos de IA están marcados por unha crecente desigualdade. Mentres algunhas grandes corporacións teñen acceso exclusivo a vastos repositorios de datos, moitas iniciativas de código aberto e comunidades marxinadas carecen dos recursos para acceder a datos representativos e de calidade. Para abordar este desequilibrio é necesario un novo enfoque na xestión e uso dos datos na IA de código aberto. O informe destaca dous cambios fundamentais na maneira en que se concibe a gobernación de datos:

Por unha banda, adoptar un enfoque de data data commons (Abre en nova xanela) que non é máis que un modelo de acceso que garante o equilibrio entre a apertura de datos e a protección de dereitos. Para iso, sería importante utilizar licenzas innovadoras que permitan compartir datos sen explotación indebida. Tamén é relevante crear estruturas de gobernación que regulen o acceso e uso de datos. E, por último, implementar mecanismos de compensación para comunidades cuxos datos son utilizados en intelixencia artificial.

Doutra banda, é necesario transcender a visión centrada en desenvolvedores de IA e incluír a máis actores na gobernación de datos, como:

Propietarios dos datos e comunidades que xeran contido.
Institucións públicas que poden promover estándares de apertura.
Organizacións da sociedade civil que velen pola equidade e o acceso responsable aos datos.

Ao adoptar estes cambios, a comunidade de IA poderá establecer un sistema máis inclusivo, no que os beneficios do acceso a datos distribúanse de maneira equitativa e respectuosa cos dereitos de todas as partes interesadas. Segundo o informe, a implementación destes modelos non só aumentará a cantidade de datos dispoñibles para a IA de código aberto, senón que tamén fomentará a creación de ferramentas máis xustas e sustentables para a sociedade no seu conxunto.

Consellos e estratexia

Para facer efectiva unha gobernación de datos robusta na IA de código aberto, o informe propón seis áreas de acción prioritarias:

Preparación e rastrexabilidade de datos: mellorar a calidade e documentación dos conxuntos de datos.
Mecanismos de licenciamiento e consentimento: permitir aos creadores de datos definir o seu uso de maneira clara.
Custodia de datos: fortalecer a figura de intermediarios que xestionen datos de forma ética.
Sustentabilidade ambiental: reducir o impacto do adestramento de IA con prácticas eficientes.
Compensación e reciprocidade: garantir que os beneficios da IA cheguen a quen contribúen con datos.
Intervencións de política pública: promover regulacións que incentiven a transparencia e o acceso equitativo a datos.

A intelixencia artificial de código aberto pode impulsar a innovación e a equidade, pero para logralo é necesario un enfoque de gobernación de datos máis inclusivo e sustentable. Adoptar modelos de datos comúns e ampliar o ecosistema de actores permitirá construír sistemas de IA máis xustos, representativos e responsables co ben común.

O informe (Abre en nova xanela) que publican Open Future e Open Source Initiative fai unha chamada á acción a desenvolvedores, lexisladores e sociedade civil para establecer normas compartidas e solucións que equilibren a apertura de datos coa protección de dereitos. Cunha gobernación de datos sólida, a IA de código aberto poderá cumprir a súa promesa de servir ao interese público.

Fonte orixinal da noticia

Intelixencia Artificial e Blockchain
Información e datos do sector público