accesskey_mod_content

Como debe ser a gobernación de datos nos modelos de IA open source

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

18 febreiro 2025

A intelixencia artificial (IA) de código aberto é unha oportunidade para democratizar a innovación e evitar a concentración de poder na industria tecnolóxica.

A intelixencia artificial (IA) de código aberto é unha oportunidade para democratizar a innovación e evitar a concentración de poder na industria tecnolóxica. Con todo, o seu desenvolvemento depende en gran medida da dispoñibilidade de conxuntos de datos de alta calidade e da implementación de marcos sólidos de gobernación de datos. Un informe recente de Open Open Future(Abre en nova xanela) e a Open Source Initiative(Abre en nova xanela) (OSI) analiza os desafíos e oportunidades nesta intersección, propondo solucións para unha gobernación de datos equitativa e responsable. Podes ler aquí o informe(Abre en nova xanela) completo.

Neste post, analízanse as ideas máis relevantes do documento, así como os consellos que ofrece para garantir unha correcta e efectiva gobernación de datos na intelixencia artificial open source e aproveitar todas as súas vantaxes.

Os retos da gobernación de datos na IA

A pesar da gran cantidade de datos dispoñibles na web, o seu acceso e uso para adestrar modelos de IA expoñen importantes desafíos éticos, legais e técnicos. Por exemplo:

  1. Equilibrio entre apertura e dereitos: en liña co Regulamento de Gobernación de Datos(Abre en nova xanela) (DGA), débese garantir un acceso amplo aos datos sen comprometer dereitos de propiedade intelectual, privacidade e equidade.
  2. Falta de transparencia e estándares de apertura: é importante que os modelos etiquetaxes como “abertos” cumpran con criterios claros de transparencia no uso de datos.
  3. Rumbos estruturais: moitos conxuntos de datos reflicten rumbos lingüísticos, xeográficos e socioeconómicos que poden perpetuar desigualdades nos sistemas de IA.
  4. Sustentabilidade ambiental: el uso intensivo de recursos para entrenar modelos de IA plantea desafíos de sostenibilidad que deben abordarse con prácticas máis eficientes(Abre en nova xanela) .
  5. Involucrar a máis actores: actualmente, os desenvolvedores e as grandes corporacións dominan a conversación sobre IA, deixando fóra a comunidades afectadas e organizacións públicas.

Unha vez identificados os retos, o informe propón unha estratexia para alcanzar o obxectivo principal: unha gobernación de datos adecuada nos modelos de IA de código abertos. Este enfoque está baseado en dous alicerces fundamentais.

Cara a unha novo paradigma de gobernación de datos

Na actualidade, o acceso e a xestión dos datos para adestrar modelos de IA están marcados por unha crecente desigualdade. Mentres algunhas grandes corporacións teñen acceso exclusivo a vastos repositorios de datos, moitas iniciativas de código aberto e comunidades marxinadas carecen dos recursos para acceder a datos representativos e de calidade. Para abordar este desequilibrio é necesario un novo enfoque na xestión e uso dos datos na IA de código aberto. O informe destaca dous cambios fundamentais na maneira en que se concibe a gobernación de datos:

Por unha banda, adoptar un enfoque de data data commons(Abre en nova xanela)  que non é máis que un modelo de acceso que garante o equilibrio entre a apertura de datos e a protección de dereitos. Para iso, sería importante utilizar licenzas innovadoras que permitan compartir datos sen explotación indebida. Tamén é relevante crear estruturas de gobernación que regulen o acceso e uso de datos. E, por último, implementar mecanismos de compensación para comunidades cuxos datos son utilizados en intelixencia artificial.

Doutra banda, é necesario transcender a visión centrada en desenvolvedores de IA e incluír a máis actores na gobernación de datos, como:

  • Propietarios dos datos e comunidades que xeran contido.
  • Institucións públicas que poden promover estándares de apertura.
  • Organizacións da sociedade civil que velen pola equidade e o acceso responsable aos datos.

Ao adoptar estes cambios, a comunidade de IA poderá establecer un sistema máis inclusivo, no que os beneficios do acceso a datos distribúanse de maneira equitativa e respectuosa cos dereitos de todas as partes interesadas. Segundo o informe, a implementación destes modelos non só aumentará a cantidade de datos dispoñibles para a IA de código aberto, senón que tamén fomentará a creación de ferramentas máis xustas e sustentables para a sociedade no seu conxunto.

Consellos e estratexia

Para facer efectiva unha gobernación de datos robusta na IA de código aberto, o informe propón seis áreas de acción prioritarias:

  1. Preparación e rastrexabilidade de datos: mellorar a calidade e documentación dos conxuntos de datos.
  2. Mecanismos de licenciamiento e consentimento: permitir aos creadores de datos definir o seu uso de maneira clara.
  3. Custodia de datos: fortalecer a figura de intermediarios que xestionen datos de forma ética.
  4. Sustentabilidade ambiental: reducir o impacto do adestramento de IA con prácticas eficientes.
  5. Compensación e reciprocidade: garantir que os beneficios da IA cheguen a quen contribúen con datos.
  6. Intervencións de política pública: promover regulacións que incentiven a transparencia e o acceso equitativo a datos.

 Como conseguir unha correcta gobernación de datos en IA de código abertos?   1. Mellorar a calidade e rastrexabilidade dos datos  2. Permitir licenciamiento e consentimento claro  3. Fortalecer a custodia de datos dos intermediarios  4. Reducir o impacto ambiental do adestramento de IA  5. Garantir unha correcta compensación dos beneficios da IA  6. Promover políticas públicas que incentiven a transparencia e o acceso equitativo aos datos   Fonte:

A intelixencia artificial de código aberto pode impulsar a innovación e a equidade, pero para logralo é necesario un enfoque de gobernación de datos máis inclusivo e sustentable. Adoptar modelos de datos comúns e ampliar o ecosistema de actores permitirá construír sistemas de IA máis xustos, representativos e responsables co ben común.

informe(Abre en nova xanela)  que publican Open Future e Open Source Initiative fai unha chamada á acción a desenvolvedores, lexisladores e sociedade civil para establecer normas compartidas e solucións que equilibren a apertura de datos coa protección de dereitos. Cunha gobernación de datos sólida, a IA de código aberto poderá cumprir a súa promesa de servir ao interese público.

Fonte orixinal da noticia(Abre en nova xanela)

  • Intelixencia Artificial e Blockchain
  • Información e datos do sector público