accesskey_mod_content

Com ha de ser la governança de dades en els models de IA open source

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

18 febrer 2025

La intel·ligència artificial (IA) de codi obert és una oportunitat per democratitzar la innovació i evitar la concentració de poder en la indústria tecnològica.

La intel·ligència artificial (IA) de codi obert és una oportunitat per democratitzar la innovació i evitar la concentració de poder en la indústria tecnològica. No obstant això, el seu desenvolupament depèn en gran manera de la disponibilitat de conjunts de dades d'alta qualitat i de la implementació de marcs sòlids de governança de dades. Un informe recent d'Open Open Future(Obre en nova finestra) i l'Open Open Source Initiative(Obre en nova finestra) (OSI) analitza els desafiaments i oportunitats en aquesta intersecció, proposant solucions per a una governança de dades equitativa i responsable. Pots llegir aquí l'informe(Obre en nova finestra) complet.

En aquest post, s'analitzen les idees més rellevants del document, així com els consells que ofereix per garantir una correcta i efectiva governança de dades en la intel·ligència artificial open source i aprofitar tots els seus avantatges.

Els reptes de la governança de dades en la IA

Malgrat la gran quantitat de dades disponibles a la web, el seu accés i ús per entrenar models de IA plantegen importants desafiaments ètics, legals i tècnics. Per exemple:

  1. Equilibri entre obertura i drets: en línia amb Reglament de Governança de Dades(Obre en nova finestra) (DGA), s'ha de garantir un accés ampli a les dades sense comprometre drets de propietat intel·lectual, privadesa i equitat.
  2. Falta de transparència i estàndards d'obertura: és important que els models etiquetats com a “oberts” compleixin amb criteris clars de transparència en l'ús de dades.
  3. Biaixos estructurals: molts conjunts de dades reflecteixen biaixos lingüístics, geogràfics i socioeconòmics que poden perpetuar desigualtats en els sistemes de IA.
  4. Sostenibilitat ambiental: el uso intensivo de recursos para entrenar modelos de IA plantea desafíos de sostenibilidad que han d'abordar-se amb pràctiques més eficients(Obre en nova finestra) .
  5. Involucrar a més actors: actualment, els desenvolupadors i les grans corporacions dominen la conversa sobre IA, deixant fora a comunitats afectades i organitzacions públiques.

Una vegada identificats els reptes, l'informe proposa una estratègia per aconseguir l'objectiu principal: una governança de dades adequada en els models de IA de codi oberts. Aquest enfocament està basat en dos pilars fonamentals.

Cap a un nou paradigma de governança de dades

En l'actualitat, l'accés i la gestió de les dades per entrenar models de IA estan marcats per una creixent desigualtat. Mentre algunes grans corporacions tenen accés exclusiu a vasts repositoris de dades, moltes iniciatives de codi obert i comunitats marginades manquen dels recursos per accedir a dades representatives i de qualitat. Per abordar aquest desequilibri és necessari un nou enfocament en la gestió i ús de les dades en la IA de codi obert. L'informe destaca dos canvis fonamentals en la manera en què es concep la governança de dades:

D'una banda, adoptar un enfocament de data commons(Obre en nova finestra)  que no és més que un model d'accés que garanteix el equilibri entre l'obertura de dades i la protecció de drets. Per a això, seria important utilitzar llicències innovadores que permetin compartir dades sense explotació indeguda. També és rellevant crear estructures de governança que regulin l'accés i ús de dades. I, finalment, implementar mecanismes de compensació per a comunitats les dades de les quals són utilitzats en intel·ligència artificial.

D'altra banda, és necessari transcendir la visió centrada en desenvolupadors de IA i incloure a més actors en la governança de dades, com:

  • Propietaris de les dades i comunitats que generen contingut.
  • Institucions públiques que poden promoure estàndards d'obertura.
  • Organitzacions de la societat civil que vetllin per l'equitat i l'accés responsable a les dades.

En adoptar aquests canvis, la comunitat de IA podrà establir un sistema més inclusiu, en el qual els beneficis de l'accés a dades es distribueixin de manera equitativa i respectuosa amb els drets de totes les parts interessades. Segons l'informe, la implementació d'aquests models no solament augmentarà la quantitat de dades disponibles per la IA de codi obert, sinó que també fomentarà la creació d'eines més justes i sostenibles per a la societat en el seu conjunt.

Consells i estratègia

Per fer efectiva una governança de dades robusta en la IA de codi obert, l'informe proposa sis àrees d'acció prioritàries:

  1. Preparació i traçabilitat de dades: millorar la qualitat i documentació dels conjunts de dades.
  2. Mecanismes de llicenciament i consentiment: permetre als creadors de dades definir el seu ús de manera clara.
  3. Custòdia de dades: enfortir la figura d'intermediaris que gestionin dades de forma ètica.
  4. Sostenibilitat ambiental: reduir l'impacte de l'entrenament de IA amb pràctiques eficients.
  5. Compensació i reciprocitat: garantir que els beneficis de la IA arribin a els qui contribueixen amb dades.
  6. Intervencions de política pública: promoure regulacions que incentivin la transparència i l'accés equitatiu a dades.

 Com aconseguir una correcta governança de dades en IA de codi oberts?   1. Millorar la qualitat i traçabilitat de les dades  2. Permetre llicenciament i consentiment clar  3. Enfortir la custòdia de dades dels intermediaris  4. Reduir l'impacte ambiental de l'entrenament de IA  5. Garantir una correcta compensació dels beneficis de la IA  6. Promoure polítiques públiques que incentivin la transparència i l'accés equitatiu a les dades   Font:

La intel·ligència artificial de codi obert pot impulsar la innovació i l'equitat, però per aconseguir-ho és necessari un enfocament de governança de dades més inclusiu i sostenible. Adoptar models de dades comunes i ampliar l'ecosistema d'actors permetrà construir sistemes de IA més justs, representatius i responsables amb el ben comú.

El  informe(Obre en nova finestra)  que publiquen Open Future i Open Source Initiative fa una trucada a l'acció a desenvolupadors, legisladors i societat civil per establir normes compartides i solucions que equilibrin la obertura de dades amb la protecció de drets. Amb una governança de dades sòlida, la IA de codi obert podrà complir la seva promesa de servir a l'interès públic.

Font original de la notícia(Obre en nova finestra)

  • Intel·ligència Artificial i Blockchain
  • Informació i dades del sector públic