Estàs en:
Portal de l'Administració Electrònica >
Actualitat >
Notícies >
Com ha de ser la governança de dades en els models de IA open source

Com ha de ser la governança de dades en els models de IA open source

18 febrer 2025

La intel·ligència artificial (IA) de codi obert és una oportunitat per a democratitzar la innovació i evitar la concentració de poder en la indústria tecnològica.

La intel·ligència artificial (IA) de codi obert és una oportunitat per a democratitzar la innovació i evitar la concentració de poder en la indústria tecnològica. No obstant açò, el seu desenvolupament depèn en gran mesura de la disponibilitat de conjunts de dades d'alta qualitat i de la implementació de marcs sòlids de governança de dades. Un informe recent d'Open Open Future (Obri en nova finestra) i l'Open Open Source Initiative (OSI) analitza els desafiaments i oportunitats en esta intersecció, proposant solucions per a una governança de dades equitativa i responsable. Pots llegir ací l'informe complet.

En este post, s'analitzen les idees més rellevants del document, així com els consells que oferix per a garantir una correcta i efectiva governança de dades en la intel·ligència artificial open source i aprofitar tots els seus avantatges.

Els reptes de la governança de dades en la IA

A pesar de la gran quantitat de dades disponibles en la web, el seu accés i ús per a entrenar models de IA plantegen importants desafiaments ètics, legals i tècnics. Per exemple:

Equilibri entre obertura i drets: en línia amb Reglament de Governança de Dades (DGA), s'ha de garantir un accés ampli a les dades sense comprometre drets de propietat intel·lectual, privacitat i equitat.
Falta de transparència i estàndards d'obertura: és important que els models etiquetats com a “oberts” complisquen amb criteris clars de transparència en l'ús de dades.
Biaixos estructurals: molts conjunts de dades reflectixen biaixos lingüístics, geogràfics i socioeconòmics que poden perpetuar desigualtats en els sistemes de IA.
Sostenibilitat ambiental: el uso intensivo de recursos para entrenar modelos de IA plantea desafíos de sostenibilidad que han d'abordar-se amb pràctiques més eficients .
Involucrar a més actors: actualment, els desenvolupadors i les grans corporacions dominen la conversa sobre IA, deixant fora a comunitats afectades i organitzacions públiques.

Una vegada identificats els reptes, l'informe proposa una estratègia per a aconseguir l'objectiu principal: una governança de dades adequada en els models de IA de codi oberts. Este enfocament està basat en dos pilars fonamentals.

Cap a un nou paradigma de governança de dades

En l'actualitat, l'accés i la gestió de les dades per a entrenar models de IA estan marcats per una creixent desigualtat. Mentre algunes grans corporacions tenen accés exclusiu a vasts repositoris de dades, moltes iniciatives de codi obert i comunitats marginades manquen dels recursos per a accedir a dades representatives i de qualitat. Per a abordar este desequilibri és necessari un nou enfocament en la gestió i ús de les dades en la IA de codi obert. L'informe destaca dos canvis fonamentals en la manera en què es concep la governança de dades:

D'una banda, adoptar un enfocament de data commons (Obri en nova finestra) que no és més que un model d'accés que garantix el equilibri entre l'obertura de dades i la protecció de drets. Per a açò, seria important utilitzar llicències innovadores que permeten compartir dades sense explotació indeguda. També és rellevant crear estructures de governança que regulen l'accés i ús de dades. I, finalment, implementar mecanismes de compensació per a comunitats les dades de les quals són utilitzats en intel·ligència artificial.

D'altra banda, és necessari transcendir la visió centrada en desenvolupadors de IA i incloure a més actors en la governança de dades, com:

Propietaris de les dades i comunitats que generen contingut.
Institucions públiques que poden promoure estàndards d'obertura.
Organitzacions de la societat civil que vetlen per l'equitat i l'accés responsable a les dades.

En adoptar estos canvis, la comunitat de IA podrà establir un sistema més inclusiu, en el qual els beneficis de l'accés a dades es distribuïsquen de manera equitativa i respectuosa amb els drets de totes les parts interessades. Segons l'informe, la implementació d'estos models no solament augmentarà la quantitat de dades disponibles per a la IA de codi obert, sinó que també fomentarà la creació de ferramentes més justes i sostenibles per a la societat en el seu conjunt.

Consells i estratègia

Per a fer efectiva una governança de dades robusta en la IA de codi obert, l'informe proposa sis àrees d'acció prioritàries:

Preparació i traçabilitat de dades: millorar la qualitat i documentació dels conjunts de dades.
Mecanismes de llicenciament i consentiment: permetre als creadors de dades definir el seu ús de manera clara.
Custòdia de dades: enfortir la figura d'intermediaris que gestionen dades de forma ètica.
Sostenibilitat ambiental: reduir l'impacte de l'entrenament de IA amb pràctiques eficients.
Compensació i reciprocitat: garantir que els beneficis de la IA arriben a els qui contribuïxen amb dades.
Intervencions de política pública: promoure regulacions que incentiven la transparència i l'accés equitatiu a dades.

La intel·ligència artificial de codi obert pot impulsar la innovació i l'equitat, però per a aconseguir-ho és necessari un enfocament de governança de dades més inclusiu i sostenible. Adoptar models de dades comunes i ampliar l'ecosistema d'actors permetrà construir sistemes de IA més justs, representatius i responsables amb el ben comú.

El informe (Obri en nova finestra) que publiquen Open Future i Open Source Initiative fa una telefonada a l'acció a desenvolupadors, legisladors i societat civil per a establir normes compartides i solucions que equilibren la obertura de dades amb la protecció de drets. Amb una governança de dades sòlida, la IA de codi obert podrà complir la seua promesa de servir a l'interés públic.

Font original de la notícia

Intel·ligència Artificial i Blockchain
Informació i dades del sector públic