La intel·ligència artificial (IA) de codi obert és una oportunitat per a democratitzar la innovació i evitar la concentració de poder en la indústria tecnològica. No obstant açò, el seu desenvolupament depèn en gran mesura de la disponibilitat de conjunts de dades d'alta qualitat i de la implementació de marcs sòlids de governança de dades. Un informe recent d'Open Open Future
i l'Open Open Source Initiative
(OSI) analitza els desafiaments i oportunitats en esta intersecció, proposant solucions per a una governança de dades equitativa i responsable. Pots llegir ací l'informe
complet.
En este post, s'analitzen les idees més rellevants del document, així com els consells que oferix per a garantir una correcta i efectiva governança de dades en la intel·ligència artificial open source i aprofitar tots els seus avantatges.
Els reptes de la governança de dades en la IA
A pesar de la gran quantitat de dades disponibles en la web, el seu accés i ús per a entrenar models de IA plantegen importants desafiaments ètics, legals i tècnics. Per exemple:
- Equilibri entre obertura i drets: en línia amb Reglament de Governança de Dades
(DGA), s'ha de garantir un accés ampli a les dades sense comprometre drets de propietat intel·lectual, privacitat i equitat.
- Falta de transparència i estàndards d'obertura: és important que els models etiquetats com a “oberts” complisquen amb criteris clars de transparència en l'ús de dades.
- Biaixos estructurals: molts conjunts de dades reflectixen biaixos lingüístics, geogràfics i socioeconòmics que poden perpetuar desigualtats en els sistemes de IA.
- Sostenibilitat ambiental: el uso intensivo de recursos para entrenar modelos de IA plantea desafíos de sostenibilidad que han d'abordar-se amb pràctiques més eficients
.
- Involucrar a més actors: actualment, els desenvolupadors i les grans corporacions dominen la conversa sobre IA, deixant fora a comunitats afectades i organitzacions públiques.
Una vegada identificats els reptes, l'informe proposa una estratègia per a aconseguir l'objectiu principal: una governança de dades adequada en els models de IA de codi oberts. Este enfocament està basat en dos pilars fonamentals.
Cap a un nou paradigma de governança de dades
En l'actualitat, l'accés i la gestió de les dades per a entrenar models de IA estan marcats per una creixent desigualtat. Mentre algunes grans corporacions tenen accés exclusiu a vasts repositoris de dades, moltes iniciatives de codi obert i comunitats marginades manquen dels recursos per a accedir a dades representatives i de qualitat. Per a abordar este desequilibri és necessari un nou enfocament en la gestió i ús de les dades en la IA de codi obert. L'informe destaca dos canvis fonamentals en la manera en què es concep la governança de dades:
D'una banda, adoptar un enfocament de data commons
que no és més que un model d'accés que garantix el equilibri entre l'obertura de dades i la protecció de drets. Per a açò, seria important utilitzar llicències innovadores que permeten compartir dades sense explotació indeguda. També és rellevant crear estructures de governança que regulen l'accés i ús de dades. I, finalment, implementar mecanismes de compensació per a comunitats les dades de les quals són utilitzats en intel·ligència artificial.
D'altra banda, és necessari transcendir la visió centrada en desenvolupadors de IA i incloure a més actors en la governança de dades, com:
- Propietaris de les dades i comunitats que generen contingut.
- Institucions públiques que poden promoure estàndards d'obertura.
- Organitzacions de la societat civil que vetlen per l'equitat i l'accés responsable a les dades.
En adoptar estos canvis, la comunitat de IA podrà establir un sistema més inclusiu, en el qual els beneficis de l'accés a dades es distribuïsquen de manera equitativa i respectuosa amb els drets de totes les parts interessades. Segons l'informe, la implementació d'estos models no solament augmentarà la quantitat de dades disponibles per a la IA de codi obert, sinó que també fomentarà la creació de ferramentes més justes i sostenibles per a la societat en el seu conjunt.
Consells i estratègia
Per a fer efectiva una governança de dades robusta en la IA de codi obert, l'informe proposa sis àrees d'acció prioritàries:
- Preparació i traçabilitat de dades: millorar la qualitat i documentació dels conjunts de dades.
- Mecanismes de llicenciament i consentiment: permetre als creadors de dades definir el seu ús de manera clara.
- Custòdia de dades: enfortir la figura d'intermediaris que gestionen dades de forma ètica.
- Sostenibilitat ambiental: reduir l'impacte de l'entrenament de IA amb pràctiques eficients.
- Compensació i reciprocitat: garantir que els beneficis de la IA arriben a els qui contribuïxen amb dades.
- Intervencions de política pública: promoure regulacions que incentiven la transparència i l'accés equitatiu a dades.

La intel·ligència artificial de codi obert pot impulsar la innovació i l'equitat, però per a aconseguir-ho és necessari un enfocament de governança de dades més inclusiu i sostenible. Adoptar models de dades comunes i ampliar l'ecosistema d'actors permetrà construir sistemes de IA més justs, representatius i responsables amb el ben comú.
El informe
que publiquen Open Future i Open Source Initiative fa una telefonada a l'acció a desenvolupadors, legisladors i societat civil per a establir normes compartides i solucions que equilibren la obertura de dades amb la protecció de drets. Amb una governança de dades sòlida, la IA de codi obert podrà complir la seua promesa de servir a l'interés públic.
Font original de la notícia
- Intel·ligència Artificial i Blockchain
- Informació i dades del sector públic