accesskey_mod_content

Open data per IA. Recomanacions de la UNESCO sobre les dades obertes

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

03 octubre 2023

La UNESCO ha publicat la guia ‘Open data for AI: what now?’, en la qual recopila consells i bones pràctiques sobre dades obertes i intel·ligència artificial.

La UNESCO és un organisme de les Nacions Unides l'objecte de les quals és el de contribuir a la pau i a la seguretat al món mitjançant l'educació, la ciència, la cultura i les comunicacions. Per complir amb el seu objectiu aquesta organització sol establir guies i recomanacions, com la qual ha publicat el passat mes de juliol titulat  ‘Open data for AI: what now?’(Obre en nova finestra)  

Després de la pandèmia del Covid-19 la UNESCO(Obre en nova finestra) destaca una sèrie de lliçons apreses:  

  • Han de desenvolupar-se marcs normatius i models de governança de dades, recolzats per infraestructures, recursos humans i capacitats institucionals suficients per abordar els reptes relacionats amb les dades obertes, amb la finalitat d'estar millor preparats per a les pandèmies i altres reptes mundials.
  • És necessari especificar més la relació entre les dades obertes i la IA, incloent què característiques de les dades obertes són necessàries perquè siguin "AI-Ready".
  • Ha d'establir-se una política de gestió, col·laboració i intercanvi de dades per a la recerca, així com per a les institucions governamentals que posseeixin o processin dades relacionades amb la salut, al mateix temps que s'ha de garantir la privadesa de les dades mitjançant la(Obre en nova finestra) anonimització.(Obre en nova finestra)
  • Els funcionaris públics que manegen dades que són o poden arribar a ser d'utilitat per a les pandèmies poden necessitar formació per reconèixer la importància d'aquestes dades, així com l'imperatiu de compartir-los.
  • Han de recopilar-se i recollir-se tantes dades d'alta qualitat com sigui possible. Les dades han de procedir d'una varietat de fonts creïbles, que, no obstant això, també han de ser ètiques, és a dir, no han d'incloure conjunts de dades amb biaixos i contingut perjudicial, i han de recopilar-se únicament amb consentiment i no de forma invasiva per a la privadesa. A més, les pandèmies solen ser processos que evolucionen ràpidament, per la qual cosa l'actualització contínua de les dades és essencial.
  • Aquestes característiques de les dades són especialment obligatòries per millorar en el futur les inadequades eines de diagnòstic i predicció de la IA. És necessari realitzar un esforç per convertir les dades pertinents en un format llegible per màquina, la qual cosa implica la conservació de les dades recopilades, és a dir, la seva neteja i etiquetatge.
  • Ha d'obrir-se una amplia gamma de dades relacionades amb les pandèmiesadherint-se als principis FAIR(Obre en nova finestra) .
  • El públic objectiu de les dades obertes relacionades amb la pandèmia inclou la recerca i el món acadèmic, els responsables de la presa de decisions als governs, el sector privat per al desenvolupament de productes rellevants, però també el públic, tots els quals han de ser informats sobre les dades disponibles
  • Les iniciatives de dades obertes relacionades amb pandèmies haurien d'institucionalitzar-se en lloc de formar-se ad hoc, i per tant haurien d'engegar-se per a la preparació davant futures pandèmies. Aquestes iniciatives també haurien de ser integradores i reunir a diferents tipus de productors i usuaris de dades.
  • Així mateix, hauria de regular-se l'ús beneficiós de les dades relacionades amb pandèmies per a les tècniques d'aprenentatge automàtic de IA amb l'objectiu d'evitar l'ús indegut per al desenvolupament de pandèmies artificials, és a dir, armes biològiques, amb l'ajuda de sistemes de IA.

La UNESCO(Obre en nova finestra) es basa en aquestes lliçons apreses per establir unes Recomanacions sobre la Ciència Oberta facilitant l'intercanvi de dades, millorant la reproducibilidad i la transparència, promovent la interoperabilitat de les dades i les normes, recolzant la preservació de les dades i l'accés a llarg termini.

A mesura que reconeixem cada vegada més el paper de la Intel·ligència Artificial (IA), la disponibilitat i l'accés a les dades són més crucials que mai, per això la UNESCO duu a terme recerques en l'àmbit de la IA per proporcionar coneixements i solucions pràctiques que fomentin la transformació digital i construeixin societats del coneixement inclusives.

Les dades obertes són el principal objectiu d'aquestes recomanacions, ja que es consideren un requisit previ per a l'elaboració de plans, la presa de decisions i les intervencions amb coneixement de causa. Per això, l'informe afirma que els Estats membres han de compartir les dades i la informació, garantint la transparència i la rendició de comptes, així com les oportunitats perquè qualsevol pugui fer ús de les dades.

La UNESCO ofereix una guia en la qual pretén donar a conèixer el valor de les dades obertes i especifiquen els passos concrets que els Estats membres poden donar per obrir les seves dades. Són passos pràctics, però d'alt nivell sobre com obrir dades, basant-se en les directrius existents. Es distingeixen tres fases: preparació, obertura de les dades i seguiment per a la seva reutilització i sostenibilitat, i es presenten quatre passos per a cada fase. 

És important assenyalar que diversos dels passos poden realitzar-se simultàniament, és a dir, no necessàriament de forma consecutiva.

Pas 1: Preparació

A més, els governs també haurien d'animar als investigadors i al sector privat dels seus països a desenvolupar polítiques de gestió i intercanvi de dades que s'adhereixin als mateixos principis.

  1. Elaborar una política de gestió i posada en comú de dades: Una política de gestió i posada en comú de dades és un requisit important previ a l'obertura de les dades, ja que aquesta política defineix el compromís dels governs de compartir les dades. L'Institut Institut de Dades Obertes(Obre en nova finestra) suggereix els següents elements d'una política de dades obertes: 
    • Una definició de dades obertes, una declaració general de principis, un esquema dels tipus de dades i referències a qualsevol legislació, política o una altra orientació pertinent.
    • S'anima als governs a adherir-se al principi "tan obert com sigui possible, tan tancat com sigui necessari". Si les dades no poden obrir-se per motius legals, de privadesa o d'un altre tipus, per exemple, dades personals o sensibles, ha d'explicar-se clarament. 
  1. Reunir i recopilar dades d'alta qualitat: Les dades existents han de recopilar-se i emmagatzemar-se en el mateix repositori, per exemple, de diversos departaments governamentals on poden haver estat emmagatzemats en sitges. Les dades han de ser precisos i no estar desfasats. A més, les dades han de ser exhaustius i no han de, per exemple, descurar a les minories o l'economia informal. Les dades sobre les persones han de desglossar-se quan sigui pertinent, fins i tot per ingressos, sexe, edat, raça, origen ètnic, situació migratòria, discapacitat i ubicació geogràfica. 
  1. Desenvolupar capacitats de dades obertes:  Aquestes capacitats es dirigeixen a dos grups: 
    • Per als funcionaris públics, inclou la comprensió dels beneficis de les dades obertes potenciant i propiciant el treball que comporta l'obertura de les dades.
    • Per als usuaris potencials, inclou la demostració de les oportunitats de les dades obertes, com la seva reutilització, i com prendre decisions informades.
  1. Preparar les dades per la IA: Si les dades no van a ser utilitzats únicament per humans, sinó que també poden alimentar sistemes de IA, han de complir alguns criteris més per estar preparats per la IA. 
    • El primer pas en aquest sentit és preparar les dades en un format llegible per màquines.
    • Alguns formats afavoreixen més que uns altres la llegibilitat per part dels sistemes d'intel·ligència artificial.
    • Les dades també han de netejar-se i etiquetar-se, la qual cosa sovint porta molt temps i, per tant, és costós.
  1. L'èxit d'un sistema de IA depèn de la qualitat de les dades d'entrenament, inclosa la seva coherència i pertinència. La quantitat necessària de dades d'entrenament és difícil de conèixer per endavant i ha de controlar-se mitjançant comprovacions de rendiment. Les dades han d'abastar tots els escenaris pels quals s'ha creat el sistema de IA.

Pas 2: Obrir les dades

L'obertura de les dades no ha de violar les lleis nacionals, com les lleis de privadesa de dades. 

  1. Seleccionar els conjunts de dades que es van a obrir: El primer pas per obrir les dades és decidir què conjunts de dades es van a obrir. Els criteris a favor de l'obertura són: 
    • Si hi ha hagut sol·licituds prèvies d'obertura d'aquestes dades.
    • Si altres governs han obert aquestes dades i si això ha donat lloc a usos beneficiosos de les dades. 

Les dades han de presentar-se en un format que permeti la seva localització, accessibilitat, interoperabilitat i reutilització, complint així els principis FAIR.

A més, les dades també podrien publicar-se en un arxiu o repositori de dades, que hauria de ser, segons la Recomanació de la UNESCO, recolzat i mantingut per una institució acadèmica, una societat acadèmica, una agència governamental o una altra organització sense ànim de lucre ben establerta i dedicada al ben comú que permeti l'accés obert, la distribució sense restriccions, la interoperabilitat i la preservació i l'arxiu digital a llarg termini. 

  1. Obrir els conjunts de dades legalment: Abans d'obrir els conjunts de dades, el govern corresponent ha d'especificar exactament en quines condicions, si escau, es poden utilitzar les dades. A l'hora de publicar les dades, els governs podran optar per la llicència que millor s'adapti als seus objectius, com són per exemple les llicències Creative Commons(Obre en nova finestra) i Open. Per donar suport a la selecció de llicència la comissió europea posa a JLA - Compatibility Checker(Obre en nova finestra) , una eina que dona suport per a aquesta decisió
  1. Obrir els conjunts de dades tècnicament: La forma més habitual d'obrir les dades és publicar-los en format electrònic per a la seva descàrrega en un lloc web, a més s'ha de comptar amb APIs per al consum d'aquestes dades, ja sigui el del propi Govern o el d'un tercer.
  1. Crear una cultura impulsada per les dades obertes: L'experiència ha demostrat que, a més de l'obertura legal i tècnica de les dades, cal aconseguir almenys dues coses més per aconseguir una cultura de dades obertes: 
    • Sovint els departaments governamentals no estan acostumats a compartir dades i ha estat necessari crear una mentalitat i educar-los en aquesta finalitat. 
    • A més, les dades han de convertir-se, si és possible, a la base exclusiva per a la presa de decisions; en altres paraules, les decisions han d'estar basades en les dades. 
    • A més es requereixen canvis culturals per part de tot el personal implicat, fomentant la divulgació proactiva de dades, la qual cosa pot assegurar que les dades estiguin disponibles fins i tot abans que se sol·licitin. 

Pas 3: Seguiment de la reutilització i la sostenibilitat

Una altra activitat important és la consulta i el compromís primerencs amb els usuaris potencials, als quals, a més d'informar sobre les dades obertes, s'ha d'animar a utilitzar-los i reutilitzar-los i a seguir participant.  

  1. Recolzar la participació ciutadana: Una vegada oberts les dades, han de ser descoberts pels usuaris potencials. Per a això cal desenvolupar una estratègia de promoció, que pot comprendre anunciar l'obertura de les dades en comunitats de dades obertes i els canals de mitjans socials pertinents. 
  1. Recolzar el compromís internacional: Les associacions internacionals augmentarien encara més els beneficis de les dades obertes, per exemple, mitjançant la col·laboració sud-sud i nord-sud. Especialment importants són les associacions que recolzen i creen capacitats per a la reutilització de les dades, ja sigui mitjançant l'ús de IA o sense ella. 
  2. Recolzar la participació beneficiosa de la IA: Les dades obertes ofereixen moltes oportunitats als sistemes de IA. Per aprofitar tot el potencial de les dades, és necessari potenciar que els desenvolupadors facin ús d'ells i desenvolupin sistemes de IA en conseqüència.  Al mateix temps, cal evitar l'abús de les dades obertes per a aplicacions de IA irresponsables i perjudicials. Una pràctica recomanada és mantenir un registre públic de quines dades han utilitzat els sistemes de IA i com ho han fet.
  3. Mantenir dades d'alta qualitat: Moltes dades queden obsolets ràpidament. Per tant, els conjunts de dades han d'actualitzar-se amb regularitat. El pas "Mantenir dades d'alta qualitat" converteix aquesta directriu en un bucle, ja que enllaça amb el pas "Reunir i recopilar dades d'alta

Conclusions

Aquestes directrius serveixen com una trucada a l'acció per part de la UNESCO sobre l'ètica de la intel·ligència artificial.  Les dades obertes són un requisit previ i necessari per a el seguiment i la consecució del desenvolupament sostenible.(Obre en nova finestra)  

A causa de la magnitud de les tasques, els governs no només han d'adoptar l'obertura de les dades, sinó també crear condicions favorables per a una participació beneficiosa de la IA que creu nous coneixements a partir de les dades obertes, per a una presa de decisions basada en proves. 

Si els Estats Membres de la UNESCO segueixen aquestes directrius i obren les seves dades de manera sostenible, creen capacitats, així com una cultura impulsada per les dades obertes, podrem aconseguir un món en el qual les dades no només siguin més ètics, sinó que les aplicacions sobre aquestes dades siguin més precises i beneficioses per a la humanitat. 

Font original de la notícia(Obre en nova finestra)

  • Informació i dades del sector públic