accesskey_mod_content

Open data per a IA. Recomendaciones de la UNESCO sobre les dades obertes

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

03 octubre 2023

La UNESCO ha publicat la guia ‘Open data for AI: what now?’, en la qual recopila consells i bones pràctiques sobre dades obertes i intel·ligència artificial.

La UNESCO és un organisme de les Nacions Unides l'objecte de les quals és el de contribuir a la pau i a la seguretat en el món mitjançant l'educació, la ciència, la cultura i les comunicacions. Per a complir amb el seu objectiu esta organització sol establir guies i recomanacions, com la qual ha publicat el passat mes de juliol titulat  ‘Open data for AI: what now?’(Obri en nova finestra)  

Després de la pandèmia del Covid-19 la UNESCO(Obri en nova finestra) destaca una sèrie de lliçons apreses:  

  • Han de desenvolupar-se marcs normatius i models de governança de dades, recolzats per infraestructures, recursos humans i capacitats institucionals suficients per a abordar els reptes relacionats amb les dades obertes, amb la finalitat d'estar millor preparats per a les pandèmies i altres reptes mundials.
  • Es necessari especificar més la relació entre les dades obertes i la IA, incloent què característiques de les dades obertes són necessàries perquè siguen "AI-Ready".
  • Ha d'establir-se una política de gestió, col·laboració i intercanvi de dades per a la investigació, així com per a les institucions governamentals que posseïsquen o processen dades relacionades amb la salut, al mateix temps que s'ha de garantir la privacitat de les dades mitjançant la(Obri en nova finestra) anonimització.(Obri en nova finestra)
  • Els funcionaris públics que manegen dades que són o poden arribar a ser d'utilitat per a les pandèmies poden necessitar formació per a reconéixer la importància d'aquestes dades, així com l'imperatiu de compartir-los.
  • Han de recopilar-se i arreplegar-se tantes dades d'alta qualitat com siga possible. Les dades han de procedir d'una varietat de fonts creïbles, que, no obstant açò, també han de ser ètiques, és a dir, no han d'incloure conjunts de dades amb biaixos i contingut perjudicial, i han de recopilar-se únicament amb consentiment i no de forma invasiva per a la privacitat. A més, les pandèmies solen ser processos que evolucionen ràpidament, per la qual cosa l'actualització contínua de les dades és essencial.
  • Estes característiques de les dades són especialment obligatòries per a millorar en el futur les inadequades ferramentes de diagnòstic i predicció de la IA. És necessari realitzar un esforç per a convertir les dades pertinents en un format llegible per màquina, la qual cosa implica la conservació de les dades recopilades, és a dir, la seua neteja i etiquetatge.
  • Ha d'obrir-se una amplia gamma de dades relacionades amb les pandèmiesadherint-se als principis FAIR(Obri en nova finestra) .
  • El públic objectiu de les dades obertes relacionades amb la pandèmia inclou la investigació i el món acadèmic, els responsables de la presa de decisions en els governs, el sector privat per al desenvolupament de productes rellevants, però també el públic, tots els quals han de ser informats sobre les dades disponibles
  • Les iniciatives de dades obertes relacionades amb pandèmies haurien d'institucionalitzar-se en lloc de formar-se ad hoc, i per tant haurien de posar-se en marxa per a la preparació davant futures pandèmies. Estes iniciatives també haurien de ser integradores i reunir a diferents tipus de productors i usuaris de dades.
  • Així mateix, hauria de regular-se l'ús beneficiós de les dades relacionades amb pandèmies per a les tècniques d'aprenentatge automàtic de IA amb l'objectiu d'evitar l'ús indegut per al desenvolupament de pandèmies artificials, és a dir, armes biològiques, amb l'ajuda de sistemes de IA.

La UNESCO(Obri en nova finestra) es basa en estes lliçons apreses per a establir unes Recomanacions sobre la Ciència Oberta facilitant l'intercanvi de dades, millorant la reproducibilidad i la transparència, promovent la interoperabilitat de les dades i les normes, recolzant la preservació de les dades i l'accés a llarg termini.

A mesura que reconeixem cada vegada més el paper de la Intel·ligència Artificial (IA), la disponibilitat i l'accés a les dades són més crucials que mai, per açò la UNESCO duu a terme investigacions en l'àmbit de la IA per a proporcionar coneixements i solucions pràctiques que fomenten la transformació digital i construïsquen societats del coneixement inclusives.

Les dades obertes són el principal objectiu d'estes recomanacions, ja que es consideren un requisit previ per a l'elaboració de plans, la presa de decisions i les intervencions amb coneixement de causa. Per açò, l'informe afirma que els Estats membres han de compartir les dades i la informació, garantint la transparència i la rendició de comptes, així com les oportunitats perquè qualsevol puga fer ús de les dades.

La UNESCO oferix una guia en la qual pretén donar a conéixer el valor de les dades obertes i especifiquen els passos concrets que els Estats membres poden donar per a obrir les seues dades. Són passos pràctics, però d'alt nivell sobre com obrir dades, basant-se en les directrius existents. Es distingixen tres fases: preparació, obertura de les dades i seguiment per a la seua reutilització i sostenibilitat, i es presenten quatre passos per a cada fase. 

És important assenyalar que diversos dels passos poden realitzar-se simultàniament, és a dir, no necessàriament de forma consecutiva.

Pas 1: Preparació

A més, els governs també haurien d'animar als investigadors i al sector privat dels seus països a desenvolupar polítiques de gestió i intercanvi de dades que s'adherisquen als mateixos principis.

  1. Elaborar una política de gestió i posada en comú de dades: Una política de gestió i posada en comú de dades és un requisit important previ a l'obertura de les dades, ja que aquesta política definix el compromís dels governs de compartir les dades. L'Institut Institut de Dades Obertes(Obri en nova finestra) suggerix els següents elements d'una política de dades obertes: 
    • Una definició de dades obertes, una declaració general de principis, un esquema dels tipus de dades i referències a qualsevol legislació, política o una altra orientació pertinent.
    • S'anima als governs a adherir-se al principi "tan obert com siga possible, tan tancat com siga necessari". Si les dades no poden obrir-se per motius legals, de privacitat o d'un altre tipus, per exemple, dades personals o sensibles, ha d'explicar-se clarament. 
  1. Reunir i recopilar dades d'alta qualitat: Les dades existents han de recopilar-se i emmagatzemar-se en el mateix repositori, per exemple, de diversos departaments governamentals on poden haver estat emmagatzemats en sitges. Les dades han de ser precisos i no estar desfasats. A més, les dades han de ser exhaustius i no han de, per exemple, descurar a les minories o l'economia informal. Les dades sobre les persones han de desglossar-se quan siga pertinent, fins i tot per ingressos, sexe, edat, raça, origen ètnic, situació migratòria, discapacitat i ubicació geogràfica. 
  1. Desenvolupar capacitats de dades obertes:  Estes capacitats es dirigixen a dos grups: 
    • Per als funcionaris públics, inclou la comprensió dels beneficis de les dades obertes potenciant i propiciant el treball que comporta l'obertura de les dades.
    • Per als usuaris potencials, inclou la demostració de les oportunitats de les dades obertes, com la seua reutilització, i com prendre decisions informades.
  1. Preparar les dades per a la IA: Si les dades no van a ser utilitzats únicament per humans, sinó que també poden alimentar sistemes de IA, han de complir alguns criteris més per a estar preparats per a la IA. 
    • El primer pas en este sentit és preparar les dades en un format llegible per màquines.
    • Alguns formats afavorixen més que uns altres la llegibilitat per part dels sistemes d'intel·ligència artificial.
    • Les dades també han de netejar-se i etiquetar-se, la qual cosa sovint porta molt temps i, per tant, és costós.
  1. L'èxit d'un sistema de IA depèn de la qualitat de les dades d'entrenament, inclosa la seua coherència i pertinència. La quantitat necessària de dades d'entrenament és difícil de conéixer per endavant i ha de controlar-se mitjançant comprovacions de rendiment. Les dades han d'abastar tots els escenaris per als quals s'ha creat el sistema de IA.

Pas 2: Obrir les dades

L'obertura de les dades no ha de violar les lleis nacionals, com les lleis de privacitat de dades. 

  1. Seleccionar els conjunts de dades que es van a obrir: El primer pas per a obrir les dades és decidir què conjunts de dades es van a obrir. Els criteris a favor de l'obertura són: 
    • Si hi ha hagut sol·licituds prèvies d'obertura d'estes dades.
    • Si altres governs han obert estes dades i si açò ha donat lloc a usos beneficiosos de les dades. 

Les dades han de presentar-se en un format que permeta la seua localització, accessibilitat, interoperabilitat i reutilització, complint així els principis FAIR.

A més, les dades també podrien publicar-se en un arxiu o repositori de dades, que hauria de ser, segons la Recomanació de la UNESCO, recolzat i mantingut per una institució acadèmica, una societat acadèmica, una agència governamental o una altra organització sense ànim de lucre ben establida i dedicada al ben comú que permeta l'accés obert, la distribució sense restriccions, la interoperabilitat i la preservació i l'arxiu digital a llarg termini. 

  1. Obrir els conjunts de dades legalment: Abans d'obrir els conjunts de dades, el govern corresponent ha d'especificar exactament en quines condicions, si escau, es poden utilitzar les dades. A l'hora de publicar les dades, els governs podran optar per la llicència que millor s'adapte als seus objectius, com són per exemple les llicències Creative Commons(Obri en nova finestra) i Open. Per a donar suport a la selecció de llicència la comissió europea posa a JLA - Compatibility Checker(Obri en nova finestra) , una ferramenta que dona suport per a esta decisió
  1. Obrir els conjunts de dades tècnicament: La forma més habitual d'obrir les dades és publicar-los en format electrònic per a la seua descàrrega en un lloc web, a més s'ha de comptar amb APIs per al consum d'estes dades, ja siga el del propi Govern o el d'un tercer.
  1. Crear una cultura impulsada per les dades obertes: L'experiència ha demostrat que, a més de l'obertura legal i tècnica de les dades, cal aconseguir almenys dos coses més per a aconseguir una cultura de dades obertes: 
    • Sovint els departaments governamentals no estan acostumats a compartir dades i ha sigut necessari crear una mentalitat i educar-los en esta finalitat. 
    • A més, les dades han de convertir-se, si és possible, en la base exclusiva per a la presa de decisions; en altres paraules, les decisions han d'estar basades en les dades. 
    • A més es requerixen canvis culturals per part de tot el personal implicat, fomentant la divulgació proactiva de dades, la qual cosa pot assegurar que les dades estiguen disponibles fins i tot abans que se sol·liciten. 

Pas 3: Seguiment de la reutilització i la sostenibilitat

Una altra activitat important és la consulta i el compromís primerencs amb els usuaris potencials, als quals, a més d'informar sobre les dades obertes, s'ha d'animar a utilitzar-los i reutilitzar-los i a seguir participant.  

  1. Recolzar la participació ciutadana: Una vegada oberts les dades, han de ser descoberts pels usuaris potencials. Per a açò cal desenvolupar una estratègia de promoció, que pot comprendre anunciar l'obertura de les dades en comunitats de dades obertes i els canals de mitjans socials pertinents. 
  1. Recolzar el compromís internacional: Les associacions internacionals augmentarien encara més els beneficis de les dades obertes, per exemple, mitjançant la col·laboració sud-sud i nord-sud. Especialment importants són les associacions que recolzen i creen capacitats per a la reutilització de les dades, ja siga mitjançant l'ús de IA o sense ella. 
  2. Recolzar la participació beneficiosa de la IA: Les dades obertes oferixen moltes oportunitats als sistemes de IA. Per a aprofitar tot el potencial de les dades, és necessari potenciar que els desenvolupadors facen ús d'ells i desenvolupen sistemes de IA en conseqüència.  Al mateix temps, cal evitar l'abús de les dades obertes per a aplicacions de IA irresponsables i perjudicials. Una pràctica recomanada és mantindre un registre públic de quines dades han utilitzat els sistemes de IA i com ho han fet.
  3. Mantindre dades d'alta qualitat: Moltes dades queden obsolets ràpidament. Per tant, els conjunts de dades han d'actualitzar-se amb regularitat. El pas "Mantindre dades d'alta qualitat" convertix esta directriu en un bucle, ja que enllaça amb el pas "Reunir i recopilar dades d'alta

Conclusions

Estes directrius servixen com una telefonada a l'acció per part de la UNESCO sobre l'ètica de la intel·ligència artificial.  Les dades obertes són un requisit previ i necessari per a el seguiment i la consecució del desenvolupament sostenible.(Obri en nova finestra)  

A causa de la magnitud de les tasques, els governs no solament han d'adoptar l'obertura de les dades, sinó també crear condicions favorables per a una participació beneficiosa de la IA que creu nous coneixements a partir de les dades obertes, per a una presa de decisions basada en proves. 

Si els Estats Membres de la UNESCO seguixen estes directrius i obrin les seues dades de manera sostenible, creen capacitats, així com una cultura impulsada per les dades obertes, podrem aconseguir un món en el qual les dades no solament siguen més ètics, sinó que les aplicacions sobre estes dades siguen més precises i beneficioses per a la humanitat. 

Font original de la notícia(Obri en nova finestra)

  • Informació i dades del sector públic