accesskey_mod_content

Open data para IA. Recomendaciones de la UNESCO sobre os datos abertos

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

03 outubro 2023

A UNESCO publicou a guía ‘Open data for AI: what now?’, na que recompila consellos e boas prácticas sobre datos abertos e intelixencia artificial.

A UNESCO é un organismo das Nacións Unidas cuxo obxecto é o de contribuír á paz e á seguridade no mundo mediante a educación, a ciencia, a cultura e as comunicacións. Para cumprir co seu obxectivo esta organización adoita establecer guías e recomendacións, como a que publicou o pasado mes de xullo titulado  ‘Open data for AI: what now?’(Abre en nova xanela)  

Tras a pandemia da Covid-19 a UNESCO(Abre en nova xanela) destaca unha serie de leccións aprendidas:  

  • Deben desenvolverse marcos normativos e modelos de gobernación de datos, apoiados por infraestruturas, recursos humanos e capacidades institucionais suficientes para abordar os retos relacionados cos datos abertos, co fin de estar mellor preparados para as pandemias e outros retos mundiais.
  • Es necesario especificar máis a relación entre os datos abertos e a IA, incluíndo que características dos datos abertos son necesarias para que sexan "AI-Ready".
  • Debe establecerse unha política de xestión, colaboración e intercambio de datos para a investigación, así como para as institucións gobernamentais que posúan ou procesen datos relacionados coa saúde, á vez que se debe garantir a privacidade dos datos mediante a(Abre en nova xanela) anonimización.(Abre en nova xanela)
  • Os funcionarios públicos que manexan datos que son ou poden chegar a ser de utilidade para as pandemias poden necesitar formación para recoñecer a importancia dos este datos, así como o imperativo de compartilos.
  • Deben recompilarse e recollerse tantos datos de alta calidade como sexa posible. Os datos teñen que proceder dunha variedade de fontes cribles, que, con todo, tamén deben ser éticas, é dicir, non deben incluír conxuntos de datos con rumbos e contido prexudicial, e teñen que recompilarse unicamente con consentimento e non de forma invasiva para a privacidade. Ademais, as pandemias adoitan ser procesos que evolucionan rapidamente, polo que a actualización continua dos datos é esencial.
  • Estas características dos datos son especialmente obrigatorias para mellorar no futuro as inadecuadas ferramentas de diagnóstico e predición da IA. É necesario realizar un esforzo para converter os datos pertinentes nun formato legible por máquina, o que implica a conservación dos datos recompilados, é dicir, a súa limpeza e etiquetaxe.
  • Debe abrirse unha a mpliagama de datos relacionados coas pandemiasadheríndose aos principios FAIR(Abre en nova xanela) .
  • O público obxectivo dos datos abertos relacionados coa pandemia inclúe a investigación e o mundo académico, os responsables da toma de decisións nos gobernos, o sector privado para o desenvolvemento de produtos relevantes, pero tamén o público, todos os cales deben ser informados os datos dispoñibles
  • As iniciativas de datos abertos relacionadas con pandemias deberían institucionalizarse en lugar de formarse ad hoc, e por tanto deberían porse en marcha para a preparación ante futuras pandemias. Estas iniciativas tamén deberían ser integradoras e reunir a distintos tipos de produtores e usuarios de datos.
  • Así mesmo, debería regularse o uso beneficioso dos datos relacionados con pandemias para as técnicas de aprendizaxe automática de IA co obxectivo de evitar o uso indebido para o desenvolvemento de pandemias artificiais, é dicir, armas biolóxicas, coa axuda de sistemas de IA.

A UNESCO(Abre en nova xanela) baséase nestas leccións aprendidas para establecer unhas Recomendacións sobre a Ciencia Aberta facilitando o intercambio de datos, mellorando a reproducibilidad e a transparencia, promovendo a interoperabilidade dos datos e as normas, apoiando a preservación dos datos e o acceso a longo prazo.

A medida que recoñecemos cada vez máis o papel da Intelixencia Artificial (IA), a dispoñibilidade e o acceso aos datos son máis cruciais que nunca, por iso a UNESCO leva a cabo investigacións no ámbito da IA para proporcionar coñecementos e solucións prácticas que fomenten a transformación dixital e constrúan sociedades do coñecemento inclusivas.

Os datos abertos son o principal obxectivo destas recomendacións, xa que se consideran un requisito previo para a elaboración de plans, a toma de decisións e as intervencións con coñecemento de causa. Por iso, o informe afirma que os Estados membros deben compartir os datos e a información, garantindo a transparencia e a rendición de contas, así como as oportunidades para que calquera poida facer uso dos datos.

A UNESCO ofrece unha guía na que pretende dar a coñecer o valor dos datos abertos e especifican os pasos concretos que os Estados membros poden dar para abrir os seus datos. Son pasos prácticos, pero de alto nivel sobre como abrir datos, baseándose nas directrices existentes. Distínguense tres fases: preparación, apertura dos datos e seguimento para a súa reutilización e sustentabilidade, e preséntanse catro pasos para cada fase. 

É importante sinalar que varios dos pasos poden realizarse simultaneamente, é dicir, non necesariamente de forma consecutiva.

Paso 1: Preparación

Ademais, os gobernos tamén deberían animar aos investigadores e ao sector privado dos seus países a desenvolver políticas de xestión e intercambio de datos que se adhiran aos mesmos principios.

  1. Elaborar unha política de xestión e posta en común de datos: Unha política de xestión e posta en común de datos é un requisito importante previo á apertura dos datos, xa que dita política define o compromiso dos gobernos de compartir os datos. O Instituto de Datos Abertos(Abre en nova xanela) suxire os seguintes elementos dunha política de datos abertos: 
    • Unha definición de datos abertos, unha declaración xeral de principios, un esquema dos tipos de datos e referencias a calquera lexislación, política ou outra orientación pertinente.
    • Anímase aos gobernos a adherirse ao principio "tan aberto como sexa posible, tan pechado como sexa necesario". Se os datos non poden abrirse por motivos legais, de privacidade ou doutro tipo, por exemplo, datos persoais ou sensibles, debe explicarse claramente. 
  1. Reunir e recompilar datos de alta calidade: Os datos existentes deben recompilarse e almacenarse no mesmo repositorio, por exemplo, de varios departamentos gobernamentais onde poden estar almacenados en silos. Os datos deben ser precisos e non estar desfasados. Ademais, os datos deben ser exhaustivos e non deben, por exemplo, descoidar ás minorías ou a economía informal. Os datos sobre as persoas deben desagregarse cando sexa pertinente, mesmo por ingresos, sexo, idade, raza, orixe étnica, situación migratoria, discapacidade e localización xeográfica. 
  1. Desenvolver capacidades de datos abertos:  Estas capacidades diríxense a dous grupos: 
    • Para os funcionarios públicos, inclúe a comprensión dos beneficios dos datos abertos potenciando e propiciando o traballo que comporta a apertura dos datos.
    • Para os usuarios potenciais, inclúe a demostración das oportunidades dos datos abertos, como a súa reutilización, e como tomar decisións informadas.
  1. Preparar os datos para a IA: Se os datos non van ser utilizados unicamente por humanos, senón que tamén poden alimentar sistemas de IA, deben cumprir algúns criterios máis para estar preparados para a IA. 
    • O primeiro paso neste sentido é preparar os datos nun formato legible por máquinas.
    • Algúns formatos favorecen máis que outros a lexibilidade por parte dos sistemas de intelixencia artificial.
    • Os datos tamén deben limparse e etiquetarse, o que a miúdo leva moito tempo e, por tanto, é custoso.
  1. O éxito dun sistema de IA depende da calidade dos datos de adestramento, incluída a súa coherencia e pertinencia. A cantidade necesaria de datos de adestramento é difícil de coñecer de antemán e debe controlarse mediante comprobacións de rendemento. Os datos deben abarcar todos os escenarios para os que se creou o sistema de IA.

Paso 2: Abrir os datos

A apertura dos datos non debe violar as leis nacionais, como as leis de privacidade de datos. 

  1. Seleccionar os conxuntos de datos que se van a abrir: O primeiro paso para abrir os datos é decidir que conxuntos de datos vanse a abrir. Os criterios a favor da apertura son: 
    • Se houbo solicitudes previas de apertura destes datos.
    • Se outros gobernos abriron estes datos e se iso deu lugar a usos beneficiosos dos datos. 

Os datos deben presentarse nun formato que permita a súa localización, accesibilidade, interoperabilidade e reutilización, cumprindo así os principios FAIR.

Ademais, os datos tamén poderían publicarse nun arquivo ou repositorio de datos, que debería ser, segundo a Recomendación da UNESCO, apoiado e mantido por unha institución académica, unha sociedade académica, unha axencia gobernamental ou outra organización sen ánimo de lucro ben establecida e dedicada ao ben común que permita o acceso aberto, a distribución sen restricións, a interoperabilidade e a preservación e o arquivo dixital a longo prazo. 

  1. Abrir os conxuntos de datos legalmente: Antes de abrir os conxuntos de datos, o goberno correspondente ten que especificar exactamente en que condicións, no seu caso, pódense utilizar os datos. Á hora de publicar os datos, os gobernos poderán optar pola licenza que mellor se adapte aos seus obxectivos, como son por exemplo as licenzas Creative Commons(Abre en nova xanela) e Open. Para dar soporte á selección de licenza a comisión europea pon a disposición JLA - Compatibility Checker(Abre en nova xanela) , unha ferramenta que dá apoio para esta decisión
  1. Abrir os conxuntos de datos tecnicamente: A forma máis habitual de abrir os datos é publicalos en formato electrónico para a súa descarga nun sitio web, ademais débese contar con APIs para o consumo destes datos, xa sexa o do propio Goberno ou o dun terceiro.
  1. Crear unha cultura impulsada polos datos abertos: A experiencia demostrou que, ademais da apertura legal e técnica dos datos, hai que lograr polo menos dúas cousas máis para alcanzar unha cultura de datos abertos: 
    • A miúdo os departamentos gobernamentais non están adoitados compartir datos e foi necesario crear unha mentalidade e educarlles nesta finalidade. 
    • Ademais, os datos deben converterse, se é posible, na base exclusiva para a toma de decisións; noutras palabras, as decisións deben estar baseadas nos datos. 
    • Ademais requírense cambios culturais por parte de todo o persoal implicado, fomentando a divulgación proactiva de datos, o que pode asegurar que os datos estean dispoñibles incluso antes de que se soliciten. 

Paso 3: Seguimento da reutilización e a sustentabilidade

Outra actividade importante é a consulta e o compromiso temperáns cos usuarios potenciais, aos que, ademais de informar os datos abertos, débese animar a utilizalos e reutilizalos e a seguir participando.  

  1. Apoiar a participación cidadá: Unha vez abertos os datos, deben ser descubertos polos usuarios potenciais. Para iso hai que desenvolver unha estratexia de promoción, que pode comprender anunciar a apertura dos datos en comunidades de datos abertos e as canles de medios sociais pertinentes. 
  1. Apoiar o compromiso internacional: As asociacións internacionais aumentarían aínda máis os beneficios dos datos abertos, por exemplo, mediante a colaboración sur-sur e norte-sur. Especialmente importantes son as asociacións que apoian e crean capacidades para a reutilización dos datos, xa sexa mediante o uso de IA ou sen ela. 
  2. Apoiar a participación beneficiosa da IA: Os datos abertos ofrecen moitas oportunidades aos sistemas de IA. Para aproveitar todo o potencial dos datos, é necesario potenciar que os desenvolvedores fagan uso deles e desenvolver sistemas de IA en consecuencia.  Ao mesmo tempo, hai que evitar o abuso dos datos abertos para aplicacións de IA irresponsables e prexudiciais. Unha práctica recomendada é manter un rexistro público de que datos utilizaron os sistemas de IA e como o fixeron.
  3. Manter datos de alta calidade: Moitos datos quedan obsoletos rapidamente. Por tanto, os conxuntos de datos deben actualizarse con regularidade. O paso "Manter datos de alta calidade" converte esta directriz nun bucle, xa que enlaza co paso "Reunir e recompilar datos de alta

Conclusións

Estas directrices serven como unha chamada á acción por parte da UNESCO sobre a ética da intelixencia artificial.  Os datos abertos son un requisito previo e necesario para o seguimento e a consecución do desenvolvemento sustentable.(Abre en nova xanela)  

Debido á magnitude das tarefas, os gobernos non só deben adoptar a apertura dos datos, senón tamén crear condicións favorables para unha participación beneficiosa da IA que cre novos coñecementos a partir dos datos abertos, para unha toma de decisións baseada en probas. 

Se os Estados Membros da UNESCO seguen estas directrices e abren os seus datos de maneira sustentable, crean capacidades, así como unha cultura impulsada polos datos abertos, poderemos conseguir un mundo no que os datos non só sexan máis éticos, senón que as aplicacións sobre estes datos sexan máis certeiras e beneficiosas para a humanidade. 

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público