accesskey_mod_content

Quantificant el valor de les dades

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

"Notícia disponible únicament amb finalitats històriques i d'hemeroteca. La informació i enllaços mostrats es corresponen amb els quals estaven operatius a la data de la seua publicació. No es garantix que continuen actius actualment".

28 setembre 2022

Davant la recurrent -i sempre en l'aire- pregunta sobre quin és el valor d'un conjunt de dades, Datos.gob publica una petit anàlisi que ens acosta una mica més a la resposta o, almenys, a saber els criteris als quals hem d'atendre per a una correcta avaluació.

Quin és el valor d'un conjunt de dades? Esta és una pregunta extremadament difícil de respondre donada no solament la complexitat inherent a les pròpies dades, que creix a més exponencialment quan comencem a combinar-los, sinó també als diferents punts de vista des dels quals es pot abordar la qüestió del valor.

  • Si sabem que el valor no serà immediat, com podem preveure i quantificar els possibles beneficis en un moment futur?
  • Podria el valor de les dades arribar a ser negatiu en alguns casos, si amb ells podem causar també algun tipus de ‘dany’?
  • Pot el valor de les dades degradar-se al llarg del temps?

Des d'este espai hem analitzat el valor de les dades obertes per a l'administració  de forma recurrent des de diferents enfocaments: les  dades d'alt valor  i la seua  identificació , la  perspectiva dels proveïdors , les  claus del valor de les dades , com  generar valor a través de les dades  o quin és el  valor de les dades en temps real . No obstant açò, el treball d'anàlisi i investigació en esta àrea seguix creixent imparable. En este sentit, volem ressaltar un treball publicat recentment des de la Universitat de Cambridge. Es tracta d'un  estudie en el desgranen alguns dels mètodes més comuns per a la valoració de les dades .

Partint de la seua  anàlisi prèvia sobre les característiques de les dades i el seu valor associat , s'ha realitzat la revisió dels mètodes que existixen actualment. Amb açò han arribat a la conclusió d'aquests mètodes poden dividir-se en diverses categories, que les seues característiques detallem a continuació.

Métodos basats en anàlisi de costos

Este enfocament es basa en el principi tradicional estadístic de la “suma de costos”. Per a açò es tenen en compte els costos de generació, recopilació, emmagatzematge i substitució dels conjunts de dades, així com els costos per a l'organització en cas que les dades donen lloc a algun tipus de pèrdua. Estos mètodes compten amb l'avantatge que són relativament fàcils de calcular, però, d'altra banda, compten amb la dificultat d'haver de diferenciar entre els costos directament atribuïbles a les dades i altres costos indirectes relacionats, per exemple, amb la varietat de labors professionals involucrades o els diferents elements de programari utilitzats.

Un exemple d'aplicació d'este mètode és  el cas del departament d'estadístiques de Canadà  amb la seua anàlisi de valoració dels costos associats a la inversió en dades, bases de dades i ciència de dades en el país.

Métodos basats en anàlisi d'ingressos

En este cas s'utilitzen les expectatives de fluxos d'ingressos, prenent com a referència el mercat potencial existent per a l'explotació de les dades. Per a açò es poden tindre en compte, per exemple, els cànons per ús, les marques registrades o les patents. Les principals limitacions d'estos mètodes consistixen, generalment, en què requerixen aplicar criteris un poc més subjectius i en la complexitat d'estimar eixe valor quan les dades no s'exploten directament sinó indirectament, per exemple, mitjançant analítica.

Estos mètodes s'utilitzen en el  estudie de l'OECD sobre les perspectives del valor de les dades . En él se calculan los ingresos declarados relacionados con la recopilación y venta de datos a través de la encuesta empresarial de los Estados Unidos.

Métodos basats en anàlisi de mercat

Generalmente estos son los métodos de preferencia que se suelen usar cuando todos los elementos necesarios para hacer los cálculos están disponibles. Sin embargo, hoy en día existe todavía una gran cantidad de datos en las organizaciones de uso exclusivamente interno, lo cual dificulta el uso de estos métodos, al no ser visible su comportamiento al mercado. Además, estos métodos tampoco pueden incorporar totalmente el valor social de los datos.

Un ejemplo de este método es el análisis realizado en el estudio llevado a cabo por la Comisión Económica para América Latina y el Caribe (CEPAL) sobre  els mercats de dades posades en marxa per la Unió Europea i el Govern de Colòmbia , respectivament.

Experimentos i enquestes

Esta aproximació al valor de les dades consistix a avaluar el sentiment de mercat en relació a les dades, preguntant directament sobre la disposició a pagar per certes dades o a prescindir d'ells. Generalment s'utilitza quan el valor públic de mercat no és conegut o en aquells casos en el qual el valor social té un pes important, com pot ser, per exemple, en l'àrea mediambiental. Una limitació d'estos mètodes és que, quan els enquestats no són especialistes, pot resultar bastant complicat per a ells avaluar els possibles usos de les dades i, per tant, el seu valor complet.

El  estudi realitzat per l'oficina nacional d'estadística del Regne Unit  és un clar exemple d'estos mètodes de valoració.

Métodos basats en l'impacte

En este cas la valoració es duu a terme a través de experiments o casos pràctics que analitzen el efecte causal sobre determinats resultats atribuïbles a les dades. Esta opció és particularment útil per als responsables de l'elaboració de polítiques públiques dirigides per l'evidència, ja que permeten establir una relació causa-efecte, la qual cosa facilita la comprensió dels beneficis i l'elaboració d'una narrativa en favor de l'ús de les dades. No obstant açò, si els experiments no estan ben dissenyats o no s'ajusten bé al context específic que volem analitzar, correm el risc d'obtindre una valoració excessivament subjectiva.

El  framework d'avaluació basat en decisions , proposat per la Internet of Water Coallition, és un bon exemple de com aplicar els mètodes centrats en l'impacte a un cas particular.

Métodos basats en la cadena d'actors

Amb estos mètodes el que es busca és usar una visió més completa per a valorar les dades des de diferents punts de vista. Açò fa que les avaluacions puguen ser també més complexes en involucrar diferents definicions del que constituïx el valor de les dades. No obstant açò, també ho convertix en el mètode més adequat quan es vol avaluar un ecosistema de dades en el seu conjunt. A més, és un mètode en alça per a les organitzacions que tenen en compte la inversió socialment responsable.

Un exemple de com es poden aplicar estos mètodes en la pràctica en el  case d'estudi dut a terme amb l'entitat gestora de les autopistes a Anglaterra  – Highways England.

Métodos basats en l'anàlisi d'opcions reals

El principal avantatge d'estos mètodes és que poden aplicar-se fins i tot quan encara no estan definits tots els possibles casos d'ús per a les dades. El seu objectiu és aconseguir una estimació del valor que tindrien les dades en certs possibles escenaris futurs – generalment a través de la simulació per computació – de manera que si s'aconseguix eixe escenari es podria justificar l'explotació de les dades. Així doncs, certes decisions i inversions relacionades amb les dades podrien ser ajornades fins que s'arribe a l'escenari ideal que maximitze el valor d'eixes dades, podent minimitzar així els costos i riscos associats fins a eixe moment.

El  cas d'estudi sobre el sector del transport dut a terme en Regne Unit  ens oferix un exemple de com es podrien aplicar estos mètodes usant models financers.

I quin és el mètode que hauria d'usar en el meu cas particular?

Desafortunadament no existix una regla d'or que ens permeta seleccionar un mètode en concret. No obstant açò, hi ha una sèrie de qüestions que els autors de l'estudi suggerixen plantejar-nos a l'hora de trobar el mètode més adequat per a cada cas:

  • Què és exactament el que estem valorant: les dades passen a través de diversos estats en el seu cicle de vida – des de les dades en cru a les dades processades, l'anàlisi o el coneixement generat. Depenent d'en quina fase vulguem centrar la nostra anàlisi alguns mètodes poden ser més apropiats que uns altres.

  • Des de quin punt de vista es duu a terme la valoració: el valor pot tindre diferents definicions depenent del punt de vista de qui realitza o encarrega una valoració. En alguns casos per exemple la contenció de costos a causa de restriccions pressupostàries pot ser el prioritari, mentre que en uns altres es podria optar per intentar maximitzar el valor social.

  • En quin moment té lloc el procés d'avaluació: bàsicament caldrà tindre en compte si l'avaluació es durà a terme de forma predictiva abans de disposar de tots els elements avaluats o si es realitzarà a posteriori, una vegada totes les variables siguen ja conegudes.

  • Quin és el propòsit de l'avaluació: diversos dels mètodes disponibles ometen o minimitzen certs aspectes de les dades centrant-se en altres característiques del seu procés d'avaluació. Per tant, serà necessari conéixer amb claredat quins són les prioritats de la nostra avaluació a l'hora de seleccionar el mètode més adequat. És l'impacte social el que ens interessa? La millora de la productivitat? Maximitzar la rendibilitat de les dades?

Per tant, el primer que hauríem de fer és una anàlisi de les nostres necessitats i la nostra pròpia definició del valor, preguntant-nos para açò què és exactament el que volem avaluar i quin és la millor forma de dur a terme eixa avaluació, per a passar després a  elaborar el nostre propi marc de valoració  usant els mètodes més apropiats d'entre l'àmplia varietat disponible.

Font original de la notícia(Obri en nova finestra)

  • Informació i dades del sector públic