accesskey_mod_content

Cuantificando el valor de los datos

  • Escuchar
  • Copiar
  • Imprimir PDF
  • Compartir

"Noticia disponible únicamente con fines históricos y de hemeroteca. La información y enlaces mostrados se corresponden con los que estaban operativos a la fecha de su publicación. No se garantiza que continúen activos actualmente".

28 septiembre 2022

Ante la recurrente -y siempre en el aire- pregunta sobre cuál es el valor de un conjunto de datos, Datos.gob publica un pequeño análisis que nos acerca un poco más a la respuesta o, al menos, a saber los criterios a los que debemos atender para una correcta evaluación.

¿Cuál es el valor de un conjunto de datos? Esta es una pregunta extremadamente difícil de responder dada no solo la complejidad inherente a los propios datos, que crece además exponencialmente en cuanto comenzamos a combinarlos, sino también a los distintos puntos de vista desde los que se puede abordar la cuestión del valor.

  • Si sabemos que el valor no será inmediato, ¿cómo podemos prever y cuantificar los posibles beneficios en un momento futuro?
  • ¿Podría el valor de los datos llegar a ser negativo en algunos casos, si con ellos podemos causar también algún tipo de ‘daño’?
  • ¿Puede el valor de los datos degradarse a lo largo del tiempo?

Desde este espacio hemos analizado el valor de los datos abiertos para la administración  de forma recurrente desde distintos enfoques: los  datos de alto valor  y su  identificación , la  perspectiva de los proveedores , las  claves del valor de los datos , cómo  generar valor a través de los datos  o cuál es el  valor de los datos en tiempo real . No obstante, el trabajo de análisis e investigación en esta área sigue creciendo imparable. En este sentido, queremos resaltar un trabajo publicado recientemente desde la Universidad de Cambridge. Se trata de un  estudio en el desgranan algunos de los métodos más comunes para la valoración de los datos .

Partiendo de su  análisis previo sobre las características de los datos y su valor asociado , se ha realizado la revisión de los métodos que existen actualmente. Con ello han llegado a la conclusión de dichos métodos pueden dividirse en varias categorías, cuyas características detallamos a continuación.

Métodos basados en análisis de costes

Este enfoque se basa en el principio tradicional estadístico de la “suma de costes”. Para ello se tienen en cuenta los costes de generación, recopilación, almacenamiento y sustitución de los conjuntos de datos, así como los costes para la organización en caso de que los datos den lugar a algún tipo de pérdida. Estos métodos cuentan con la ventaja de que son relativamente fáciles de calcular, pero, por otro lado, cuentan con la dificultad de tener que diferenciar entre los costes directamente atribuibles a los datos y otros costes indirectos relacionados, por ejemplo, con la variedad de labores profesionales involucradas o los distintos elementos de software utilizados.

Un ejemplo de aplicación de este método es  el caso del departamento de estadísticas de Canadá  con su análisis de valoración de los costes asociados a la inversión en datos, bases de datos y ciencia de datos en el país.

Métodos basados en análisis de ingresos

En este caso se utilizan las expectativas de flujos de ingresos, tomando como referencia el mercado potencial existente para la explotación de los datos. Para ello se pueden tener en cuenta, por ejemplo, los cánones por uso, las marcas registradas o las patentes. Las principales limitaciones de estos métodos consisten, generalmente, en que requieren aplicar criterios algo más subjetivos y en la complejidad de estimar ese valor cuando los datos no se explotan directamente sino indirectamente, por ejemplo, mediante analítica.

Estos métodos se utilizan en el  estudio de la OECD sobre las perspectivas del valor de los datos . En él se calculan los ingresos declarados relacionados con la recopilación y venta de datos a través de la encuesta empresarial de los Estados Unidos.

Métodos basados en análisis de mercado

Generalmente estos son los métodos de preferencia que se suelen usar cuando todos los elementos necesarios para hacer los cálculos están disponibles. Sin embargo, hoy en día existe todavía una gran cantidad de datos en las organizaciones de uso exclusivamente interno, lo cual dificulta el uso de estos métodos, al no ser visible su comportamiento al mercado. Además, estos métodos tampoco pueden incorporar totalmente el valor social de los datos.

Un ejemplo de este método es el análisis realizado en el estudio llevado a cabo por la Comisión Económica para América Latina y el Caribe (CEPAL) sobre  los mercados de datos puestos en marcha por la Unión Europea y el Gobierno de Colombia , respectivamente.

Experimentos y encuestas

Esta aproximación al valor de los datos consiste en evaluar el sentimiento de mercado en relación a los datos, preguntando directamente acerca de la disposición a pagar por ciertos datos o a prescindir de ellos. Generalmente se utiliza cuando el valor público de mercado no es conocido o en aquellos casos en el que el valor social tiene un peso importante, como puede ser, por ejemplo, en el área medioambiental. Una limitación de estos métodos es que, cuando los encuestados no son especialistas, puede resultar bastante complicado para ellos evaluar los posibles usos de los datos y, por tanto, su valor completo.

El  estudio realizado por la oficina nacional de estadística del Reino Unido  es un claro ejemplo de estos métodos de valoración.

Métodos basados en el impacto

En este caso la valoración se lleva a cabo a través de experimentos o casos prácticos que analizan el efecto causal sobre determinados resultados atribuibles a los datos. Esta opción es particularmente útil para los responsables de la elaboración de políticas públicas dirigidas por la evidencia, ya que permiten establecer una relación causa-efecto, lo que facilita la comprensión de los beneficios y la elaboración de una narrativa en favor del uso de los datos. No obstante, si los experimentos no están bien diseñados o no se ajustan bien al contexto específico que queremos analizar, corremos el riesgo de obtener una valoración excesivamente subjetiva.

El  framework de evaluación basado en decisiones , propuesto por la Internet of Water Coallition, es un buen ejemplo de cómo aplicar los métodos centrados en el impacto a un caso particular.

Métodos basados en la cadena de actores

Con estos métodos lo que se busca es usar una visión más completa para valorar los datos desde distintos puntos de vista. Esto hace que las evaluaciones puedan ser también más complejas al involucrar distintas definiciones de lo que constituye el valor de los datos. No obstante, también lo convierte en el método más adecuado cuando se quiere evaluar un ecosistema de datos en su conjunto. Además, es un método en alza para las organizaciones que tienen en cuenta la inversión socialmente responsable.

Un ejemplo de cómo se pueden aplicar estos métodos en la práctica en el  caso de estudio llevado a cabo con la entidad gestora de las autopistas en Inglaterra  – Highways England.

Métodos basados en el análisis de opciones reales

La principal ventaja de estos métodos es que pueden aplicarse incluso cuando todavía no están definidos todos los posibles casos de uso para los datos. Su objetivo es conseguir una estimación del valor que tendrían los datos en ciertos posibles escenarios futuros – generalmente a través de la simulación por computación – de forma que si se alcanza ese escenario se podría justificar la explotación de los datos. Así pues, ciertas decisiones e inversiones relacionadas con los datos podrían ser aplazadas hasta que se llegue al escenario ideal que maximice el valor de esos datos, pudiendo minimizar así los costes y riesgos asociados hasta ese momento.

El  caso de estudio sobre el sector del transporte llevado a cabo en Reino Unido  nos ofrece un ejemplo de cómo se podrían aplicar estos métodos usando modelos financieros.

¿Y cuál es el método que tendría que usar en mi caso particular?

Desafortunadamente no existe una regla de oro que nos permita seleccionar un método en concreto. Sin embargo, hay una serie de cuestiones que los autores del estudio sugieren plantearnos a la hora de encontrar el método más adecuado para cada caso:

  • Qué es exactamente lo que estamos valorando: los datos pasan a través de varios estados en su ciclo de vida – desde los datos en crudo a los datos procesados, el análisis o el conocimiento generado. Dependiendo de en qué fase queramos centrar nuestro análisis algunos métodos pueden ser más apropiados que otros.

  • Desde qué punto de vista se lleva a cabo la valoración: el valor puede tener distintas definiciones dependiendo del punto de vista de quién realiza o encarga una valoración. En algunos casos por ejemplo la contención de costes debido a restricciones presupuestarias puede ser lo prioritario, mientras que en otros se podría optar por intentar maximizar el valor social.

  • En qué momento tiene lugar el proceso de evaluación: básicamente habrá que tener en cuenta si la evaluación se llevará a cabo de forma predictiva antes de disponer de todos los elementos evaluados o si se realizará a posteriori, una vez todas las variables sean ya conocidas.

  • Cuál es el propósito de la evaluación: varios de los métodos disponibles omiten o minimizan ciertos aspectos de los datos centrándose en otras características de su proceso de evaluación. Por lo tanto, será necesario conocer con claridad cuáles son las prioridades de nuestra evaluación a la hora de seleccionar el método más adecuado. ¿Es el impacto social lo que nos interesa? ¿La mejora de la productividad? ¿Maximizar la rentabilidad de los datos?

Por tanto, lo primero que deberíamos hacer es un análisis de nuestras necesidades y nuestra propia definición del valor, preguntándonos para ello qué es exactamente lo que queremos evaluar y cuál es la mejor forma de llevar a cabo esa evaluación, para pasar luego a  elaborar nuestro propio marco de valoración  usando los métodos más apropiados de entre la amplia variedad disponible.

Fuente original de la noticia(Abre en nueva ventana)

  • Información y datos del sector público