accesskey_mod_content

Aplicació de l'Especificació UNEIX 0081:2023 per a l'avaluació de qualitat de dades

  • Escoltar
  • Imprimir PDF
  • Compartir

01 desembre 2023

La nueva especificación UNE 0081 Evaluación de Calidad de Datos, centrada en los datos como producto, complementa la especificación UNE 0079 Gestión de la calidad del dato.

La nova especificació  UNEIX 0081 Avaluació de Qualitat de Dades , centrada en los datos como producto (conjuntos de datos o bases de datos), complementa la especificación  UNEIX 0079 Gestió de la qualitat de la dada , que (analitzada per Dades.gob prèviament en  aquest article ), se focaliza en los procesos de gestión de la calidad del dato. Ambas normas, la 0079 y la 0081 se complementan y abordan de forma holística la calidad de los datos:

  • La norma UNEIX 0079 refereix els processos, les activitats que haver de realitzar l'organització per garantir els nivells adequats de qualitat de les seves dades per satisfer l'estratègia que l'organització s'han marcat.

  • D'altra banda, la UNEIX 0081 defineix un model de qualitat de la dada, basat en les normes  ISO/IEC 25012  i  ISO/IEC 25024 , en el qual es detallen les característiques de qualitat que poden tenir les dades, així com algunes mètriques aplicables. També defineix el procés que s'ha de seguir per avaluar la qualitat d'un conjunt de dades concret, prenent com a base la norma  ISO/IEC 25040 . Finalment, l'especificació acaba detallant com interpretar els resultats obtinguts de l'avaluació, mostrant exemples concrets d'aplicació.

Com pugues una organització fer ús d'aquesta especificació per avaluar el nivell de qualitat de les seves dades?

Para donar resposta a aquesta pregunta, anem a explicar l'exemple de l'Ajuntament de Vistabella, prèviament  utilitzat en articles anteriors . El ayuntamiento tiene una serie de conjuntos de datos, cuya calidad quiere evaluar, para poder mejorarlos y dar un mejor servicio a la ciudadanía. La institución es consciente de que trabaja con muchos tipos de datos (transaccionales, maestros, de referencia, etc.), por lo tanto, lo primero que realiza es una primera identificación de los conjuntos de datos que aportan valor y para los cuales, no disponer de niveles adecuados de calidad, puede repercutir en el día a día. Algunos criterios a la seguir a la hora de seleccionar estos conjuntos pueden ser: datos que aportan un valor al ciudadano, datos resultantes de un proceso de integración o visión maestra del dato, datos críticos por ser utilizados en varios procesos/procedimientos, etc.

El següent pas serà determinar en quin punt(s) del cicle de vida dels processos operatius de l'ajuntament es realitzaran aquests controls de qualitat de la dada.

És en aquest punt on l'especificació UNEIX 0081 entra en joc. L'avaluació es fa en funció de les "regles de negoci" que defineixen els requeriments, requisits de dades o validacions que han de complir les dades perquè aportin valor a l'organització. A continuació, es mostren alguns exemples:

  • Els DNI dels ciutadans hauran de complir amb la sintaxi específica per a això (8 nombres i una lletra).
  • Tota data existent en el sistema haurà de seguir la notació DD-MM-AAAA.
  • No s'admetran registres de documentació amb data posterior a l'actual.
  • S'haurà de tenir traça de qui i quan ha realitzat un canvi en un conjunt de dades.

Per poder identificar de forma sistemàtica i exhaustiva les regles de negoci que hagin de complir les dades en cada etapa del seu cicle de vida, l'ajuntament fa ús d'una metodologia  basada en BR4DQ .

A continuació, des de l'ajuntament, es revisen totes les característiques de qualitat de dades incloses dins de l'especificació, es prioritzen, i es determina un primer conjunt d'elles que es voldran tenir en compte per a l'avaluació. Per a això, i en aquesta primera etapa, l'ajuntament decideix quedar-se exclusivament amb les 5 característiques inherents de  ISO 25012  definides dins de l'especificació. Aquestes són: exactitud, completesa, consistència, credibilitat i actualitat.

Del mismo modo, para cada una de estas primeras características que se ha acordado abordar, se identifican posibles propiedades. Para ello, finalmente, desde el ayuntamiento se decide trabajar con el siguiente modelo de calidad que incluye las siguientes características y propiedades:

Fins a aquest punt, l'ajuntament té identificat el conjunt de dades a avaluar, així com les regles de negoci que li apliquen, i en quins aspectes de la qualitat es va a centrar (model de qualitat de dades). A continuació, és necessari dur a terme el mesurament de qualitat de dades a través de la validació de les regles de negoci. Per a això s'obtenen valors per a les diferents mètriques, els quals es computen seguint una aproximació d'a baix cap amunt fins a determinar el nivell de qualitat de dades del repositori

Definició del procés d'avaluació

Para realizar la evaluación de una forma adecuada, se decide hacer uso del proceso de evaluación de calidad basado en ISO 25024, indicado dentro de la especificación UNE 0081 (véase a continuación).

Aplicació del procés d'avaluació

A continuació, es resumeixen els aspectes més destacables duts a terme per l'Ajuntament durant la etapa 4 del procés d'avaluació:

  1. Validació del grau de compliment de cada regla de negoci per propietat: Disponiendo de totes les regles de negoci classificades per propietat, es valida el grau de compliment de cadascuna d'elles, obtenint així una sèrie de valors per a cadascuna de les mètriques. Això s'executa sobre cadascun dels conjunts de dades a avaluar.

A manera d'exemple, per a la propietat d'exactitud sintàctica s'obtenen dues mètriques:

  1. Nombre de registres que compleixen les regles de negoci d'exactitud sintàctica: 826.254
  2. Nombre de registres que han de complir les regles de negoci d'exactitud sintàctica: 850.639
  1. Quantificació del valor de la propietat: A partir de aquestes mètriques, es quantifica i determina el valor de la propietat fent ús de la funció de mesurament especificat en l'especificació UNEIX 0081. Per al cas concret de l'exactitud sintàctica es determina que una densitat de registres del 97,1% compleixen totes les regles d'exactitud sintàctica.
  2. Cálculo del valor de la característica: Per a això, es fa ús dels resultats de cadascuna de les mètriques de qualitat de dades associades a una propietat. Per calcular-ho, i tal com s'especifica en l'especificació UNEIX 0081, es decideix seguir una suma ponderada en la qual cada propietat té el mateix pes. Per al cas de l'Exactitud, es disposa dels valors d'Exactitud sintàctica: 97,1, Exactitud semàntica: 95, i Rango d'exactitud: 92,9. Computant aquestes 3 puntuacions, es va obtenir un valor de 95 sobre 100 per a aquesta característica.
  3. Pas del valor quantitatiu al qualitatiu: Per finalitzar i poder proporcionar un resultat final de qualitat, es decideix fer ús d'una altra suma ponderada; en aquest cas, totes les dimensions tenen el mateix pes. Partint dels resultats agregats anteriorment de les característiques esmentades: Exactitud: 95, Completesa: 87, Consistència: 90, Credibilitat: 88, Actualitat: 93, es determina un nivell de qualitat de 90 sobre 100 per al repositori. Finalment, és necessari passar d'aquest valor quantitatiu de 0 a 100 a un valor qualitatiu. En aquest exemple concret, fent, ús de la funció de nivells de qualitat basada en percentatges, es conclou que el nivell de qualitat del repositori, per a la propietat analitzada, és 4, o “Molt Bona”.

Visualització de resultats

Finalment, i una vegada realitzada l'avaluació de totes les característiques, des de l'ajuntament es construeixen una sèrie de quadres de comandaments de control de qualitat de dades amb diferent nivell d'agregació (característica, propietat, conjunt de dades i taula/vesteixi) partint dels resultats de l'avaluació, de manera que ràpidament es pot consultar el nivell de qualitat. Per a això, a manera d'exemple es mostren els resultats amb diferent nivell d'agregació.

Com es pot veure al llarg de tot l'exemple d'aplicació, existeix una relació directa entre l'aplicació d'aquesta especificació UNEIX 0081, amb determinades parts de la  especificació 0078 , concretament amb el procés de gestió de requisits de dades, i amb la  especificació UNEIX 0079 , almenys amb els processos de planificació i control de qualitat de dades. Fruto de l'avaluació s'establiran recomanacions de millora de qualitat (accions correctives), que incidiran directament en els processos de la dada establerts, tot això d'acord amb el circulo de millora contínua PDCA de Deming.

Una vegada finalitzat l'exemple, i com a valor afegit, cal destacar que és possible certificar el nivell de qualitat de dades dels repositoris organitzacionals. Per a això, serà necessari comptar amb una entitat de certificació que proveeixi aquest servei de qualitat de dades, així com amb un laboratori acreditat segons la norma ISO 17025 amb potestat per a l'emissió d'informes d'avaluació de qualitat de dades.

Font original de la notícia(Obre en nova finestra)

  • Informació i dades del sector públic