accesskey_mod_content

La citació de les dades, una pràctica que afavoreix la seva reutilització

  • Escoltar
  • Copiar
  • Imprimir PDF
  • Compartir

13 febrer 2024

Les dades són un actiu clau, del que depenen cada dia multitud de pequeño i grans decisions d'empreses, organismes públics, entitats socials i ciutadans.

Què és la citació de dades?

Quan parlem de “citar” ens referim a el procés d'indicar què fonts externes s'han utilitzat per crear continguts. Una qüestió àmpliament recomanable que afecta a totes les dades, inclosos les dades públiques com està recollit en el nostre ordenament jurídic. En el cas de les dades ofertes per les adminstraciones, el Reial decret 1495/2011(Obre en nova finestra)  inclou la necessitat del reutilitzador de citar la font d'origen de la informació.

Per ajudar als usuaris en aquesta tasca, l'Oficina Oficina de Publicacions de la Unió Europea(Obre en nova finestra)  va editar Data Citation: A guide to bestpractice (Obre en nova finestra) , on es parla de la importància de la citació de dades i es recullen recomanacions de bones pràctiques, així com els reptes a superar per citar conjunts de dades de manera correcta.

Per què és important la citació de dades?

La guia esmenta les raons més rellevants per les quals és recomanable dur a terme aquesta pràctica:

  • El crèdit. Crear conjunts de dades comporta treball. Citar a l'autor o autors els permet rebre feedback i saber que el seu treball és útil, la qual cosa els anima a seguir treballant en nous conjunts de dades.
  • La transparència. Quan les dades se citen, el lector pot acudir a ells per revisar-los, comprendre millor el seu abast i avaluar la seva idoneïtat.
  • La integritat. Els usuaris no deuen caure en el plagi. No han d'atribuir-se el mèrit de la creació de conjunts de dades que no són seus..
  • La reproducibilidad. La citació de les dades permet que una tercera persona pugui intentar reproduir els mateixos resultats, utilitzant la mateixa informació.
  • La reutilització. La citació de dades facilita que cada vegada més conjunts de dades es donin a conèixer i, per tant, augmenti el seu ús.
  • Mineria de textos. Les dades no solament són consumits per humans, també poden ser-ho per màquines. Una correcta citació ajudarà a les màquines a comprendre millor el context dels conjunts de dades, amplificant els beneficis de la seva reutilització.

Bones pràctiques generals

D'entre totes les bones pràctiques generals incloses en la guia, a continuació destaquem algunes de les més rellevants:

  • Sé precís. És necessari que les dades citades estiguin definits amb exactitud. La citació de dades ha d'indicar què dades concretes s'han utilitzat de cada conjunt de dades. També és important assenyalar si han estat processats i si provenen directament del creador o d'algun agregador (com un observatori que ha pres dades de diverses fonts). 
  • Utilitza "identificadors persistents" (persistent identifiers  o PID). Igual que cada llibre que trobem en una biblioteca té el seu identificador, els conjunts de dades també poden (i han de) tenir-ho. Els identificadors persistents són esquemes formals que proporcionen una nomenclatura comuna, que identifiquen de manera única els conjunts de dades, evitant ambigüitats. A l'hora de citar conjunts de dades, és necessari localitzar-los i escriure'ls com un enllaç accionable, sobre el qual es pot fer clic per accedir al conjunt de dades citat i a les seves metadades.  Existeixen diferents famílies de PID, però la guia destaca dues de les més comunes: el sistema Handle(Obre en nova finestra)  i l'identificador identificador d'objecte digital (DOI).(Obre en nova finestra)
  • Indica el moment en el qual s'ha accedit a les dades. Aquesta qüestió és de gran importància quan treballem amb dades dinàmiques (que s'actualitzen i canvien periòdicament) o continus (sobre els quals s'afegeixen dades addicionals sense modificar els antics). En aquests casos, és important citar la data d'accés. A més, si és necessari, l'usuari pot afegir “snapshots” o instantànies del conjunt de dades, és a dir, còpies preses en moments concrets.
  • Consulta les metadades del conjunt de dades utilitzat i les funcionalitats del portal en què se situa. En les metadades es troba gran quantitat de la informació necessària per a la cita.
    A més, els portals de dades poden incloure eines que ajudin a la citació. És el cas del portal data.europa.eu en el menú superior del qual es pot trobar el botó de citació(Obre en nova finestra) .

  • Recolza't en eines de programari. La majoria dels programes informàtics utilitzats per crear documents permeten crear i formatar cites automàticament, assegurant el seu format. A més, existeixen eines específiques de gestió de cites com BibTeX(Obre en nova finestra)  o Mendeley(Obre en nova finestra) , que permeten crear bases de dades de cites tenint en compte les seves peculiaritats, una funció de gran utilitat quan és necessari citar nombrosos conjunts de dades en múltiples documents.

Com citar correctament

La segona part de l'informe conté el material tècnic de referència per crear cites que compleixin les recomanacions indicades. Abasta els elements que ha d'incloure una cita i com ordenar-los per a diferents finalitats.

Entre els elements que ha d'incloure una cita es troben:

  • Autor, pot referir tant a l'individu que ha creat el conjunt de dades (autor personal) com a la organització responsable (autor corporatiu).
  • Títol del dataset.
  • Versió/edició.
  • Publicador, que és l'entitat que fa disponible el conjunt de dades i pot coincidir o no amb l'autor (en cas que coincideixin no és necessari repetir-ho).
  • Data de publicació, on s'indica l'any en què es va crear. És important incloure entre parèntesi el moment de l'última actualització.
  • Data de citació, que expressa la data en la qual el creador de la cita va accedir a les dades, incloent l'hora si és necessari. Per als formats de dates i hores, la guia recomana acudir a la especificació  DCAT(Obre en nova finestra) , ja que ofereix una precisió major en termes d'interoperabilitat.
  • Identificador persistent.

Respecte a l'ordre de tota aquesta informació, existeixen diferents directrius en relació amb l'estructura general de les cites. La guia mostra les diferents formes més adequades de citar segons el tipus de document en el qual apareix la cita (documents periodístics, online, etc.), incloent exemples i recomanació. Entre uns altres, destaca l'exemple del Llibre d'estil interinstitucional (ISG)(Obre en nova finestra) , que edita l'Oficina de Publicacions de la UE. Aquest llibre d'estil no conté orientacions específiques sobre com citar dades, però sí una estructura general per a cites que pot aplicar-se als conjunts de dades, recollida en la següent imatge.

 

La guia finalitza amb una sèrie d'annexos amb llistes de control, diagrames i exemples.

Si vols saber més sobre aquest document, et recomanem veure aquest seminari online(Obre en nova finestra)  on es resumeixen els punts més importants.

En definitiva, citar correctament els conjunts de dades millora la qualitat i la transparència del procés de reutilització de les dades, estimulant-ho al mateix temps. Per tant, fomentar la citació correcta de les dades és una pràctica no solament recomanable, sinó cada vegada més necessària.

Font original de la notícia(Obre en nova finestra)

  • Informació i dades del sector públic