accesskey_mod_content

Les sales segures a Espanya: A quin tipus de dades poden accedir els investigadors?

  • Escoltar
  • Imprimir PDF
  • Compartir

27 agost 2024

Són dades confidencials sobre els quals recauen drets de tercers que impedixen la seua posada a disposició a través de plataformes obertes, però que poden ser fonamentals per a investigacions que promoguen avanços per a tota la societat.

Existixen una sèrie de dades molt valuoses, però que per la seua naturalesa no es poden obrir al gran públic. Són dades confidencials sobre els quals recauen drets de tercers que impedixen la seua posada a disposició a través de plataformes obertes, però que poden ser fonamentals per a investigacions que promoguen avanços per a tota la societat, en camps com el diagnòstic mèdic(Obri en nova finestra) , l'avaluació de polítiques públiques, la detecció o enjudiciament d'infraccions penals, etc. 

Per a facilitar l'extracció de valor d'estes dades, respectant la normativa vigent i els drets vinculats, s'han posat a la disposició dels investigadors uns entorns de tractament segur, coneguts com a sales segures. L'objectiu és que els investigadors puguen sol·licitar i, posteriorment, utilitzar i integrar les dades contingudes en certes bases de dades en poder d'organismes per a dur a terme treballs amb finalitats científiques d'interés públic. Tot açò de manera controlada, segura i preservant la privacitat. Per açò, els investigadors i institucions que tinguen accés a les dades estaran obligats a guardar absoluta reserva sobre els mateixos i a no difondre cap informació identificable.

En este context, l'Institut Nacional d'Estadística (INE), l'Agència Estatal d'Administració Tributària (AEAT), diferents instàncies de la Seguretat Social, el Servici Públic d'Ocupació Estatal (SEPE) i el Banc d'Espanya han firmat un conveni(Obri en nova finestra) per a dinamitzar l'accés controlat a este tipus de dades. L'acord s'emmarca en l'estratègia de la Unió Europea i el Reglament de Governança de Dades(Obri en nova finestra) ( Data Governance Act o DGA en anglés), com t'expliquem en este article(Obri en nova finestra) . Una dels avantatges d'este conveni és que facilita l'encreuament de dades de diferents organismes a través d'És_Datalab.

És_Datalab, accés conjunt a múltiples bases de dades

ÉS_DataLab(Obri en nova finestra) és un laboratori de microdatos restringit per a investigadors que desenvolupen projectes amb finalitats científiques i d'interés públic. L'accés als microdatos es dona en un entorn que garantix la confidencialitat de la informació, ja que no permet la identificació directa de les unitats, procedents de diferents bases de dades.

Per a accedir a este entorn s'ha de realitzar una sol·licitud que es descriu ací (Obri en nova finestra) i l'accés solament serà vàlid durant el període especificat que dure la investigació. El procés és el següent:

  1. L'investigador ha de ser reconegut com a "entitat d'investigació".  Actualment existix un registre d'entitats(Obri en nova finestra) (universitats, instituts d'investigació, departaments d'investigació d'administracions públiques, etc.) que s'anirà ampliant a mesura que nous organismes sol·liciten la seua incorporació.
  2. Una vegada acreditada, l'entitat ha de sol·licitar l'accés als microdatos, per a açò és necessari presentar una proposta d'investigació.

A través d'És_ Datalab, es pot accedir a diversos microdatos, arreplegats en este enllaç(Obri en nova finestra) . En este sentit, ÉS_Datalab facilita l'encreuament de bases de dades de les institucions participants, maximitzant el valor que les dades poden oferir al desenvolupament de la investigació.

A continuació, et vam mostrar alguns exemples de les dades oferides per cadascun dels organismes, ja siga a través d'ÉS_datalab per al seu encreuament amb altres fonts, o en els seus propis entorns de tractament segur.

Institut Nacional d'Estadística

Actualment posa a disposició microdatos relatius conjunts de dades de l'INE, entre els quals es troben:

  • Resultats d'enquestes que arrepleguen informació sobre la inserció laboral de titulats universitaris, l'estructura salarial, la població activa, les condicions de vida, la salut a Espanya, etc.
  • Estadístiques sobre diversos aspectes socials i econòmics, com a matrimonis o defuncions, activitats de protecció mediambiental, filials d'empreses en l'exterior, etc.
  • Censos, tant generals de població com per activitats econòmiques (per exemple, el cens agrari).

L'INE, al seu torn, compta amb la seua pròpia sala segura(Obri en nova finestra) que facilita l'accés a dades confidencials per a la realització d'anàlisis estadístiques amb finalitats científiques d'interés públic.

Agència Estatal d'Administració Tributària

Els microdatos relatius a les bases de dades que l'AEAT oferix inclouen informació detallada sobre:

  • Dades sobre les principals partides contingudes en diversos models, com per exemple el model 100, relatiu a la declaració anual de l'IRPF, el model 576, sobre matriculacions de vehicles, o el model 714, de l'Impost sobre patrimoni, entre uns altres.
  • Estadístiques de comerç exterior, amb dades tant totals com segmentats per sector d'activitat.

També cal destacar l'aportació de l'Institut d'Estudis Fiscals, que es nodrix de dades de l'Agència Estatal de l'Administració Tributària. Lligat al Ministeri d'Hisenda, ha posat a la disposició dels ciutadans un Àrea d'estadística de l'Institut d'Estudis Fiscals,(Obri en nova finestra) així com la seua pròpia sala segura(Obri en nova finestra) . Entre les seues bases de dades destaquen, per exemple, les mostres d'IRPF, els panells de llars, els panells de renda o la base de dades econòmics del sector espanyol (BADESPE). La descripció dels productes i el protocol de petició de dades es troba disponible ací(Obri en nova finestra) .

Seguretat Social

La Seguretat Social concedix accés a microdatos que fan referència a bases de dades com:

  • La Mostra Contínua de Vides Laborals (MCVL), que inclou dades individuals, actuals i històrics, de bases de cotització, afiliacions (vida laboral), pensions, convivientes, Imposat sobre la Renda de Persones Físiques (IRPF), etc.
  • Els afiliats a la Seguretat Social amb informació mensual de relacions laborals, per dates d'alta i baixa d'empreses, tipus de contracte, col·lectiu, règim, província, etc.
  • Les prestacions reconegudes en l'exercici anterior, que inclou pensions de jubilació, incapacitat permanent, incapacitat temporal i naixement i cura del menor.
  • Altres bases de dades com a diverses liquidacions pressupostàries, els expedients de regulació temporal d'ocupació (ERTE) per Covid-19, els reconeixements mèdics de l'Institut Social de la Marina (ISM) o dades sobre la formació marítima d'estudiants.

Les sales segures de la Seguretat Social(Obri en nova finestra) , disponibles a Madrid, Barcelona i Albacete, permeten el tractament d'esta i una altra informació protegida oferint accés a una sèrie de llocs segurs amb diversos programes i llenguatges de programació (SAS, STATA, R, Python i LibreOffice). També es permet l'accés remot a través de dispositius segurs (anomenats “dispositius bastionados”) que es distribuïxen entre els investigadors.

Gràcies a estes dades s'han pogut realitzar estudis sobre el impacte de l'edat de Jubilació sobre la mortalitat(Obri en nova finestra) o l'ús ús dels permisos de paternitat a Espanya(Obri en nova finestra) .

Banc d'Espanya

També trobem en És_Datalab microdatos relatius al Banc d'Espanya i a bases de dades com: 

  • Bases de dades sobre empreses, amb informació sobre empreses individuals, grups empresarials no financers consolidats o l'estructura de grups empresarials.
  • Dades macroeconòmiques, com el deute del sector públic o els préstecs a persones jurídiques.
  • Altres dades relatives a indicadors de sostenibilitat o el panell de llars.

BELab(Obri en nova finestra) és el laboratori de dades protegides gestionat pel Banc d'Espanya, que oferix accés in situ (Madrid) i en remot. Les seues dades han permès el desenvolupament de projectes sobre els efectes del salari mínim interprofessional en les empreses espanyoles, la gestió de la tecnologia en el sector tèxtil o l'aplicat machine learning al risc de crèdit, entre uns altres. Pots conéixer tots els projectes ací(Obri en nova finestra) , tant els finalitzats com els quals encara estan en marxa.

Impuls a la reutilització de dades gràcies al Reglament de Governança de Dades

Totes estes mesures formen part del plantejament i processos harmonitzats dut a terme en execució de les previsions del Reglament de Governança de Dades(Obri en nova finestra) ( Data Governance Act o DGA en anglés) per a facilitar i fomentar la utilització amb finalitats d'investigació científica de les dades que obren en poder dels organismes del sector públic, per raons d'interés públic. Així mateix, a fi d'incentivar la reutilització de categories específiques de dades que obren en poder d'organismes del sector públic, s'ha habilitat en datos.gob.es el “Punt “Punt Únic d'Informació Nacional(Obri en nova finestra) ” (NSIP per les seues sigles en anglés), gestionat per la Direcció general de la Dada.

Amb açò, es busca contribuir a l'avanç de la investigació científica en el nostre país, al mateix temps que es protegix la confidencialitat de les dades sensibles. Les Sales Segures són un recurs important per a la reutilització de dades protegides a poder del sector públic. Permeten un tractament controlat de la informació, preserven la privacitat i altres drets vinculats a les dades, al mateix temps que faciliten el compliment del Reglament de Governança de Dades europeu.

Font original de la notícia(Obri en nova finestra)

  • Informació i dades del sector públic
  • Seguretat i Protecció de Dades