accesskey_mod_content

Les sales segures/segures a Espanya: A quin tipus de dades poden accedir els investigadors?

  • Escoltar
  • Imprimir PDF
  • Compartir

27 agost 2024

Són dades confidencials sobre els quals recauen drets de tercers que impedeixen la seva posada a disposició a través de plataformes obertes, però que poden ser fonamentals per a recerques que promoguin avanços per a tota la societat.

Existeixen una sèrie de dades molt valuoses, però que per la seva naturalesa no es poden obrir al gran públic. Són dades confidencials sobre els quals recauen drets de tercers que impedeixen la seva posada a disposició a través de plataformes obertes, però que poden ser fonamentals per a recerques que promoguin avanços per a tota la societat, en camps com el diagnòstic mèdic(Obre en nova finestra) , l'avaluació de polítiques públiques, la detecció o enjudiciament d'infraccions penals, etc. 

Per facilitar l'extracció de valor d'aquestes dades, respectant la normativa vigent i els drets vinculats, s'han posat a la disposició dels investigadors uns entorns de tractament segur/segur, coneguts com a sales segures/segures. L'objectiu és que els investigadors puguin sol·licitar i, posteriorment, utilitzar i integrar les dades contingudes en certes bases de dades en poder d'organismes per dur a terme treballs amb finalitats científiques d'interès públic. Tot això de manera controlada, segura/segura i preservant la privadesa. Per això, els investigadors i institucions que tinguin accés a les dades estaran obligats a guardar absoluta reserva sobre els mateixos i a no difondre cap informació identificable.

En aquest context, l'Institut Nacional d'Estadística (INE), l'Agència Estatal d'Administració Tributària (AEAT), diferents instàncies de la Seguretat Social, el Servei Públic d'Ocupació Estatal (SEPE) i el Banc d'Espanya han signat un conveni(Obre en nova finestra) per dinamitzar l'accés controlat a aquest tipus de dades. L'acord s'emmarca en l'estratègia de la Unió Europea i el Reglament de Governança de Dades(Obre en nova finestra) ( Data Governance Act o DGA en anglès), com t'expliquem en aquest article(Obre en nova finestra) . Una dels avantatges d'aquest conveni és que facilita l'encreuament de dades de diferents organismes a través d'És_Datalab.

És_Datalab, accés conjunt a múltiples bases de dades

ÉS_DataLab(Obre en nova finestra) és un laboratori de microdatos restringit per a investigadors que desenvolupen projectes amb finalitats científiques i d'interès públic. L'accés als microdatos es dona en un entorn que garanteix la confidencialitat de la informació, ja que no permet la identificació directa de les unitats, procedents de diferents bases de dades.

Per accedir a aquest entorn s'ha de realitzar una sol·licitud que es descriu aquí (Obre en nova finestra) i l'accés solament serà vàlid durant el període especificat que duri la recerca. El procés és el següent:

  1. L'investigador ha de ser reconegut com a "entitat de recerca".  Actualment existeix un registre d'entitats(Obre en nova finestra) (universidades, institutos de investigación, departamentos de investigación de administraciones públicas, etc.) que se irá ampliando a medida que nuevos organismos soliciten su incorporación.
  2. Una vegada acreditada, l'entitat ha de sol·licitar l'accés als microdatos, per a això és necessari presentar una proposta de recerca.

A través de Es_ Datalab, se puede acceder a diversos microdatos, recogidos en aquest enllaç(Obre en nova finestra) . En aquest sentit, ÉS_Datalab facilita l'encreuament de bases de dades de les institucions participants, maximitzant el valor que les dades poden oferir al desenvolupament de la recerca.

A continuació, et vam mostrar alguns exemples de les dades ofertes per cadascun dels organismes, ja sigui a través d'ÉS_datalab per al seu encreuament amb altres fonts, o en els seus propis entorns de tractament segur/segur.

Institut Nacional d'Estadística

Actualment posa a disposició microdatos relatius conjunts de dades de l'INE, entre els quals es troben:

  • Resultats d'enquestes que recullen informació sobre la inserció laboral de titulats universitaris, l'estructura salarial, la població activa, les condicions de vida, la salut a Espanya, etc.
  • Estadístiques sobre diversos aspectes socials i econòmics, com a matrimonis o defuncions, activitats de protecció mediambiental, filials d'empreses en l'exterior, etc.
  • Censos, tant generals de població com per activitats econòmiques (per exemple, el cens agrari).

L'INE, al seu torn, compta amb la seva pròpia sala segura/segura(Obre en nova finestra) que facilita l'accés a dades confidencials per a la realització d'anàlisis estadístiques amb finalitats científiques d'interès públic.

Agència Estatal d'Administració Tributària

Els microdatos relatius a les bases de dades que l'AEAT ofereix inclouen informació detallada sobri:

  • Dades sobre les principals partides contingudes en diversos models, com per exemple el model 100, relatiu a la declaració anual de l'IRPF, el model 576, sobre matriculacions de vehicles, o el model 714, de l'Impost sobre patrimoni, entre uns altres.
  • Estadístiques de comerç exterior, amb dades tant totals com segmentats per sector d'activitat.

També cal destacar l'aportació de l'Institut d'Estudis Fiscals, que es nodreix de dades de l'Agència Estatal de l'Administració Tributària. Lligat al Ministeri d'Hisenda, ha posat a la disposició dels ciutadans un Àrea d'estadística de l'Institut d'Estudis Fiscals,(Obre en nova finestra) així com la seva pròpia sala segura/segura(Obre en nova finestra) . Entre les seves bases de dades destaquen, per exemple, les mostres d'IRPF, els panells de llars, els panells de renda o la base de dades econòmics del sector espanyol (BADESPE). La descripció dels productes i el protocol de petició de dades es troba disponible aquí(Obre en nova finestra) .

Seguretat Social

La Seguretat Social concedeix accés a microdatos que fan referència a bases de dades com:

  • La Mostra Contínua de Vides Laborals (MCVL), que inclou dades individuals, actuals i històrics, de bases de cotització, afiliacions (vida laboral), pensions, convivientes, Imposat sobre la Renda de Persones Físiques (IRPF), etc.
  • Els afiliats a la Seguretat Social amb informació mensual de relacions laborals, per dates d'alta i baixa d'empreses, tipus de contracte, col·lectiu, règim, província, etc.
  • Les prestacions reconegudes en l'exercici anterior, que inclou pensions de jubilació, incapacitat permanent, incapacitat temporal i naixement i cura del menor.
  • Altres bases de dades com a diverses liquidacions pressupostàries, els expedients de regulació temporal d'ocupació (ERTE) per Covid-19, els reconeixements mèdics de l'Institut Social de la Marina (ISM) o dades sobre la formació marítima d'estudiants.

Les sales segures/segures de la Seguretat Social(Obre en nova finestra) , disponibles a Madrid, Barcelona i Albacete, permeten el tractament d'aquesta i una altra informació protegida oferint accés a una sèrie de llocs segurs/segurs amb diversos programes i llenguatges de programació (SAS, STATA, R, Python i LibreOffice). També es permet l'accés remot a través de dispositius segurs/segurs (anomenats “dispositius bastionados”) que es distribueixen entre els investigadors.

Gràcies a aquestes dades s'han pogut realitzar estudis sobre el impacte de l'edat de Jubilació sobre la mortalitat(Obre en nova finestra) o l'ús ús dels permisos de paternitat a Espanya(Obre en nova finestra) .

Banc d'Espanya

També trobem en És_Datalab microdatos relatius al Banc d'Espanya i a bases de dades com: 

  • Bases de dades sobre empreses, amb informació sobre empreses individuals, grups empresarials no financers consolidats o l'estructura de grups empresarials.
  • Dades macroeconòmiques, com el deute del sector públic o els préstecs a persones jurídiques.
  • Altres dades relatives a indicadors de sostenibilitat o el panell de llars.

BELab(Obre en nova finestra) és el laboratori de dades protegides gestionat pel Banc d'Espanya, que ofereix accés in situ (Madrid) i en remot. Les seves dades han permès el desenvolupament de projectes sobre els efectes del salari mínim interprofessional en les empreses espanyoles, la gestió de la tecnologia en el sector tèxtil o l'aplicat machine learning al risc de crèdit, entre uns altres. Pots conèixer tots els projectes aquí(Obre en nova finestra) , tant els finalitzats com els quals encara estan en marxa.

Impuls a la reutilització de dades gràcies al Reglament de Governança de Dades

Todas estas medidas forman parte del planteamiento y procesos armonizados llevado a cabo en ejecución de las previsiones del Reglament de Governança de Dades(Obre en nova finestra) ( Data Governance Act o DGA en anglès) per facilitar i fomentar la utilització amb finalitats de recerca científica de les dades que obrin en poder dels organismes del sector públic, per raons d'interès públic. Així mateix, a fi d'incentivar la reutilització de categories específiques de dades que obrin en poder d'organismes del sector públic, s'ha habilitat en datos.gob.es el “Punt “Punt Únic d'Informació Nacional(Obre en nova finestra) ” (NSIP per les seves sigles en anglès), gestionat per la Direcció general de la Dada.

Amb això, se cerca contribuir a l'avanç de la recerca científica al nostre país, al mateix temps que es protegeix la confidencialitat de les dades sensibles. Les Sales Segures/Segures són un recurs important per a la reutilització de dades protegides a poder del sector públic. Permeten un tractament controlat de la informació, preserven la privadesa i altres drets vinculats a les dades, al mateix temps que faciliten el compliment del Reglament de Governança de Dades europeu.

Font original de la notícia(Obre en nova finestra)

  • Informació i dades del sector públic
  • Seguretat i Protecció de Dades