accesskey_mod_content

As salas seguras en España: A que tipo de datos poden acceder os investigadores?

  • Escoitar
  • Imprimir PDF
  • Compartir

27 agosto 2024

Son datos confidenciais sobre os que recaen dereitos de terceiros que impiden a súa posta a disposición a través de plataformas abertas, pero que poden ser fundamentais para investigacións que promovan avances para toda a sociedade.

Existen unha serie de datos moi valiosos, pero que pola súa natureza non se poden abrir ao gran público. Son datos confidenciais sobre os que recaen dereitos de terceiros que impiden a súa posta a disposición a través de plataformas abertas, pero que poden ser fundamentais para investigacións que promovan avances para toda a sociedade, en campos campos como o diagnóstico médico(Abre en nova xanela) , a avaliación de políticas públicas, a detección ou axuizamento de infraccións penais, etc. 

Para facilitar a extracción de valor destes datos, respectando a normativa vixente e os dereitos vinculados, puxéronse a disposición dos investigadores unhas contornas de tratamento seguro, coñecidos como salas seguras. O obxectivo é que os investigadores poidan solicitar e, posteriormente, utilizar e integrar os datos contidos en certas bases de datos en poder de organismos para levar a cabo traballos con fins científicos de interese público. Todo iso de maneira controlada, segura e preservando a privacidade. Por iso, os investigadores e institucións que teñan acceso aos datos estarán obrigados a gardar absoluta reserva sobre os mesmos e a non difundir ningunha información identificable.

Neste contexto, o Instituto Nacional de Estatística (INE), a Axencia Estatal de Administración Tributaria (AEAT), distintas instancias da Seguridade Social, o Servizo Público de Emprego Estatal (SEPE) e o Banco de España asinaron un convenio(Abre en nova xanela) para dinamizar o acceso controlado a este tipo de datos. O acordo enmárcase na estratexia da Unión Europea e o Regulamento de Gobernación de Datos(Abre en nova xanela) ( Data Governance Act o DGA en inglés), como contámosche neste este artigo(Abre en nova xanela) . Unha das vantaxes deste convenio é que facilita o cruzamento de datos de diferentes organismos a través de É_Datalab.

É_Datalab, acceso conxunto a múltiples bases de datos

É_DataLab(Abre en nova xanela) é un laboratorio de microdatos restrinxido para investigadores que desenvolven proxectos con fins científicos e de interese público. O acceso aos microdatos dáse nunha contorna que garante a confidencialidade da información, xa que non permite a identificación directa das unidades, procedentes de distintas bases de datos.

Para acceder a esta contorna débese realizar unha solicitude que se describe aquí (Abre en nova xanela) e o acceso só será válido durante o período especificado que dure a investigación. O proceso é o seguinte:

  1. O investigador debe ser recoñecido como "entidade de investigación".  Actualmente existe un rexistro de entidades(Abre en nova xanela) (universidades, institutos de investigación, departamentos de investigación de administracións públicas, etc.) que se irá ampliando a medida que novos organismos soliciten a súa incorporación.
  2. Unha vez acreditada, a entidade debe solicitar o acceso aos microdatos, para o que é necesario presentar unha proposta de investigación.

A través de É_ Datalab, pódese acceder a diversos microdatos, recollidos nesta esta ligazón(Abre en nova xanela) . Neste sentido, É_Datalab facilita o cruzamento de bases de datos das institucións participantes, maximizando o valor que os datos poden ofrecer ao desenvolvemento da investigación.

A seguir, mostrámosche algúns exemplos dos datos ofrecidos por cada un dos organismos, xa sexa a través de É_datalab para o seu cruzamento con outras fontes, ou nas súas propias contornas de tratamento seguro.

Instituto Nacional de Estatística

Actualmente pon a disposición microdatos relativos conxuntos de datos do INE, entre os que se atopan:

  • Resultados de enquisas que recollen información sobre a inserción laboral de titulados universitarios, a estrutura salarial, a poboación activa, as condicións de vida, a saúde en España, etc.
  • Estatísticas sobre diversos aspectos sociais e económicos, como matrimonios ou defuncións, actividades de protección ambiental, filiais de empresas no exterior, etc.
  • Censos, tanto xerais de poboación como por actividades económicas (por exemplo, o censo agrario).

O INE, á súa vez, conta coa súa propia sala segura(Abre en nova xanela) que facilita o acceso a datos confidenciais para a realización de análises estatísticas con fins científicos de interese público.

Axencia Estatal de Administración Tributaria

Os microdatos relativos ás bases de datos que a AEAT ofrece inclúen información detallada sobre:

  • Datos sobre as principais partidas contidas en diversos modelos, por exemplo o modelo 100, relativo á declaración anual do IRPF, o modelo 576, sobre matriculacións de vehículos, ou o modelo 714, do Imposto sobre patrimonio, entre outros.
  • Estatísticas de comercio exterior, con datos tanto totais como segmentados por sector de actividade.

Tamén cabe destacar a achega do Instituto de Estudos Fiscais, que se nutre de datos da Axencia Estatal da Administración Tributaria. Ligado ao Ministerio de Facenda, puxo a disposición dos cidadáns unha Área de estatística do Instituto de Estudos Fiscais,(Abre en nova xanela) así como a súa propia sala segura(Abre en nova xanela) . Entre as súas bases de datos destacan, por exemplo, as mostras de IRPF, os paneis de fogares, os paneis de renda ou a base de datos económicos do sector español (BADESPE). A descrición dos produtos e o protocolo de pedimento de datos atópase dispoñible aquí(Abre en nova xanela) .

Seguridade Social

A Seguridade Social concede acceso a microdatos que fan referencia a bases de datos como:

  • A Mostra Continua de Vidas Laborais (MCVL), que inclúe datos individuais, actuais e históricos, de bases de cotización, afiliacións (vida laboral), pensións, convivientes, Imposto sobre a Renda de Persoas Físicas (IRPF), etc.
  • Os afiliados á Seguridade Social con información mensual de relacións laborais, por datas de alta e baixa de empresas, tipo de contrato, colectivo, réxime, provincia, etc.
  • As prestacións recoñecidas no exercicio anterior, que inclúe pensións de xubilación, incapacidade permanente, incapacidade temporal e nacemento e coidado do menor.
  • Outras bases de datos como diversas liquidacións orzamentarias, os expedientes de regulación temporal de emprego (ERTE) por Covid-19, os recoñecementos médicos do Instituto Social da Mariña (ISM) ou datos sobre a formación marítima de estudantes.

As salas seguras da Seguridade Social(Abre en nova xanela) , dispoñibles en Madrid, Barcelona e Albacete, permiten o tratamento desta e outra información protexida ofrecendo acceso a unha serie de postos seguros con diversos programas e linguaxes de programación (SAS, STATA, R, Python e LibreOffice). Tamén se permite o acceso remoto a través de dispositivos seguros (chamados “dispositivos bastionados”) que se distribúen entre os investigadores.

Grazas a estes datos puidéronse realizar estudos sobre impacto da idade de Xubilación sobre a mortalidade(Abre en nova xanela) ou o uso dos permisos de paternidade en España(Abre en nova xanela) .

Banco de España

Tamén atopamos en É_Datalab microdatos relativos ao Banco de España e a bases de datos como: 

  • Bases de datos sobre empresas, con información sobre empresas individuais, grupos empresariais non financeiros consolidados ou a estrutura de grupos empresariais.
  • Datos macroeconómicos, como a débeda do sector público ou os préstamos a persoas xurídicas.
  • Outros datos relativos a indicadores de sustentabilidade ou o panel de fogares.

BELab(Abre en nova xanela) é o laboratorio de datos protexidos xestionado polo Banco de España, que ofrece acceso in situ (Madrid) e en remoto. Os seus datos permitiron o desenvolvemento de proxectos sobre os efectos do salario mínimo interprofesional nas empresas españolas, a xestión da tecnoloxía no sector téxtil ou o machine learning aplicado ao risco de crédito, entre outros. Podes coñecer todos os proxectos aquí(Abre en nova xanela) , tanto os finalizados como os que aínda están en marcha.

Impulso á reutilización de datos grazas ao Regulamento de Gobernación de Datos

Todas estas medidas forman parte da formulación e procesos harmonizados levado a cabo en execución das previsións do Regulamento de Gobernación de Datos(Abre en nova xanela) ( Data Governance Act o DGA en inglés) para facilitar e fomentar a utilización con fins de investigación científica dos datos que estean en poder dos organismos do sector público, por razóns de interese público. Así mesmo, co fin de incentivar a reutilización de categorías específicas de datos que estean en poder de organismos do sector público, habilitouse en datos.gob.es o “Punto Único de Información Nacional(Abre en nova xanela) ” (NSIP polas súas siglas en inglés), xestionado pola Dirección Xeral do Dato.

Con iso, búscase contribuír ao avance da investigación científica no noso país, á vez que se protexe a confidencialidade dos datos sensibles. As Salas Seguras son un recurso importante para a reutilización de datos protexidos en poder do sector público. Permiten un tratamento controlado da información, preservan a privacidade e outros dereitos vinculados aos datos, ao mesmo tempo que facilitan o cumprimento do Regulamento de Gobernación de Datos europeo.

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público
  • Seguridade e Protección de Datos