accesskey_mod_content

Las salas seguras en España: ¿A qué tipo de datos pueden acceder los investigadores?

  • Escuchar
  • Imprimir PDF
  • Compartir

27 agosto 2024

Son datos confidenciales sobre los que recaen derechos de terceros que impiden su puesta a disposición a través de plataformas abiertas, pero que pueden ser fundamentales para investigaciones que promuevan avances para toda la sociedad.

Existen una serie de datos muy valiosos, pero que por su naturaleza no se pueden abrir al gran público. Son datos confidenciales sobre los que recaen derechos de terceros que impiden su puesta a disposición a través de plataformas abiertas, pero que pueden ser fundamentales para investigaciones que promuevan avances para toda la sociedad, en campos como el diagnóstico médico(Abre en nueva ventana) , la evaluación de políticas públicas, la detección o enjuiciamiento de infracciones penales, etc. 

Para facilitar la extracción de valor de estos datos, respetando la normativa vigente y los derechos vinculados, se han puesto a disposición de los investigadores unos entornos de tratamiento seguro, conocidos como salas seguras. El objetivo es que los investigadores puedan solicitar y, posteriormente, utilizar e integrar los datos contenidos en ciertas bases de datos en poder de organismos para llevar a cabo trabajos con fines científicos de interés público. Todo ello de manera controlada, segura y preservando la privacidad. Por ello, los investigadores e instituciones que tengan acceso a los datos estarán obligados a guardar absoluta reserva sobre los mismos y a no difundir ninguna información identificable.

En este contexto, el Instituto Nacional de Estadística (INE), la Agencia Estatal de Administración Tributaria (AEAT), distintas instancias de la Seguridad Social, el Servicio Público de Empleo Estatal (SEPE) y el Banco de España han firmado un convenio(Abre en nueva ventana) para dinamizar el acceso controlado a este tipo de datos. El acuerdo se enmarca en la estrategia de la Unión Europea y el Reglamento de Gobernanza de Datos(Abre en nueva ventana) (Data Governance Act o DGA en inglés), como te contamos en este artículo(Abre en nueva ventana) . Una de las ventajas de este convenio es que facilita el cruce de datos de diferentes organismos a través de Es_Datalab.

Es_Datalab, acceso conjunto a múltiples bases de datos

ES_DataLab(Abre en nueva ventana) es un laboratorio de microdatos restringido para investigadores que desarrollan proyectos con fines científicos y de interés público. El acceso a los microdatos se da en un entorno que garantiza la confidencialidad de la información, ya que no permite la identificación directa de las unidades, procedentes de distintas bases de datos.

Para acceder a este entorno se debe realizar una solicitud que se describe aquí (Abre en nueva ventana) y el acceso solo será válido durante el periodo especificado que dure la investigación. El proceso es el siguiente:

  1. El investigador debe ser reconocido como "entidad de investigación".  Actualmente existe un registro de entidades(Abre en nueva ventana) (universidades, institutos de investigación, departamentos de investigación de administraciones públicas, etc.) que se irá ampliando a medida que nuevos organismos soliciten su incorporación.
  2. Una vez acreditada, la entidad debe solicitar el acceso a los microdatos, para lo cual es necesario presentar una propuesta de investigación.

A través de Es_ Datalab, se puede acceder a diversos microdatos, recogidos en este enlace(Abre en nueva ventana) . En este sentido, ES_Datalab facilita el cruce de bases de datos de las instituciones participantes, maximizando el valor que los datos pueden ofrecer al desarrollo de la investigación.

A continuación, te mostramos algunos ejemplos de los datos ofrecidos por cada uno de los organismos, ya sea a través de ES_datalab para su cruce con otras fuentes, o en sus propios entornos de tratamiento seguro.

Instituto Nacional de Estadística

Actualmente pone a disposición microdatos relativos conjuntos de datos del INE, entre los que se encuentran:

  • Resultados de encuestas que recogen información sobre la inserción laboral de titulados universitarios, la estructura salarial, la población activa, las condiciones de vida, la salud en España, etc.
  • Estadísticas sobre diversos aspectos sociales y económicos, como matrimonios o defunciones, actividades de protección medioambiental, filiales de empresas en el exterior, etc.
  • Censos, tanto generales de población como por actividades económicas (por ejemplo, el censo agrario).

El INE, a su vez, cuenta con su propia sala segura(Abre en nueva ventana) que facilita el acceso a datos confidenciales para la realización de análisis estadísticos con fines científicos de interés público.

Agencia Estatal de Administración Tributaria

Los microdatos relativos a las bases de datos que la AEAT ofrece incluyen información detallada sobre:

  • Datos sobre las principales partidas contenidas en diversos modelos, como por ejemplo el modelo 100, relativo a la declaración anual del IRPF, el modelo 576, sobre matriculaciones de vehículos, o el modelo 714, del Impuesto sobre patrimonio, entre otros.
  • Estadísticas de comercio exterior, con datos tanto totales como segmentados por sector de actividad.

También cabe destacar la aportación del Instituto de Estudios Fiscales, que se nutre de datos de la Agencia Estatal de la Administración Tributaria. Ligado al Ministerio de Hacienda, ha puesto a disposición de los ciudadanos un Área de estadística del Instituto de Estudios Fiscales,(Abre en nueva ventana) así como su propia sala segura(Abre en nueva ventana) . Entre sus bases de datos destacan, por ejemplo, las muestras de IRPF, los paneles de hogares, los paneles de renta o la base de datos económicos del sector español (BADESPE). La descripción de los productos y el protocolo de petición de datos se encuentra disponible aquí(Abre en nueva ventana) .

Seguridad Social

La Seguridad Social concede acceso a microdatos que hacen referencia a bases de datos como:

  • La Muestra Continua de Vidas Laborales (MCVL), que incluye datos individuales, actuales e históricos, de bases de cotización, afiliaciones (vida laboral), pensiones, convivientes, Impuesto sobre la Renta de Personas Físicas (IRPF), etc.
  • Los afiliados a la Seguridad Social con información mensual de relaciones laborales, por fechas de alta y baja de empresas, tipo de contrato, colectivo, régimen, provincia, etc.
  • Las prestaciones reconocidas en el ejercicio anterior, que incluye pensiones de jubilación, incapacidad permanente, incapacidad temporal y nacimiento y cuidado del menor.
  • Otras bases de datos como diversas liquidaciones presupuestarias, los expedientes de regulación temporal de empleo (ERTE) por COVID-19, los reconocimientos médicos del Instituto Social de la Marina (ISM) o datos sobre la formación marítima de estudiantes.

Las salas seguras de la Seguridad Social(Abre en nueva ventana) , disponibles en Madrid, Barcelona y Albacete, permiten el tratamiento de esta y otra información protegida ofreciendo acceso a una serie de puestos seguros con diversos programas y lenguajes de programación (SAS, STATA, R, Python y LibreOffice). También se permite el acceso remoto a través de dispositivos seguros (llamados “dispositivos bastionados”) que se distribuyen entre los investigadores.

Gracias a estos datos se han podido realizar estudios sobre el impacto de la edad de Jubilación sobre la mortalidad(Abre en nueva ventana) o el uso de los permisos de paternidad en España(Abre en nueva ventana) .

Banco de España

También encontramos en Es_Datalab microdatos relativos al Banco de España y a bases de datos como: 

  • Bases de datos sobre empresas, con información sobre empresas individuales, grupos empresariales no financieros consolidados o la estructura de grupos empresariales.
  • Datos macroeconómicos, como la deuda del sector público o los préstamos a personas jurídicas.
  • Otros datos relativos a indicadores de sostenibilidad o el panel de hogares.

BELab(Abre en nueva ventana) es el laboratorio de datos protegidos gestionado por el Banco de España, que ofrece acceso in situ (Madrid) y en remoto. Sus datos han permitido el desarrollo de proyectos sobre los efectos del salario mínimo interprofesional en las empresas españolas, la gestión de la tecnología en el sector textil o el machine learning aplicado al riesgo de crédito, entre otros. Puedes conocer todos los proyectos aquí(Abre en nueva ventana) , tanto los finalizados como los que todavía están en marcha.

Impulso a la reutilización de datos gracias al Reglamento de Gobernanza de Datos

Todas estas medidas forman parte del planteamiento y procesos armonizados llevado a cabo en ejecución de las previsiones del Reglamento de Gobernanza de Datos(Abre en nueva ventana) (Data Governance Act o DGA en inglés) para facilitar y fomentar la utilización con fines de investigación científica de los datos que obren en poder de los organismos del sector público, por razones de interés público. Asimismo, a fin de incentivar la reutilización de categorías específicas de datos que obren en poder de organismos del sector público, se ha habilitado en datos.gob.es el “Punto Único de Información Nacional(Abre en nueva ventana) ” (NSIP por sus siglas en inglés), gestionado por la Dirección General del Dato.

Con ello, se busca contribuir al avance de la investigación científica en nuestro país, al tiempo que se protege la confidencialidad de los datos sensibles. Las Salas Seguras son un recurso importante para la reutilización de datos protegidos en poder del sector público. Permiten un tratamiento controlado de la información, preservan la privacidad y otros derechos vinculados a los datos, al mismo tiempo que facilitan el cumplimiento del Reglamento de Gobernanza de Datos europeo.

Fuente original de la noticia(Abre en nueva ventana)

  • Información y datos del sector público
  • Seguridad y Protección de Datos