A través de dicho documento, se establecen las bases sobre las cuales las universidades en España pueden abrir sus datos de forma coherente, desarrollando políticas de acceso abierto al conocimiento, tanto docente como investigador.
El documento brinda una introducción general a la cultura de datos abiertos, haciendo un recorrido por los diferentes conceptos y sus fundamentos e incluyendo ejemplos de iniciativas de apertura. A su vez, promueve la adopción institucional de políticas que fijen la orientación y alcance de las iniciativas proponiendo una serie de formulaciones básicas de estas políticas y asumiendo el decálogo de buenas prácticas en apertura de los datos creado en el Día Open Data en Euskadi, celebrado en el año 2012:
1. Publicación de datos en formatos abiertos y estándares.
2. Esquemas y vocabularios consensuados y metadatos abiertos.
3. Inventario en un catálogo de datos estructurado.
4. Datos accesibles desde direcciones web persistentes y amigables.
5. Mínimo de datasets relativos al nivel de competencias del organismo y su estrategia de exposición de datos
6. Compromiso de servicio, actualización y calidad del dato.
7. Monitorización y evaluación del uso y servicio mediante métricas.
8. Datos bajo condiciones de uso no restrictivas y comunes.
9. Evangelización y enseñanza en el uso de datos.
10. Recopilación de aplicaciones, herramientas y manuales para motivar y facilitar la reutilización.
Para ayudar a las universidades a determinar qué datos abrir, se ha realizado una revisión los portales de datos abiertos de universidades a escala internacional y fruto de este trabajo el documento incluye un listado con las categorías de datos más habituales publicados por las instituciones académicas. Además, el grupo CRUE-TIC está trabajando actualmente en un censo inicial consensuado de datasets (acceso, matrícula, calificaciones y graduación de estudiantes, docencia impartida, investigación realizada, recursos humanos, economía, y recursos materiales) que aumente el valor de la información al facilitar su combinación y comparación, permita enlazar los datos y posibilite el desarrollo nuevos productos y servicios.
Esta guía ofrece también una serie de recomendaciones técnicas para orientar y facilitar el análisis técnico a los departamentos de TI de las universidades que emprendan el camino hacia la publicación de sus datos en abierto.
Dichas pautas establecen tres niveles de complejidad en el desarrollo de un portal open data teniendo en cuenta el volumen de datos publicados y la periodicidad de actualización:
- Nivel 1: Hasta 100 datasets y hasta 10 datasets que requieren actualización semanal.
- Nivel 2: Hasta 1.000 datasets, hasta 100 datasets que requieren actualización semanal.
- Nivel 3: Superior a 1.000 datasets o más de 100 conjuntos que requieran actualización semanal.En base a ello, el documento analiza las soluciones tecnológicas y describe unas infraestructuras orientativas incluyendo la estructura de los metadatos; los formatos (estructurado, semántico, enriquecido); el almacenamiento de la información; frameworks; la integración con los sistemas de información existentes y los lenguajes de consulta.
Por último, se describen las iniciativas de datos abiertos puestas en marcha o en desarrollo en 7 universidades españolas: Universidad Pablo de Olavide, Universitat Pompeu Fabra, Universidad de Alicante, Universitat Jaume I, Universidad de León y Universidad de Granada.
Con este tipo de trabajos, el grupo CRUE-TIC pretende fomentar el trabajo coordinado, evitar replicar los esfuerzos de análisis y diseño de soluciones y favorecer la colaboración entre universidades.