A través deste documento, establécense as bases sobre as cales as universidades en España poden abrir os seus datos de forma coherente, desenvolvendo políticas de acceso aberto ao coñecemento, tanto docente como investigador.
O documento brinda unha introdución xeral á cultura de datos abertos, facendo un percorrido polos diferentes conceptos e os seus fundamentos e incluíndo exemplos de iniciativas de apertura. Á súa vez, promove a adopción institucional de políticas que fixen a orientación e alcance das iniciativas propondo unha serie de formulacións básicas destas políticas e asumindo o decálogo de boas prácticas en apertura dos datos creado no Día Open Data en Euskadi, celebrado no ano 2012:
1. Publicación de datos en formatos abertos e estándares.
2. Esquemas e vocabularios consensuados e metadatos abertos.
3. Inventario nun catálogo de datos estruturado.
4. Datos accesibles desde direccións web persistentes e amigables.
5. Mínimo de datasets relativos ao nivel de competencias do organismo e a súa estratexia de exposición de datos
6. Compromiso de servizo, actualización e calidade do dato.
7. Monitorización e avaliación do uso e servizo mediante métricas.
8. Datos baixo condicións de uso non restritivas e comúns.
9. Evangelización e ensino no uso de datos.
10. Recompilación de aplicacións, ferramentas e manuais para motivar e facilitar a reutilización.
Para axudar ás universidades a determinar que datos abrir, realizouse unha revisión os portais de datos abertos de universidades a escala internacional e froito deste traballo o documento inclúe unha listaxe coas categorías de datos máis habituais publicados polas institucións académicas. Ademais, o grupo CRUE-TIC está a traballar actualmente nun censo inicial acordado de datasets (acceso, matrícula, cualificacións e gradación de estudantes, docencia impartida, investigación realizada, recursos humanos, economía, e recursos materiais) que aumente o valor da información ao facilitar a súa combinación e comparación, permita enlazar os datos e posibilite o desenvolvemento novos produtos e servizos.
Esta guía ofrece tamén unha serie de recomendacións técnicas para orientar e facilitar a análise técnica aos departamentos de TI das universidades que emprendan o camiño cara á publicación dos seus datos en aberto.
Dichas pautas establecen tres niveles de complejidad en el desarrollo de un portal open data teniendo en cuenta el volumen de datos publicados y la periodicidad de actualización:
- Nivel 1: Hasta 100 datasets y hasta 10 datasets que requieren actualización semanal.
- Nivel 2: Ata 1.000 datasets, ata 100 datasets que requiren actualización semanal.
- Nivel 3: Superior a 1.000 datasets ou máis de 100 conxuntos que requiran actualización semanal.Con base niso, o documento analiza as solucións tecnolóxicas e describe unhas infraestruturas orientativas incluíndo a estrutura dos metadatos; os formatos (estruturado, semántico, enriquecido); o almacenamento da información; frameworks; a integración cos sistemas de información existentes e as linguaxes de consulta.
Por último, descríbense as iniciativas de datos abertos postas en marcha ou en desenvolvemento en 7 universidades españolas: Universidade Pablo de Olavide, Universitat Pompeu Fabra, Universidade de Alacante, Universitat Jaume I, Universidade de León e Universidade de Granada.
Con este tipo de traballos, o grupo CRUE-TIC pretende fomentar o traballo coordinado, evitar replicar os esforzos de análises e deseño de solucións e favorecer a colaboración entre universidades.