ESTADO DE LOS DATOS ABIERTOS
PARA LA INVESTIGACIÓN EN
EL PERÚ
Carlos Quispe Gerónimo (Ministerio de Educación)[email protected]
Diana Balcázar Tafur (GRADE)[email protected]
VI Jornadas Nacionales de Bibliotecas Universitarias: Redescubriendo la educación superior en la era del conocimiento
Lima, 29 de mayo de 2014
El contexto
El incremento de los datos ha crecido de forma exponencial en los últimos años. En la figura se muestra el crecimiento que ha tenido a nivel mundial sobre todo por la evolución
de dispositivos de almacenamiento, en la nube y por Internet.
Fuente: Dhar (2013)
Esta situación ha provocado un
gran impacto en la ciencia a través
de la gestión de datos derivados de investigaciones, la Big Data, la visualización de
datos, nuevos estilos de descripción de datos, entre
otros.
Cambios producidos por el uso de datos como soporte principal de la investigación
Data Journals
Repositorios de datos
Data Scientists
Data Curation
Visualización de datos
Databrarian Servidores de gestión de
datos
Objetivos de la presentación
• Determinar el estado de los datos abiertos en la investigación científica peruana.
• Comparar la realidad peruana con la realidad latinoamericana en relación a gestión de datos.
• Proponer iniciativas para armar un plan de gestión de datos en una institución de investigación.
Metodología
Se analizó los portales web de las siguientes entidades:
Ministerios Institutos de investigación estatales
(adscritas al sistema nacional de Ciencia y Tecnología)
Universidades (incluidas en el directorio de la ANR)
Organismos No Gubernamentales
• Fueron incluidos solo aquellos portales web que incluyeran datos derivados de investigación, que los datos estén disponibles sin restricciones y que se puedan descargar bajo algún formato.
• Los datos fueron recopilados en una tabla generada en Excel 2010 donde se generaron las gráficas correspondientes.
• En las bases de datos identificadas se evaluó el tipo de datos ofrecido, si contaba con licencia CC, el formato de datos, entre otros aspectos.
Instituciones que ofrecen datos abiertos derivados de investigación: Ministerios
En total se evaluaron los portales web de 18 ministerios
Se incluyeron en el estudio solamente a los portales que ofrecían datos derivados de investigación, no estadísticas diversas.
6%
94%
Ministerios que cuentan con datos abiertos
Datos abiertos
No tiene datos
El único ministerio que ofrece datos abiertos es el
Ministerio de Educación
Al hacer click a la opción Archivo de Datos se muestran
los 2 servicios ofrecidos por el
MINEDU
Ministerio de Educación
Datos derivados del Censo Escolar
Censo nacional de talla
Otros datos
Proyecto implementado en cooperación con el International
Household Survey Network (IHSN).
Instituciones de investigación gubernamentales que ofrecen datos abiertos derivados de investigación
En total se revisaron 19 portales web
INEI ofrece 2 servicios de datos
abiertos
El servicio ofrece 2 tipos de formato: uno para poder
procesar la documentación y otra para obtener
la descripción.
Universidades que ofrecen datos abiertos derivados de investigación
Ofrece datos abiertos derivados de investigaciones sociales realizados por el Instituto de Opinión Pública (IOP-Data)
Tiene restricciones en el acceso
Estado de los datos abiertos para la investigación en el Perú
Base de datos
Tipo de información
Institución Formato de descripciónde datos
LicenciasCCZero
Uso de estilo de citación
Declaración de re-uso de datos
UUEE Socio-económica
MINEDU International Household Survey Network (IHSN)
No No No
UUEE-Sistema de documentación virtual
Socio-económica
MINEDU International Household Survey Network (IHSN)
No No No
Microdatos Socio-económica
INEI No se especifica
No No No
ANDA Socio-económica
INEI No se especifica
No No No
IOP-Data Socio-económica
PUCP No se especifica
No No No
¿Por qué son importantes los datos para la investigación científica?
Grandes beneficios para el manejo de Big-Data
Permite respuestas rápidas a emergencias
Combate el fraude Estimula la novedad y la
colaboración creativa Fortalece la transparencia
ciudadana Respuestas eficientes a
cambios globales
Fuente: Boulton (2013)
Directrices para establecer un plan de gestión de datos científicos
• Revisar los Principios de Panthon
• Describir y procesar los tipos de datos, muestras, colecciones físicas, software, materiales curriculares y otros materiales que se produzcan en el curso de un proyecto o investigación;
• Establecer las normas que se utilizarán para los datos y el formato de metadatos y el contenido (donde las normas existentes están ausentes o se considere inadecuada, esto debe documentarse junto con las soluciones o remedios propuestos)
• Establecer las políticas de acceso y distribución incluyendo disposiciones para la protección adecuada de la privacidad, la confidencialidad, seguridad, propiedad intelectual u otros derechos o requisitos;
• Determinar las políticas y disposiciones para la reutilización, la redistribución, y la producción de derivados; y planes para el archivado de datos, muestras y otros productos de investigación, y para la preservación del acceso a los mismos.
Fuente: University of Alabama
Conclusiones
• El estado de la gestión de datos abiertos en la investigación en el Perú se encuentra en estado embrionario.
• Es necesario que las instituciones públicas comprendan que la apertura de datos es una condición propia de su esencia.
• Se deben implementar formatos de descripción de datos (por ejemplo: CSMD-CCLRC Core Scientific Metadata Model) y de citaciones de datos (por ejemplo: DataCite).
• Se debe comprender que el re-uso de datos permitirá no duplicar esfuerzos por investigar un tema teniendo en cuenta el presupuesto limitado para la investigación en el país.
• Las especialidades de Bibliotecología y CC.II. en el país deben adoptar programas para el manejo de gestión de datos no solo para la investigación sino también para cualquier ámbito.
MUCHAS GRACIAS POR SU ATENCIÓN
Carlos Quispe Gerónimo (MINEDU): [email protected]
Diana Balcázar Tafur (GRADE): [email protected]