Post on 19-Oct-2019
transcript
Datos Científicos y Transferencia de
Conocimiento
Ricardo Alía, Felipe Bravo
SmartOpenData
Instituto Nacional de Investigación y Tecnología Agraria y Alimentaria
Madrid, 29 de Octubre de 2015
Instituto Mixto Universitario de Gestión Forestal
Sostenible INIA-Uva
Importancia de los datos
procedentes de actividades de I+D+i • Se obtienen mediante metodologías reconocidas y
publicadas
• Son objeto de validación y verificación en distintas
etapas:
– Obtención
– Análisis estadístico
– Publicación de resultados
• Son contrastables
• Permiten avanzar en el conocimiento o generar valor
(e.g. patentes, registro variedades)
• No caducan => pueden ser re-analizados con otros
objetivos, incluidos en meta-análisis, etc.
Tipos de datos
• Datos brutos de resultados de mediciones
experimentales y de seguimiento científico (e.g. altura,
diámetro, genotipo)
• Datos elaborados a partir de estas mediciones (e.g.
series temporales de crecimiento, respuesta a factores)
• Datos de monitorización operativa en el sector
agroalimentario (e.g. Inventario Forestal, Clima,
Producciones,…)
• Datos georefenciados
Proceden/Se relacionan con
• Proyectos de I+D+i
• Publicaciones científicas
• Publicaciones técnicas
No se tratan de
una base de
datos única y
consistente
Pero..
• En I+D+i no todos los datos proceden de proyectos
de Investigación:
• Datos del inventario Forestal para desarrollo de
modelos de gestión, modelos de nicho de especies
forestales
• Redes de monitorizacion
• Estadisticas Forestales
• Proyectos de Ordenacion /Repoblacion
• => posibilidad de integrar datos de distintas fuentes o
en el tiempo
Ejemplos de integración de datos:
Recomendaciones de uso de MFR
• Catalogo Nacional de materiales de base
• Modelos climáticos (Gonzalo et al. 2010)
• Datos edáficos
• Datos genéticos (www.genfored.es)
• Datos fenotipicos
Necesidad de actualizar la información. Bases de datos
vivas.
Posibilidad de incorporar otras fuentes de información
(ej, experiencias repobladoras)
Nuevos productos contrastables por una metodologia
testada y pública
Ejemplos de integración de datos: IBERO-Modelo de crecimiento de árbol individual
• Datos del Inventario Forestal Nacional
• Red de parcelas permanentes de gestión forestal
• Integración de datos de ordenaciones y
aprovechamientos forestales
• Integración de herramientas open-acces: SIMANFOR y
CUBIFOR
• Posibilidad de integración futuras con datos abiertos:
LiDAR, Clima, Suelo,…
Las actividades de I+D+i contribuyen a
la mejora de bases de datos existentes • Distribución de especies forestales (distinción masas
naturales / repoblaciones)
• Determinación de edades y crecimientos en parcelas del
IFN
• Medición de otras variables en estas parcelas (ej.
producción de setas, fijación de carbono en suelo, datos
edáficos.
muchos de estos datos nunca son públicos o se
pierden
Los datos científicos para la
transferencia
• Una forma eficiente de transferir los resultados de I+D+i
es poner a disposición del sector los datos y
metodologías desarrolladas.
• ¿Debemos cambiar nuestro esquema de transferencia
para permitir que el sector pueda decidir en algunos
casos cuál es la información relevante?
Principales problemas
• Ausencia de repositorios públicos de datos de I+D+i
forestal
• No conexión con datos públicos mediaombientales (ej.
Banco de datos del patrimonio Natural): Ej, poblaciones
naturales vs repoblaciones, etc,
• Indefinición de la política de acceso y utilización de los
datos.
– Dudas sobre los derechos de propiedad sobre los
datos
– Ausencia de políticas de datos explicitas por parte de
las agencias financiadoras y de los centros de I+D+i y
las Universidades
– Riesgo de privatización posterior de los datos al ser
re-elaborados
Repositorio de datos
• Un repositorio es un sitio centralizado donde se almacena
y mantiene información digital, habitualmente bases de
datos o archivos informáticos.
• Los datos pueden distribuirse a través de una red
informática, como Internet, o de un medio físico, como un
disco compacto.
• Pueden ser de acceso público o estar protegidos y
necesitar de una autentificación previa.
• Depositar no debe confundirse con publicar. El depósito en
los repositorios es una manera de comunicar públicamente
los trabajos de los investigadores, aumentando su difusión.
• Los sistemas de repositorios suelen integrarse e
interoperar con otros sistemas y aplicaciones
¿Por qué hacen falta los
repositorios de datos científicos?
• Evitar la perdida de datos
• Evitar la redundancia en la toma de datos.
• Favorecer la investigación multidisciplinar (e.g.
gestión forestal multifuncional) mediante la incorporación
de datos existentes y mejorados por distintos grupos de
investigación
• Generar valor añadido a las investigaciones
realizadas mediante su utilización en otros contextos,
otras relaciones.
• Poner en valor las series de datos disponibles
La utilización de datos como
combustible del desarrollo
Los datos bien documentados son fuente de desarrollo
para el sector científico (Universidades, Centros de
Investigación)
Pero …
.. mas aun para otros usuarios finales:
Empresas de base tecnológica
Centros tecnológicos
que pueden re-utilizar estos datos con otros fines
Los repositorios públicos un problema
de política científica
• Ley de la ciencia. Artículo 37. Difusión en acceso
abierto.
1. Los agentes públicos del Sistema Español de
Ciencia, Tecnología e Innovación impulsarán el
desarrollo de repositorios, propios o
compartidos, de acceso abierto a las
publicaciones de su personal de investigación,
y establecerán sistemas que permitan
conectarlos con iniciativas similares de ámbito
nacional e internacional”.
• El programa H2020 ha establecido unas “Guidelines
on Open Access to Scientific Publications and
Research Data in Horizon 2020”.
Los repositorios públicos un problema
de política científica
• “paradoja del recolector de datos”: Si recoge datos
muy buenos puede publicar menos que utilizando
datos existentes ya obtenido por otros invesigadores
• Necesidad de integrar la obtención y difusión de
datos como un mérito científico
Política de publicación de datos
Ventajas de la publicación de datos
• Son datos publicados: se reconoce y cita la autoría.
• Tienen identificación para su uso
• Datos públicos
• Posibilidad de uso a largo plazo (según un estudio
cada año se pierde el acceso a 17% de los datos
obtenido por contacto a los autores)
• Reconocer a los autores que realmente obtienen los
datos y desarrollan los protocolos de toma de datos
Política de publicación de datos
Inconvenientes
• Necesidad de tiempo para documentar los datos:
Para evitar esta dificultad, sería necesario valorar
este trabajo (el sistema de valoración de
productividad debería considerar la publicación de
datos en repositorios públicos, y también se debería
incluir como requisito de proyectos la convocatoria la
necesidad de subir los datos a un repositorio publico)
• Resistencia de algunos investigadores (uso libre de
los datos).
• Necesidad de desarrollar políticas de buenas
prácticas incluyendo salvaguardas para los
estudiantes en formación
Dryad , LabArchives.. E
jem
plo
de r
epositori
o
de
da
tos
Red de Excelencia Evoltree
● Repositorio de datos de ISS (Intensive Sampling
Sites)
● Datos georeferenciados relacionados con todos los
datos disponibles en estos sitios de muestreo
Eje
mplo
de r
epositori
o
de
da
tos
Eje
mplo
de r
epositori
o
de
da
tos
eResearch Archive
¿Hacia un repositorio de datos medio-
ambientales-forestales-
agroalimentario?
Com
ponente
s
po
sib
les
● Repositorio de proyectos y resultados de proyectos forestales
● Repositorio de datos forestales- Combinación con otros organismos/entidades
● Artículos y Datos de Publicaciones científicas
● Data Journal (complementa las revistas. Permite animar a publicar los datos al ser un sistema internacionalmente reconocido)
● Bases datos de los grupos de Investigación (e.g. GENFORED, SELVIRED, Recursos Genéticos Forestales, Herbario, Identificación maderas, Suelos)
¿Hacia un repositorio de datos? Administración General del Estado
MINECO:
- MINECO- Direccion General de Investigacion Cientifica y Técnica
o Datos de resultados de proyectos agroalimentarios dependientes del Plan
Nacional
o Datos de resultados de proyectos agroalimentarios dependientes de
proyectos Europeos
- CSIC
o Datos de resultados de proyectos agroalimentarios
o Repositorio de datos agroalimentarios (Comprobar si existe)
o Publicaciones Agroalimentarias
MAGRAMA.
- Banco de datos de la Naturaleza
o Mapa Forestal de España
o Inventario Forestal Nacional
o Mapa de Propiedades y Montes
o Parques Naturales y Zonas protegidas
o Catálogo de Materiales de Base
o Mapas de Regiones de Procedencia
o Mapa de Zonas de Utilización de MFR
o Registro de Unidades de Conservación de Recursos Genéticos
o Mapa de Suelos Forestales
o Datos climáticos
o Red de seguimiento de daños en los bosques
o Estadística Forestal
- Oficina de Variedades Vegetales
o Registro de Variedades Vegetales
- Direccion General de Desarrollo Rural
o SIGPAC. Cartografía Básica.
Comunidades Autónomas
- Centre Tecnológic de Catalunya
- CREAF
- CETEMAS
- CITA
- CIFA-Lourizan
- IRTA
o Repositorio de publicaciones agroalimentarias
o Repositorio datos agroalimentarios
Universidades
Sociedades Científicas
Otros??
Posib
les f
uente
de
da
tos
¿Hacia un repositorio de datos? P
ublic
acio
nes
cie
ntíficas
● Repositorios de artículos científicos (open-access) y de monografías (e.g. Forest systems, Cuadernos de la SECF)
● Exigir la publicación de datos?
● Crear un Data Journal Forestal?
¿Hacia un repositorio de datos? R
edes d
e e
nsayos
¿Hacia un repositorio de datos? F
edera
ció
n d
e
serv
idore
s
El repositorio a
desarrollar sería el
resultado de federar
múltiples repositorios
existentes mediante
la recolección de
metadatos y la
centralización de los
mismos junto al
sistema de búsqueda
y navegación
correspondiente.
Nuevos métodos. Nuevas necesidades
• Debemos prepararnos para poder utilizar bases de
datos masivas
• Solo una visión integrada nos puede permitir
aprovechar el potencial del uso de datos para
abordar los retos del sector forestal
• Pero unos estándares de datos de calidad requiere
un esfuerzo de todos los agentes implicados y un
reconocimiento
• Nuevos métodos de investigación y análisis de datos
requieren nuevos métodos en política científica
¡Gracias!
Felipe Bravo
Universidad de Valladolid
Avda. Madrid s/n
E-34004 Palencia, España
e-mail: fbravo@pvs.uva.es
Página electrónica: http://www.research4forestry.org
Ricardo Alía
INIA-CIFOR
Avda. A Coruña s/n
E-28040 Madrid, España
e-mail: alia@inia.es