Acceso AbiertoUna nueva generación deMétricas e Indicadores
Isidro F. AguilloCybermetricsLab
CCHS-CSIC
XI Jornadas Españolas de DocumentaciónZaragoza, 20-22 de Mayo 2009
www.webometrics.info
Agenda
www.webometrics.info
OAI – Segunda fase
• Las iniciativas OA avanzan (lentamente)– Mandatos institucionales para repositorios locales– Éxitos puntuales en ciertas disciplinas– Mayor flexibilidad por parte de las revistas (a pesar
del “gold model”, embargos, control de formatos)• Generar valor añadido a los repositorios
– Ir más allá del depósito de documentos– Primeras medidas encaminadas a la
interoperabilidad• Aceptación de estándares de metadatos
– Estadísticas de uso rudimentarias– Control de citas recibidas
• Estudios sobre ventajas de los repositorios en los procesos de citación (más citas y más rápidas)
www.webometrics.info
Modelo catalográfico
• La profesión bibliotecaria a la cabeza de la gestión de los repositorios– Desarrollo de estándares– Uso de herramientas FLOSS– “Aldeas galas” relevantes: Repositorios temáticos
• Resultados positivos– Recolectores (“harvesters”)
• Opciones muy limitadas
• Consecuencias negativas– Repositorios poco amigables a los motores de
búsqueda– Items individuales poco citables: URLs larguísimas– Recursos propios y ajenos mezclados, dando lugar a
categorías de repositorios confusas
www.webometrics.info
Repositometría
• Identificar usuarios finales– Bibliotecario/desarrollador– Gestores, responsables política científica– Científicos– Internautas
• Importancia del control métrico– Seguimiento del uso de los repositorios – Justificación interna de recursos invertidos– Información para la elaboración de políticas
científicas– Evaluación de visibilidad e impacto (calidad?)
• Individual
• Institucional
www.webometrics.info
Candidatos
• Indicadores bibliométricos– Actividad: Artículos depositados, distribución por
autor, institución, país, fecha, disciplina, (revista)– Visibilidad (impacto): Citas recibidas (Scielo)
• Indicadores cibermétricos (webométricos)– Actividad: Presencia en motores de búsqueda – Visibilidad
• Enlaces recibidos, PageRank
• Posicionamiento en motores: invocación
• Indicadores de uso – Visitas, visitantes, volcados– Referentes, referencias
www.webometrics.info
Necesidades técnicas
• Sistema gestor de estadísticas– Estándares– Bases de datos relacionales (autores, revistas, …)– Actualización automática
• Licencias– Conexión a bases de datos bibliométricas
• APIs– Conexión a motores de búsqueda
• Mash-up– Interfaz común integrado– Mecanismos de personalización (web 2.0)– Exportación/Generación de informes
www.webometrics.info
Estadísticas: Situación actual
• Números absolutos– Visitas, visitantes, volcados– Normalización– Consumo interno, publicidad externa– Limitado interés para científicos
• Viabilidad técnica– Programas para análisis de ficheros log
• No hay estándares, dificultades con los informáticos
– Códigos incrustados (interceptar visitas)• Google Analytics: Estándar de facto
– Complejidad técnica para control de volcados
• Muchas otras opciones: Acceso público
www.webometrics.info
Scielo
www.webometrics.info
E-LIS
www.webometrics.info
CiteSeer
1,400,000 articles27 million citations
www.webometrics.info
CiteBase
260,000 full-text records6 million references3 million Web download hits (uk.arXiv.org))
www.webometrics.info
Alexa :-(
• Limitaciones técnicas– Sólo posiciones (valores relativos)– Sólo dominios (todo incluido)
• Reparto por subdominios indicativo
– Otros datos• Enlaces recibidos (poco fiable?)
• Tiempo por visita
• Referentes y referencias
• Sesgos– Método/cobertura confidencial– Fácil de manipular– Evidentes sesgos geográficos
www.webometrics.info
Google Analytics :-0
• ¡Gratis!• Fácil de instalar• Muy potente• Difícil de configurar
– Especialmente para seguimiento de volcados– Automatización requiere conocimientos
informáticos• Estándar de facto (?)• Acceso privado• Sesgos
– Google principal referente– Cookies sospechosas
www.webometrics.info
Nuestra Propuesta
• CV virtual (solo sobre depósito)– Entradas por nombres normalizados (IRALIS)
• Sin datos personales (?)
– Visitas/Volcados• Mensuales, anuales, totales
– Citas Web, Enlaces Web• Motores, Google Scholar (PoP)
– Citas bibliométricas• Por años, totales
– Indicadores derivados: citas/art, índice h (similares)
• ¿Y los datos globales?– Desde recolectores, directorios y rankings
www.webometrics.info
Publish or Perish
www.webometrics.info
ISI ResearcherID
www.webometrics.info
Scopus AU-ID
www.webometrics.info
RePEc IDEAS
www.webometrics.info
Ranking Web
ReferendumVirtual
Páginas Trabajos
Enlaces Visitas
www.webometrics.info
¿y MESUR?
• Proyecto de Los Alamos National Laboratory (USA)– Métricas obtenidas de datos de uso
• … colecciones de revistas electrónicas (subscripción)
– Con el objetivo de analizar y describir los procesos de comunicación científica
• Resultados espectaculares– Indicadores de uso representan una nueva realidad– Sofisticada metodología
• Gravísimos peligros– Monopolio: Recursos ingentes necesarios para definir
escenarios globales– Colonialismo: Las fuentes son colecciones cerradas
controladas por editoriales, muy sesgadas. Usuarios USA
www.webometrics.info
Humor