FACULTAD DE TELEMÁTICAdigeset.ucol.mx/tesis_posgrado/Pdf/LUIS_ENRIQUE_ROSAS_GONZAL… ·...

transcript

UNIVERSIDAD DE COLIMA

FACULTAD DE TELEMÁTICA

“Administración de Repositorios Institucionales

Híbridos de Acceso Abierto”

QUE PARA OBTENER EL GRADO DE

MAESTRO EN COMPUTACIÓN

Presenta:

Luis Enrique Rosas González

ASESORES:

D. en C. María Andrade Aréchiga

D. en C. Nicandro Farías Mendoza

Colima, Col. Febrero de 2012

Dedicatoria y agradecimientos

Quiero dedicar este trabajo a todas las personas que me han apoyado a lo largo de mi

trayectoria académica y que han hecho posible que yo haya llegado hoy aquí.

Agradezco en primer lugar a Dios por darme el entendimiento, la fuerza y entereza necesarios

para lograr una meta más en mi vida.

A mis padres y hermanos que siempre confiaron en mí e incondicionalmente me han brindado

toda la ayuda que he necesitado.

Quiero agradecer especial y sinceramente a mis asesores, la doctora María Andrade Aréchiga

y el doctor Nicandro Farías Mendoza por darme el honor de ser protagonista de este trabajo,

por su ayuda puntual y por supervisar con profesionalismo el progreso del mismo.

A mis maestros por transmitirme algo de su vasto conocimiento que estoy seguro me será de

mucha utilidad en mi desempeño profesional y personal.

A mis compañeros con quienes intercambié conocimientos y experiencias que nunca olvidaré.

A mis auténticos amigos con los que he pasado ratos maravillosos y que se han mantenido

interesados en cada proyecto de mi vida.

Por todos ustedes vale la pena seguir adelante.

Enrique

ÍNDICE

Dedicatoria y agradecimientos ......................................................................................... ii

Índice ............................................................................................................................... iii

Índice de figuras ...............................................................................................................vi

Índice de tablas .............................................................................................................. viii

Resumen ...........................................................................................................................ix

Abstract .............................................................................................................................. x

I.- CAPÍTULO 1. Introducción ..................................................................................... 1

1.1.- Contexto del problema ..................................................................................... 1

1.2.- Antecedentes del problema .............................................................................. 2

1.3.- Síntesis de trabajos relacionados ..................................................................... 3

1.4.- Planteamiento del problema ........................................................................... 5

1.5.- Objetivos .......................................................................................................... 6

1.6.- Métodos empleados ......................................................................................... 6

1.7.- Organización del documento ......................................................................... 11

II.- CAPÍTULO 2. Estado del Arte ............................................................................ 13

2.1.- Marco histórico .............................................................................................. 13

2.2.- Marco contextual ........................................................................................... 16

2.3.- Marco teórico ................................................................................................. 17

2.3.1.- Repositorios Institucionales .............................................................. 17

2.3.2.- Metadatos .......................................................................................... 18

2.3.3.- Dublín Core ....................................................................................... 19

2.3.4.- Protocolo OAI-PMH ......................................................................... 21

2.3.5.- XML .................................................................................................. 32

2.3.6.- PHP .................................................................................................... 33

2.3.7.- MySQL .............................................................................................. 34

2.3.8.- Servidor Apache ................................................................................ 36

2.3.9.- HTML ................................................................................................ 36

III.- CAPÍTULO 3. Análisis del Sistema .................................................................... 38

3.1.- Descripción de la metodología ...................................................................... 38

3.2.- Requerimientos de usuario............................................................................. 43

3.2.1.- Servicios que brinda el sistema al usuario......................................... 43

3.3.- Requerimientos de sistema ............................................................................ 44

3.3.1.- Servicios requeridos por el sistema ................................................... 45

IV.- CAPÍTULO 4. Diseño de Sistema ........................................................................ 48

4.1 Diseño del Interfaces ........................................................................................ 48

4.2 Diseño de la base de datos ............................................................................... 51

V.- CAPÍTULO 5. Implementación y Pruebas ........................................................... 56

5.1 Implementación de interfaces .......................................................................... 56

5.2 Pruebas del sistema .......................................................................................... 61

5.3 Discusión .......................................................................................................... 66

VI.- CAPÍTULO 6. Conclusiones ................................................................................. 68

Trabajo futuro......................................................................................................... 69

ANEXO ........................................................................................................................ 70

Referencias ................................................................................................. 76

ÍNDICE DE FIGURAS

Figura 1. Incremento de Repositorios Institucionales. ...................................................... 4

Figura 2. Diagrama conceptual del esquema propuesto .................................................... 7

Figura 3. Ejemplo de un metadato estructurado en XML. .............................................. 10

Figura 4. Comparativa entre las tres diferentes versiones del protocolo OAI-PMH ....... 25

Figura 5. Implementación más común del protocolo OAI-PMH. ................................... 27

Figura 6. Implementación con un agregador de servicios intermedio. ............................ 28

Figura 7. Combinación de diferentes protocolos. ............................................................ 28

Figura 8. Interacción entre un proveedor de datos y un proveedor de servicios. ............ 29

Figura 9. Modelo de peticiones y respuestas utilizando OAI-PMH. ............................... 30

Figura 10. Control de flujo entre proveedores de datos y servicios. ............................... 31

Figura 11. Diagrama de la metodología empleada. ......................................................... 38

Figura 12. Ontología del esquema propuesto .................................................................. 41

Figura 13. Interacción entre el sistema y el usuario final. ............................................... 44

Figura 14. Interacción entre el usuario y el sistema. ....................................................... 46

Figura 15. Proceso de diseño de interfaces de usuario. ................................................... 48

Figura 16. Esquema de la interfaz principal. ................................................................... 49

Figura 17. Estructura en MySQL de la tabla de metadatos ............................................. 52

Figura 18. Interfaz principal del sistema. ........................................................................ 53

Figura 19. Interfaz del centro de investigación de ingenierías. ....................................... 54

Figura 20. Opción de acceso al sistema. .......................................................................... 56

Figura 21. Formulario de registro de material bibliográfico 1/2. .................................... 57

Figura 22. Formulario de registro de material bibliográfico 2/2. .................................... 58

Figura 23. Notificación de registro exitoso. .................................................................... 59

Figura 24. Notificación de registro erróneo..................................................................... 60

Figura 25. El proceso de pruebas..................................................................................... 61

Figura 26. El proceso de pruebas de defectos ................................................................. 63

Figura 27. Estructura en MySQL de la tabla de investigadores. ..................................... 70

Figura 28. Estructura en MySQL de la tabla de noticias y boletines informativos. ....... 71

Figura 29. Interfaz de captura de investigadores 1/2 ....................................................... 72

Figura 30. Interfaz de captura de investigadores 2/2 ....................................................... 73

Figura 31. Interfaz de captura de noticias o boletines informativos ................................ 74

ÍNDICE DE TABLAS

Tabla 1. Campos del estándar de generación de metadatos Dublín Core........................ 19

Tabla 2. Servicios que brinda el sistema al usuario. ........................................................ 43

Tabla 3. Requerimientos del sistema. .............................................................................. 46

Tabla 4. Tabla de pruebas realizadas al sistema .............................................................. 64

Resumen

Hoy en día, cada institución educativa y científica se debe mantener en comunicación, con la

finalidad de compartir, generar o renovar conocimientos. En este trabajo se describe el

desarrollo de un esquema para la administración de Repositorios Institucionales en ambientes

operativos y de ejecución abiertos, a través de la aplicación del protocolo OAI-PMH. Para

lograr los objetivos de este trabajo, se utilizaron métodos de cosecha y recolección de

metadatos para la difusión y transferencia de información, siempre bajo contextos abiertos.

Las aportaciones buscadas con este trabajo son principalmente la colaboración constante entre

diferentes instituciones educativas para compartir, generar o renovar conocimientos; así como

también ofrecer al usuario que lo deseé, información variada, confiable y actualizada. Algo del

sistema. También se describe el desarrollo de una plataforma Web para implementar la

metodología propuesta en el proyecto así como las pruebas realizadas al mismo y sus

respectivos resultados.

Abstract

Today every educational and scientific institution should be kept communicated in order to

share, generate or renovate knowledge. This paper describes the development of a

management scheme for Institutional Repositories in operating environments and open design,

through the implementation of the OAI-PMH protocol. To achieve the objectives of this paper,

were used methods of harvesting and collection of metadata for information dissemination and

transfer, always under open contexts. Contributions sought with this paper are primarily the

ongoing collaboration between different educational institutions to share, build or renovate

knowledge; as well as offering the user who wants to, reliable and updated information. It also

describes the development of a Web platform to implement the methodology proposed

in the project and the same tests and their results.

CAPÍTULO 1. Introducción

En este capítulo se exponen brevemente el contexto del problema, la justificación, los

objetivos y algunos conceptos que sirven de fundamento científico a la investigación y

muestran la importancia de la misma.

1.1 Contexto del problema

En los siguientes párrafos se explica la problemática que se aborda con la investigación

mostrando las deficiencias que existen en el sistema científico actual respecto al

procedimiento de consulta e intercambio de material científico entre distintas instituciones y

dependencias.

Para las instituciones educativas y científicas, es importante mantener una buena

comunicación con otras instituciones o sistemas, con la finalidad de compartir, generar o

renovar conocimientos.

Por lo general, las investigaciones producen tesis, memorias, artículos de investigación,

reportes técnicos, entre otros productos de investigación generados en diferentes Instituciones

educativas. Estos productos se conservan en las mismas sin difundirse y sólo consultadas -en

el mejor de los casos- por académicos, investigadores y estudiantes de la misma Institución.

Esto impacta directamente en el desarrollo y generación de conocimiento nuevo, en casos en

los que en una Institución se desarrollan proyectos o investigaciones idénticos a los ya

existentes en otra, que lejos de tratarse de plagio, se debe en gran medida al desconocimiento

de la existencia de dicho proyecto por la falta de difusión brindada al mismo. Esto a su vez

implica pérdida de tiempo y recursos al desarrollar una investigación que ya existe en alguna

otra Institución, mismos que bien, pueden emplearse para continuar con dicha investigación o

en su caso para realizar una investigación nueva, generando de esta forma conocimiento

nuevo.

1.2 Antecedentes del problema

En esta sección se explican los procedimientos de consulta e intercambio de información

científica que surgieron con la aparición de Internet, así como algunas iniciativas previas al

movimiento Open Access que dieron como resultado el surgimiento del mismo.

Con el surgimiento de Internet se abrieron nuevas posibilidades de comunicación, situación

que aprovecharon los investigadores para acelerar el intercambio de datos e ideas con pares

incluso de otros países, utilizando tecnologías como el correo electrónico o los protocolos de

transferencia de archivos (FTP).

El intercambio de material así como el de resultados o avances de investigaciones, se realizaba

ajeno a la visión de las editoriales, quienes se habían mantenido en esta tarea desde su

aparición. Las visiones eran divididas, pues había quienes veían esto con ilusión y otros con

inquietud. Las mismas universidades e instituciones de investigación comenzaron a debatir

sobre el existente sistema que según Keefer (2007) consistía en:

La inversión económica de sus investigaciones mediante los sueldos de sus científicos

y docentes.

La entrega de sus resultados científicos a los editoriales de manera totalmente gratuita.

La inversión que efectuaban las instituciones científicas mediante las suscripciones a

las revistas donde se publicaban los resultados de sus propias investigaciones.

Algunas de las iniciativas previas al movimiento Open Access y a la implantación de los

primeros repositorios institucionales fueron:

El archivo de preprints arXiv es un archivo creado en 1991 donde los físicos

depositan sus trabajos preliminares para luego ser leídos y comentados por los

miembros que así lo deseen (CUL, 2010).

La SPARC (Scholary Publishing and Academic Resources Coalition) es una

asociación creada en 1997 con el propósito de concientizar a la comunidad científica

sobre la necesidad de impulsar la aparición de nuevos modelos de comunicación

académica para difundir la investigación científica y reducir las presiones financieras

provocadas por las revistas donde eran publicados sus trabajos (SPARC, 2010).

La PLoS (Public Library of Science) es una organización sin fines de lucro conformada

por científicos de diversas áreas de conocimiento buscando hacer de la literatura

científica mundial un recurso público (PLoS, 2010).

1.3 Síntesis de trabajos relacionados

En esta sección se presentan algunos trabajos de investigación relacionados con Repositorios

Institucionales así como sus principales resultados o aportaciones.

En su trabajo, Santillan (2009) demuestra la importancia y utilidad de los Repositorios

Institucionales en el proceso de divulgación de información, especialmente a través de

bibliotecas digitales, basándose como caso de estudio en el proyecto E-LIS (E-prints in

librarianship and information science).

El autor afirma que las universidades, por su carácter de productoras y consumidoras de

información, son las más interesadas en el desarrollo y florecimiento del acceso abierto y

prueba de ello es el reciente aumento en el desarrollo de Repositorios Institucionales por parte

de las mismas, como se refleja en el ROAR (Registry of Open Acces Repositories) y cuyo

comportamiento se muestra en la figura 1.

Figura 1. Incremento de Repositorios Institucionales (ROAR, 2011).

Santillan menciona también que estos repositorios son la prueba fehaciente del impacto

positivo del Open Access como alternativa al sistema tradicional de comunicación científica y

como vía para la integración de los países en desarrollo al circuito mundial de la información y

el conocimiento.

Por otro lado, Chawner (2005) menciona y utiliza un modelo para la clasificación del tipo de

software utilizado en la implementación de repositorios institucionales y bibliotecas digitales,

obteniendo como resultado que la mayoría del software libre enfocado a la operación de este

tipo de servicios está siendo desarrollado a muy pequeña escala en comparación con otros

proyectos de desarrollo de software llevados a cabo por bibliotecas privadas más grandes que

a menudo reciben apoyos de organismos de investigación.

Las estadísticas obtenidas por la autora evidencian la necesidad de desarrollar aplicaciones

para repositorios institucionales, sin embargo, no propone ningún método o proyecto para

llevarlo a cabo.

A su vez, Nikolov y Stoehr (2008) exponen algunas estadísticas que evidencian la “muerte” de

millones de artículos científicos en internet, debido a que muchos autores no almacenan sus

trabajos en repositorios institucionales, sino que lo hacen en páginas personales o servidores

públicos donde corren el riesgo de perderse debido a la constante inestabilidad de las

tecnologías utilizadas. Una de sus estadísticas más relevante expone que cerca del 11% de las

URL’s de los documentos PDF que contienen referencias a las publicaciones de ciencias de la

vida, no eran accesibles dentro de los 5 meses después de haber sido cosechados. Al mismo

tiempo proponen la cosecha de metadatos como una forma de abordar este problema y como

factor crucial para preservar la literatura científica en línea.

Sin embargo, los autores sólo se enfocan en la problemática y las estadísticas y no mencionan

algún método o esquema para implementar las cosechas que proponen.

1.4 Planteamiento del problema

En esta sección se plantea de manera específica la problemática que se aborda y se pretende

resolver con esta investigación en particular.

Hoy en día cada institución educativa y científica se debe mantener en comunicación, con la

finalidad de compartir, generar o renovar conocimientos. Los investigadores, por ejemplo, al

momento de desarrollar proyectos se ven obligados a consultar información de diferentes

fuentes (libros, revistas, tesis, memorias, etc.); este proceso de consulta resulta con frecuencia

frustrante ya que el acervo inverosímil que transita en Internet expone, en su mayoría,

suposiciones no comprobadas como datos importantes.

En contraste con lo mencionado anteriormente, el hecho de apoyarse en material científico

respaldado por investigadores reconocidos garantiza que las ideas ahí expuestas han sido

probadas y sus resultados y conclusiones son reales.

Por lo expuesto en los párrafos previos, resulta de gran importancia una colaboración

constante entre instituciones y dependencias para compartir fuentes de información que

incrementen el acervo bibliográfico y así dar un soporte significativo a los investigadores que

buscan referencias bibliográficas para dar fundamento a sus proyectos. Sin embargo, al menos

en la Universidad de Colima, se carece de un sistema o esquema de administración de

repositorios eficiente que permita el intercambio y difusión de material bibliográfico de

calidad científica en Internet.

1.5 Objetivos

Desarrollar un esquema de administración de repositorios institucionales híbridos capaz de

ofrecer, intercambiar y difundir material bibliográfico en Internet con la participación de

diferentes instituciones educativas y de investigación de forma libre y abierta.

Los objetivos específicos son:

Implementar un módulo para la conectividad entre repositorios institucionales y

bibliotecas digitales en la Web.

Representar la información del material bibliográfico a transmitir en forma de

metadatos Dublín Core a través de XML.

Desarrollar un módulo para cosechar y exportar metadatos entre los Repositorios

Institucionales y Bibliotecas Digitales implicadas.

Diseñar un buscador para localizar de manera rápida y eficiente documentos

bibliográficos en la Web.

1.6 Métodos empleados

En esta sección se explican los métodos empleados para lograr los objetivos de esta

investigación.

Para lograr los objetivos buscados se utilizan métodos de intercambio de información a través

de internet enfocándonos específicamente en cosecha y recolección de metadatos

estructurados en XML bajo el estándar de generación de metadatos Dublín Core apegándose

en todo momento a la aplicación del protocolo OAI-PMH (Open Access Initiative Protocol for

Metadata Harvesting).

En la figura 2 se muestra el diagrama conceptual del esquema propuesto en este proyecto y su

descripción se hace en los párrafos siguientes.

Figura 2. Diagrama conceptual del esquema propuesto

Interfaz: Uno de los factores más importantes a tomar en cuenta en el desarrollo de un

sistema de información son las interfaces, las cuales deben ser amigables y atractivas hacia el

usuario para que este se interese en el sistema y realice sus actividades con interés y de forma

intuitiva. Si una interfaz es relativamente compleja, el usuario puede rehusarse a usarla por

temor a equivocarse o simplemente provocará errores debido a la confusión que la interfaz le

cause.

A lo largo de la historia de la informática han ido apareciendo diferentes tipos y estilos de

interfaz de usuario dependiendo, sobre todo, de la capacidad gráfica de los ordenadores

(Alonso et al., 2005).

La interfaz de usuario es en la mayoría de los casos el componente más crítico del sistema.

Los usuarios generalmente no entienden sobre el mundo interno de los ordenadores, que se

compone de bits, bytes, ficheros, circuitos, entre otros. Es más, conocen el sistema por medio

de su interfaz, el texto, las imágenes o los sonidos que aparecen en los dispositivos de salida

del sistema en cuestión (pantallas, altavoces, etc.). Los usuarios sólo son capaces de explotar

las posibilidades que la tecnología ofrece si sus interfaces transmiten dichas posibilidades

(Saltivery et al., 2005).

En esta propuesta, la interfaz de usuario pretende ser relativamente simple pero sin descuidar

con ello el potencial que el sistema puede tener. El usuario se encontrará ante una interfaz

amigable capaz de ofrecerle el material bibliográfico que busca de manera intuitiva y simple.

Así mismo, la interfaz también le ofrece al usuario la posibilidad de realizar búsquedas

avanzadas con la finalidad de obtener resultados más específicos en cuanto al tipo, enfoque,

área de conocimiento, etc. del material buscado.

Almacenamiento: La cuestión del almacenamiento es crucial para el éxito del proyecto. Es en

este bloque donde se almacenan los metadatos de todo el material bibliográfico disponible en

sus respectivos repositorios.

Un repositorio no es más que el lugar donde reside una determinada información utilizada para

fines operativos. Dicha información puede ser de cualquier tipo, por ejemplo de clientes,

productos o como en este caso, de material bibliográfico (Croxatto, 2005).

La función de los repositorios en el presente proyecto reside en almacenar los metadatos de

todo el material disponible para consulta manteniéndolos siempre ordenados y clasificados.

Los repositorios de metadatos se mantendrán actualizados haciendo cosechas de metadatos en

repositorios externos en la Web con determinada frecuencia, usando los bloques de

Interoperabilidad y Comunicación descritos en los párrafos siguientes.

Interoperabilidad: La interoperabilidad semántica o interoperabilidad de los metadatos está

destinada a la descripción de los recursos de información para facilitar el intercambio de

información y la recuperación óptima por parte de los usuarios. En este ámbito se suelen

utilizar un conjunto de herramientas para la representación del conocimiento contenido en los

recursos, generalmente provenientes del ámbito de la documentación y la gestión del

conocimiento, como son: los vocabularios controlados, los metadatos, las ontologías y los

topic maps.

Los metadatos son un conjunto de elementos que poseen una semántica comúnmente

aceptada, ya que surgieron por la necesidad de recuperar la información electrónica dispersa

(Martínez y Navarra, 2007).

XML (Extensible Markup Language o lenguaje de anotación extensible, por sus siglas en

inglés) ofrece un formato para la descripción de datos estructurados, Es decir, XML es un

metalenguaje, dado que con él podemos definir nuestro propio lenguaje de presentación y, a

diferencia del HTML, que se centra en la representación de la información, XML se centra en

la información en sí misma. La particularidad más importante del XML es que no posee

etiquetas prefijadas con anterioridad, ya que es el propio diseñador el que las crea a su antojo,

dependiendo del contenido del documento (Arellano et al., 2009).

En la figura 3 se muestra un ejemplo de un metadato con etiquetas Dublín Core estructurado

en XML.

Los principales objetivos que se buscan con la implementación de XML como lenguaje de

marcado son (Ayllón Bonet, 2006):

Representar y distribuir tanto documentos como información textual.

Intercambio de datos e información estructurada a través de Internet y WWW.

Integración de datos procedentes de fuentes heterogéneas.

Eliminar la barrera entre información estructurada e información textual.

Figura 3. Ejemplo de un metadato estructurado en XML.

Comunicación: La comunicación implica la recíproca relación con mensajes, es decir, con

contenidos de comunicación que representan precisamente a la información; en otras palabras,

la información es el contenido de la comunicación.

A través del bloque de Comunicación el sistema se mantendrá en contacto constante con otras

instituciones educativas a través de la Web para compartir e intercambiar información

bibliográfica confiable de manera abierta y libre.

Al sistematizar cada uno de los bloques mencionados queda conformado el esquema propuesto

para administrar Repositorios Institucionales híbridos en Internet bajo contextos abiertos,

logrando nuestro propósito de ofrecer, intercambia y difundir material bibliográfico en internet

a través de diferentes Repositorios de Instituciones o dependencias educativas y científicas

<?xml versión=”1.0”?>

<!DOCTYPE MENSAJE SYSTEM “metadato.dtd”>

<título> Administración de Repositorios Institucionales Híbridos de Acceso Abierto

</título>

<descripción> Propone un esquema para la administración de Repositorios

Institucionales Híbridos de Acceso Abierto a través de la aplicación del protocolo OAI-

PMH </descripción>

</contenido>

<creador> Rosas G., Andrade A., Farías M.</creador>

<colaborador>Universidad de Colima</colaborador>

</propiedad intelectual>

<aplicación>

<fecha> Enero 24, 2011 </fecha>

</aplicación>

</metadato>

Actualmente existen varios estándares para la generación de metadatos, sin embargo, se optó

por el uso del Dublín Core por ser éste uno de los más flexibles y relativamente fáciles de

implementar.

Se contactó al CGIC (Centro General de Investigación Científica) con el propósito de contar

con su apoyo e idear algún método para facilitar el proceso de recopilación de material

científico de investigadores de la U de C y ponerlo a disposición del usuario en general.

Para el correcto funcionamiento y optimización del sistema se requiere firmar convenios con

otras dependencias o centros de investigación que estén interesados en participar en la

iniciativa de archivos abiertos con el propósito de compartir e intercambiar material científico

de forma libre y abierta logrando una mayor disponibilidad de información.

1.7 Organización del documento

El documento está organizado de la siguiente manera, en el capítulo II se presenta la situación

actual y tendencias en cuanto a repositorios institucionales y el movimiento Open Access, se

exponen también sucesos históricos importantes como la declaración de Budapest y su

influencia vital para el florecimiento y desarrollo de nuevos repositorios institucionales; se

describen también términos inherentes al tema, tales como metadatos, el estándar Dublín Core

y el protocolo OAI-PMH.

En el capítulo III se describe en profundidad el análisis y la metodología empleada en el

desarrollo del sistema utilizando métodos de ingeniería de software tales como diagramas de

requerimientos de usuario y modelos de desarrollo de sistemas.

En el capítulo IV se describe el procedimiento de diseño del sistema luego del análisis

realizado previamente y se incluyen algunas interfaces gráficas diseñadas tomando en cuenta

los requerimientos y el perfil del usuario final.

En el capítulo V se describe el procedimiento de implementación del esquema a través de un

sistema o plataforma de software, así como las pruebas hechas al mismo y sus respectivos

resultados.

En el capítulo VI se describen las conclusiones y resultados generales de la investigación,

también se verifica si se alcanzaron los objetivos planteados desde el principio y se propone el

trabajo a futuro.

CAPÍTULO 2. Estado del Arte

En este capítulo se presenta la situación actual y las tendencias en cuanto a Repositorios

Institucionales y el movimiento Open Acces, se exponen sucesos históricos importantes como

la declaración de Budapest por ejemplo, también se describe brevemente lo que son los

metadatos, el estándar de metadatos Dublín Core y el protocolo OAI-PMH.

2.1 Marco histórico.

En esta sección se exponen acontecimientos históricos importantes que precedieron a la

aparición del movimiento Open Access que tiene como filosofía el acceso gratuito y sin

restricciones al conocimiento científico.

La declaración de Budapest llevada a cabo en 2001 fue considerada como el inicio oficial del

movimiento Open Access. Esta declaración expone diferentes puntos de vista, tanto de

científicos como académicos de diferentes instituciones académicas y científicas,

compartiendo similares posturas sobre la crisis de las revistas científicas y buscando

colectivamente el acceso gratuito y sin restricciones al conocimiento científico.

Los resultados de la convención de Budapest propusieron dos métodos para asegurar la acción

del movimiento Open Access (Hagemann, 2002):

1) La ruta dorada, que consiste en la publicación de artículos en revistas de acceso

abierto.

2) La ruta verde, que consiste en depositar los artículos en repositorios por parte del

mismo autor, lo que se conoce como autoarchivo.

Es evidente que la ruta verde es la mejor opción para lograr implementar al máximo la

filosofía del Open Access, debido a que los autores pueden seguir publicando sus trabajos en

cualquier tipo de revistas incluyendo las de paga, y al mismo tiempo es posible el acceso libre

a estos trabajos mediante la versión depositada en un repositorio.

En un principio, los investigadores que pretendían colaborar con el movimiento Open Access

no tenían dónde depositar sus trabajos para compartirlos con los demás y la única alternativa

para muchos de ellos era depositar sus trabajos en servidores personales o públicos, donde

podían ser accedidos libremente desde internet. Sin embargo, este método no garantizaba la

permanencia ni la interoperabilidad entre diferentes sistemas y plataformas.

La declaración de Budapest creó un gran impacto en la comunidad científica y motivó el

desarrollo de repositorios institucionales. Según el estudio de Swan y Brown (2005), en los

años posteriores a la declaración de Budapest entre 2003 y 2004, se detectó un aumento

internacional hasta del 100% en el número de repositorios institucionales existentes.

Aún cuando uno de los objetivos más trascendentales del movimiento Open Access es el

acceso público y libre a los repositorios institucionales, no todos estos lo ofrecen, incluso

varios de ellos pertenecientes a importantes instituciones, generalmente universidades, lo que

pretenden es disponer de un lugar seguro para depositar sus recursos digitales, sean científicos

o no, dejando como factor secundario el tema del acceso libre. Debido a esto, los repositorios

institucionales existentes varían unos de otros en algunos factores como:

Su finalidad

El tipo de material admitido

Los formatos mantenidos

Los procesos aplicados

El control de acceso

La permanencia de los recursos

Aún cuando el movimiento Open Access ha tenido una notable relevancia y su filosofía ha

sido respaldada por miles de científicos y académicos alrededor del mundo, la mayoría de los

repositorios institucionales existentes actualmente están todavía en fase de desarrollo y

muchos de ellos, incluso algunos de los más antiguos, tienen relativamente pocos documentos

en relación a la producción digital mundial de las instituciones. Por ejemplo, según un estudio

realizado por la ARL (Association of Research Libraries) aplicado en 37 instituciones con un

repositorio funcional, revela que sus contenidos varían entre 20 y 19,000 recursos digitales

(Keefer, 2007).

Un factor fundamental para poder alcanzar los objetivos del movimiento Open Access es sin

duda la colaboración de los autores. Los beneficios para éstos son varios, entre los más

relevantes destacan:

Mayor acceso a documentos científicos sin restricciones.

Mayor visibilidad de sus documentos.

Mayor estabilidad para la permanencia o manejo de sus documentos.

Mayor número de citas en publicaciones.

A pesar de los evidentes beneficios que el Open Access ofrece a los autores, resulta

sorprendente y a la vez alarmante, tanto para los simpatizantes del movimiento como para las

instituciones de investigación, la falta de participación por parte de este grupo. En opinión de

Keefer (2007), algunos de los factores que contribuyen a la resistencia de algunos autores para

involucrarse a participar en el movimiento Open Access y negarse a depositar sus trabajos en

repositorios institucionales son:

Desconocimiento del movimiento Open Access.

Desconocimiento de los procedimientos del autoarchivo.

Falta de tiempo para hacerlo.

Falta de medios para hacerlo.

Indiferencia a los posibles beneficios.

Resistencia a los cambios de procedimientos.

Resistencia a los cambios tecnológicos.

Resistencia a un nuevo sistema.

Resistencia a la obligación de archivar su trabajo (en instituciones que exigen el

autoarchivo a sus investigadores).

Miedo a la pérdida del control de su obra y al posible plagio.

Miedo a entrar en conflicto con el editor.

Desacuerdo con la filosofía Open Access.

Desacuerdo con la idea de compartir abiertamente su trabajo.

Las instituciones deben combatir los problemas existentes para que los repositorios puedan

seguir creciendo. El uso e inversión de un repositorio debe ser siempre justificado, un

repositorio sin signos de éxito dejará de ser mantenido por la institución y perderá el apoyo

para garantizar su mantenimiento a mediano o largo plazo.

2.2 Marco contextual.

La revolución tecnológica que se ha dado recientemente ha motivado la creación y difusión de

todo tipo de información. El desarrollo de Internet en los años 70 y su libre acceso a principios

de los 90, aunado al fuerte impulso que le dio a éste el WWW (World Wide Web), provocó un

fuerte impacto en todos los ámbitos mundiales y marcó un antes y un después en cuanto a los

métodos de intercambio de información, especialmente entre la comunidad científica (Keefer,

2007).

Hoy en día, gracias a las tecnologías de información, es posible facilitar actividades que en un

principio (antes de Internet) parecían utópicas. Ahora la comunidad científica es capaz de

mantenerse al día en cuanto a conocimientos e ideas con relativa sencillez y los estudiantes e

investigadores de todos los niveles tienen acceso a una cantidad de información que hasta hace

años era inimaginable.

En esta nueva era, las distancias han dejado de representar un problema. Ahora es posible

acceder a todo tipo de información desde prácticamente cualquier parte del mundo venciendo

las barreras geográficas. En ese sentido, un punto importante es la educación a distancia -con

investigadores, profesores y alumnos distribuidos geográficamente- que demanda la creación y

preservación de espacios electrónicos informativos comunes y compartidos (López, 2000).

López (2000) considera que las bibliotecas que han sido automatizadas están siendo

transformadas o complementadas implementando bibliotecas digitales, bajo el concepto

general de recopilar, almacenar y organizar información de manera digital. Esto con el

propósito de realizar búsquedas, recuperaciones y procesamientos vía las redes de cómputo;

todo bajo un ambiente sencillo para el usuario y tomando en cuenta factores fundamentales

como la presentación y la representación de la información, los mecanismos de

almacenamiento y recuperación, la interacción humano-computadora, la plataforma

tecnológica y el ancho de banda de la red.

2.3 Marco teórico.

En esta sección se describen los conceptos y tecnologías existentes relacionadas con esta

investigación.

2.3.1 Repositorios Institucionales

El desarrollo de repositorios digitales en el seno de las instituciones académicas es una

necesidad que gana cada vez mayor importancia no sólo para difundir la producción

corporativa, es decir, los contenidos culturales, científicos técnicos y divulgativos de los

miembros de una institución, sino también para poder disponer de sistemas que permitan su

reaprovechamiento en la propia institución, así como de un mecanismo eficaz para facilitar su

gestión. Todo ello tiene lugar en un contexto en el que la producción académica ya se expresa

en medios digitales que requieren de nuevos mecanismos y prácticas para facilitar su gestión y

administración.

Como se ha mencionado antes, los repositorios institucionales es una de las dos vías, la

llamada ruta verde, vías que se están desarrollando para llevar a cabo el movimiento Open

Access al conocimiento, es decir, hacer disponibles en Internet la literatura científica para que

cualquier usuario pueda reutilizarla (leerla, descargarla, copiarla, distribuirla, imprimirla). La

segunda vía, la dorada, se basa en publicar los artículos en revistas de acceso abierto. Por lo

que se refiere a la publicación en repositorios como complemento a la publicación en las

revistas tradicionales, cabe destacar que el número de nuevos repositorios va en creciente

evolución.

Aún cuando el acceso abierto a la información científica es actualmente el principal motivo

para el desarrollo y florecimiento de repositorios institucionales, en realidad, éstos ya van más

allá del propio movimiento para consolidarse como plataformas útiles para las instituciones

que los promueven y convirtiéndose un completo entorno de gestión para la producción

científica de las mismas. Los principales objetivos de los repositorios son: aumentar la

visibilidad de la propia organización y de sus autores, incrementar el impacto de los resultados

de la institución –especialmente los que emanan de las actividades de investigación-, acelerar

la eficiencia del progreso de la ciencia y mejorar la evaluación y la administración de la

actividad científica. Quizás uno de los aspectos que más ha influido en la creación de

repositorios institucionales ha sido el incremento de precios de las revistas científicas así como

la creciente importancia de la investigación y de su difusión en la sociedad (Vives et al.,

2009).

2.3.2 Metadatos

Según Voutssás (2005), Un metadato es un elemento que describe el contenido, condiciones,

características, etcétera, de un documento, con el fin de definir, identificar, organizar, indizar,

filtrar, colocar, preservar, recuperar y administrar ese documento como una parte de un

conjunto ordenado de recursos de información, ya sean electrónicos o no. Por otro lado,

Martínez y Navarra (2007) consideran que los metadatos son un conjunto de elementos que

poseen una semántica comúnmente aceptada, que surgieron de la necesidad de recuperar la

información electrónica dispersa.

Para Voutssás (2005) los metadatos pueden crearse para describir los atributos inherentes de

un recurso documental cualquiera que este sea: objeto bibliográfico (libro revista, tesis,

etcétera), registros e inventarios archivísticos, entre los más comunes.

2.3.3 Dublín Core

Para generar metadatos es necesario apegarse a algún estándar de metadatos bien definido para

lograr una homogeneidad y estructura organizada en la información que se transmite (IEEE,

2010). Dublín Core es uno de los estándares de metadatos de mayor aplicación y que ha dado

lugar incluso a otros formatos. El modelo de metadatos Dublín Core es un esfuerzo

internacional e interdisciplinar abocado a definir el conjunto de elementos básicos para

describir los recursos electrónicos y facilitar su recuperación (DCMI, 2010).

El estándar Dublín Core consta de quince campos subdivididos en tres grupos: Contenido,

Propiedad intelectual y Aplicación, los cuales se encuentran resumidos en la tabla 1.

Tabla 1. Campos del estándar de generación de metadatos Dublín Core

CONTENIDO PROPIEDAD INTELECTUAL APLICACIÓN

Título (Title). Creador (Creator). Fecha (Date).

Materia (Subject). Editor (Publisher). Formato (Format).

Descripción (Description). Colaborador (Contributor). Identificador (Identifier).

Fuente (Source). Derechos (Rights). Tipo (Type).

Relación (Relation). Lenguaje (Language).

Cobertura (Coverage).

Enseguida se describen brevemente cada una de las etiquetas que conforman el estándar de

generación de metadatos Dublín Core.

- Contenido. En este grupo se encuentran siete campos que describen el contenido de los

datos, éstos son:

Título (Title). Se refiere al título que lleva por nombre el documento.

Materia (Subject). En este campo se hace referencia a los diversos temas que puede

contener el material.

Descripción (Description). Se hace un breve resumen sobre el contenido del objeto

digital.

Fuente (Source). Es como una pequeña ficha bibliográfica que se elabora para asentar

los datos sobre la procedencia del documento original.

Relación (Relation). Este campo tiene que ver con el material principal u objetos de su

misma referencia, ya sea una colección, una serie, un documento, etcétera.

Cobertura (Coverage). Este campo se refiere al proyecto o sitio donde estará

resguardada la información. Aquí pueden anotarse fechas o zonas geográficas por

ejemplo.

- Propiedad Intelectual. En este grupo se encuentran cuatro campos que se encargan de

describir los datos referentes al creador del objeto o recurso en cuestión, éstos son:

Creador (Creator). Aquí se anota el autor intelectual de la obra o documento original.

Editor (Publisher). Este campo se refiere al sitio o colección responsable, a la que está

adscrito el material.

Colaborador (Contributor). En este campo se anotan, si es que se da el caso, el nombre

u organización que contribuyó a la creación del material, que no se especificó en la

parte de Creador.

Derechos (Rights). Se anota en este campo el nombre o la institución a la cual

pertenece el material y lo facilitó.

- Aplicación. En este grupo se encuentran cinco campos que describen datos referentes la

creación y origen del objeto o recurso en cuestión, éstos son:

Fecha (Date). Se anota la fecha de elaboración del registro.

Formato (Format). En este campo se registra el tipo de extensión con que se presenta

el objeto digital, ya sea HTML, JPG, GIFF o PDF.

Identificador (Identifier). Se refiere a la dirección electrónica de origen a la que está

adscrito el material. Para ello se utilizan las siglas URL.

Tipo (Type). Aquí se menciona la presentación que tiene el objeto digital, ya sea como

texto, audio, video, etcétera.

Lenguaje (Language). En este campo se establecen las siglas correspondientes al

idioma en que se presenta la publicación.

2.3.4 Protocolo OAI-PMH

El protocolo para la transmisión de contenidos en internet OAI-PMH (Open Access Initiative

– Protocol for Metadata Harvesting) consiste en una interfaz sencilla que se utiliza para

acceder a la información bibliográfica disponible en un archivo o repositorio. Se creó con la

misión de desarrollar y promover estándares de interoperabilidad para facilitar la difusión

eficiente de contenidos en Internet (OAI, 2008). Utiliza transacciones HTTP para emitir

preguntas y obtener respuestas entre un servidor o archivo y un cliente o servicio recolector de

metadatos donde el cliente puede pedir al servidor que le envíe metadatos según determinados

criterios, como por ejemplo la fecha de creación de los datos. En respuesta, el servidor

devuelve un conjunto de registros en formato XML, incluyendo identificadores (URL’s por

ejemplo) de los objetos descritos en cada registro.

Búsquedas simultáneas y recolección de metadatos

Las ideas previas al surgimiento del protocolo OAI-PMH demandaban alternativas viables que

proporcionaran al investigador y al usuario final la mejor opción para depositar y consultar

trabajos científicos. Finalmente, después de mucho debatir, se propusieron dos alternativas:

Búsquedas simultáneas.

Recolección de metadatos.

Las búsquedas simultáneas planteaban la posibilidad de explorar paralelamente diferentes

servidores de datos utilizando un procedimiento determinado o algún tipo de protocolo para

obtener resultados, sin embargo la experiencia de los expertos sobre las búsquedas simultáneas

revelaba que éstas no eran del todo viables dado que la velocidad del proceso de búsquedas de

este tipo se ve reducida en relación a la velocidad misma de cada uno de los servidores

implicados en ella, entonces, cuanto mayor fuese el número de servidores implicados en las

búsquedas simultáneas mayor sería la probabilidad de encontrar servidores con un pobre

rendimiento y esto a su vez implicaría que la búsqueda simultánea no fuese eficiente.

A su vez, la diferencia de tecnologías utilizadas entre distintos servidores y la falta de

interoperabilidad entre los mismos, generaría resultados inconsistentes e inesperados en

algunos casos; eso sin mencionar que sería difícil desarrollar una interfaz de navegación

eficiente dado que los objetos de búsqueda por los que sería necesario navegar estarían

distribuidos en diferentes servidores.

Al analizar las desventajas que implicaban las búsquedas simultáneas, los expertos

consideraron que la mejor solución sería reunir todos los registros de material científico en un

solo lugar y optaron por implementar la recolección de metadatos.

La recolección de metadatos consiste en crear una colección de recursos conformada a partir

de una recopilación de metadatos obtenidos desde diferentes servidores, de esta manera el

número de servidores a consultar se reduciría a uno, mejorando significativamente el

rendimiento de las búsquedas. Así mismo, al enfocarse en un solo servidor, es mucho más

sencillo crear una interfaz de navegación venciendo la barrera de la interoperabilidad, así

también el proceso de ordenación de recursos se realiza de una manera más eficiente.

Proveedores de datos y proveedores de servicios

En todo este entorno de intercambio de contenidos en Internet existen dos actores

fundamentales:

Los proveedores de datos.

Los proveedores de servicios.

Los proveedores de datos son aquellos que contienen y resguardan los contenidos

estandarizados. Estos proveedores de datos son los encargados de organizar los metadatos de

sus repositorios para ser puestos a disposición de los proveedores de servicios. Los

proveedores de datos son los encargados de garantizar la permanencia y conservación de los

metadatos y mantenerlos siempre disponibles para su recolección en Internet.

A su vez, los proveedores de servicios son aquellos que acceden a los proveedores de datos

para recolectar sus metadatos y a su vez, utilizan los metadatos recolectados para ofrecer

servicios. Estos servicios pueden ser variados, sin embargo, uno de los servicios más comunes

que ofrecen los proveedores de datos es el de búsquedas a través de una interfaz de usuario.

Cabe mencionar que un proveedor puede jugar los dos papeles, es decir, puede funcionar

como proveedor de datos y como proveedor de servicios a la vez. Dicho en otras palabras, un

proveedor funciona de ambas maneras cuando es capaz de ofrecer metadatos para ser

recolectados (proveedor de datos) y cuando ofrece servicios al usuario final utilizando

metadatos (proveedor de servicios).

El factor clave y desafiante en este entorno fue el hecho de idear una nueva arquitectura que

no sólo ofreciera interfaces para actores humanos, sino que además las ofreciera también para

máquinas recolectoras de metadatos, de esta manera se han podido crear interfaces para

usuario humanos y a la vez, interfaces para máquinas que pueden recolectar metadatos de

otros proveedores utilizando sus propias interfaces.

Versiones de OAI-PMH

Para definir una versión inicial del protocolo OAI-PMH los expertos de la OAI (Open Access

Initiative) debatieron y expusieron diferentes alternativas y puntos de vista con el objetivo de

encontrar la manera más eficiente de facilitar la recolección de metadatos entre diferentes

proveedores en Internet. Al final del debate, todos coincidieron en que debía existir un acuerdo

claro en cuanto a (Carpenter, 2003):

Un protocolo de transporte (HTTP o FTP, por ejemplo).

Un formato de metadatos (MARC o Dublín Core, por ejemplo).

Una base para el control de calidad de los metadatos (conjunto de elementos

obligatorios, convenciones sobre nombres y materias, etc.).

Propiedad intelectual y derechos de uso (¿quién puede hacer qué con qué?).

El acuerdo conjunto de los expertos respecto a los cuatro puntos fundamentales mencionados

arriba, permitió desarrollar una primera versión del protocolo para la recolección de metadatos

en Internet, esta primera versión fue llamada “Convenio de Santa Fe”, haciendo referencia al

lugar de encuentro de los expertos donde se consolidó este acuerdo.

En la figura 4 se muestra una comparativa entre los diferentes versiones del protocolo OAI-

PMH desde su primera versión llamada “Convenio de Santa Fe” hasta la versión 2.0 vigente

hasta ahora. Las marcas rojas indican las diferencias significativas entre cada una de las

versiones del protocolo.

Figura 4. Comparativa entre las tres diferentes versiones del protocolo OAI-PMH (Carpenter, 2003)

Como se mencionó antes, la “Convención de Santa Fe” fue la primera versión implementada

del protocolo OAI-PMH y tenía como objetivo primordial mejorar las búsquedas de material

científico autoarchivado por los mismos autores.

El siguiente paso en el desarrollo del protocolo OAI-PMH fue la versión 1.0 que incluyó, entre

sus principales mejoras, la implementación de Dublín Core no cualificado como el estándar de

metadatos mínimo para garantizar la interoperabilidad entre metadatos a transmitir utilizando

este protocolo. Otro diferencia sustancial respecto a la primera versión del mismo, fue un

cambio en el enfoque para facilitar ya no sólo la búsqueda de material autoarchivado por los

autores, sino también de todos aquellos “objetos tipo documento” (Carpenter, 2003). Se

trataba de una especificación de interoperabilidad sencilla que pretendía únicamente ofrecer

una alternativa para la recolección de metadatos, por lo cual, no proporcionaba soporte para

búsquedas; es decir, se enfocaba solamente al aspecto de recolección de metadatos entre los

repositorios de los proveedores de datos en Internet. A partir de esta versión se usó ya el

nombre oficial del protocolo: “el protocolo OAI-PMH”.

La versión OAI-PMH 1.1 no fue más que una corrección de la versión 1.0 donde se incluyeron

los cambios de XML schema que los proveedores de datos utilizaban para enviar sus

respuestas a los proveedores de servicios. Cabe mencionar que tanto la versión 1.0 y la 1.1

fueron solamente de propósito experimental.

La versión más reciente del protocolo OAI-PMH es la 2.0 que implicó una revisión más

intensa y minuciosa de las versiones anteriores, tal fue la intensidad y corrección respecto a las

versiones anteriores, que la 2.0 no es compatible con ellas. Una vez más se amplió el enfoque

del protocolo y ahora se dice que se trata “el intercambio recurrente de metadatos de recursos

entre distintos sistemas” (Carpenter, 2003). La versión 2.0 del protocolo sigue siendo una

especificación de interoperabilidad de bajo nivel basado en la recolección de metadatos en

Internet.

A partir de la versión 2.0 el protocolo OAI-PMH deja de ser una versión experimental y se

convierte en una versión estable, así mismo la OAI se ha comprometido a que las versiones

posteriores del protocolo sean compatibles hacia atrás (Carpenter, 2003).

Flexibilidad de implementación

OAI-PMH permite ser implementado de distintas maneras dependiendo de los objetivos y

necesidades de cada caso. Permite ser implementado de manera relativamente sencilla y

flexible dado que es un protocolo basado en HTTP y XML, tecnologías totalmente

compatibles con la Web.

Aún cuando los metadatos y el texto completo de los recursos que éstos describen son por lo

general puestos a disposición de manera libre, esto no es necesariamente un requisito. Existen

escenarios en los que el protocolo OAI-PMH puede utilizarse entre grupos cerrados como por

ejemplo en la distribución de metadatos de aplicaciones comerciales (Carpenter, 2003).

Enseguida se muestran algunos diagramas que muestran diferentes formas en que sistemas

basados en el protocolo OAI-PMH pueden configurarse.

Entre los diferentes tipos de implementación del protocolo, podemos encontrar tres de los más

usuales, el primero y más común de ellos es aquel en el que varios proveedores de servicios

pueden recolectar metadatos de varios proveedores de datos. Un ejemplo de este tipo de

implementación se muestra en la figura 5.

Figura 5. Implementación más común del protocolo OAI-PMH (Carpenter, 2003).

Otra tipo de implementación existente es aquella en la que un agregador de servicios se sitúa

de manera intermedia entre proveedores de servicios y proveedores de datos actuando de

ambas maneras. En la figura 6 se muestra un ejemplo de este tipo de implementación.

Una tercera implementación y la más rara de encontrar en un sistema funcional real es aquella

donde se combinan diferentes protocolos de transmisión de contenidos. Es raro encontrarse

con una implementación real de este tipo ya que por lo general se utiliza sólo un protocolo de

transmisión para evitar problemas de incompatibilidades entre los mismos. En la figura 7 se

muestra un ejemplo de este tipo de implementación.

Figura 6. Implementación con un agregador de servicios intermedio (Carpenter, 2003).

Figura 7. Combinación de diferentes protocolos (Carpenter, 2003).

Como podemos darnos cuenta, la flexibilidad del protocolo OAI-PMH ofrece varias

posibilidades de implementación y es quizá esta característica la que lo posiciona como uno de

los protocolos de transmisión de contenidos que han ganado mayor popularidad en los últimos

años.

Funcionamiento de OAI-PMH

En la figura 8 se muestra un diagrama básico del funcionamiento del protocolo OAI-PMH

donde se puede observar la interacción y el flujo de información entre un proveedor de datos y

un proveedor de servicios.

Figura 8. Interacción entre un proveedor de datos y un proveedor de servicios (Carpenter, 2003).

En el diagrama se observa cómo el proveedor de servicios llama al proveedor de datos usando

peticiones HTTP, en estas peticiones el proveedor de servicios le pide al proveedor de datos

que le envíe los metadatos que cumplan con ciertos parámetros enviados junto con las

peticiones HTTP, en caso de que no existan dichos parámetros, el proveedor de datos

entenderá que debe enviar toda la colección de metadatos existente en sus repositorios.

Evidentemente este procedimiento de envío total de metadatos se puede complicar en casos en

los que la colección de metadatos de un determinado proveedor de datos sea demasiado grande,

sin embargo el protocolo también ofrece una alternativa a este posible problema de control de

flujo utilizando señales de reanudación entre proveedores de datos y proveedores de servicios.

El tema de control de flujo se detalla más adelante.

Modelo estructural

El proceso de peticiones y respuestas entre proveedores de servicios y proveedores de datos

utilizando el protocolo OAI-PMH es relativamente sencillo. En la figura 9 se muestra un

modelo estructural que denota cómo se lleva a cabo dicho proceso en el que un proveedor de

servicios realiza peticiones a varios proveedores de datos de diferentes áreas de interés y

recibe respuestas a sus peticiones tomando en cuenta los parámetros especificados

inicialmente.

Como se ha mencionado antes, el protocolo OAI-PMH está basado en HTTP, por lo tanto los

parámetros de las peticiones que realiza el proveedor de servicios a los proveedores de datos

se proporcionan como parámetros GET o POST.

Figura 9. Modelo de peticiones y respuestas utilizando OAI-PMH (Carpenter, 2003).

En la figura se muestran también los seis tipos de peticiones (también llamadas verbos) que

soporta el protocolo OAI-PMH. Estas peticiones son (Carpenter, 2003):

Identify (Solicita le descripción de un archivo).

ListMetadataFormats (Recupera los formatos de metadatos disponibles de un

proveedor de datos).

ListSets (Recupera la estructura de organización de un proveedor de datos).

ListIdentifiers (Recupera sólo las cabeceras de los registros de un proveedor de

datos).

ListRecords (Recolecta registros de un proveedor de datos).

GetRecord (Recupera los metadatos de un registro individual de un proveedor de

datos).

Las respuestas a todas las peticiones están estructuradas con XML. El formato de metadatos

Dublín Core es el estándar mínimo para garantizar la interoperabilidad entre sistemas que

utilicen OAI-PMH, sin embargo este protocolo admite cualquier tipo de formato de metadatos

siempre y cuando éstos estén estructurados con XML.

Control de flujo

Cuando un proveedor de datos cuenta con una amplia colección de metadatos y todos éstos

son recolectados por algún proveedor de servicios, el tráfico en la red puede ser crítico y

garantizar la transferencia de todos ellos no sería posible sin una buena gestión del control de

flujo.

En la figura 10 se muestra un ejemplo del control de flujo de metadatos existente entre un

proveedor de servicios y un proveedor de datos al momento de una petición que devuelve una

cantidad considerable de metadatos.

Figura 10. Control de flujo entre proveedores de datos y servicios (Carpenter, 2003).

Como se muestra en la figura, la gestión del control de flujo es útil en listados largos donde se

utilizan señales de reanudación para llevar un orden y un control adecuados minimizando de

esta manera la generación de errores durante el proceso de recolección de metadatos.

2.3.5 XML

XML (Extensible Markup Language o lenguaje de anotación extensible) es un lenguaje de marcas que

ofrece un formato para la descripción de datos estructurados. Es decir, XML es un metalenguaje, dado

que con él podemos definir nuestro propio lenguaje de presentación y, a diferencia del HTML, que se

centra en la representación de la información, XML se centra en la información en sí misma. La

particularidad más importante del XML es que no posee etiquetas prefijadas con anterioridad, ya que

es el propio diseñador el que las crea a su antojo, dependiendo del contenido del documento. XML es

un formato basado en texto, específicamente diseñado para almacenar y transmitir datos. Un

documento XML se compone de elementos XML, cada uno de los cuales consta de una etiqueta de

inicio, de una etiqueta de fin y de los datos comprendidos entre ambas etiquetas. Al igual que los

documentos HTML, un documento XML contiene texto anotado por etiquetas. Sin embargo, a

diferencia de HTML, XML admite un conjunto ilimitado de etiquetas, no para indicar el aspecto que

debe tener algo, sino lo que significa (Arellano, et al., 2009).

Objetivos y orígenes de XML

XML fue desarrollado por un grupo de trabajo bajo los auspicios del consorcio World Wide

Web (W3C) a partir de 1996. Este fue constituido en 1994 con el objetivo de desarrollar

protocolos comunes para la evolución de Internet. Se trata de un consorcio de la industria

internacional con sedes conjuntas en el Instituto Tecnológico de Massachussets, de Estados

Unidos, el Instituto Nacional de Investigación en Informática y Automática europeo y la Keio

University Shonan Fujisawa Campus de Japón. El W3C tiene como misión la publicación para

uso público de protocolos o estándares globales de uso libre. Al comenzar el proyecto, los

objetivos planteados por el grupo de desarrollo del XML fueron diez puntos (Arellano, et al.,

2009).

1. XML debe ser directamente utilizable sobre Internet.

2. XML debe soportar una amplia variedad de aplicaciones.

3. XML debe ser compatible con SGML.

4. Debe ser fácil la escritura de programas que procesen documentos XML.

5. El número de características opcionales en XML debe ser absolutamente mínimo,

idealmente cero.

6. Los documentos XML deben ser legibles por los usuarios de este lenguaje y

razonablemente claros.

7. El diseño de XML debe ser formal, conciso y preparado rápidamente.

8. XML debería ser simple pero perfectamente formalizado.

9. Los documentos XML deben ser fáciles de crear.

10. La brevedad en las marcas XML es de mínima importancia.

2.3.6 PHP

PHP (Hipertext Preprocessor o Preprocesador de hipertexto) es un lenguaje de scripting

embebido en HTML. Mucha de su sintaxis es tomada de C, Java y Perl con un par de

características adicionales únicas y específicas de PHP. El propósito del lenguaje es permitir

que los desarrolladores web escriban páginas generadas dinámicamente con rapidez. El fácil

uso y la similitud con los más comunes lenguajes de programación estructurada, como el C y

el Perl, permiten a la mayoría de los programadores experimentados crear aplicaciones

complejas con una curva aprendizaje muy suave. También les permite envolverse con

aplicaciones de contenido dinámico sin tener que aprender todo un nuevo grupo de funciones

y prácticas. Su interpretación y ejecución se da en el servidor en el cual se encuentra

almacenada la página y el cliente sólo recibe el resultado de la ejecución. Cuando el cliente

hace una petición al servidor para que le envíe una página web, enriquecida con código PHP,

el servidor interpretará las instrucciones mezcladas en el cuerpo de la página y las sustituirá

con el resultado de la ejecución antes de enviar el resultado a la computadora del cliente (Cobo

et al., 2005).

Una característica importante de PHP es su independencia de plataforma, es decir, se puede

ejecutar en cualquier sistema operativo actual, tales como Windows, UNIX, Linux y Mac OS

X. PHP también puede acoplarse a los servidores Web más comúnmente usados.

2.3.7 MySQL

MySQL es uno de los Sistemas Gestores de bases de Datos (SQL) más populares desarrolladas

bajo la filosofía de código abierto. Se puede decir también que MySQL es un gestor de base de

datos sencillo de usar e increíblemente rápido. También es uno de los motores de base de

datos más usados en Internet, la principal razón de ésto es que es gratis para aplicaciones no

comerciales. La desarrolla y mantiene la empresa MySql AB pero puede utilizarse

gratuitamente y su código fuente está disponible (Ullman, 2006).

Características de MySQL

Inicialmente, MySQL carecía de elementos considerados esenciales en las bases de datos

relacionales, tales como integridad referencial y transacciones. A pesar de ello, atrajo a los

desarrolladores de páginas web con contenido dinámico, justamente por su simplicidad;

aquellos elementos faltantes fueron llenados por la vía de las aplicaciones que la utilizan. Poco

a poco los elementos faltantes en MySQL están siendo incorporados tanto por desarrollos

internos, como por desarrolladores de software libre. Entre las características disponibles en

las últimas versiones se destacan (Converse et al., 2004):

Amplio subconjunto del lenguaje SQL. Algunas extensiones son incluidas

igualmente.

Disponibilidad en gran cantidad de plataformas y sistemas.

Diferentes opciones de almacenamiento según si se desea velocidad en las

operaciones o el mayor número de operaciones disponibles.

Transacciones y claves foráneas.

Conectividad segura.

Replicación.

Pero principalmente:

Es un gestor de base de datos. Una base de datos es un conjunto de datos y un gestor de

base de datos es una aplicación capaz de manejar este conjunto de datos de manera

eficiente y cómoda.

Es una base de datos relacional. Una base de datos relacional es un conjunto de datos

que están almacenados en tablas entre las cuales se establecen unas relaciones para

manejar los datos de una forma eficiente y segura. Para usar y gestionar una base de

datos relacional se usa el lenguaje estándar de programación SQL.

Es Open Source. El código fuente de MySQL se puede descargar y está accesible a

cualquiera, por otra parte, usa la licencia GPL para aplicaciones no comerciales.

Es una base de datos muy rápida, segura y fácil de usar. Gracias a la colaboración de

muchos usuarios, la base de datos se ha ido mejorando optimizándose en velocidad.

Por eso es una de las bases de datos más usadas en Internet.

Existe una gran cantidad de software que la usa.

2.3.8 Servidor Apache

El servidor HTTP Apache es un servidor HTTP de código abierto para plataformas Unix (BSD,

GNU/Linux, etcétera), Windows y otras, que implementa el protocolo HTTP/1.1 (RFC 2616)

y la noción de sitio virtual. Cuando comenzó su desarrollo en 1995 se basó inicialmente en

código del popular NCSA HTTPd 1.3, pero más tarde fue reescrito por completo. Su nombre

se debe a que originalmente Apache consistía solamente en un conjunto de parches a aplicar al

servidor de NCSA. Era, en inglés, a patchy server (un servidor parcheado). Apache presenta

entre otras características mensajes de error altamente configurables, bases de datos de

autenticación y negociado de contenido, pero fue criticado por la falta de una interfaz gráfica

que ayude en su configuración. Apache es el servidor Web hecho por excelencia, su

configurabilidad, robustez y estabilidad hacen que cada vez millones de servidores reiteren su

confianza en este programa (Gilmore, 2008).

2.3.9 HTML

HTML son las siglas de "HyperText Mark-up Language". "Mark-up" es un término de

imprenta que significa el conjunto de instrucciones estilísticas detalladas escritas en un

manuscrito que debe ser tipografiado. Así, HTML podría ser traducido como "Lenguaje de

Formato de Documentos para Hipertexto". HTML es una aplicación de SGML, un lenguaje

muy general para definir lenguajes de formato de documentos. A principios de 1993 había

alrededor de 50 servidores. Existían básicamente dos tipos de browsers: el original, gráfico,

pero sólo para plataformas NeXT, y el browser en modo de línea, preparado para cualquier

plataforma pero muy limitado y muy poco atractivo. En Febrero del 93 se lanzó la primera

versión alfa del navegador "Mosaic for X", desarrollado en el NCSA (National Center for

Supercomputing Applications, Centro Nacional para Aplicaciones de Supercómputo).

Funcionaba en X Windows, que era una plataforma popular entre la comunidad científica. En

Abril del 93 el tráfico de la WWW era el 0.1% del total de Internet. El CERN declaraba la

WWW como tecnología de acceso gratuito. En septiembre ya había versiones de Mosaic para

PC y Macintosh. El tráfico alcanzaba el 1% de todo el tráfico de Internet y había más de 500

servidores (Castro, 2003).

En este capítulo se exhibió una visión general de la situación actual y las tendencias en cuanto

a Repositorios Institucionales y el movimiento Open Access, se explicó la declaración de

Budapest como el suceso detonante del movimiento Open Access, también se describió

concisamente lo que son los metadatos, el estándar de generación de metadatos Dublín Core y

el protocolo OAI-PMH.

En el siguiente capítulo se describe en profundidad el análisis y la metodología empleada en el

desarrollo del sistema utilizando métodos de ingeniería de software tales como diagramas de

requerimientos de usuario y modelos de desarrollo de sistemas.

CAPÍTULO 3. Análisis del Sistema

En este capítulo se describe la metodología empleada para el desarrollo del sistema utilizando

métodos de Ingeniería de Software tales como diagramas de requerimientos de usuario y

modelos de desarrollo de sistemas, así como también las variables adecuadas para el diseño

del sistema.

3.1 Descripción de la metodología

A continuación se describe la metodología seguida para lograr nuestro principal objetivo de

implementar una confiable cosecha y recolección de metadatos a través de diferentes

repositorios institucionales en internet.

En la figura 11 se muestra un diagrama de la metodología seguida para lograr los objetivos

planteados al principio, y enseguida se hace su respectiva descripción.

Figura 11. Diagrama de la metodología empleada.

Representar

metadatos a

través de XML

Garantizar la

conectividad

entre diferentes

Cosechar y

exportar

metadatos entre

diferentes RI

Implementar un

buscador de

material

bibliográfico

Representar metadatos a través de XML.- Como lo establece el protocolo OAI-PMH y

dado que XML es actualmente el lenguaje líder para la transferencia de datos en Internet, para

compartir los metadatos propios del sistema es necesario estructurarlos y estandarizarlos

implementando XML.

Para lograrlo, en el caso de esta investigación, se desarrolló un módulo capaz de generar un

metadato Dublín Core por cada registro de material científico almacenado en la base de datos.

Dicha conversión se llevó a cabo siguiendo las especificaciones marcadas por el estándar de

generación de metadatos Dublín Core. Una vez estructurados los metadatos, estos son

almacenados en un repositorio del servidor donde se encuentran disponibles para ser

recolectados por otros cosechadores y recolectores de metadatos, también llamados

proveedores de servicios.

Garantizar la conectividad entre diferentes RI.- Evidentemente en una red pueden surgir

diferentes tipos de errores, uno de los más comunes es la desconexión o la pérdida de enlace

entre dos o más nodos. Sin embargo este tipo de problemas están fuera de nuestro control y en

estos casos, lo mejor que podemos hacer es implementar procedimientos a seguir en caso de

que ocurra una eventualidad de este tipo para recuperarse con el menor daño o pérdida posible

en casos en los que se está haciendo una cosecha remota, por ejemplo.

En estos casos resulta útil emplear especificaciones de control de flujo como las mencionadas

en la descripción del protocolo OAI-PMH en el capítulo 2.

Cosechar y exportar metadatos entre diferentes RI.- Es en este punto donde realmente

entra en acción el protocolo OAI-PMH. Es aquí donde los proveedores de datos y los

proveedores de servicios interactúan entre sí conforme al protocolo OAI-PMH para brindar

sus servicios respectivos. El proveedor de datos, quien es responsable de resguardar y

garantizar la permanencia vigente de una determinada colección de metadatos, debe ser capaz

de poner dicha colección de metadatos a disposición de los proveedores de servicios quienes

se dedican a recolectar metadatos y usarlos para brindar servicios al usuario final.

Con base en lo antes mencionado, el sistema desarrollado en esta investigación tiene las

siguientes funcionalidades:

Proveedor de datos que ofrece a otros proveedores de servicios, material científico

creado por investigadores de la Universidad de Colima.

Proveedor de servicios capaz de acceder a los proveedores de datos de otras

organizaciones e instituciones científicas.

Implementar un buscador de material bibliográfico.- Como se ha mencionado antes y dado

que el sistema desarrollado es también un proveedor de servicios, éste es capaz de brindar

funcionalidades al usuario final empleando los metadatos propios y los cosechados de otros

proveedores de datos.

Uno de los servicios fundamentales con los que cuentan la mayoría de los proveedores de

servicios es la posibilidad de brindarle al usuario final la oportunidad de buscar metadatos en

base a determinados parámetros definidos por las necesidades particulares de cada uno de

ellos. Es un hecho que sin la implementación de un buen buscador, un proveedor de servicios

es incapaz de explotar todas sus posibilidades.

Dada la importancia que tiene en un proveedor de servicios, el sistema desarrollado fue

provisto de un buscador donde el usuario final puede acceder y consultar los metadatos tanto

de la Universidad de Colima como de otras organizaciones e instituciones científicas

obteniendo información científica confiable de libre acceso y respaldada por investigadores

reconocidos.

En la Figura 12 se muestra la ontología de material científico usada en este proyecto y su

descripción se hace en los párrafos siguientes.

La ontología muestra como nodo jerárquico un repositorio institucional Green Access que

ofrece un conjunto de servicios que una o varias instituciones ofrecen a los miembros de su

comunidad para la gestión y la difusión de los materiales digitales creados por la misma

institución y su comunidad de miembros, el cual se divide a su vez en dos tipos de trabajos de

investigación: científica y académica.

Figura 12. Ontología del esquema propuesto

Según Velez (2001) la investigación científica es el proceso sistemáticamente ordenado, cuyo

objetivo es la demostración de hipótesis o la confirmación y desarrollo de teorías. Ésta

comprende trabajos como:

Artículos científicos: Robert Day (2005) define el artículo científico como un

informe escrito y publicado que describe resultados originales de investigación que

debe ser escrito y publicado de cierta forma, definida por tres siglos de tradiciones

cambiantes: práctica editorial, ética científica e influencia recíproca de los

procedimientos de impresión y publicación.

Informes de investigación: Es un documento que tiene como propósito primordial

comunicar de forma concreta y breve los resultados de una determinada investigación

independientemente del área a la que pertenezca.

Repositorio

Institucional Green

Access

Investigación

Científica

Investigación

Académica

Artículos

científicos

Informes de

investigación

Reportes

técnicos

Apuntes

Libros

Experimentos

Experimentos: Hernández y sus colegas (Hernández et al., 2003) afirman que es una

“situación de control en la cual se manipulan, de manera intencional, una o más

variables independientes (causas) para analizar las consecuencias de tal manipulación

sobre una o más variables dependientes (efectos)”.

Por otro lado la investigación académica, es mayoritariamente investigación básica con el

objetivo de elaborar teorías y modelos que expliquen y permitan predecir la realidad. La

investigación académica se lleva a cabo en instituciones de enseñanza superior dirigidas por

investigadores. Este tipo de investigación es formal y muy sistemática debido a que los

resultados que se obtienen son serios, ciertos y verdaderos. Comprende trabajos como:

Tesis: Es un trabajo de investigación de libre elección presentado por escrito y dirigido

por uno o varios profesores investigadores, que presenta un estudiante de nivel

superior como culminación de sus estudios para obtener el título o grado

correspondiente, ya sea licenciatura, maestría o doctorado.

Reportes técnicos: Es un documento que se presenta para informar de los

procedimientos y resultados de una determinada investigación de forma clara y

estructura lógica. Una característica fundamental del reporte técnico es que busca

presentar la investigación y no la personalidad del autor, es por eso que el tono es

impersonal y no se utiliza la primera persona.

Apuntes: Son documentos por lo general informales guardados por el autor durante

algún tiempo luego de la finalización de su trabajo que pueden ser consultados

posteriormente con el fin de esclarecer dudas o debates sobre algún punto de la

investigación.

Libros: Es una obra científica o literaria de cierta extensión configurada en un

volumen. Es un conjunto de cuantiosas hojas de papel impresas, con tapas de cartón o

cartulina, que forman un volumen.

3.2 Requerimientos de usuario

En esta sección se muestran de manera general los servicios que provee el sistema al usuario

final mediante diagramas de casos de uso para mostrar la interacción entre el usuario y el

sistema.

Los requerimientos de usuario son declaraciones, en lenguaje natural y en diagramas, de los

servicios que se espera que el sistema brinde y las restricciones bajo las cuales el sistema debe

operar (Pressman et al., 2002).

3.2.1 Servicios que brinda el sistema al usuario.

En la tabla 2 se ordenan los servicios que el sistema brinda al usuario humano final, seguido

de una breve descripción.

Tabla 2. Servicios que brinda el sistema al usuario.

No. de servicio Acción

1 Buscar en el sitio

2 Listar resultados de búsquedas en el sitio

3 Buscar material bibliográfico

4 Listar resultados de búsquedas bibliográficas

5 Consultar bibliografía

1. El sistema permite al usuario realizar búsquedas generales referentes a cualquier

contenido del sitio.

2. El sistema lista los resultados de búsquedas generales referentes a cualquier contenido

del sitio con su respectivo enlace cada uno.

3. El sistema permite al usuario realizar búsquedas del material bibliográfico almacenado

en los repositorios del mismo.

4. El sistema lista los resultados de búsquedas del material bibliográfico almacenado en

los repositorios del mismo con su respectivo enlace cada uno.

5. El sistema permite al usuario consultar el material bibliográfico listado resultante de la

búsqueda y visualizarlo en su monitor.

En la figura 13 se muestra de manera general la interacción entre el sistema y el usuario final

mediante un diagrama de casos de uso.

Figura 13. Interacción entre el sistema y el usuario final.

3.3 Requerimientos de sistema

En esta sección se describen los requerimientos que el sistema necesita para brindar sus

servicios óptimamente. Haciendo uso de diagramas de secuencia se muestra el flujo de

mensajes interactivos a lo largo del tiempo.

Buscar en el sitio

Buscar material

bibliográfico Usuario Final

Listar resultados de

búsquedas en el sitio

Listar resultados de

búsquedas bibl.

Consultar bibliografía

Los requerimientos del sistema establecen los detalles, los servicios y restricciones del sistema.

El documento de requerimientos del sistema, algunas veces nombrado especificación

funcional, debe ser formal. Éste sirve como un contrato entre el comprador del sistema y el

desarrollador del software (Pressman, et al., 2002).

3.3.1 Servicios requeridos por el sistema.

Así como el usuario expresa sus requerimientos al momento de desarrollar cualquier sistema

con el fin de satisfacer sus necesidades y solventar sus problemas, los sistemas también

demandan requerimientos de parte del usuario para funcionar y ser implementados de la

manera más óptima. Es así como el sistema desarrollado en esta investigación demanda

también requerimientos de parte del usuario.

En la tabla 3 se resumen los requisitos del sistema al momento que el usuario realiza una

búsqueda y/o consulta de material bibliográfico.

En la figura 14 se observa el diagrama de secuencias que muestra la interacción y el flujo de

mensajes entre el usuario y el sistema.

Primeramente el usuario accede al sistema y por medio del buscador incorporado en el mismo

procede a hacer una búsqueda determinada ingresando los parámetros o palabras clave del

tema de su interés en el buscador.

Enseguida el sistema hace la consulta en la base de datos de los metadatos almacenados en la

misma y regresa los resultados coincidentes con los parámetros de búsqueda que el usuario

ingresó al momento de realizar la acción. Mencionemos que, en caso de que el usuario no

ingrese ninguna palabra o parámetro de búsqueda en la interfaz del buscador, el sistema

regresará como resultado todos los registros de metadatos que contenga en su base de datos al

momento de hacer la búsqueda.

Tabla 3. Requerimientos del sistema.

Figura 14. Interacción entre el usuario y el sistema.

Función.- Buscar y/o consultar.

Descripción.- El sistema permite al usuario buscar y/o consultar el material

bibliográfico registrado en el mismo.

Entradas.- Alfanuméricas.

Fuente.- Usuario.

Salidas.- Interfaz gráfica en HTML que despliega los resultados de la búsqueda y/o

consulta realizada.

Destino.- Monitor.

Requerimientos.- Al introducir la cadena de texto, el sistema realiza la búsqueda en

todo el material bibliográfico registrado.

Precondición.- Ingresar en el navegador la URL del sistema.

Postcondición.- Ninguna.

Efectos colaterales.- Ninguno.

Usuario Sistema

Búsqueda de material bibliográfico

Selección del material deseado

Resultado de búsqueda

Material seleccionado

Una vez desplegados los resultados de la búsqueda en la pantalla del usuario, éste los

analiza y determina en un momento dado cuáles de esos resultados le son de utilidad y

procede a consultarlos requiriéndole al sistema la versión en texto completo dado que los

resultados mostrados al usuario en su pantalla inicialmente, muestran solamente

características relevantes del recurso en sí; características de un metadato tales como: título

de la obra, nombre(s) de autor(es), descripción, etc.

En caso de que el documento solicitado se encuentre en los repositorios del sistema

localmente, éste es desplegado en versión completa al usuario en su monitor en caso de

que se cuente con la versión en formato de archivo .pdf o se podrá descargar si se

encuentra en otro formato. En caso de que el documento completo haga referencia a un

archivo remoto, es decir, que se encuentre alojado en otro repositorio en Internet, el

usuario será redireccionado a la ubicación exacta del archivo utilizando el identificador

único de dicho archivo incluido en la información de su respectivo metadato; el cual,

obviamente se encuentra la base de datos del sistema local.

Es así como el usuario final realiza el proceso de consulta de material científico de libre

acceso en el sistema.

En este capítulo se describió en profundidad el análisis y la metodología empleada en el

desarrollo del sistema utilizando métodos de ingeniería de software tales como diagramas

de requerimientos de usuario y modelos de desarrollo de sistemas.

En el siguiente capítulo se describe el procedimiento de diseño del sistema luego del

análisis realizado en este capítulo y se incluyen las interfaces gráficas de mayor relevancia,

tomando en cuenta los requerimientos y el perfil del usuario final.

CAPÍTULO 4. Diseño del Sistema

En este capítulo se explica el proceso de diseño del sistema incluyendo algunas interfaces

gráficas tomando en cuenta los requerimientos y los diferentes perfiles de usuario a los que

el sistema está enfocado.

4.1 Diseño de interfaces

Uno de los factores más importantes a tomar en cuenta en el desarrollo del sistema son las

interfaces, estas deben ser amigables y atractivas hacia el usuario para que esté se interese

en el sistema y realice sus actividades con interés y de forma intuitiva. Si una interfaz es

relativamente compleja, el usuario puede rehusarse a usarla por temor a equivocarse o

simplemente provocará errores debido a la confusión que la interfaz le cause.

En la figura 15 se muestra un diagrama del proceso de diseño de interfaces de usuario.

Este proceso es iterativo y por lo tanto es común repetirlo más de una vez hasta lograr el

diseño deseado.

Figura 15. Proceso de diseño de interfaces de usuario.

Se debe mencionar que el sistema estará implementado dentro de la página Web de la

Secretaría de Investigación de la Universidad de Colima y se podrá acceder al mismo

mediante el menú de navegación de ésta. Dicha página también está siendo desarrollada a

la par del sistema en cuestión y aunque el desarrollo de la misma no es parte medular de

esta investigación, en adelante se muestran algunos elementos de su desarrollo con el

propósito de contextualizar la investigación.

Después de analizar los servicios que brinda el sistema y tomando en cuenta el perfil del

usuario promedio del mismo y de la página web en sí, se ha definido una plantilla general

para utilizarse en el proyecto.

En la figura 16 se muestra el esquema de bloques o módulos establecido durante la fase de

análisis de la interfaz principal de la página web, seguida de una descripción breve de cada

uno de sus módulos.

Figura 16. Esquema de la interfaz principal.

Encabezado. El encabezado se encuentra ubicado, como en la mayoría de sitios web, en la

parte superior de la interfaz. Dado que por lo general es lo primero que el usuario observa

a primera vista, dicho encabezado debe contener información acerca del contenido general

del sitio y de la Institución al que éste pertenece. Por lo tanto, el encabezado de este sitio

en particular estará conformado por un banner con el logotipo de la Universidad de Colima

seguido del texto “Coordinación General de Investigación Científica”.

Menú. El menú que contendrá las opciones de navegación dentro del sitio estará ubicado

justo a la izquierda de la interfaz y contendrá, además del enlace al sistema en cuestión,

enlaces a subpáginas del mismo sitio, tales como Misión, Visión, Proyectos, etc.

Centros de Investigación. Justo en la parte central de la interfaz estará ubicada una

sección que contendrá enlaces directos a cada uno de los centros de investigación de la

Universidad de Colima, ya sea a sus páginas particulares en caso de que las tengan o en

caso contrario a una página con información de contacto referente a cada uno de ellos.

Noticias. En la parte derecha de la interfaz se encontrará ubicada una sección de noticias y

boletines informativos con enlaces directos a páginas externas o internas donde se detallen

más a fondo.

Proyectos Internacionales. Justo debajo de la sección de noticias, en la parte derecha de

la interfaz, se encontrará ubicada una sección llamada “Proyectos Internacionales” donde

se pueda tener acceso a información, convocatorias, noticias, etc. De carácter internacional

donde los investigadores y el público en general puedan postularse o simplemente tener un

acceso más sencillo a todo tipo de gestiones e información científica de carácter

internacional relacionado a la Universidad de Colima.

Buscador. En la parte izquierda de la interfaz, justo debajo de la sección de menú se

encontrará ubicado un buscador donde el usuario puede ingresar y encontrar la

información del sitio que le interese en específico.

4.2 Diseño de la base de datos

Dado a que el sitio en sí mostrará información relevante del cuerpo académico de la

Universidad de Colima, así como de sus instalaciones y recursos científicos, es necesario

diseñar también, además de las interfaces, la base de datos que contendrá la información

antes mencionada.

En este proyecto en particular se utilizó MySQL como gestor de bases de datos debido a

que se adapta perfectamente a las tecnologías utilizadas y se adecúa a nuestras necesidades

para conseguir los objetivos buscados.

Después de analizar detenidamente los requerimientos de usuario y de sistema, se ha

decidido crear una base de datos con tres tablas, la primera es la que contiene el registro

del material científico almacenado en los repositorios del sistema y su estructura en

MySQL se muestra en la figura 17, la información almacenada en esta tabla es utilizada

para generar los metadatos relativos al material científico resguardado en el repositorio del

sistema. La segunda tabla es la relativa a la información del cuerpo académico de los

investigadores de la Universidad de Colima dado que la página cuenta con un catálogo de

investigadores con información relativa a cada uno de ellos. La tercera tabla contiene la

información de noticias y boletines informativos mostrados en la parte derecha de la

interfaz principal del sistema. Las estructuras en MySQL de las tablas de cuerpo

académico y de noticias se muestran en las figuras 27 y 28 respectivamente en la sección

de anexos al final de este documento.

En la estructura de la tabla podemos identificar las etiquetas que especifica el estándar de

generación de metadatos Dublín Core para describir el material bibliográfico de acuerdo al

dicho estándar (título, autor, descripción, editor, entre otros). Además de las etiquetas

especificadas por el estándar, se han agregado tres campos más en la misma tabla, estos

campos son:

Figura 17. Estructura en MySQL de la tabla de metadatos.

id (identificador). Utilizado para llevar un índice y mejor control de cada registro

almacenado en la tabla.

invest (investigación). Utilizado definir el tipo de investigación o de material del

que se trata. Este campo puede incluir valores como “Artículo científico”, “Tesis”,

“Libro”, “Reporte técnico”, “Experimento”, “Reporte de investigación” y

“Apuntes”.

Archivo. Dado no es útil almacenar archivos como tales en una base de datos, este

campo contiene la ruta del documento respectivo almacenado en el repositorio de

material bibliográfico en el servidor.

Interfaz principal

En la figura 18 se muestra la imagen de la interfaz principal, la interfaz con la que el

usuario se encontrará en primera instancia cuando ingrese en su navegador la URL del

sistema.

Figura 18. Interfaz principal del sistema.

La interfaz principal está pensada en un diseño minimalista tratando de contribuir en buena

medida a la usabilidad. Está estructurada con un menú de opciones a la izquierda donde el

usuario puede acceder a información relativa al CGIC (Centro General de Investigación

Científica), debajo de este menú se encuentra el buscador que se encuentra siempre visible

y accesible brindándole al usuario la posibilidad de buscar en cualquier momento sin

importar en qué sección del sitio se encuentre. En la parte central se puede acceder a los

diferentes centros de investigación dependientes del CGIC, mientras que en la parte

derecha se ubica una sección con noticias o boletines relevantes.

Interfaz de Centros de Investigación

En la figura 19 se muestra la interfaz de un centro de investigación en particular

(ingenierías) dependiente del CGIC.

Figura 19. Interfaz del centro de investigación de ingenierías.

La interfaz de los centros de investigación es aún más sencilla y minimalista que la interfaz

principal, ésta cuenta solamente con un menú situado justo a la izquierda con opciones

referentes a dicho centro y a la derecha muestra información básica sobre el mismo,

información tal como el director de dicho centro, su correo electrónico, etc. En cualquier

momento el usuario puede regresar a la interfaz inicial.

En este capítulo se describió el procedimiento de diseño del sistema, derivado del análisis

realizado en el capítulo anterior. Se mostraron algunas interfaces gráficas diseñadas tomando

en cuenta los requerimientos y el perfil del usuario final.

En el siguiente capítulo se describe el procedimiento de implementación del esquema a través

de un sistema o plataforma de software, así como las pruebas hechas al mismo y sus

respectivos resultados.

CAPÍTULO 5. Implementación y Pruebas

En este capítulo se detalla el procedimiento de implementación y la puesta en marcha del

sistema. También se discuten las pruebas realizadas al mismo y los resultados obtenidos en

cada una de éstas.

5.1 Implementación de interfaces

Como se mencionó anteriormente, el sistema fue implementado dentro de la página Web

de la Secretaría de Investigación de la Universidad de Colima donde puede ser accesado

desde el menú principal de opciones de dicha página, en la opción “Búsquedas

bibliográficas”. En la Figura 20 se resalta la opción del menú donde es posible tener

acceso al sistema.

Figura 20. Opción de acceso al sistema.

Una vez en el sistema, el usuario administrador del sitio, por medio de un usuario y una

contraseña únicos, podrá tener acceso a diversas opciones de gestión del sitio y de su

contenido, entre esas opciones se encuentra la de registrar material científico en el sistema

con el objetivo de resguardarlo de manera segura y de compartirlo con otros proveedores

de servicios en internet poniéndolo a disposición de los mismos por medio de su metadato

respectivo. Proporcionándole de ésta manera una mayor difusión a dicho material y

contribuyendo con la filosofía del movimiento de acceso abierto a la información científica

surgida con la convención de Budapest en el 2001.

En las figuras 21 y 22 se muestran imágenes del formulario usado por el administrador del

sistema para registrar material científico.

Figura 21. Formulario de registro de material bibliográfico 1/2.

Figura 22. Formulario de registro de material bibliográfico 2/2.

En el formulario de registro de material bibliográfico del sistema podemos identificar a las

quince etiquetas que especifica el estándar de generación de metadatos Dublín Core,

además de algunos otros campos añadidos como por ejemplo el tipo de investigación, que

especifica exactamente el tipo de material que se registra, por ejemplo libro, tesis, artículo

científico, experimento, etc.

Una vez que el administrador del sistema llena el formulario con los datos del registro que

el sistema espera recibir (requerimientos de sistema) y envía el formulario, se llevan a cabo

procesos como la validación de los datos en el formulario por ejemplo.

En caso de que todo esté correcto, es decir, si el formulario fue llenado con los datos

esperados por el sistema y si no existe ningún error de validación del formulario mismo,

entonces la información es procesada por el servidor. Si no surge ningún problema o error

durante el proceso de información por parte del servidor, el administrador del sistema es

retroalimentado con un mensaje de éxito indicando que el proceso se realizó exitosamente,

esto implica que la información fue registrada en la base de datos, que la versión completa

del documento fue almacenado correctamente en el repositorio de material bibliográfico

del sistema y que su metadato respectivo fue creado y almacenado en el repositorio de

metadatos locales del sistema.

En la figura 23 se muestra la notificación de éxito en caso de que todo el proceso de

registro haya sido correcto.

Figura 23. Notificación de registro exitoso.

Por otro lado, si ocurre algún error o surge algún problema durante el proceso de registro

del material bibliográfico en el sistema, éste devuelve un mensaje de error al administrador

notificándole que surgió algún problema durante el proceso, sugiriéndole volverlo a

intentar.

En la figura 24 se muestra la notificación de error en caso de que surja algún problema

durante el proceso de registro.

Figura 24. Notificación de registro erróneo.

Las pruebas se realizaron con base a una simulación en una red local donde se instaló el

sistema en dos computadoras diferentes simulando que cada una de ellas se trataba de una

institución educativa o científica y donde cada una de ellas cosechaba metadatos de la otra

Además de las interfaces generales de la página web mostradas anteriormente, enseguida

se muestran los diagramas representativos de la fase de implementación del sistema ya

puesto en marcha sobre una red local para fines demostrativos únicamente, obviamente el

sistema responde de igual manera a nivel Web.

5.2 Pruebas del sistema

A excepción de los programas pequeños, los sistemas no se prueban, como una simple

unidad monolítica. Los sistemas grandes se construyen a partir de subsistemas que a su vez

se construyen a partir de módulos que están compuestos de procedimientos y funciones.

Por lo tanto, el proceso de prueba se lleva a cabo en etapas en las que las pruebas se

aplican de forma incremental en conjunto con la implementación del sistema (Sommerville

y Domínguez Torres, 2002).

La figura 25 muestra un proceso de pruebas de cinco etapas en las cuales se prueban los

componentes del sistema, la integración del sistema y, finalmente, el sistema con los datos

del usuario. El proceso es iterativo y se retroalimenta tanto de las últimas etapas como de

la primera parte del proceso.

Figura 25. El proceso de pruebas (Sommerville y Domínguez Torres, 2002).

Las etapas en el proceso de pruebas son:

1. Prueba de unidades. Se prueban los componentes individuales para asegurarse de que

operan correctamente. Cada uno se prueba de forma independiente, sin los otros componentes

del sistema.

2. Prueba de módulos. Un módulo es una colección de componentes dependientes, como una

clase de objetos, un tipo de datos abstracto o alguna colección de procedimientos y funciones.

Un módulo encapsula componentes relacionados, de tal forma que se pueden probar sin los

otros módulos del sistema.

3. Prueba de subsistemas. Esta fase comprende la colección de pruebas de los módulos que

integran el subsistema. Los problemas más comunes que surgen en los sistemas grandes de

software son el desacoplamiento de las interfaces. Por tanto, el proceso de prueba del

subsistema se concentra en detectar errores en los módulos de la interfaz por medio de

ejercicios rigurosos sobre estas interfaces.

4. Prueba del sistema. Los subsistemas se integran para constituir el sistema. Este proceso

comprende encontrar errores que son el resultado de interacciones no previstas entre los

subsistemas y su interfaz. También comprende validar que el sistema cumpla sus

requerimientos funcionales y no funcionales y probar las propiedades emergentes del sistema.

5. Pruebas de aceptación. Ésta es la etapa final en el proceso de pruebas antes de que se

acepte que el sistema se ponga en operación. Éste se prueba con los datos proporcionados por

el cliente más que con datos de prueba simulados. Debido a la diferencia existente entre los

datos reales y los de prueba, la prueba de aceptación revela errores y omisiones en la

definición de requerimientos del sistema. También revela donde los problemas de

requerimientos en los recursos del sistema no cumplen las necesidades del usuario o donde el

desempeño del sistema es inaceptable (Sommerville y Domínguez Torres, 2002).

Pruebas de defectos.

La meta de las pruebas de defectos es exponer los defectos latentes en un sistema de software

antes de entregar el sistema. Una prueba de defectos exitosa es una prueba que provoca que el

sistema se desempeñe incorrectamente y así exponer un defecto (Sommerville y Domínguez

Torres, 2002).

En la figura 26 se muestra un modelo general del proceso de prueba de defectos. Los casos de

prueba son especificaciones de las entradas a la prueba y de la salida esperada del sistema más

una declaración de lo que se prueba. Los datos de prueba son las entradas seleccionadas para

probar el sistema.

Figura 26. El proceso de pruebas de defectos (Sommerville y Domínguez Torres, 2002).

Pruebas realizadas al sistema y resultados

Se efectuaron diferentes casos de prueba a los diferentes subsistemas que conforman al

sistema completo, en cada uno de estos casos de prueba se introdujeron los datos

correspondientes para cada subsistema, y se procedió a comparar los resultados esperados con

los resultados arrojados, en base a estos resultados se verificó la funcionalidad del sistema.

En la tabla 4 se listan algunos de los casos de pruebas que se realizaron a los diferentes

subsistemas así como los resultados obtenidos.

Tabla 4. Tabla de pruebas realizadas al sistema.

Subsistema Descripción del caso

de prueba

Datos de

prueba

Resultados de

prueba Subsistema de

autentificación

Se realizaron pruebas de

seguridad, estas

consistieron en tratar de

burlar la autentificación

para las secciones

restringidas del sistema,

secciones a las que sólo el

administrador tiene acceso

mediante un usuario y una

contraseña. Además se

realizaron todas las

combinaciones posibles

con los datos de prueba

para validar el proceso de

autentificación.

Nombres de

usuario y

contraseñas

(correctas e

incorrectas)

Los resultados

de las pruebas

no mostraron

ningún defecto

Subsistema de

gestión de

material

bibliográfico

científico

Se ingresaron datos de

prueba hipotéticos

referentes a documentos

científicos y se procedió a

realizar todas las acciones

posibles tales como altas,

bajas, modificaciones y

consultas tratando de

verificar la estabilidad y

correcto funcionamiento

del sistema.

Información

referente a

documentos

científicos usando

el formulario de

captura de

material

bibliográfico

(figuras 24 y 25)

tratando de usar

la mayoría de las

etiquetas que

especifica el

estándar Dublín

Core para lograr

una óptima

descripción del

material

bibliográfico.

Los resultados

mostraron

algunos

problemas al

momento de

tratar de subir al

servidor

archivos que

excedían los

2MB de tamaño,

sin embargo,

este problema ha

sido ya resuelto

pudiendo subir

archivos de hasta

5MB, rango

bastante

accesible para un

documento

científico

promedio.

Subsistema de

generación de

metadatos

Una vez registrados en la

base de datos y

almacenados los

documentos en el

repositorio de material

bibliográfico del servidor,,

se procedió a generar

automáticamente los

metadatos (estandarizados

a Dublín Core)

descriptivos de cada

material científico

registrado utilizando

XML y a almacenarlos en

el repositorio de

metadatos locales para

ponerlos a disposición de

sistemas cosechadores

externos; tratando de

verificar su correcta

generación y

almacenamiento

Información

obtenida de la

base de datos

referente a

información

relevante de cada

documento

científico

registrado y

almacenado en el

servidor.

Los resultados

de las pruebas

no mostraron

ningún defecto

Subsistema de

cosecha de

metadatos

Utilizando protocolos de

servicios Web como el

SOAP se realizaron

pruebas simulando

cosechas de metadatos

desde nuestro sistema

hacia otros sistemas

proveedores de metadatos

y viceversa, tratando de

verificar la correcta acción

de las cosechas poniendo

especial atención en este

punto, dado que se trata

del objetivo primordial de

este proyecto.

Para realizar

cosechas de

metadatos en un

proveedor externo

de metadatos es

necesario hacer la

consulta con

dicho proveedor

utilizando un

nombre de

usuario conocido

por el consultor y

el proveedor para

que éste último

tenga la certeza

de que quien

solicita sus

metadatos es

precisamente un

ente conocido,

seguro y

autorizado.

Los resultados

mostraron

algunos defectos

al momento de

especificar la

dirección del

proveedor de

metadatos, sin

embargo se trató

de errores

mínimos de

codificación que

fueron resueltos

de manera

inmediata.

Subsistema de

búsquedas y

consultas de

material científico

Se realizaron pruebas

exhaustivas tratando de

verificar el correcto

funcionamiento de las

consultas de material

científico y tratando de

encontrar posibles errores

al realizarlas. Para ello se

utilizó la interfaz

búsquedas del sistema.

Se introdujo todo

tipo de

información en

los formularios de

búsqueda de la

interfaz de

consultas

buscando

cualquier posible

error al momento

de llevarlas a

cabo. Se ingresó

todo tipo de

criterios de

búsqueda.

Los resultados

mostraron

algunos defectos

originados a la

hora de hacer las

consultas SQL

en la base de

datos, los cuales

ya han sido

corregidos.

Discusión

Los resultados de esta investigación ponen de manifiesto el potencial y el fuerte impacto

positivo que tiene el Open Access en la comunidad científica al poner a disposición totalmente

libre, material científico de calidad reafirmando su filosofía de un acceso libre y sin

restricciones al conocimiento científico.

A su vez se evidencia también la importante influencia del protocolo OAI-PMH para lograr

los objetivos del Open Access.

Siguiendo la ruta verde que especifica la OAI (aparte de la ruta dorada) conjuntamente con la

utilización del protocolo OAI-PMH, hemos logrado contribuir con esta filosofía al desarrollar

un Repositorio Institucional capaz de albergar y garantizar la “vida” y permanencia de

material bibliográfico científico de calidad respaldado por investigadores reconocidos. Así

también, se ha logrado intercambiar exitosamente dicho material con otras instituciones

interesadas en cooperar con el Open Access; logrando de esta manera brindar una mayor

difusión al libre conocimiento.

En este capítulo se describió el procedimiento de implementación del esquema a través de un

sistema de entorno Web, también se especificaron las pruebas a las que éste fue sometido y

sus respectivos resultados.

Para cerrar esta investigación, enseguida se describen las conclusiones y resultados generales

del estudio, haciendo énfasis en el alcance de los objetivos planteados en el proyecto y la

propuesta del trabajo futuro.

CAPÍTULO 6. Conclusiones

El tema de los Repositorios Institucionales, aunque es un concepto relativamente reciente,

está marcando nuevas tendencias y adquiere cada vez mayor fuerza conforme al continuo

avance y desarrollo de Internet. Día a día, nuestras actividades cotidianas se involucran

cada vez más con la tecnología y el intercambio de información y recursos a través de

Internet se ha vuelto un factor clave, fundamental y crucial en numerosos sectores sociales.

En este trabajo se desarrolló e implementó un esquema de administración de Repositorios

Institucionales capaz de ofrecer, intercambiar y difundir material bibliográfico entre

diferentes repositorios en Internet utilizando la filosofía de contextos abiertos del protocolo

OAI-PMH.

El sistema desarrollado en este trabajo cumplió con los objetivos planteados inicialmente.

Se creó una interfaz amigable, intuitiva y relativamente fácil de usar para automatizar los

procedimientos de registro y almacenamiento de material bibliográfico de calidad en

formato digital. Así mismo, se desarrolló un módulo capaz de recolectar, intercambiar,

difundir y compartir material y recursos científicos con otras instituciones educativas y

científicas a través de Internet. Se diseñó también una interfaz de búsqueda para localizar y

consultar documentos bibliográficos de manera rápida y eficiente.

Los resultados manifiestan la importancia de la colaboración entre instituciones y

dependencias para compartir fuentes de información que incrementen el acervo

bibliográfico y así dar un soporte significativo a los investigadores que buscan referencias

bibliográficas de calidad para dar fundamento a sus proyectos.

Trabajo futuro

Con el propósito de continuar con la investigación en el futuro se hacen las siguientes

recomendaciones:

Sugerimos trasladar la operatividad de nuestro repositorio Green Access hacia un

repositorio Golden Acces, que incluya referencias de editoriales y bibliotecas digitales de

reconocido prestigio.

Se recomienda también mantener una convocatoria permanente para lograr acuerdos y

realizar convenios con otras organizaciones educativas y/o científicas interesadas en

participar con el movimiento de acceso abierto y enriquecer de esta manera el acervo

bibliográfico libre constantemente.

Información complementaria del sistema

En esta sección se incluye contenido complementario a la investigación realizada con el

objetivo de sustentar y enriquecer el trabajo realizado.

En la figura 27 se muestra la estructura en MySQL de la tabla de investigadores.

Figura 27. Estructura en MySQL de la tabla de investigadores.

La tabla de investigadores almacena información relativa a cada uno de los investigadores

de la Universidad de Colima, dicha información es empleada para conformar el catálogo

de investigadores que está disponible en la página Web de la Secretaría de Investigación

de la Universidad de Colima, misma que fue desarrollada en conjunto con el sistema

expuesto en esta investigación.

En la figura 28 se muestra la estructura en MySQL de la tabla de noticias y boletines

informativos.

Figura 28. Estructura en MySQL de la tabla de noticias y boletines informativos.

La tabla de noticias y boletines informativos contiene la información de noticias ubicada

en la parte derecha de la interfaz principal del sistema, dicha interfaz se puede apreciar en

la figura 18.

Interfaz de captura de investigadores.

En las figuras 29 y 30 se muestra la interfaz de captura de información relativa a

investigadores de la Universidad de Colima, en ella es posible capturar información tanto

personal como institucional. Es posible capturar información relevante de cada

investigador como por ejemplo sus trabajos, publicaciones, material de experimentación,

Figura 29. Interfaz de captura de investigadores 1/2.

Figura 30. Interfaz de captura de investigadores 2/2.

La interfaz de captura de información es un formulario donde se ingresa la información

relativa a investigadores de la Universidad de Colima, esta información se guardada en la

base de datos del sistema en la tabla de investigadores y es utilizada para conformar el

catálogo de investigadores en el sistema.

Interfaz de captura de noticias

En la figura 31 se muestra la interfaz de captura de noticias donde se ingresa la

información que será visualizada y accesible en la sección de noticias o boletines

informativos en la interfaz principal del sistema.

Figura 31. Interfaz de captura de noticias o boletines informativos.

La interfaz es simple, se trata de un formulario con tres campos para ser llenados, estos son:

Texto Introductorio: En este campo se escribe una breve introducción (100

caracteres) para la noticia descrita.

Enlace directo: En este campo se escribe la ruta o el enlace URL donde la noticia

completa puede ser consultada.

Fecha actual: Este campo no puede ser modificado por el administrador, se

actualiza automáticamente con la fecha actual del servidor y tiene como objetivo

registrar la fecha en que la noticia fue dada de alta.

Referencias

Alonso, F., Martínez, L., y Segovia, F. J. (2005). Introducción a la Ingeniería del Software - Modelos de desarrollo de programas. España: Delta publicaciones.

Arellano, M. C., Nogales, J., y Martín, B. (2009). La organización hipertextual del ordenamiento jurídico - Posibilidades de XML y estándares relacionados. Revista General de Información y Documentación, 182-189.

Ayllón Bonet, J. C. (2006). Metadatos y documentos XML/RDF para recuperación y organización de la información. Recuperado el 22 de abril de 2010, de http://metadatos-xml-rdf.awardspace.com/xml.html

Carpenter, L. (2003). OAI para principiantes - tutorial en línea del Open Archives Forum. Recuperado el 29 de noviembre de 2011, de http://travesia.mcu.es/portalnb/jspui/html/10421/1823/intro.htm

Castro, E. (2003). HTML for the World Wide Web (Fifth ed.). Estados Unidos: Peachpit Press. Cobo, A., Gómez, P., Pérez, D., y Rocha, R. (2005). PHP y MySQL- tecnologías para el desarrollo de

aplicaciones Web. España: Díaz de santos. Converse, T., Park, J., y Morgan, C. (2004). PHP5 and MySQL Bible. Estados Unidos: Wiley Publishing. Croxatto, H. L. (2005). Creando valor en la relación con sus clientes - cómo desarrollar todo el

potencial de una solución CRM y transformarlo en ventajas de negocio. Argentina: Editorial dunken.

CUL. (2010). Cornell Universtity Library. Recuperado el 20 de mayo del 2010, de http://arxiv.org/ Chawner, B. (2005). F/OSS in the Library World: An Exploration. Artículo presentado en el

International Conference on Software Engineering. Day, R. A. (2005). Cómo escribir y publicar trabajos científicos. (3 ed.). Washington, D.C.: OPS. DCMI. (2010). The Dublin Core Metadata Initiative. Recuperado el 7 de octubre del 2010

de http://dublincore.org/ Gilmore, W. J. (2008). Beginning PHP and MySQL: From Novice to Professional (Third ed.). Estados

Unidos: Apress. Hagemann, E. (2002). Budapest Open Access Initiative. Recuperado el 20 de mayo del 2010, de

http://www.soros.org/openaccess/index.shtml/ Hernández, S., Fernandez, C., y Baptista, L. (2003). Metodología de la investigación. México: McGraw-

Hill. IEEE. (2010). IEEE draft standard for learning object metadata. Learning Technology Standards

Committee. Recuperado el 8 de octubre del 2010, de http://ieeeltsc.org/ Keefer, A. (2007). Los Repositorios Digitales Universitarios y los Autores. Anales de documentación, 10,

205-214. López, C. (2000). Modelo para el Desarrollo de Bibliotecas Digitales Especializadas. Tesis de maestría,

Instituto Tecnológico Autónomo de México. Recuperado de http://www.bibliodgsca.unam.mx/tesis/tes7cllg/tes7cllg.htm

Martínez, J. Á., y Navarra, P. L. (2007). La interoperabilidad de la información. Barcelona: Editorial UOC.

Nikolov, N., y Stoehr, P. (2008). Harvesting Needed To Maintain Scientific Literature Online. Artículo presentado en el International Conference on Digital Libraries.

OAI. (2008). Archives Initiative, Standards for Web Content Interoperability. Recuperado el 22 de mayo del 2009, de http://www.openarchives.org

PLoS. (2010). Public Library of Science. Recuperado el 20 de mayo del 2010, de http://www.plos.org/about/letter.php/

Pressman, R. S., Ojeda Martín, R., Morales Jareño, I., y Virgilio Yagüe, G. (2002). Ingeniería del software: un enfoque práctico. (5 ed.). Madrid, España: Mc Graw-Hill

ROAR. (2011). Registy of Open Acces Repositories. Recuperado el 9 de Agosto de 2011, de

http://roar.eprints.org Saltivery, T. G., Vidal, J. L., y Cañas, J. J. (2005). Diseño de sistemas interactivos centrados en el usuario.

Barcelona: Editorial UOC. Santillan Aldana, J. (2009). El movimiento del acceso abierto y el mundo bibliotecario desde la

experiencia del proyecto E-LIS. AIBDA, XXX. Sommerville, I., y Domínguez Torres, J. (2002). Ingeniería de Software. (6 ed.). México: Pearson

Educación de México. SPARC. (2010). Scholarly Publishing & Academic Resources Coalition. Recuperado el 20 de mayo de

2010, de http://www.arl.org/sparc/ Swan, A., y Brown, S. (2005). Access self archiving: an author study. Recuperado el 30 marzo 2007,

de://eprints.ecs.soton.ac.uk/10999/ Ullman, L. (2006). MySQL (2° ed.). Estados Unidos: Peachpit Press. Velez, S. (2001). Apuntes de metodología de la investigación. Medellín. Vives, J., Alberch, R., Alvárez, J., Cuevas, A., Labastida, I., Munilla, G., . . . Solanilla, L. (2009).

Digitalización del patrimonio: archivos, bibliotecas y museos en la red. Barcelona: editorial UOC.

Voutssás Márquez, J. (2005). Bibliotecas y publicaciones digitales. México: UNAM, Centro Universitario de Investigaciones Bibliotecológicas.

FACULTAD DE TELEMÁTICAdigeset.ucol.mx/tesis_posgrado/Pdf/LUIS_ENRIQUE_ROSAS_GONZAL… ·...

Documents