Date post: | 03-Aug-2015 |
Category: |
Documents |
Upload: | john-sebastian |
View: | 1,276 times |
Download: | 2 times |
Escáneres "hazlo tú mismo": digitalización de bajo costo para archivos y
bibliotecas con software libre, cámaras fotográficas y filosofía hacker1.
Autora: Evelin Heidel
Ciudad / País: Capital Federal, Argentina
Título: estudiante de Letras y estudiante de Bibliotecología y Cs. de la Información
Lugar de trabajo: Facultad de Filosofía y Letras, Universidad de Buenos Aires /
Fundación Vía Libre / Creative Commons Argentina
Email: [email protected]
Resumen: En la actualidad, la mayoría de las bibliotecas y los archivos sienten una
necesidad imperiosa de digitalizar sus acervos bibliográficos. Sin embargo, esta tarea
puede ser costosa, puede requerir una gran pericia técnica, en ocasiones implica lidiar
con grandes trabas burocráticas para la adquisición o importación de los equipos, y si
estos llegaran a romperse, los costos de reparación son tan altos que los programas de
digitalización emprendidos se detienen. El modelo del escáner "Do It Yourself" (hazlo tú
mismo) es una solución fácil, sencilla y barata de implementar, realizada 100% con
hardware y software libre, y diseñada para cumplir con los estándares bibliotecarios para
la digitalización. Actualmente se implementa en la Facultad de Filosofía y Letras (UBA) y
pasará a implementarse en otras bibliotecas del país en breve.
Palabras claves: SOFTWARE LIBRE - HARDWARE LIBRE - DIGITALIZACIÓN -
ESCÁNERES
1 Este trabajo está licenciado con una licencia Creative Commons – Atribución – Compartir Igual 2.5, Argentina. Ver más en: http://creativecommons.org/licenses/by-sa/2.5/ar/
Introducción
A finales de 2010, la Subsecretaria de Bibliotecas de la Facultad de Filosofía y
Letras de la Universidad de Buenos Aires, comenzó a indagar opciones para la
digitalización de los acervos bibliográficos de la facultad. Los presupuestos para la
adquisición de un escáner profesional oscilaban entre los 10.000 a 90.000 dólares, sin
haber nunca un presupuesto intermedio. Ninguno de los escáneres cumplía además con
una serie de requisitos necesarios para la facultad, a saber:
1. que el escáner fuera sólido y robusto;
2. que fuera adaptable a más de un tipo de libro o de archivo;
3. que no dañara los libros forzándolos a abrirse más de lo necesario;
4. que fuera rápido digitalizar un libro;
5. que la digitalización cumpliera con estándares mínimos de calidad, tales
como obtener imágenes a 300 DPI.
La mayoría de los escáneres, además de quedar fuera de las posibilidades de la
facultad en términos económicos, no cumplían con al menos una de las cinco
condiciones. En ocasiones, el diseño del escáner exigía forzar la apertura del libro (como
en el caso de los escáneres planos o de los escáneres orbitales con vidrio); en otros
casos el sistema de toma de las imágenes tomaba demasiado tiempo, y finalmente, en
otros casos, los costos de reparación si algo se dañaba ascendían a sumas en dólares
que en muchos casos volverían irrecuperables las máquinas.
Además, se sumaba en este caso el problema de la cantidad de escáneres. En la
medida en que todos los escáneres necesitan ser operados por una persona, el límite
temporal de la persona para la digitalización, se impone por sobre la velocidad de la toma
de la imagen. De este modo, para iniciar un programa de digitalización, se necesita tener
más de un escáner y más de una persona para las operaciones. Al de por sí ya alto costo
unitario, se imponía un costo aún mayor si se necesitaba adquirir más de un escáner.
Fue así como, finalmente, tras haber indagado por los caminos comerciales, el blog
Derecho a Leer2, integrado por el diseñador gráfico Juan Pablo Suárez y por mí,
decidimos construir un escáner casero utilizando cámaras compactas o de bolsillo, como
solución alternativa al problema presentado por la Subsecretaria de Bibliotecas de la
Facultad de Filosofía y Letras.
Los escáneres DAL, que toman su nombre del acrónimo del sitio web ya
mencionado, "Derecho A Leer", son escáneres desarrollados con métodos de
autoconstrucción diseñados por comunidades colaborativas globales de especialistas en
diversos campos, tales como fotografía, digitalización y programación, que por fuera de
canales institucionales y a través de Internet, ofrecen soluciones a bajo costo para la
digitalización de acervos bibliográficos3. El escáner DAL incorpora como dispositivos de
digitalización cámaras fotográficas, y las coloca sobre una estructura que garantiza la
preservación del material bibliográfico.
Al contrario de los escáneres comerciales tradicionales, las ventajas de un escáner
DAL pueden resumirse en:
1. gran capacidad de adaptación a distintos tipos de libros y archivos;
2. bajos costos de reparación de los materiales;
3. amplio rango de calidad, dado que la tecnología se encuentra mayormente
depositada en las cámaras;
4. desmontable y fácil de trasladar, por lo que puede ser llevado a otras
instituciones u institutos de investigación, sin necesidad de trasladar el
material;
5. fácil de operar;
6. veloz.
2 http://derechoaleer.org 3Do It Yourself Book Scanner (http://www.diybookscanner.org) es una comunidad global de hackers, especializados en la construcción de escáneres utilizando técnicas, materiales y herramientas de fácil acceso, cuyo principal objetivo es colaborar con organizaciones dedicadas a preservar y dar acceso a acervos bibliográficos.
Fotos de los escáneres terminados
Ilustración 1: Uno de los escáneres actualmente en uso en la Facultad de Filosofía y Letras, UBA.
Ilustración 2: El primer escáner construido en 2011.
Desarrollo de los escáneres
Los componentes principales del escáner DAL son:
1. estructura de madera o metal;
2. cámaras fotográficas;
3. lámparas (iluminación).
Estructura de madera o metal
La estructura puede hacerse de múltiples materiales, aunque por razones obvias, la
madera resulta el más barato y el más práctico. Hay otros modelos de escáneres que
pueden observarse en la comunidad DIY Book Scanner, algunos de ellos hechos con
extrusiones de aluminio 80/20, entre otros materiales. Sin embargo, en líneas generales,
la madera gana por sobre el resto de los materiales por su costo y su versatilidad.
La base de la estructura posee unas guías de aluminio (vulgarmente conocidas
como correderas, que se utilizan en cajones o en los portateclados), que van adheridas a
los costados de la base. Sobre las guías se monta a su vez la base de la forma en V que
se observa en la foto.
La forma en V es donde descansa el libro durante el proceso de digitalización. Esta
apertura, calculada en un ángulo de 30 grados, le permite al libro no forzar su apertura en
exceso, y funciona con libros nuevos o de tapa blanda, e incluso con libros que están
dañados o cuyas letras están demasiado cercanas a los márgenes del nacimiento de las
hojas. La forma en V puede deslizarse hacia un costado según el tamaño del libro. De
esta forma, se garantiza que cualquier libro pueda ponerse sobre la base, sin importar si
el lomo es grande o pequeño, o la cantidad de páginas. Es conveniente colocar goma
espuma sobre la base en V, para corregir ligeras curvaturas que puedan producirse. El
libro permanece abierto y fijo en la misma posición durante todo el proceso de
digitalización, aunque lo hace en una posición que puede denominarse como natural.
Sobre la forma en V, y en el nacimiento de la parte posterior de la base, van
colocadas otras guías, también de aluminio, que sostienen dos acrílicos -también en
forma en V- y que siguen un movimiento arriba-abajo. Los acrílicos sirven para aplanar la
hoja y corregir la curvatura natural que tiene el libro cuando se encuentra abierto en una
posición no forzada. El espesor de los acrílicos permite a su vez llegar hasta los
márgenes internos cuando las letras se encuentran demasiado cercanas a ellos. A su vez,
los acrílicos en V tienen un sistema de poleas para aligerar su peso, resultando de esta
forma un dispositivo liviano para el operador, quien de lo contrario se vería afectado por el
peso total de los acrílicos, de las guías y del aglomerado al que están adheridos los
acrílicos.
Sobre los costados, van adheridos los brazos, que funcionan como sostenes de las
cámaras. Los brazos pueden ser de posición variables (movibles) o fijos, siempre y
cuando respeten una distancia predeterminada de la cámara con respecto a los acrílicos.
La estructura finaliza con un sostén para las lámparas, que son las que proveerán
de la iluminación necesaria para obtener una imagen uniforme.
Cabe destacar que este es sólo un enfoque entre las múltiples formas de
aproximación que pueden hacerse al problema de la base y de la estructura. Otros
enfoques contemplan la posibilidad de mover el libro en lugar de los acrílicos; hay
escáneres que llevan vidrio en vez de acrílico; otros ponen las luces a los costados en vez
de encima de los acrílicos; en fin, pueden explorarse diferentes ideas en la comunidad de
DIY Book Scanner. Por el momento, la decisión de elegir esta aproximación es su alto
nivel de estandarización dentro de la propia comunidad de DIY Book Scanner.
Cámaras fotográficas
En la actualidad, las cámaras fotográficas han conseguido un desarrollo
impresionante, que ha provocado que tengan cada vez mayor calidad en menor tamaño.
Las mejoras en la tecnología CCD, además de la ampliación de la cantidad de píxeles
reales en las cámaras de buena calidad, hacen que las cámaras compactas puedan y
sean, de hecho, una buena opción para la digitalización de bajo costo.
Actualmente, el mínimo necesario de megapíxeles para la digitalización está en el
orden de los 8 MP reales, cantidad que tiene cualquier cámara de baja gama. Se puede
utilizar una sola cámara y hacer un libro en dos pasadas, o utilizar dos cámaras y hacer
un libro en una sola pasada. El inconveniente de las dos pasadas es, además del tiempo,
que debe ser cuidadosamente controlado por el operador humano para no cometer
errores.
Las cámaras deben dispararse de manera sincronizada y consecutiva (es decir, la
cantidad de imágenes pares e impares deben coincidir). Para que eso suceda pueden
usarse dos métodos de control de disparo: electrónico (vía USB y software) o bien de
manera mecánica.
En el caso de los escáneres DAL, la opción ha sido la vía electrónica. Las cámaras
van conectadas a un USB hub, un dispositivo que cuenta con cuatro entrada adicionales
para fichas USB. El dispositivo se conecta a su vez a un transformador de 5 volts que va
conectado a una zapatilla que lo provee de energía eléctrica, y a un cable con un
disparador en la punta que funciona precisamente como disparador. Los cables USB van
enchufados al USB Hub y a las cámaras.
La desventaja de esta opción es que deben utilizarse cámaras Canon. Sobre la
tarjeta de memoria se monta un firmware llamado CHDK (Canon Hackers Development
Kit), que funciona sobre la tarjeta de memoria, sin alterar el firmware original de la
cámara. Se corre un pequeño script (conjunto de instrucciones) que hace que la cámara
reconozca el impulso eléctrico de los 5 volts que se otorgan a través del disparador, como
si efectivamente se estuviera presionando el disparador original de la cámara.
Lámparas
Las lámparas son en este caso lámparas comunes, fluorescentes, de luz fría, cuyo
grado de temperatura es muy bajo y que tienen una vida útil de más de 8.000 horas, y
cuyo consumo eléctrico es menor a los 23W. Si bien las lámparas fluorescentes no tienen
un espectro tan amplio de luz como sí tienen las lámparas halógenas, se optó por utilizar
fluorescentes porque nunca llegan a alcanzar los niveles de temperatura que alcanzan las
halógenas. Además, las halógenas pueden dañar la vista del operador de la máquina y
exponerlo a quemaduras por sobreexposición al UV de la lámpara.
También podrían haberse utilizado lámparas dicroicas (de museo), pero su alto
costo, sumado a que se necesitan múltiples lámparas (alrededor de ocho lámparas en
total), con un bajo rendimiento y un alto consumo (alrededor 8 amperes), hacen que sean
fácilmente descartables para este tipo de tareas.
Proceso de digitalización
El proceso de digitalización está dividido en dos partes: una parte correspondiente
a la toma de las imágenes, y una segunda parte correspondiente al postproceso.
Brevemente, la parte correspondiente a la toma de las imágenes consiste en:
1. Se coloca el libro sobre la base en V, ajustando las planchas en V según el
tamaño del lomo.
2. Se mide la distancia de las cámaras entre sí y de las cámaras respecto del
acrílico. Tienen que guardar una distancia proporcional e igual.
3. Se configuran los parámetros de la cámara para que estén iguales (asas,
exposición focal, apertura focal, zoom, entre otros).
4. Se conectan las cámaras al USB Hub.
5. Se activa el script.
6. Se procede a la digitalización del libro.
El postproceso, al igual que todo el proceso de digitalización, utiliza software libre.
El desarrollo de software libre, además de ser muy conveniente en cuanto a los costos,
tiene una línea política coincidente con la misión y los valores de la universidad4. En este
caso, el único punto donde el software libre falla un poco respecto del software privativo
es en el OCR. Brevemente, el postproceso de las imágenes continúa de esta forma:
1. Se bajan las imágenes a la computadora con Gtkam (basado en gphoto).
2. Se rotan masivamente con Phatch.
3. Se renombran masivamente con Krename o similar.
4. Se procesan con ScanTailor.
5. Se les aplica OCR con el motor de Tesseract, aplicado en Ocropus, montado
en gscan2pdf.
El resultado es un PDF de imágenes, que pueden estar en blanco y negro, color o
combinado. Una vez terminado el proceso de digitalización, pueden subirse a la web o al
repositorio institucional de la facultad.
Por supuesto, el diseño de los pasos del postproceso no es fijo ni estanco, y podría
diseñarse de otra forma. En todo caso, lo que interesa es que todo puede realizarse con
software libre y que, aún más, el software libre resulta aquí una opción con mayor
capacidad de prestación y rendimiento que el software privativo.
Un plan de digitalización, ¿para qué?
Es importante destacar, a su vez, que el programa de digitalización en la FFyL se
ha pensado como una política integral en relación con la política general de la facultad,
por lo tanto su desarrollo es mucho más que la simple digitalización y contempla cuatro
áreas de desarrollo principales: acceso, preservación, servicios de extensión y formación.
Es una estrategia de democratización de acceso al saber y al conocimiento, a la par que
4 El software libre, según la Free Software Foundation, se refiere a la libertad de los usuarios respecto de la posibilidad de ejecutar, copiar, distribuir, estudiar y modificar el software, y distribuir copias de esas modificaciones.
concebida con un fuerte desarrollo de la extensión, permitiendo que otras instituciones
puedan digitalizar sus acervos bibliográficos y puedan, a su vez, apropiarse de lo
realizado por la Facultad, tanto en términos de los resultados finales como de todo el
proceso de aprendizaje y experiencia que conlleva el desarrollo del programa.
En este sentido, cabe aclarar también que los escáneres DAL, si bien están
utilizándose intensivamente en Filosofía y Letras, también han sido solicitados por otras
instituciones, entre ellas el SEDICI de la Universidad Nacional de La Plata, y se está
llevando adelante un plan con la Asociación Civil Wikimedia Argentina, consistente en la
manufacturación de escáneres para su entrega en commodato en bibliotecas de
universidades públicas, instituciones culturales o de investigación y bibliotecas populares.
Conclusión
Todas las instituciones que resguardan acervos bibliográficos necesitan digitalizar o
contar con un escáner que les permita digitalizar material, ya sea porque el material que
tienen actualmente se encuentra deteriorado y necesitan sacarlo de circulación; porque se
cuenta con una única copia del material; porque el material es muy valioso, de dominio
público, y no se encuentra en ningún otro sitio; entre muchos otros factores. Una política
de digitalización puede, además, ser un gran instrumento para pensar en la extensión
cultural de la biblioteca.
Sin embargo, los costos actuales de los escáneres comerciales son una barrera
para masivizar una herramienta tecnológica tan importante para la vida de las bibliotecas.
Los escáneres caseros DIY o "hazlo tú mismo", pueden ser una opción que permitan
desarrollar un plan intensivo de digitalización a bajo costo y con gran calidad.
Quedará para otra discusión la situación actual de la legislación de propiedad
intelectual, que es un obstáculo enorme para el desarrollo integral de proyectos de
digitalización en las bibliotecas.