I. Fundamentos - Universidad de Córdobalr1maalm/apuntesherramientasarchivo1.pdf · componentes de...

1

I. Fundamentos

1. ¿Qué son los formatos de archivo implicados en la localización?

En general, un formato de archivo implicado en la localización se puede definir como el

diseño y la organización de los datos de un archivo usado para la localización de

componentes de software. Al usar herramientas de TAO y de software en un proyecto

de localización, los formatos de archivo implicados en la localización se importan como

achivos de origen al principio del proyecto. Con el fin de trabajar con los formatos de

archivo de localización para localizar componentes de software, primero es necesario

distinguir entre texto traducible y no traducible contenido en los archivos. Para ello, es

importante considerar que según qué componentes del software se deban localizar

(interfaz de usuario, sitios web, archivo de ayuda o documentación impresa), los

formatos de archivo implicados en la localización pueden variar.

2. Tipos de formato de archivo implicados en la localización

2.1 Según los componentes de software

Los componentes de software (el software y la documentación) se crean usando

distintas aplicaciones informáticas basadas en distintos lenguajes de programación.

Como resultado, tienen formatos de archivo distintos. Por ejemplo, con las interfaces de

usuario de software, los datos pueden comprender no sólo texto (datos localizables),

sino también código de programa, código fuente o código de recursos, una secuencia de

instrucciones escritas en un lenguaje de programación legible por el ser humano. En el

caso de la documentación, como los sitios web y los archivos de ayuda, el texto

traducibles puede estar enmarcado entre etiquetas de diseño. Algunos de los formatos

posibles para los distintos componentes de software son: Software:

Archivos de programa: Archivos RC files y .exe procedentes de distintos

entornos de programación, como Borland Delphi, Java, XML, .NET, Visual

Basic o archivos en formatos de metalocalización como .po, XLIFF, etc.

Archivos gráficos: .gif, .jpg, .tiff, .psd, .bmp, etc.

Documentación:

Documentación impresa: .fm, .indd, .doc, .rtf, etc.

Archivos de ayuda: .chm, .hlp, .rtf, .html, etc.

Páginas web: .xml, .html, .php, .js, .pl, etc.

Respecto a los datos, las diferencias entre los formatos de archivo de la localización

para los componentes de software dependen de:

Qué datos se consideran relevantes para la localización

Cómo se distinguen los datos relevantes para la localización de otros datos

Cómo se almacenan los datos

Cómo se usan los "transferibles" y las secuencias de escape

2

2.2 Según el desarrollo de software

2.2.1 Archivos de código fuente y archivos binarios

Al desarrollar aplicaciones de software, hay más tipos de formatos de archivo

implicados en la localización: archivos de código fuente y archivos binarios. Al escribir

aplicaciones de software, los programadores usan conjuntos de archivos de código

fuente (que contienen código de programación, código fuente y código de recursos, que

se compilan a continuación para crear archivos de programa. Tanto los archivos de

código fuente como los binarios son tipos de formatos de archivo implicados en la

localización que contienen texto traducible. Archivos de código fuente: Estos archivos,

también llamados archivos de código de recursos (archivos RC), contienen

componentes de la interfaz de usuario (como menús y cuadros de diálogo) y podrían

ser:

Basados en texto: En estos archivos de formato de texto sin formato, el texto

traducible suele estar rodeado por código del programa (como especificaciones

de cuadros de diálogo, etc.), que no deben cambiarse durante la traducción. Con

el fin de traducir archivos de código fuente que consisten en texto sin formato,

pueden usarse editores de texto, herramientas de memorias de traducción o una

herramienta específicamente creada para la localización de software.

Basados en HTML/XML: Estos archivos de código fuente basados en HTML o

XML pueden editarse o traducirse con un editor de código fuente (herramienta

de desarrollo de software utilizado para crear y editar archivos de código

fuente), un editor de texto o una herramienta de memorias de traducción, usando

un filtro que permita extraer texto traducible y proteger los elementos de código,

p.ej. en la mayoría de los editores de los sistemas de MT y herramientas de

localización.

Archivos binarios: Se trata de archivos ejecutables que contienen datos "codificados en

formato binario (en secuencias de bytes) con fines de almacenamiento y procesamiento

informáticos" (trad. de Wikipedia, 2007). Los archivos binarios se utilizan en los

programas de ordenador para "ejecutar" las instrucciones de programa contenidas en

ellos. Esto quiere decir que son archivos de programa compilados, y, al contrario que

los archivos de código fuente, no pueden ser leídos por los seres humanos. Los archivos

binarios sólo pueden traducirse con herramientas de localización de software o de

memorias de traducción, que son capaces de extraer elementos localizables del código

binario. Son ejemplos de archivos binarios los ejecutables (p.ej. .exe, .dll), los gráficos,

los de audio y los comprimidos en formato .zip.

2.2.2 Diferencias estructurales

Respecto a su estructura, los archivos de código fuente y los binarios también se

distinguen por su:

Estructura externa: Hay diferentes posibilidades para identificar y editar la

información localizable sin destruir/corromper el formato, p.ej. para extraer los

3

elementos localizables, de forma que el traductor no manipula el código del

programa

Contexto, alcance, conceptos de programación: La información contextual que

falte, la información incompleta o las reglas a seguir por los archivos de destino

en los archivos de código fuente pueden ser distintos de los de los archivos

binarios.

Comunicación interna: Los elementos como los transferibles, las secuencias de

escape y las etiquetas pueden ser distintos en los archivos de código fuente y los

binarios.

2.2.3 Archivos de código fuente o binarios implicados en la localización

El uso de archivos de código fuente o binarios en la localización tiene ventajas y

desventajas que merece la pena mencionar:

Archivos de código fuente

Ventajas:

No hace falta ningún editor en especial -- casi cualquier editor puede editar este

tipo de archivos

No hacen falta herramientas caras (de localización de software) (estos archivos

pueden traducirse usando herramientas de localización de software o de

memorias de traducción).

Después de la traducción, hay que compilar los archivos de código fuente, y

quizás enlazarlos entre sí para formar una aplicación completa creada para el

aseguramiento de la calidad.

Desventajas:

No es fácil mantener la visión de conjunto al traducir este tipo de archivos. Si no

se usan herramientas, los traductores tienen que buscar todas las cadenas de

texto traducibles.

Sin herramientas específicamente concebidas para ello, los traductores no

pueden ver el aspecto de la interfaz traducida.

Si no se usan herramientas específicamente creadas para ello, hay un alto riesgo

de que el traductore sobreescriba partes del programa.

La información contextual (en particular, la relativa a la estructura) puede

perderse si se presenta al traductor en forma de lista texto traducible extraído de

los archivos de código, en particular si se hace en orden alfabético.

Sin herramientas específicamente pensadas para ello, puede ser difícil (o incluso

imposible) reconstruir esta información contextual del archivo original.

Archivos binarios

Ventajas:

Como la mayoría de las herramientas de localización incluyen una opción

WYSIWYG, los traductores pueden ver inmediatamente el aspecto de su

traducción en la interfaz del software.

Los archivos binarios contienen información contextual

Es la mejor opción para prevenir hacer cambios por error en los archivos de

código fuente en formato de texto (Esselink, 2000:59, Sachse, 2005:147).

4

Desventajas:

Hacen falta editores o herramientas especiales (como las herramientas de

localización de software) para editar estos archivos.

3. Elementos localizables

Aunque ya hemos dado una visión general de los tipos de formatos de archivo

implicados en la localización que existen, ahora nos concentraremos en dichos formatos

de archivo, concretamente en los elementos localizables contenidos en tales formatos.

Los elementos localizables en los formatos de archivo implicados en la localización de

software (archivos de código fuente o archivos binarios) son los datos que forman la

interfaz de usuario. Los siguientes son ejemplos de elementos de la interfaz de usuario

que deben ser localizados:

Menús

Cuadros de diálogo

Teclas de acceso y atajos de teclado (teclas rápidas)

Tablas de cadenas de caracteres

Elementos gráficos

3.1 Menús

Menús

http://ecolotrain.uni-saarland.de/index.php?eID=tx_cms_showpic&file=uploads%2Fpics%2Ffile_new.jpg&width=800m&height=600m&bodyTag=%3Cbody%20style%3D%22margin%3A0%3B%20background%3A%23fff%3B%22%3E&wrap=%3Ca%20href%3D%22javascript%3Aclose%28%29%3B%22%3E%20%7C%20%3C%2Fa%3E&md5=b141cc9cab33b0631c4bc241534b4676

5

Se trata de listas de opciones que se muestran en la pantalla (en forma de menús

emergentes o desplegables) en los que los usuarios pueden tomar decisiones. Son:

Barras de menú

Opciones de menú

Menús contextuales

3.2 Cuadros de diálogo

Se trata de pequeñas ventanas que se superponen al programa, en las que hay campos en

los que el usuario puede introducir datos. Pueden contener pestañas, casillas de

opciones, texto estático, listas,

etc.

3.3 Teclas de acceso y atajos de teclado

También llamadas teclas rápidas, las teclas de acceso son combinaciones de teclas que

permiten al usuario acceder a funciones en menús y submenús. Las teclas de acceso

suelen ser fáciles de recorder, al incluir normalmente la primera letra de la función

correspondiente. Esta aparece subrayada en la línea de menús, p.ej. la "S" en "Save"

6

("guardar"). Los atajos de teclado también son combinaciones de teclado usadas para

acceder funciones en menús y submenús. La combinación de teclas es una abreviatura

de la instrucción de la opción de menú. En nuestro ejemplo, se usa Ctrl+S como atajo

de teclado de la instrucción Save ("guardar"). Cuando se localiza una aplicación de

software, no suelen cambiarse los atajos de teclado, especialmente porque a menudo son

comunes a otras aplicaciones. Sin embargo, las teclas de acceso sí que deben adaptarse

a los nombres de las opciones respectivas en la lengua de destino.

3.4 Tablas de cadenas de caracteres


Se trata de secuencias de símbolos, normalmente ordenadas en forma de tabla.

Mensajes del sistema

Tooltips

Texto de la barra de estado

Opciones en los campos de listas

Valores de las variables en los mensajes del sistema

7

3.5 Elementos gráficos

Elementos gráficos

Pueden ser:

Mapas de bits: Es el tipo de formato que suelen tener los gráficos en una interfaz

de usuario. Los cursores y los iconos, por ejemplo, pueden estar en este formato.

Las imágenes de mapas de bits tienen que localizarse, y esto puede hacerse con

un editor gráfico convencional, como Adobe Photoshop o JASC Paint Shop Pro.

Iconos: Se trata de pequeñas imágenes en la pantalla del ordenador que

representan objetos o funciones para que las vea el usuario. Su finalidad es hacer

el uso de los ordenadores más fácil, y son una de las características de los

sistemas basados en interfaces gráficas de usuario.

Cursores: Un cursor es el símbolo en la pantalla del ordenador que indica la

posición de la entrada actual o el lugar en el que aparecerá el próximo carácter.

8

Formatos de archivo implicados en la localización

En la sección siguiente, se describen tres tipos de formatos de archivo propios de la

localización, de acuerdo con sus características técnicas y los retos que suponen en el

proceso de localización de software. Cubriremos:

Archivos RC,

Archivos HTML y

XML

Archivos RC

Definición

Los archivos RC (archivos de Resource Script) son archivos de código fuente estándar

en Windows. Normalmente, las aplicaciones de Windows se construyen de tal forma

que un compilador de recursos crea un archivo de recursos binario (.res), enlazando un

archivo de recursos ASCII (.rc) con un archivo compilado o ejecutable.

Características

Los archivos RC normalmente están escritos en ASCII y por líneas, porque contienen

líneas que terminan en un carácter de línea nueva (que indica el final de una línea de

texto) o par de retorno de carro.

9

Ejemplo de datos contenidos en un archivo RC proveniente de un cuadro de diálogo

Entorno de desarrollo

Los archivos RC se usan en las aplicaciones Windows, que, a su vez, suelen haber sido

desarrolladas en entornos de programación orientados a objetos como Visual C++,

Visual Basic o un entorno de desarrollo basado en web como Java.

Retos

Los archivos RC contienen información localizable que normalmente procede de

cuadros de diálogo, menús y tablas de cadenas de caracteres. Ahora examinaremos una

serie de características de los archivos RC que plantean un reto a la localización.

Elementos localizables

Entre los elementos que pueden encontrarse en los archivos RC que pueden o deben ser

localizados, están el texto, los botones, las cuestiones de tamaño, las fuentes y el tamaño

de las mismas.

10

Ejemplo de elementos que pueden o deben ser localizados en los archivos RC: texto y

botones (en rojo), cuestiones de tamaño, fuentes y el tamaño de las mismas (en azul)

Identificadores

Los identificadores o IDs son marcas usadas para distinguir elementos del programa

específicos en todo el paquete de software. Los identificadores permiten realizar

"conexiones" entre el código del programa y los recursos. Aunque los identificadores se

usan muy frecuentemente en los archivos RC, su uso no es muy intuitivo. Realizar

cambios en el formato de origen sin el asesoramiento técnico adecuado puede llegar a

errores. Por tanto, los identificadores no deberán cambiarse durante la localización.

11

Ejemplo de identificadores (en verde) en un archivo RC

12

Transferibles

Los transferibles se utilizan, por ejemplo, cuando hay que generar un mensaje en

pantalla de forma dinámica durante la ejecución. Un ejemplo puede ser el siguiente

mensaje: "El documento %s contiene %d palabras", en el que, durante la ejecución del

programa, se inserta el nombre del documento en lugar de %s y el número de palabras

en lugar de %d. Los transferibles representan los parámetros o valores actuales que hay

que insertar. En particular, los caracteres "%s" son transferibles sensibles a la ubicación,

utilizados en C y C++. Esto significa que también "%" necesita una secuencia de

escape, por ejemplo: "%%" en la cadena "%d %%" donde %d es el número porcentual

(p.ej. 50) y %% representa el carácter "%" en un mensaje como "50 %".


Uno de los retos al localizar tablas de caracteres en archivos RC es que la localización

se realiza sin información contextual. Las únicas pistas son los identificadores (IDs),

que no deben modificarse. Para reducir este problema, se pueden insertar comentarios

para los traductores o localizadores en las tablas de cadenas.

Espacio

Respecto al espacio en la interfaz de usuario de un programa, podría suponer un gasto

de tiempo enorme ajustarlo en los archivos RC si no se dispone de una herramienta de

localización de software. Muy a menudo, los traductores/localizadores tienen que

ajustar manualmente el tamaño del texto traducido que aparece en botones y cuadros de

13

diálogo usando un editor gráfico. Las herramientas de localización de software permiten

acelerar este proceso.

Editor gráfico

Juegos de caracteres y fuentes

Al localizar las interfaces de usuario a idiomas como el ruso, el griego o el chino, el

texto traducido no se muestra siempre en la pantalla en la manera que debería. Esto a

menudo tiene que ver con los juegos de caracteres y fuentes utilizados. Los recursos

binarios siempre se guardan en formato UNICODE. Sin embargo, los programas pueden

estar escritos tanto en UNICODE como en una página de código concreta, porque,

dependiendo del sistema operativo, las aplicaciones podrían no funcionar, p.ej. en MS

Windows 9x/ME sólo funcionan las aplicaciones basadas en una página de código

determinada. Si los juegos de caracteres y las fuentes no se muestran correctamente en

la pantalla, esto no significa necesariamente que haya errores de localización. Siempre

es buena idea probar el software en un sistema operativo localizado. Finalmente, para

simplificar el flujo de trabajo, los localizadores deberían intentar usar las fuentes

predeterminadas.

Archivos HTML Se trata de archivos de texto escritos en HTML (HyperText Markup Language), un

lenguaje de formateado por etiquetas (un lenguaje de marcado) que tiene finalidades

específicas y usa un conjunto de etiquetas predefinidas. En su origen, HTML fue

desarrollado a partir de SGML (Standard Generalized Markup Language). El término

hypertext en HyperText Markup Language se refiere al método de organizar texto o

contenidos, de forma que ciertos elementos estén vinculados a otros, como sitios web,

formularios interactivos, imágenes incrustadas y otros objetos (hipervínculos). Por

tanto, el contenido no sólo puede leerse de forma lineal, sino también navegando por

14

diversos documentos y sitios yendo de un hipervínculo a otro. El término marcado se

refiere al proceso de añadir información estructural y de formateado al texto mediante

etiquetas predefinidas. Por ejemplo, estas etiquetas permiten la descripción de

elementos estructurales en las páginas web como encabezados, tablas, gráficos,

hipervínculos, etc. Las etiquetas HTML se usan para el formateado, indicando al

navegador web cómo mostrar el texto o contenido. (cf. Zerfaß, 2005).


HTML es el lenguaje de marcado más extendido para la creación de páginas web. Hoy

en día, cuatro millones de páginas web activas están escritas en HTML, y este formato

es comúnmente aceptado como formato estándar para escribir páginas web. En el

ámbito de la localización de software, el HTML se ha convertido en el formato de

archivo estándar para las páginas web y los archivos de ayuda. Al localizar, los

formatos de archivo en HTML suelen ser traducidos con una memoria de traducción o

una herramienta de localización de software. Para editar archivos HTML sin usar

herramientas, debería usarse un editor apropiado, preferiblemente el mismo que se usó

para crear los archivos originales (cf. Esselink 2000:175).

Características

Los formatos de archivo HTML consisten en etiquetas, encerradas por signos de "menor

que" (<) y "mayor que" (>). Todos los archivos HTML comienzan con una etiqueta de

apertura, <HTML>, y una de cierre, </HTML>. Estas etiquetas permiten la definición

de la estructura del contenido, del diseño de página, del formato del texto, de la

inserción de imágenes, etc. Etiquetas externas frente a internas En el formato de

archivo HTML hay dos tipos de etiquetas: internas y externas. Las etiquetas internas

están dentro de los segmentos traducibles (p.ej. en frases). Un ejemplo de etiquetas

internas son las de apertura <b> y cierre </b> de texto en negrita. Las etiquetas externas

se encuentran fuera de los segmentos traducibles, y permiten el marcado del contenido y

el formateado de los párrafos (cf. Esselink, 2000:2007). Es importante para los

15

traductores/localizadores distinguir entre ambos tipos de etiquetas, ya que puede que

hay que modificar las internas al traducir, mientras que las externas deben mantenerse

tal cual. DTD En los formatos de archivo HTML, todas las etiquetas están predefinidas.

Esto significa que hay un número concreto de etiquetas que pueden usarse en un

documento dado. La especificación de las etiquetas que se pueden usar está contenida

en la definición de tipo de documento (DTD), en la que también se especifican las reglas

que debe seguir la estructura del documento (cf. Esselink, 2000:2007). Los documentos

HTML también incluyen una declaración que especifica la versión de HTML y el tipo

de documento. En la declaración, un documento HTML dado se "declara" válido de

acuerdo con la DTD de HTML. Casi todas las ediciones actuales de herramientas de

MT incluyen un archivo de ajustes para archivos HTML (p.ej. el archivo HTML4.ini de

SDL TRADOS), que contiene reglas de segmentación predefinidas. Validación Con el

fin de validar la conformidad de los documentos HTML con la norma, hay varias

herramientas en Internet (analizadores sintácticos o "parsers") que comprueban la

sintaxis del documento respecto a la DTD. Los documentos deberían validarse tras la

localización, para verificar que todos los enlaces internos y externos funcionan y que no

hay etiquetas corruptas. Algunos ejemplos de herramientas de validación en línea son

www.htmlvalidator.com y www.linkbot.com (cf. Esselink, 2000:268).

Ejemplos de DTD

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<?xml version="1.0" encoding="utf-8"?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">



<html>

...

</html>

XML DTD schema example

<!ELEMENT people_list (person)*>

<!ELEMENT person (name, birthdate?, gender?, socialsecuritynumber?)>

<!ELEMENT name (#PCDATA)>

<!ELEMENT birthdate (#PCDATA)>

<!ELEMENT gender (#PCDATA)>

<!ELEMENT socialsecuritynumber (#PCDATA)>

Entidades: Las entidades HTML son cadenas de caracteres específicos que pueden

tener funciones especiales. Por ejemplo, pueden utilizarse como "secuencias de escape"

para representar caracteres extendidos que no están en el juego de caracteres estándar

ASCII. El carácter que las introduce indica que los caracteres que siguen hay que

interpretarlos de forma alternativa. Algunos ejemplos de caracteres extendidos y las

secuencias de escape correspondientes son:

16

La entidad HTML utilizada para transcribir umlauts alemanes como "ä" es

ä

El carácter alemán "ß" se transcribe ß

El carácter alemán "ç" se transcribe ç

Otros caracteres, como '&', '<' y '>' son parte de la sintaxis HTML. Cuando se desea

utilizar estos caracteres de otra forma, por ejemplo, como parte del texto, hay que

utilizar el mismo sistema. Por ejemplo:

"Ampersand" ('&') se transcribe &

"Menor que" '<' se transcribe <

"Mayor que" '>' se transcribe >

Ejemplo de caracteres extendidos alemanes con las correspondientes "secuencias de

escape" en HTML

Retos

Los archivos HTML contienen código de programa, texto e información metatextual

(formateado etc.) Distinguir estos elementos unos de otros plantea un auténtico reto a la

localización. En general, los retos al localizar HTML están relacionados con los mismos

elementos sintáticos de HTML mencionados en la sección anterior. Por ejemplo, en un

documento HTML es posible encontrar documentos hipertextuales; texto, gráficos,

archivos de sonido y vídeo; hojas de estilo, formularios, diseños y scripts que tienen que

ser localizados o actualizados según cuál sea el mercado de destino. Algunas de estas

particularidades de los documentos HTML que pueden suponer un reto para los

traductores o localizadores son: Formularios: En HTML puede haber formularios,

áreas de entrada de texto o listas de opciones. En este caso, el reto para los traductores y

localizadores supone distinguir el texto de los formularios que debe ser traducido. El

siguiente gráfico muestra la representación en HTML de un formulario con áreas de

entrada de texto y listas para seleccionar opciones:

17

Formularios

Formato: En HTML, formatear se refiere a las especificaciones que definen cómo el

texto va a aparecer. Por ejemplo, el tamaño, la familia y el color de la fuente, las

indicaciones sobre tamaños y listas son elementos de formateado en HTML. Para los

traductores y localizadores, es importante distinguir elementos de formateado, con el fin

de modificarlas o adaptarlas según los requisitos del mercado de destino.

Elementos de formateado como la familia, el tamaño, el color y el tamaño de la fuente

en el texto HTML

Scripts incrustados: Los scripts son "instrucciones para otros ordenadores", dicho de

otra manera: lenguajes de programación que pueden ser interpretados por un ordenador

e introducidos por un ser humano usando un teclado. Un script muy extendido en la

creación de websites es el JavaScript. Este tipo de script suele estar incrustado y

permite el acceso a los objetos de otras aplicaciones. Uno de los retos que plantean los

scripts incrustados a los traductores/localizadores es distinguir el subconjunto de datos

incrustados: los lugares en los que los datos incrustados comienzan y terminarn, y

dónde se encuentra el texto traducible. Por ejemplo, dada la siguiente aplicación

JavaScript y su correspondiente código fuente:

http://en.wikipedia.org/wiki/JavaScript

18

Alerta en JavaScript

Código fuente en JavaScript

El script incrustado contiene, obviamente, información traducible (en verde).

Archivos XML Definición

Se trata de archivos escritos en XML (eXtensible Markup Language). El XML es un

lenguaje d emarcadao que combina texto e información relacionada. Una de sus

finalidades principales es facilitar el intercambio de datos entre distintos sistemas de

información, en particular a través de Internet. Como el HTML, el XML fue

desarrollado originalmente a partir de SGML (Standard Generalized Markup

Language). Fue diseñado para ser más fácil de analizar sintácticamente y de procesar

que el SGML, y se considera una simplificación del SGML, destinado a aplicaciones de

uso general, como el web.


Hoy en día, el XML juega un papel creciente en la gestión de datos, al ser "una de las

formas más seguras, más potentes y flexibles de almacenar, manipular, localizar y

presentar datos en distintos idiomas" (Savourel, 2005). Es por ello que se ha convertido

en un compnente importante en ámbitos tales como la internacionalización y la

19

localización. En la localización, por ejemplo, se usa el XML a menudo,

independientemente de si el proyecto de localización hay implicados componentes en

XML o no. Los archivos XML pueden usarse como archivos de recurso para la

localización, y casi todas las herramientas de localización de software trabajan con

formatos XML.

Visión de los datos de XML como formato de recursos

Al localizar, los formatos de archivo en XML suelen ser traducidos con una memoria de

traducción o una herramienta de localización de software. Para editar formatos de

archivo XML sin herramienta, deberá usarse un editor adecuado. Aunque los ámbitos de

uso del XML más comunes son la documentación y los sitios web, también puede

encontrarse XML en las interfaces de usuario, las capas de transferencia de datos, los

mecanismos de exportación/importación de bases de datos y los gráficos. También se

usa el XML como formato de intercambio, p.ej. entre distintas aplicaciones como bases

de datos, procesadores de textos, hojas de cálculo, etc.

Características

El XML permite la representación estructurada de contenidos y relaciones, separando

contenido y forma.

20

Ejemplo de visión de la estructura de un documento XML

Como en HTML, la estructura XML consiste en etiquetas (encerradas entre signos < >)

y texto. Cada elemento XML viene marcado por una etiqueta de apertura y otra de

cierre, y puede contener texto u otros elementos. Las etiquetas tienen nombres de

atributos y pueden contener además atributos, que, a su vez, están compuestos de

nombres de atributo y valores, pudiéndose definir ambos libremente. En un documento

XML bien escrito, las etiquetas no se solapan, y todas las etiquetas están cerradas. Al

contrario que ocurre en HTML, en que los nombres de todas las etiquetas están

predefinidos, en XML se pueden definir etiquetas a placer.

UNICODE Una de las razones que hacen que XML esté tan extendido en la industria

de la localización y la internacionalización es que el juego de caracteres Unicode de los

documentos XML puede incluir caracterers en la mayoría de las lenguas utilizadas hoy

en día (cf. Savourel, 2005). Entidades Como en HTML, en XML algunos de los

caracteres que corresponden a la sintaxis XML tienen que ser representados con

"secuencias de escape", es decir, ser sustituidos por entidades. Por ejemplo, el signo

"menor que" "<" debe representarse "<" y el de "mayor que" ">" con ">". Los

caracteres extendidos pueden ser tratados de la misma forma en XML. De esta forma,

los documentos XML pueden contener caracteres de cualquier tipo, aun cuando la

codificación del documento no sea compatible con ellos. Como ejemplo, la letra griega

Omega (Ω) puede sustituirse por &#x3a9 o &#937, si el documento usa una

codificación incompatible con el alfabeto griego (cf. Savourel, 2005). DTD Como en el

caso de los archivos HTML, los archivos XML también tienen una definición del tipo

de documento (DTD) que contiene información sobre las funciones y las

interdependencias jerárquicas de las etiquetas, la estructura, etc. Sin embargo, en

21

contraste con lo que ocurre con las etiquetas HTML, las de XML no están predefinidas.

Por tanto, la DTD describe el archivo XML mediante restricciones de la estructura.

Contiene las etiquetas y los atributos permitidos en el documento XML y describe

algunas construcciones que no son imprescindibles para establecer la estructura, pero

que pueden afectar la interpretación de algunos documentos. Cuando la estructura de un

documento XML se corresponde con el esquema DTD definido previamente, el

documento XML se considera "válido".

Retos

Los retos que plantea la localización de archivos XML están relacionados con la

complejidad natural de los archivos XML. DTD: Para los localizadores y los

traductores, puede ser difícil obtener el archivo DTD de los clientes. Algunas de las

versiones de los sistemas de memorias de traducción (p.ej. en el caso de SLD TRADOS,

todas las versiones anteriores a SDL TRADOS 7) necesitan, para traducir archivos XML,

el archivo que contiene la DTD, para poder crear el archivo de configuración (en

TRADOS, el archivo *.ini), que especifica las reglas de segmentación que se utilizará en

el documento XML en particular. De otro modo, hay que crear el archivo de

configuración haciendo una lista de las etiquetas y sus funciones manualmente.Algunas

versiones recientes de herramientas de memorias de traducción o localización no

necesitan forzosamente el archivo DTD, pero tienen sus propios mecanismos para

analizar y extraer las etiquetas XML del documento XML, creando así el archivo de

configuración de manera semiautomática (el usuario aún puede hacer ajustes).

Estructura cambiante: A menudo, la localización de archivos en XML puede ser muy

compleja, porque las estructuras cambian, y puede ser difícil determinar qué elementos

son localizables.

Distintas estructuras para los mismos datos en XML

Hay distintas posibilidades de estructurar XML como formato de recursos. En estos dos

ejemplos, la misma información se presenta con dos estructuras distintas. Por ejemplo,

en el primero, todos los valores de los identificadores y los datos traducibles están

incrustados directamente entre la etiqueta de apertura y la de cierre correspondiente. En

el segundo, los valores de los identificadores están incrustados en la subentidad XML, y

los datos traducibles en la subentidad XML, ambas subordinadas a la entidad.

22

XML en el proceso de localización

Situación 1: XML como fuente de datos temporal

En esta situación, el formato XML se usa como puente para la localización. Usando

filtros especiales, los datos para localizar pueden convertirse, extraerse o mezclarse del

formato propietario del desarrollador de la aplicación o del autor de la documentación a

un formato XML que será utilizado durante la localización. Después, los archivos XML

localizados serán convertidos de nuevo al formato propietario del desarrollador de la

aplicación o del autor de la documentación.

Situación 1

Situación 2: XML como fuente de datos alternativa

En este escenario, los archivos de origen están en formato XML y tienen que ser

traducidos primero y luego convertidos al formato propietario del desarrollador de la

aplicación o del autor de la documentación, mediante una herramienta de conversión.

De esta forma, no son necesarios datos de extracción o conversión antes de la

localización, y es posible conservar las ventajas de proveer datos en XML a los

localizadores.

Situación 2

Situación 3: XML como fuente de datos original

En este caso, los archivos para localizar son entregados por el desarrollador de la

aplicación o el autor de la documentación en formato XMl. No hará falta, por tanto,

convertir los archivos antes ni después del proceso de localización.

23

(Gráficos tomados de Savourel, 2005)

Situación 3

HTML frente a XML ¿Qué futuro tienen HTML y XML?

En los últimos años, XML ha cobrado importancia hasta el punto de que muchos

afirman que está retando el papel de líder que el HTML tuvo hasta ahora. Algunos de

los argumentos utilizados en favor de XML tienen que ver con las limitaciones de

HTML, por ejemplo:

HTML consiste en un catálogo fijo de etiquetas y sólo describr documentos de

un tipo en concreto

Los datos en HTML son difíciles de procesar para los navegadores

Los documentos HTML utilizados como aplicaciones acaban creando cuellos de

botella aumentando el tráfico entre cliente y servidor

Sin embargo, no es realista pensar que el HTML se convertirá en relevante de pronto,

especialmente si se tiene en cuenta el número de páginas útiles en activo que hay en

Internet hoy en día. Hay algunas propuestas para conservar el HTML y encontrar una

forma de integrarlo con el XML. La idea es apoyar la inclusión y el proceso de datos en

XML, bien delimitados y definidos, en documentos HTML. Esta estrategia permitirá:

que el contenido suministrado al web se enriquezca y apoyar futuras mejoras en

los modelos de contenido basados en XML

que los desarrolladores de contenido puedan confiar en las capacidades probadas

y conocidas de HTML mientras experimentan con XML en sus entornos

(Adaptado de "XML: It's the Future of HTML")

Formatos de archivo en la metalocalización

Los formatos de metalocalización fueron diseñados especialmente para ayudar en el

proceso de localización. Son formatos de recursos que pueden contener información

sobre diversos formatos de recursos, así como información adicional. Algunas de las

razones de mezclar formatos de recursos son:

24

Uso paralelo de distintos entornos de desarrollo, por ejemplo, recursos en

diferentes formatos de recurso (p.ej. el caso del formato de archivo .po)

Minimización del número de formatos de localización en el flujo de trabajo, por

lo que se usan metaformatos (p.ej. XLIFF)

Definición

XLIFF (XML Localization Interchange File Format) es un formato estándar basado en

XML diseñado para guardar texto extraído de archivos similares al software y

documentos con etiquetas. XLIFF fue desarrollado a finales de 2000 por un grupo de

compañías, entre las cuales estaban Oracle, Novell, Sun e IBM/Lotus, con el objetivo de

definir una especificación extensible para el intercambio de información de

localización. Como los formatos de localización pueden variar en su estructura, el uso

de juegos de caracteres, las marcas sustitutivas, las secuencias de escape, el formateado,

etc., se creó XLIFF para unificarlas todas en un solo formato, independientemente de

herramientas de localización específicas.

Ejemplo de un archivo XLIFF

Las siguientes características son propias de XLIFF:

El contenido se describe en forma de esquema, atendiendo a los elementos, sus

atributos y su uso. El gráfico siguiente muestra un ejemplo de un esquema

XLIFF:

25

Esquema XLIFF

El elemento más importante en la estructura XLIFF es la <trans-unit>, que

contiene los datos localizables en <source> y la traducción en <target>.

XLIFF sigue un enfoque bilingüe, porque se prevé un elemento específico para

la traducción <target>, y no hace falta sobreescribir el texto en <source>.

Ejemplo de elementos de una <trans-unit> en cierta estructura XLIFF

Es posible incluir información adicional.

26

Se usa como formato de localización nativo (p.ej. en Macromedia Flash).

En los archivos XLIFF también hay

Traducciones alternativas. En nuestro ejemplo, los térmions en alemán Extras y

Optionen equivalen al inglés Options.

Comentarios para traductores o localizadores

27

Leyendas con información para traductores o localizadores

Leyendas

28

Flujos de trabajo

Flujo de trabajo típico en la localización sin XLIFF En un flujo de localización típico

sin XLIFF, habiendo aplicaciones del desarrollador en varios archivos, cada uno en un

formato distinto, la localización puede resultar compleja. Con el fin de preparar todos

estos archivos para la localización, los gestores de proyecto o localizadores tendrán que

usar los filtros de recurso de la herramienta para convertir los archivos a un formato

apropiado, de forma que los archivos puedan ser editados y traducidos por traductores

usando la herramienta especificada por el cliente (si la indica).

Flujo de trabajo típico en la localización sin XLIFF (Fuente: OASIS)

Flujo de trabajo en la localización con XLIFF En un flujo de trabajo típico en la

localización con XLIFF, el proceso de localización se simplifica, porque hay menos

pasos en el proceso de localización. Por una parte, las aplicaciones del

desarrollador que se van a localizar podrían estar disponibles en el formato

XLIFF. En este caso, no hace falta pre-proceso, y los recursos traducibles pueden

editarse directamente y ser traducidos utilizando un editor compatible con XLIFF

o las herramientas apropiadas de memoria de traducción o localización. Si, por

otra parte, las aplicaciones del desarrollador que se van a localizar son

proporcionadas en un formato distinto a XLIFF los archivos (p.ej. HTML, RC,

Java, etc.) deben ser preprocesados y convertidos al formato XLIFF. Una vez que

estén en XLIFF, los recursos traducibles pueden editarse directamente y ser

traducidos utilizando un editor compatible con XLIFF o las herramientas

apropiadas de memoria de traducción o localización. (Gráficos tomados de Oasis)

29

Flujo de trabajo en la localización con XLIFF (Fuente: OASIS)

Hoy en día, las herramientas de localización de software han ampliado la cantidad de

formatos de archivo con los que son compatibles. Son compatibles con formatos tales

como:

Archivos binarios de recursos estándar de Windows (de 16 y 32 bits) (archivos

EXE, DLL, SYS) y RC)

Archivos binarios de Microsoft Visual Basic 6

Archivos XML, incluido XLIFF

HTML

Archivos de Microsoft Installer (MSI)

Archivos de texto monolingües

Algunas herramientas son compatibles con otros formatos de archivo, a través de add-

ins. Se trata de pequeños programas escritos para extender ciertas características a las

herramientas de localización de software. Algunos add-ins opcionales para otros

formatos de archivo son:

Archivos binarios de recursos de Microsoft .NET (EXE, DLLs satélite y

ensamblados), archivos de recursos (RESX y RESOURCE), compatibilidad con

cuadros de diálogo heredados (WYSIWYG), compatibilidad con controles y

propiedades personalizados, compatibilidad de todos los marcos .NET

Archivos binarios de recursos de Borland Delphi / C++ Builder (EXE, DLL,

BPL)

30

Java (todas las plataformas: Archivos J2EE, J2SE y J2ME), archivos de

propiedades (PROPERTIES), archivos de código fuente (JAVA), archivos

binarios (CLASS), archivos de proyecto Java (JAR)

Formatos de archivo compatibles adicionales:

Analizador sintáctico de bases de datos ODBC

o MS Access, MS Excel

o MS SQL Server

o Oracle

o IBM DB2

Palm OS Parser

.Analizador sintáctico po

31

Introducción.

HTML significa HyperText Markup Language. Es el lenguaje en que se escriben

los millones de documentos que hoy existen en el World Wide Web. Cuando

accedemos a uno de estos documentos, el cliente (Netscape, IE, Mosaic, Lynx,

IBrowse) los interpreta y los despliega. Existen clientes gráficos como Netscape, y otros

como el Lynx que solo despliegan texto. Es muy importante no olvidar esto cuando se

diseña una página web. Crear una buena página tiene dos aspectos; por un lado el

conocimiento técnico para crear código HTML correcto, por otro lado el claro diseño

para presentar la información.

El objetivo de este texto es proporcionar un conocimiento básico acerca de la

construcción y manejo de etiquetado para la ingeniería aplicada a la traducción de

páginas Web y dispositivos móviles, para un conocimiento más profundo de este

lenguaje posteriormente se desarrollarán más versiones de este texto, por el momento

esperamos que la información aquí proporcionada le sea de utilidad.

Etiquetas de muestra

Los archivos con etiquetas son archivos en los que la disposición o la estructura

de la información aparece separada del texto o del contenido y almacenada en códigos

que rodean a los elementos de texto. Por ejemplo, las páginas web están codificadas por

medio de un sistema de etiquetas llamado HTML (HyperText Markup Language).

Este ejemplo muestra parte de un documento HTML con etiquetas que rodean a los

elementos de texto. Las etiquetas contienen información estructural que identifica

distintas partes del documento web (p.ej. el título o los encabezamientos). Al traducir

documentos como este, el traductor tiene que tener cuidado de no cambiar, sobreescribir

32

o eliminar estas etiquetas, porque los navegadores de Internet las necesitan para mostrar

el documento web correctamente.

Etiquetas de protección

A través de un proceso de traducción mediante sistemas de MT, es una tarea importante

del editor ser capaz de proteger todas las etiquetas para que no puedan ser eliminadas o

modificadas por el(/los) traductor(es). Algunos sistemas lo hacen escondiendo

totalmente las etiquetas en el editor, y proporcionando una vista previa del documento

web en la lengua de destino, como se muestra en la captura de pantalla del programa

across.

Etiquetas como marcas sustitutivas

En otros sistemas, sin embargo, las etiquetas son reemplazadas por marcas sustitutivas

en el editor. En DéjàVu, por ejemplo, se representan como números entre corchetes

(llamados "códigos incrustados"), lo que significa que hay alguna etiqueta en el

33

documento original. El usuario puede elegir cómo desea que se muestre el significado

de estos códigos incrustados.

Según el sistema utilizado, el traductor puede mostrar todas las etiquetas e incluso

modificarlas, aunque no fuera recomendable. En un sistema como DéjàVu, es imposible

exportar el proyecto sin que todos los códigos sean insertados en los segmentos

correspondientes. En tales casos, el sistema alertará al usuario y mostrará el segmento

exacto en el que falta un código. El usuario tendrá que volver e insertar los códigos que

faltan para poder realizar la exportación.

Etiquetas en Trados

En el TagEditor de Trados, las etiquetas se muestran bien en forma abreviada o

completa, y pueden ser desplazadas, editadas o eliminadas durante la traducción. Si es

necesario, el traductor también puede añadir una etiqueta.

Es importante saber que hay etiquetas externas e internas:

Las etiquetas externas tienen, de forma predeterminada, un borde negro; por

ejemplo la etiqueta HTML Normalmente representan información estructural.

Estas etiquetas se ignoran completamente junto con su contenido durante el

proceso de traducción y sólo pueden aparecer fuera de las frases. Rara vez es

necesario mover o borrar las etiquetas externas durante la traducción.

Las etiquetas internas presentan un borde rojo, de forma predeterminada; por

ejemplo la etiqueta B. Estas etiquetas pueden representar información acerca del

34

formato (como el formato de fuente negrita), rodear hipervínculos u otras

marcas, y pueden aparecer dentro del texto. La mayoría de las etiquetas internas

se pueden desplazar dentro de la frase para ajustarse a la traducción.

Dependiendo del formato de archivo, se pueden añadir o borrar etiquetas

internas, si es necesario. De forma predeterminadad, el TagEditor considera las

etiquetas desconocidas como internas. Cuando las etiquetas contienen texto que

no sea información acerca de la estructura o el formato, TagEditor clasifica el

contenido del texto bien como traducible o bien como no traducible.

Convertir formatos de archivos con etiquetas

Con el fin de importar/convertir algunos formatos de archivo con etiquetas como

HTML, o archivos con etiquetas creados por filtros de importación desde formatos de

autoedición como FrameMaker, InDesign etc., las herramientas de MT suelen ser

capaces de reconocer las etiquetas utilizadas en estos formatos. Sin embargo, para los

archivos cuyo formato incluye etiquetas definibles por e autor del texto en la lengua de

origen, p.ej. XML, el traductor tiene que configurar filtros él mismo, bien a partir de

una Definición de Tipo de Documento (DTD) provista por el cliente, o analizando los

archivos y determinando la función de las etiquetas, p.ej. si se usan para delimitar

segmentos o para hacer que ciertos elementos del texto no sean traducibles.

35

36

Mapa de los lenguajes de marcas

Principales

GML --> SGML --> XML --> Dialectos XML

Documentos en general

Lenguajes

descriptivos

Lenguajes

de

presentación

Lenguajes ligeros Lenguajes

para manuales

ASN.1

EBML

YAML

Rich Text

Format

S1000D

TeX

troff

HTML

BBCode

Markdown

ReStructuredText

setext

Textile

Wikitexto

DocBook

HelpML

LinuxDoc

POD

Microsoft

Assistance

ML

Tecnologías de internet

World Wide

Web

Interfaz de

usuario Sindicación Servicios web

HTML

XHTML

Wireless ML

Handhelp

ML

RDF

Meta Content

Framework

GladeXML

MXML

(Macromedia)

User Interface

ML

XAML and

MyXaml

XForms

XUL / XBL

Atom

RSS

ICE

OPML y

OML

SyncML

WSDL

XINS

WSCL

WSFL

XML-RPC

Webml

Lenguajes especializados

Gráficos 2D: SVG, CGM, VML, InkML.

Gráficos 3D: VRML/X3D, STEP.

Matemática: MathML y OpenMath.

Música: LilyPond y MusicXML.

Taxonomía: DITA

Finanzas: eXtensible Bussiness Reporting Language, Financial products ML.

Geomática: Geography ML.

Aeronáutica: Spacecraft ML.

Multimedia: Synchronized Multimedia Integration Language.

Voz: VoiceXML.

Mensajería instantánea: XMPP.

Videojuegos: BulletML, COLLADA.

http://es.wikipedia.org/w/index.php?title=Generalized_Markup_Languaje&action=edit&redlink=1

http://es.wikipedia.org/wiki/SGML

http://es.wikipedia.org/wiki/XML

http://es.wikipedia.org/wiki/Anexo:Dialectos_XML

http://es.wikipedia.org/wiki/ASN.1

http://es.wikipedia.org/wiki/EBML

http://es.wikipedia.org/wiki/YAML

http://es.wikipedia.org/wiki/RTF

http://es.wikipedia.org/wiki/RTF

http://es.wikipedia.org/w/index.php?title=S1000D&action=edit&redlink=1

http://es.wikipedia.org/wiki/TeX

http://es.wikipedia.org/wiki/Troff

http://es.wikipedia.org/wiki/HTML

http://es.wikipedia.org/wiki/BBCode

http://es.wikipedia.org/wiki/Markdown

http://es.wikipedia.org/wiki/ReStructuredText

http://es.wikipedia.org/w/index.php?title=Setext&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=Textile&action=edit&redlink=1

http://es.wikipedia.org/wiki/Wikitexto

http://es.wikipedia.org/wiki/DocBook

http://es.wikipedia.org/w/index.php?title=HelpML&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=LinuxDoc&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=Plain_Old_Documentation&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=Microsoft_Assistance_Markup_Language&action=edit&redlink=1



http://es.wikipedia.org/wiki/HTML

http://es.wikipedia.org/wiki/XHTML

http://es.wikipedia.org/wiki/WML

http://es.wikipedia.org/w/index.php?title=Handheld_Device_Markup_Language&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=Handheld_Device_Markup_Language&action=edit&redlink=1

http://es.wikipedia.org/wiki/Resource_Description_Framework

http://es.wikipedia.org/w/index.php?title=Meta_Content_Framework&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=Meta_Content_Framework&action=edit&redlink=1

http://es.wikipedia.org/wiki/GladeXML

http://es.wikipedia.org/wiki/MXML

http://es.wikipedia.org/wiki/Macromedia

http://es.wikipedia.org/w/index.php?title=UIML&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=UIML&action=edit&redlink=1

http://es.wikipedia.org/wiki/XAML

http://es.wikipedia.org/w/index.php?title=MyXaml&action=edit&redlink=1

http://es.wikipedia.org/wiki/XForms

http://es.wikipedia.org/wiki/XUL

http://es.wikipedia.org/wiki/XBL

http://es.wikipedia.org/wiki/Atom

http://es.wikipedia.org/wiki/RSS

http://es.wikipedia.org/w/index.php?title=Information_Content_Exchange&action=edit&redlink=1

http://es.wikipedia.org/wiki/OPML

http://es.wikipedia.org/w/index.php?title=OML&action=edit&redlink=1

http://es.wikipedia.org/wiki/SyncML

http://es.wikipedia.org/wiki/WSDL

http://es.wikipedia.org/w/index.php?title=XINS&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=WSCL&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=WSFL&action=edit&redlink=1

http://es.wikipedia.org/wiki/XML-RPC

http://es.wikipedia.org/wiki/Webml

http://es.wikipedia.org/wiki/Scalable_Vector_Graphics

http://es.wikipedia.org/w/index.php?title=Computer_Graphics_Metafile&action=edit&redlink=1

http://es.wikipedia.org/wiki/Vector_Markup_Language

http://es.wikipedia.org/w/index.php?title=InkML&action=edit&redlink=1

http://es.wikipedia.org/wiki/VRML

http://es.wikipedia.org/wiki/X3D

http://es.wikipedia.org/wiki/ISO_10303

http://es.wikipedia.org/wiki/Matem%C3%A1tica

http://es.wikipedia.org/wiki/MathML

http://es.wikipedia.org/wiki/OpenMath

http://es.wikipedia.org/wiki/M%C3%BAsica

http://es.wikipedia.org/wiki/GNU_LilyPond

http://es.wikipedia.org/w/index.php?title=MusicXML&action=edit&redlink=1

http://es.wikipedia.org/wiki/Taxonom%C3%ADa

http://es.wikipedia.org/wiki/DITA

http://es.wikipedia.org/wiki/Finanzas

http://es.wikipedia.org/wiki/XBRL

http://es.wikipedia.org/w/index.php?title=FpML&action=edit&redlink=1

http://es.wikipedia.org/wiki/Geom%C3%A1tica

http://es.wikipedia.org/wiki/Geography_Markup_Language

http://es.wikipedia.org/wiki/Aeron%C3%A1utica

http://es.wikipedia.org/w/index.php?title=Spacecraft_Markup_Language&action=edit&redlink=1

http://es.wikipedia.org/wiki/Multimedia

http://es.wikipedia.org/wiki/SMIL

http://es.wikipedia.org/w/index.php?title=VoiceXML&action=edit&redlink=1

http://es.wikipedia.org/wiki/Mensajer%C3%ADa_instant%C3%A1nea

http://es.wikipedia.org/wiki/Extensible_Messaging_and_Presence_Protocol

http://es.wikipedia.org/w/index.php?title=BulletML&action=edit&redlink=1

http://es.wikipedia.org/w/index.php?title=COLLADA&action=edit&redlink=1

37

1. Estructura de un Documento HTML

Una página web es un archivo de texto, se puede crear con cualquier editor de

texto como el edit de DOS. El principio esencial del lenguaje HTML (HyperText

Markup Language) es el uso de las etiquetas (tags). Funcionan de la siguiente manera:

<XXX> Este es el inicio de una etiqueta.

</XXX> Este es el cierre de una etiqueta.

Las letras de la etiqueta pueden estar en mayúsculas o minúsculas,

indiferentemente. Por claridad, se usarán en este texto sólamente las mayúsculas.

Lo que haya entre ambas etiquetas estará influenciada por ellas. Por ejemplo,

todo el documento HTML debe estar entre las etiquetas <HTML> y </HTML>:

<HTML> [Todo el documento] </HTML>

El documento en sí está dividido en dos zonas principales:

El encabezamiento, comprendido entre las etiquetas <HEAD> y </HEAD>

El cuerpo, comprendido entre las etiquetas <BODY> y </BODY>

Dentro del encabezamiento hay información del documento, que no se ve en la

pantalla principal, principalmente el título del documento, comprendido entre las

etiquetas <TITLE> y </TITLE>. El título debe ser breve y descriptivo de su contenido,

pues será lo que vean los demás cuando añadan nuestra página a su bookmark (o agenda

de direcciones).

Dentro del cuerpo está todo lo que queremos que aparezca en la pantalla

principal (texto, imágenes, etc.)

Por tanto, la estructura queda de esta manera:

<HTML>

<HEAD>

<TITLE> Título de la página </TITLE>

</HEAD>

<BODY>

38

[Aquí van las etiquetas que visualizan la página]

</BODY>

</HTML>

Antes de crear nuestra primera página, unas consideraciones sobre el texto:

Cuando escribimos en el documento el texto que queremos que aparezca en la

pantalla, veremos que éste se acomoda a ella, sin que tengamos que pulsar el

retorno del carro. Si queremos separar el texto en distintos párrafos debemos

usar la etiqueta <P>, (que no tiene su correspondiente etiqueta de cierre </P>) .

El texto puede tener unas cabeceras, comprendidas entre las etiquetas <H1> y

</H1>, <H2> y </H2>, etc. (hasta el número 6), siendo el número indicativo del

tamaño. El tamaño mayor es el correspondiente al número 1. Puedes

experimentar en el ejemplo que sigue, cambiando el número para comprobar el

efecto que se logra.

Una etiqueta muy interesante es la de centrado <CENTER> y </CENTER> (no la

soportan todos los navegadores, aunque sí la mayoría de ellos). Nos centra todo lo que

esté dentro de ella, ya sea texto, imágenes, etc.

También tenemos los separadores (horizontal rules), que se consiguen con la

etiqueta <HR> (no existe la correspondiente de cierre). Con ella se obtiene una raya

horizontal tan ancha como la pantalla, y con la apariencia de estar embutida sobre el

fondo, como se puede observar a continuación:

Práctica 1.

En el procesador de texto copiamos lo siguiente:

<HTML>

<HEAD>

<TITLE> Mi pagina del Web - 1 </TITLE>

</HEAD>

<BODY>

<H1> <CENTER> Primera pagina </CENTER> </H1>

<HR>

39

Esta es mi primera pagina, aunque todavia es muy sencilla.

Como el

lenguaje HTML no es dificil, pronto estare en condiciones de

hacer

cosas mas interesantes.

<P> Aqui va un segundo parrafo.

</BODY>

</HTML>

Guardamos el fichero en el procesador de textos con el nombre de mipag1.html

y lo cargamos en el navegador. Este será el resultado.

2. Dando forma al texto

Como hemos visto en el ejemplo del epígrafe anterior, cuando queremos poner

un texto sin ninguna caracterísca especial, lo ponemos directamente. Unicamente, la

separación entre párrafos (dejando una línea en blanco) la conseguimos con la etiqueta

<P>.

Si queremos separar los párrafos, o cualquier otra cosa, pero sin dejar una línea

en blanco, usamos una etiqueta parecida <BR> (break, o romper). Tampoco tiene

etiqueta de cierre.

Si queremos obtener múltiples líneas en blanco no basta con repetir la etiqueta

<P>, sino que hay que combinarla con la etiqueta <BR>. Así por ejemplo, si queremos

obtener cuatro líneas en blanco, pondríamos:

40

<BR><P>

<BR><P>

<BR><P>

<BR><P>

Al escribir el texto, si ponemos más de un espacio en blanco entre dos palabras

observamos que el navegador sólo reconoce uno de ellos. Si queremos forzarle a que lo

haga, debemos poner el código " " (non-breaking space).

Para destacar alguna parte del texto se pueden usar:

<B> y </B> para poner algo en negrita (bold).

<I> y </I> para poner algo en cursiva (italic).

Otra etiqueta interesante es <PRE> y </PRE>. El texto que se encuentre entre

ella estará preformateado, es decir que aparecerá como si hubiera sido escrito con una

máquina de escribir, con una fuente de espaciado fijo (tipo Courier). Además se

respetarán los espacios en blanco y retornos del carro, tal como estaban en nuestro

documento HTML (lo cual no ocurre normalmente, como hemos visto anteriormente).

Es muy apropiada para confeccionar tablas y otros documentos similares.

Con la etiqueta <TT> y </TT> conseguimos también que el texto tenga un

tamaño menor y la apariencia de los caracteres de una máquina de escribir (typewriter).

La diferencia con la anterior es que no preformatea el texto, sino que únicamente

cambia su apariencia.

La etiqueta <BLOCKQUOTE> y </BLOCKQUOTE> se utiliza para destacar una

cita textual dentro del texto general.

En las fórmulas matemáticas puede interesar poder escribir índices y subíndices,

que se consiguen con las etiquetas <SUP> </SUP> y <SUB> </SUB> respectivamente.

Así, por ejemplo:

m2 se consigue de la siguiente manera: m<SUP>2</SUP>

vx se consigue con: v<SUB>x</SUB>

A menudo nos interesará presentar las cosas en forma de listas. Podemos

escoger entre tres tipos distintos:

1.Listas desordenadas (no numeradas)

2.Listas ordenadas (numeradas)

3.Listas de definición.

Las listas desordenadas (unordered lists) sirven para presentar cosas que, por

no tener un orden determinado, no necesitan ir precedidas por un número. Su estructura

es la siguiente: <UL>

<LI> Una cosa

<LI> Otra cosa

41

<LI> Otra más

<LI> Etc.

</UL>

Es decir, toda la lista está dentro de la

etiqueta <UL> y </UL>, y luego cada cosa va

precedida de la etiqueta <LI> (list item). El

resultado de lo anterior es el siguiente:

Se puede anidar una lista dentro de otra. Por ejemplo:

<UL>

<LI> Mamíferos

<LI> Peces

<UL>

<LI> Sardina

<LI> Bacalao

</UL>

<LI> Aves

</UL>

Las listas ordenadas (ordered lists) sirven para presentar cosas en un orden

determinado. Su estructura es muy similar a la anterior. La diferencia estriba en que en

el resultado aparecerá automáticamente un número correlativo para cada cosa.

<OL>

<LI> Primera cosa

<LI> Segunda cosa

<LI> Tercera cosa

<LI> Etc.

</OL>

Al igual que las listas desordenadas, también se pueden anidar las listas

ordenadas.

El tercer tipo lo forman las listas de definición. Como su nombre indica, son

apropiadas para glosarios (o definiciones de términos). Toda la lista debe ir englobada

42

entre las etiquetas <DL> y </DL>. Y a diferencia de las dos que hemos visto, cada

renglón de la lista tiene dos partes:

1. El nombre de la cosa a definir , que se consigue con la etiqueta <DT>

(definition term)

2. La definición de dicha cosa, que se consigue con la etiqueta <DD> (definition

definition).

<DL>

<DT> Una cosa a definir

<DD> La definición de esta cosa

<DT> Otra cosa a definir

<DD> La definición de esta otra cosa

</DL>

Comentarios no visibles en la pantalla

A veces es muy útil escribir comentarios en el documento HTML sobre el

código que escribimos, que nos pueden servir para recordar posteriormente sobre lo que

hicimos, y que no queremos que se vean en pantalla.

Esto se consigue encerrando dichos comentarios entre estos dos símbolos: 

Ejemplo:



Práctica 2

En el procesador de textos copiamos:

<HTML>

<HEAD>


</HEAD>

<BODY>

<CENTER>

<H1> Mis aficiones </H1>

</CENTER>

<HR>

Sin un orden particular, mis <B> aficiones </B> son las

siguientes:

<UL>

<LI> El cine

43

<LI> El deporte

<UL>

<LI> Natacion

<LI> Baloncesto

</UL>

<LI> La musica

</UL>

La musica que mas me gusta es <I> (en orden de preferencia):

</I>

<OL>

<LI> El rock

<LI> El jazz

<LI> La musica clasica

</OL>

</BODY>

</HTML>

Guardamos el fichero de texto con un nombre cualquiera y la extensión .html y

lo cargamos en el navegador.

Este es el resultado.

3. Enlaces con otras páginas

La característica que más ha influido en el espectacular éxito del Web (o tela de

araña) ha sido, aparte la de su carácter multimedia, la posibilidad de unir los distintos

documentos repartidos por todo el mundo por medio de enlaces hipertexto.

44

Estructura de los enlaces

En general, los enlaces tienen la siguiente estructura:

<A HREF="xxx"> yyy </A>

donde xxx es el destino del enlace (Obsérvese las comillas). yyy es el texto indicativo

en la pantalla del enlace (con un color especial y generalmente subrayado)

Tipos de enlaces

Vamos a distinguir cuatro tipos de enlaces:

a) Enlaces dentro de la misma página

b) Enlaces con otra página nuestra

c) Enlaces con una página fuera de nuestro sistema

d) Enlaces con una dirección de email

a) Enlaces dentro de la misma página

A veces, en el caso de documentos (o páginas) muy extensos, nos puede

interesar dar un salto desde una posición a otra determinada. En este caso, lo que antes

hemos llamado XXX, es decir, el destino del enlace, en este caso el sitio dentro de la

página a donde queremos saltar, se sustituye por #marca (la palabra marca puede ser

cualquier palabra que queramos). Lo que hemos llamado antes YYY es la palabra (o

palabras) que aparecerán en la pantalla en color (en forma de hipertexto). Su estructura

es, entonces: <A HREF="#marca"> YYY </A>

Y en el sitio exacto a donde queremos saltar, debemos poner la siguiente etiqueta:

<A NAME="marca"> </A>

Por ejemplo, si quiero saltar desde aquí a la pantalla final, pongo la siguiente etiqueta:

<A HREF="#final"> Pulsa para ir al final</A>

Y en el final del documento he puesto esta otra etiqueta:

<A NAME="final"> </A>

b) Enlaces con otra página nuestra

Puede ser que tengamos una sola página. Pero lo más frecuente es que tengamos

varias páginas, una inicial (o principal) y otras conectadas a ella, e incluso entre ellas

mismas.

Supongamos que queremos enlazar con la página creada en el ejemplo del

epígrafe anterior, que la hemos llamado mipag2.html. En este caso, simplemente

sustituimos lo que hemos llamado XXX (el destino del enlace) por el nombre del

fichero:

45

<A HREF="mipag2.html"> Ejemplo del epígrafe 2 </A>

Si queremos que vaya a un sitio concreto de otra página nuestra en vez de ir al

principio de la página, adonde va por defecto, en ese sitio tenemos que colocar una

marca (véase la sección anterior), y completar el enlace con la referencia a esa marca.

Una observación importante: Estoy suponiendo que la página en la que estoy

escribiendo esta etiqueta y la otra página a la que quiero saltar están en el mismo

directorio. Porque pudiera ocurrir que he organizado mi sitio del Web con un directorio

principal, y otros subdirectorios auxiliares. Si la página a la que quiero saltar está, p. ej.

en el subdirectorio subdir, entonces en la etiqueta tendría que haber puesto

"subdir/mipag2.html".

Y a la inversa, si quiero saltar desde una página a otra que está en un directorio

anterior, en la etiqueta tendría que haber puesto "../mipag2.html". Esos dos puntos hace

que se dirija al directorio anterior. Obsérvese que se debe utilizar el símbolo / para

indicar los subdirectorios, y no este otro \, que es propio únicamente de Windows.

Si nos queremos evitar todas estas complicaciones, podemos tener todo junto en

un único directorio, pero esto tiene el inconveniente de que esté todo más desordenado,

y sean más difíciles de hacer las futuras modificaciones.

c) Enlaces con una página fuera de nuestro sistema

Si queremos enlazar con una página que esté fuera de nuestro sistema (es decir,

que esté en un servidor distinto al que soporta nuestra página), es necesario conocer su

dirección completa, o URL (Uniform Resource Locator). El URL podría ser, además de

la dirección de una página del Web, una dirección de ftp, gopher, etc.

Una vez conocida la dirección (o URL), lo colocamos en vez de lo que hemos

llamado anteriormente xxx (el destino del enlace). Si queremos enlazar con la página de

Netscape (cuyo URL es: http://home.netscape.com/), la etiqueta sería:

<A HREF="http://home.netscape.com/"> Página inicial de Netscape

</A>

Es muy importante copiar estas direcciones correctamente (respetando las

mayúsculas y minúsculas, pues los servidores UNIX sí las distinguen)

d) Enlaces con una dirección de email

En este caso, sustituimos lo que se ha llamado antes xxx (el destino del enlace)

por mailto: seguido de la dirección de email. La estructura de la etiqueta es:

<A HREF="mailto: dirección de email"> Texto del enlace </A>

Es decir, es conveniente poner también en el texto del enlace la dirección de email.

Práctica 3.

46


<HTML>

<HEAD>


</HEAD>

<BODY>

<CENTER>

<H1> Mis paginas favoritas </H1>

</CENTER>

<HR>

Estas son mis paginas favoritas:

<P><A HREF="http://home.netscape.com"> Netscape </A>

<BR> <A HREF="http://www.microsoft.com"> Microsoft </A>

<BR> <A HREF="http://www.yahoo.com"> Yahoo! </A>

</BODY>

</HTML>

Guardamos el fichero de texto con el nombre mipag3.html y lo cargamos en el

navegador. Este es el resultado:

4. Imágenes

La etiqueta que nos sirve para incluir imágenes en nuestras páginas del Web es

muy similar a la de enlaces a otras páginas, que hemos visto en el epígrafe anterior. La

única diferencia es que, en lugar de indicar al programa navegador el nombre y la

localización de un documento de texto HTML para que lo cargue, se le indica el nombre

y la localización de un fichero que contiene una imagen. La estructura de la etiqueta es:

<IMG SRC="imagen.gif">

Con el comando IMG SRC (image source, fuente de la imagen) se indica que se

quiere cargar una imagen llamada imagen.gif (o el nombre que tenga).

Dentro de la etiqueta se pueden añadir otros comandos, tal como ALT

<IMG SRC="imagen.gif" ALT="descripción">

47

Con el comando ALT se introduce una descripción (una palabra o una frase

breve) indicativa de la imagen. Este comando, que en principio se puede omitir, es en

beneficio de los que accedan a nuestra página con un programa navegador en forma de

texto sólo. Ya que no son capaces de ver la imagen, por lo menos pueden hacerse una

idea sobre ella. Pero no es sólo por esto. Hay casos, como veremos más adelante, en los

que se utiliza una imagen como enlace a otra página. Si se omitiera este comando, los

que utilizan dichos navegadores no podrían de ninguna manera acceder a esas páginas.

Con respecto a la localización del fichero de esa imagen, se puede decir aquí lo

mismo que en el epígrafe anterior referente a los enlaces.

Al igual que una página con la que queremos enlazar puede estar fuera de

nuestro sistema, (en cuyo caso había que indicar su URL o dirección completa),

podemos cargar una imagen que no esté en nuestro sistema siguiendo el mismo método,

es decir, indicar en la etiqueta el URL completo de la imagen. Aunque esto no es muy

aconsejable, pues alargaría innecesariamente el tiempo de carga de nuestra página.

Las imágenes deben estar guardadas en un formato de fichero especial llamado

GIF. (Hay también otro formato más avanzado, del que se hablará más adelante). Este

formato GIF almacena las imágenes con un máximo de 256 colores, en forma

comprimida. Hay programas gráficos (como el Paint Shop Pro para el PC, o el Graphic

Converter para el Mac) que nos permiten guardar las imágenes en este formato, además

de cumplir otras muchas tareas de manipulación de las mismas.

Un aspecto muy importante a tener en cuenta es el tamaño de las imágenes, pues

una imagen grande supone un fichero grande, y esto puede resultar en un tiempo

excesivo de carga.

Para elegir la posición de la imagen con respecto al texto hay distintas

posibilidades. La más sencilla es colocarla entre dos párrafos, con un titular a un lado.

Los navegadores más actuales (como el Netscape Navigator y el Microsoft Internet

Explorer) permiten que el texto pueda rodear a la imagen (como se verá más adelante,

en el Epígrafe 8).

De momento nos vamos a limitar a escoger la posición del titular con respecto a

la imagen (si es que queremos ponerle un titular, claro está). Se puede poner arriba, en

medio o abajo del lado de la imagen. Para ello se añade el comando ALIGN a la

etiqueta, de la siguiente manera:

<IMG SRC="isla.gif" ALIGN=TOP> Titular alineado arriba

<IMG SRC="isla.gif" ALIGN=MIDDLE> Titular alineado en medio

<IMG SRC="isla.gif" ALIGN=BOTTOM> Titular alineado abajo

Otra posibilidad muy interesante es la de utilizar una imagen como enlace a otra

página. Para estos casos se utilizan generalmente imágenes pequeñas (iconos), aunque

se puede usar cualquier tipo de imagen.

Según vimos en el epígrafe anterior, la estructura general de un enlace es:

48

<A HREF="xxx"> yyy </A>

En este caso sustituimos xxx por el nombre del fichero de la página a la que

queremos acceder. Y en lugar de yyy ponemos la etiqueta completa de la imagen (que

queda así englobada dentro de la etiqueta del enlace)

Como ejemplo vamos a utilizar la imagen (hand.gif) para acceder al ejemplo práctico

del epígrafe 2 (mipag2.html):

<A HREF="mipag2.html"><IMG SRC="hand.gif"></A>

que da como resultado:

Pulsando la imagen

comprobamos cómo efectivamente

enlaza con la página deseada.

Obsérvese además que la imagen está

rodeada de un rectágulo del color

normal en los enlaces. Si no se desea

que aparezca ese rectángulo, hay que

incluir dentro de la etiqueta de la

imagen el atributo

BORDER=0, es decir:

<A HREF="mipag2.html"><IMG SRC="hombre.gif" BORDER=0></A>

que da como resultado:

Posicionando el cursor sobre esta

última imagen, comprobamos que actúa

también como enlace aunque carezca del

rectángulo de color. Esto puede resultar

más estético.

También podemos utilizar una imagen para enlazar con otra imagen. En este

caso sustituimos xxx (el destino del enlace) con el nombre del fichero de la imagen a la

que queremos acceder e yyy (lo que aparece en pantalla como el enlace) por la etiqueta

completa de la imagen que queremos que aparezca en la pantalla como el enlace de la

otra.

Por último, otra posibilidad es la de utilizar un texto para enlazar con una

imagen. En este caso sustituimos xxx (el destino del enlace) con el nombre del fichero

de la imagen a la que queremos acceder e yyy (lo que aparece en pantalla como el

enlace) por el texto.

49

Supongamos que queremos enlazar con la imagen hand.gif por medio de un texto:

<A HREF="hand.gif"> necesitas una mano? </A>

Que da como resultado:

Un tipo de imágenes del que se hace abundante uso y que sirven para mejorar la

presentación de la página son los iconos, botones, barras separadoras, etc. A pesar de su

tamaño o forma, son imágenes como cualquier otra.

Por ejemplo utilizamos un boton aceptar y escribimos en el sitio correspondiente:

<IMG SRC="b_aceptar.gif”> Esta linea esta precedida por un boton

aceptar.

Que resulta:

Práctica 4.

Primeramente es necesario obtener tres imágenes Gif, que puede capturar de

alguna página en internet solo presionando el boton derecho del mouse, y guardarlas en

el mismo directorio en el que se guardará el fichero de texto que se va a crear a

continuación, junto con los de los epígrafes anteriores.


<HTML>

<HEAD>


</HEAD>

<BODY>

50

<CENTER>

<H1> Mi pagina del Web </H1>

</CENTER>

<HR>

Esta es mi pagina del Web. No es muy extensa, pero tiene todos los

elementos basicos. Espero que os guste. Poco a poco le ire anadiendo

mas cosas interesantes.

<P> <A HREF="mipag2.html"> <IMG SRC="imagen1.gif"> </A> Mis aficiones

<P> <A HREF="mipag3.html"> <IMG SRC="imagen2.gif"> </A> Mis paginas

favoritas

<CENTER>

<H3> Un lugar ideal para mis vacaciones </H3>

<IMG SRC="imagen3.gif" ALT="isla">

</CENTER>

</BODY>

</HTML>

Guardamos el fichero de texto con el nombre mipag4.html y lo cargamos en el

navegador. Este es el resultado.

5. Caracteres especiales

Existen algunas limitaciones para escribir el texto. Una de ellas es debido a que

las etiquetas se forman como un comando escrito entre los símbolos "<" y ">". Por

tanto, si se quisieran escribir estos caracteres como parte normal del texto, daría esto

lugar a una ambigüedad, ya que el programa navegador podría interpretarlos como el

comienzo o final de una etiqueta, en vez de un carácter más del texto.

Para resolver este problema, existen unos códigos para poder escribir estos

caracteres y otros relacionados con las etiquetas.

< para < (less than, menor que)

51

> para > (greater than, mayor que)

& para & (ampersand)

" para " (double quotation)

Como se ve, estos códigos empiezan siempre con el signo & y acaban siempre

con ; De una manera similar, existen códigos para escribir letras específicas de

distintos idiomas. Hay muchos de ellos, pero, lógicamente, los que más nos interesan

son los propios del castellano (las vocales acentuadas, la ñ y los signos ¿ y ¡ )

Los códigos de las vocales acentuadas se forman comenzando con &, seguido de

la vocal en cuestión, seguido de la palabra acute (aguda) y terminando con el signo ;

á para la á é para la é

í para la í ó para la ó

ú para la ú Á para la Á

É para la É Í para la Í

Ó para la Ó Ú para la Ú

El resto de los códigos son:

ñ para la ñ Ñ para la Ñ

ü para la ü Ü para la Ü

¿ para ¿ ¡ para ¡

Práctica 5.

Como ejercicio de este epígrafe vamos a sustituir en el ejemplo práctico del epígrafe

anterior (mipag4.html) las vocales acentuadas por sus correspondientes códigos.

Quedará de esta manera:

<HTML>

<HEAD>

<TITLE> Mi página del Web - 4 </TITLE>

</HEAD>

<BODY>

<CENTER>

<H1> Mi página del Web </H1>

</CENTER>

<HR>

Esta es mi página del Web. No es muy extensa, pero tiene

todos los

elementos básicos. Espero que os guste. Poco a poco le

iré

añadiendo más cosas interesantes.

<P> <A HREF="mipag2.html"> <IMG SRC="hombre.gif"> </A> Mis

aficiones

<P> <A HREF="mipag3.html"> <IMG SRC="casa.gif"> </A> Mis

páginas

favoritas

<CENTER>

52

<H3> Un lugar ideal para mis vacaciones </H3>

<IMG SRC="isla.gif" ALT="isla">

</CENTER>

</BODY>

</HTML>

6. Fondos

Se puede cambiar el fondo de dos maneras distintas:

a) Con un color uniforme

b) Con una imagen

a) Fondos con un color uniforme

Se consigue añadiendo el comando BGCOLOR a la etiqueta <BODY> (situada

al principio del documento), de la siguiente manera:

<BODY BGCOLOR="#XXYYZZ">

donde:

XX es un número indicativo de la cantidad de color rojo

YY es un número indicativo de la cantidad de color verde

ZZ es un número indicativo de la cantidad de color azul

Estos números están en numeración hexadecimal. Esta numeración se

caracteriza por tener 16 dígitos (en lugar de los diez de la numeración decimal habitual).

Estos dígito son:

0 1 2 3 4 5 6 7 8 9 A B C D E F

Es decir, que en nuestro caso, el número menor es el 00 y el mayor el FF. Así,

por ejemplo, el color rojo es el #FF0000, porque tiene el máximo de rojo y cero de los

otro dos colores .

Los colores primarios son:

#FF0000 - Rojo

#00FF00 - Verde

#0000FF - Azul

Otros colores son:

#FFFFFF - Blanco

#000000 - Negro

#FFFF00 - Amarillo

53

Para hacer un color más oscuro, hay que reducir el número de su componente,

dejando los otros dos invariables. Así, el rojo #FF0000 se puede hacer más

oscuro con #AA0000, o aún más oscuro con #550000.

Para hacer que un color tenga un tono más suave (más pastel), se deben variar

los otros dos colores haciéndolos más claros (número más alto), en una cantidad

igual. Así, podemos convertir el rojo en rosa con #FF7070.

Colores del texto y de los enlaces

Si no se variasen los colores habituales del texto y de los enlaces (negro y azul,

respectivamente), podría ocurrir que su lectura contra un fondo oscuro fuese muy

dificultosa, o incluso imposible, si el fondo fuese precisamente negro o azul.

Para evitar esto, se pueden escoger los colores del texto y de los enlaces,

añadiendo a la etiqueta (si se desea) los siguientes comandos:

TEXT - color del texto

LINK - color de los enlaces

VLINK - color de los enlaces visitados

ALINK - color de los enlaces activos (el que adquieren en el momento de ser

pulsados)

Los códigos de los colores son los mismos que los que se han visto anteriormente.

La etiqueta, con todas sus posibilidades, sería:

< BODY BGCOLOR="#XXYYZZ" TEXT="#XXYYZZ" LINK="#XXYYZZ"

VLINK="#XXYYZZ"

ALINK="#XXYYZZ">

Ejemplo.

El comando TEXT explicado

anteriormente (que va englobado dentro

de la etiqueta <BODY>) cambia el color

de la totalidad del texto de la página.

54

Tanto el Netscape Navigator 2, como el Microsoft Explorer soportan una etiqueta de

color de la fuente con la que se puede cambiar sólo una parte del texto:

<FONT COLOR="#FF0000"> Este texto es de color rojo </FONT>

b) Fondos con una imagen

El fondo de una página puede ser también una imagen, ya sea en formato GIF o

JPEG. Esta imagen se repite por toda la página, de una manera análoga al tapiz de

Windows. La estructura de la etiqueta es:

<BODY BACKGROUND="imagen.gif">

o bien:

<BODY BACKGROUND="imagen.jpg">

No todos los navegadores soportan este formato

Hay que prever la posibilidad de que quien acceda a nuestra página haya

deshabilitado la carga automática de imágenes, en cuyo caso tampoco cargaría la

imagen que sirve como fondo y sólo vería el fondo estándar de color gris. Esto podría

ser muy perjudicial si hemos escogido unos colores para el texto y los enlaces que no

contrastan bien con ese fondogris. La solución a este problema es poner dentro de la

etiqueta <BODY> los dos comandos BACKGROUND y BGCOLOR (en este orden),

teniendo cuidado en escoger un color uniforme de fondo parecido al de la imagen.

Práctica 6.

Vamos a poner como fondo la imagen nubes.jpg, junto con un fondo alternativo

de color azul claro y hacer que el texto sea de color rojo oscuro. Para ello es necesario

antes capturar la imagen y guardarla en el mismo directorio en donde vamos a guardar

el fichero que vamos a crear.

Cargamos en el editor de textos mipag3.html y sustituimos la etiqueta <BODY> por

esta otra:

<BODY BACKGROUND="nubes.jpg" BGCOLOR="#CCFFFF"

TEXT="#AA0000">

55

Guardamos este fichero como mipag7.html y lo cargamos en el navegador para

visualizarlo. Este es el resultado :

7. Tablas

Hasta que no se empezaron a usar las tablas, la única manera de tabular las cosas

era utilizar la etiqueta de preformateado, con la que es necesario poner textomente los

espacios en blanco para que quede todo alineado formando filas y columnas, con un

resultado muy poco estético.

Estructura de una tabla

Vamos a ver ordenadamente (de fuera hacia dentro) las etiquetas necesarias para

confeccionar las tablas.

1. La etiqueta general, que engloba a todas las demás es <TABLE> y </TABLE>. Es

decir:

<TABLE>

[resto de las etiquetas]

</TABLE>

Para que los datos vayan dentro de cajas formadas por un borde tenemos que añadir el

atributo BORDER a la etiqueta, es decir:

<TABLE BORDER>

[resto de las etiquetas]

</TABLE>

2. En el siguiente nivel, dentro de la anterior, están las etiquetas para formar cada fila

(row) de la tabla, que son <TR> y </TR>. Hay que repetirlas tantas veces como filas

queremos que tenga la tabla. Es decir, para una tabla con dos filas, sería:

<TR> [etiquetas de las distintas celdas de la primera fila]

56

</TR>

<TR>

[etiquetas de las distintas celdas de la segunda fila]

</TR>

3. En el último nivel (dentro de las anteriores) están las etiquetas de cada celda, que

son <TD> y </TD>, que engloban el contenido de cada celda concreta (texto,

imágenes, etc.). Hay que repetirla tantas veces como celdas queremos que haya en

esa fila.

Veamos un ejemplo de una tabla con dos filas. Cada fila va a tener tres celdas.

Dentro de cada celda vamos a poner un texto indicativo de la posición de dicha celda:

<TABLE BORDER>

<TR>

<TD>fila1-celda1</TD> <TD>fila1-celda2</TD> <TD>fila1-celda3</TD>

</TR>

<TR>

<TD>fila2-celda1</TD> <TD>fila2-celda2</TD> <TD>fila2-celda3</TD>

</TR>

</TABLE>

Que resulta:

Titular de la tabla

Se puede añadir un titular (caption) a la tabla, es decir un texto situado encima

de la tabla que indica cuál es su contenido. Se consigue con la etiqueta <CAPTION> y

</CAPTION>.

Variando el espesor de los bordes

57

El atributo BORDER (visto más arriba) pone por defecto un borde de espesor

igual a la unidad. Pero se puede hacer que este borde sea tan grueso como queramos,

poniendo: <TABLE BORDER=número deseado>

Si en el ejemplo anterior ponemos:

<TABLE BORDER=5>

Celdas de cabecera

Además de las celdas que contienen datos normales, podemos poner, si nos

conviene, celdas de cabecera (header), que se distinguen por estar el texto de dichas

celdas en negrita y centrado. Esto se consigue con la etiqueta <TH> y </TH> (en vez de

la normal <TD> y </TD>)

Vamos a añadir, en el ejemplo anterior, una fila de estas celdas de cabecera,

antes de las otras dos que ya existían:

<TR>

<TH>Columna 1</TH> <TH>Columna 2</TH> <TH>Columna 3</TH>

</TR>

Que resulta:

Contenido de las celdas

Hasta ahora, en todos los ejemplos se ha puesto un texto normal dentro de las

distintas celdas. Pero se puede poner en ellas cualquier otro elemento de los que van en

un documento HTML, como imágenes, enlaces, etc. No hay más que poner dentro de la

etiqueta de la celda la etiqueta correspondiente a una imagen, un enlace, etc.

Ejemplo con una imagen:

<TABLE BORDER=2>

<TR><TD><IMG SRC="babe.gif"></TD></TR>

58

</TABLE>

Ejemplo con un enlace:

<TABLE BORDER=2>

<TR><TD><A HREF="index.html">Página principal </A></TD></TR>

</TABLE>

Posicionamiento del contenido dentro de la celda

Normalmente, el contenido de una celda está alineado a la izquierda. Pero se

puede cambiar esto añadiendo dentro de la etiqueta de la celda los siguientes atributos:

<TD ALIGN=CENTER> Al centro </TD>

<TD ALIGN=RIGHT> A la derecha </TD>

<TH ALIGN=LEFT> Cabecera a la izquierda </TH> (Recuérdese que

por defecto están centradas)

El alineamiento por defecto en el sentido vertical es en el medio. También se

puede cambiar,añadiendo dentro de la etiqueta de la celda los siguientes atributos:

<TD VALIGN=TOP> Arriba </TD>

<TD VALIGN=BOTTOM> Abajo </TD>

Variando las dimensiones de la tabla

El navegador se encarga normalmente de dimensionar el tamaño total de la tabla

de acuerdo con el número de filas, de columnas, por el contenido de las celdas, espesor

de los bordes, etc.

A veces nos puede convenir forzarle para que la tabla tenga unas dimensiones

totales mayores que las que le corresponden, tanto en anchura como en longitud. Esto se

consigue añadiendo dentro de la etiqueta de la tabla los atributos WIDTH y HEIGHT

igual a un porcentaje de la dimensión de la pantalla, o a una cifra que equivale al

número de pixels.

Por ejemplo ponemos: <TABLE WIDTH=60%>

O ponemos: <TABLE HEIGHT=200>

Celdas que abarcan a otras varias

A veces puede interesarnos que una celda se extienda sobre otras varias. Esto se

consigue añadiéndo dentro de la etiqueta de la celda los atributos COLSPAN=número

59

para extenderse sobre un número determinado de columnas, o ROWSPAN=número

para extenderse verticalmente sobre un número determinado de filas.

Por ejemplo, en la tabla vamos a añadir una fila con una sola celda, que abarca a

dos columnas:

<TR> <TD COLSPAN=2> Celda sobre 2 columnas </TD> <TR>

Color de fondo en las tablas

Podemos conseguir que las tablas tengan un color de fondo, siguiendo un

procedimiento totalmente análogo al empleado para que una página tenga un color de

fondo uniforme (según vimos en el epígrafe 6). Para ello debemos utilizar el atributo

BGCOLOR="#XXYYZZ", visto en dicho epígrafe.

Se puede conseguir:

1.Que la totalidad de la tabla tenga un color de fondo. Para ello, colocamos el atributo

dentro de la etiqueta TABLE. Por ejemplo, vamos a hacer que la tabla tenga un fondo

verde

(#00FF00):

<TABLE BORDER BGCOLOR="#00FF00">

<TR> <TD>fila1-celda1</TD> <TD>fila1-celda2</TD> </TR>


</TABLE>

2.Que sólamente una celda determinada tenga un color de fondo. Para ello, colocamos

el atributo dentro de la etiqueta de la celda correspondiente. Por ejemplo, vamos a

hacer que sólo la celda 1 de la fila 1 tenga un color verde:

<TABLE BORDER> <TR><TD BGCOLOR="#00FF00">fila1-celda1</TD><TD>fila1-

celda2</TD></TR>

60


</TABLE>

3.Que la generalidad de las celdas tenga un color, pero que alguna celda tenga uno

particular. El atributo del color general se coloca en la etiqueta TABLE, y el del color

particular en la etiqueta de la celda en cuestión (una combinación de los dos casos

anteriores). por ejemplo, vamos a hacer que la generalidad de la tabla sea de color

rojo

(#FF0000), pero que la celda 1 de la fila 1 sea de color verde (#00FF00):

<TABLE BORDER BGCOLOR="#FF0000"> <TR><TD BGCOLOR="#00FF00">fila1-celda1</TD><TD>fila1-

celda2</TD></TR>


</TABLE>

Imágenes de fondo en las tablas

El Explorer de Microsoft soporta la colocación de imágenes de fondo en el

interior de las tablas, de una manera análoga a como se hace en una página (según

vimos en el epígrafe 6).

Para ello debemos utilizar el atributoBACKGROUND="imagen.gif" o

BACKGROUND="imagen.jpg", visto en dicho epígrafe.

Si se utiliza dentro de la etiqueta <TABLE> la imagen en cuestión se

multiplicará detrás de todas las celdas.

Separación entre las celdas de una tabla

Por defecto, la separación entre las distintas celdas de una tabla es de dos pixels.

Pero se puede variar esto con el atributo CELLSPACING, que se pone dentro de la

etiqueta TABLE.

Por ejemplo, para obtener una separación de 20 pixels entre celdas ponemos:

<TABLE BORDER CELLSPACING=20>

Separación entre el borde y el contenido dentro de las celdas

Por defecto, la separación entre el borde y el contenido dentro de las celdas es de

un pixel. Se puede cambiar esto con el atributo CELLPADDING, que se pone dentro de

la etiqueta TABLE.

Por ejemplo, para obtener una separación de 20 pixels entre el contenido y los

bordes, dentro de cada celda:

<TABLE BORDER CELLPADDING=20>

61

Práctica 7.

Vamos a crear una tabla de dos filas, con una celda cada una. La primera, como

cabecera, con el texto "Un lugar ideal para mis vacaciones", y la segunda con la imagen

isla.gif. Además vamos a alargar a lo ancho la tabla al 75% de la pantalla.

Para ello: <P> <TABLE BORDER=5 WIDTH=75%>

<TR> <TH> Un lugar ideal para mis vacaciones </TH> </TR>

<TR> <TD ALIGN=CENTER> <IMG SRC="isla.gif" ALT="isla"> </TD>

</TR>

</TABLE>

El resultado es:

8. Formularios

La manera general para que los lectores de nuestra página se puedan comunicar

con nosotros es por medio de un enlace a nuestra dirección de email, con lo que

recibiríamos un email convencional.

Pero puede ser que lo que necesitemos sea sólamente una respuesta concreta a

unas opciones que presentaremos nosotros mismos, o un comentario del usuario, para lo

que le suministraremos un espacio en donde introducirlo.

Se puede hacer todo esto, además de otras cosas, utilizando los formularios, con

los que se pueden confeccionar páginas que contengan los elementos necesarios para

ello, tal como botones de radio, listas de selección, cajetines de introducción de texto y

de control, etc., como vamos a ver.

Los formularios permiten que los demás nos envíen la información directamente

a nosotros o bien a nuestro servidor, en donde hemos instalado un programa que procese

esta información.

62

Por ejemplo, vamos a suponer que queremos crear una lista de correo. Los

usuarios pueden introducir sus nombres y direcciones de email y pulsar un botón de

envío. Esos datos los podemos recibir "en bruto" en nuestro correo, con los que

confeccionaríamos textomente dicha lista de correo, sin necesitar ningún programa para

ello. Este proceso es el que vamos a comentar en este epígrafe.

La otra posibilidad, de la que únicamente se va a hacer esta mención, es que

hubiéramos instalado en nuestro servidor un programa especial para procesar esos datos

y añadirlos a la lista de correo, y que incluso pudiera devolver automáticamente al

usuario algún tipo de información. Para conseguir esto, los formularios necesitan

ejecutar programas o scripts por medio del CGI (Common Gateway Interface). El CGI

permite a los formularios ser procesados por programas escritos en cualquier lenguaje,

aunque los más usados en Internet son el Perl y el C.

NOTA:

El tipo de formulario que se describe a continuación podrá ser utilizado por la

mayoría de los navegadores, con la notable excepción del Explorer (incluso la versión

3.0), por lo que es conveniente suministrar al final del formulario, como una alternativa

para estos casos, un enlace de email ordinario (ver el Epígrafe 3)

Estructura de un formulario

La estructura general de un formulario es:

1. Etiqueta de inicio: <FORM ACTION="mailto:dirección_de_email" METHOD="POST" ENCTYPE="TEXT/PLAIN">

2. Cuerpo del formulario, con los distintos elementos para poder introducir los datos.

3. Botones de envío y de borrado.

4. Etiqueta de cierre </FORM>

Etiqueta de inicio

El atributo ACTION indica la acción que se debe efectuar y que es que los datos

sean enviados por email a la dirección indicada. (Si hiciéramos uso del CGI, sería

precisamente aquí donde indicaríamos su localización en el servidor, que habitualmente

es el directorio cgi-bin, para que procese los datos).

El atributo METHOD=POST indica que los datos sean inmediatamente enviados

por correo a la dirección de email, nada más pulsar el usuario el botón de envío.

Con el atributo ENCTYPE="TEXT/PLAIN" se consigue que las respuestas las

recibamos como un fichero de texto, perfectamente legible y sin codificar.

Elementos para introducir los datos

Los vamos a dividir en tres clases:

a) Introducción por medio de texto

63

b) Introducción por medio de menús

c) Introducción por medio de botones

La introducción de los datos se consigue por medio de la etiqueta:

<INPUT TYPE="xxx" NAME="yyy" VALUE="zzz">

En donde:

xxx es la palabra que indica el tipo de introducción.

yyy es el nombre que le asignamos nosotros a la variable de introducción del dato.

zzz es la palabra asociada a un elemento.

a) Introducción por medio de texto (una línea)

En este caso es xxx=text, es decir, INPUT TYPE="text". El atributo VALUE no

procede en este caso.

Vamos a poner un ejemplo: solicitamos el apellido del usuario.

<FORM ACTION="mailto:dirección_de_email" METHOD="POST"

ENCTYPE="TEXT/PLAIN">

Escribe tu apellido:

<BR><INPUT TYPE="text" NAME="Apellido">

</FORM>

Que resulta:

Si el usuario introduce su

apellido, p. ej. Ruiz, y pulsa el botón de

envío (que veremos más adelante),

recibiremos un email suyo con el

siguiente texto:

Apellido=Ruiz

La longitud de este formulario es por defecto de 20 caracteres. Se puede variar

incluyendo en la etiqueta el atributo SIZE="número". Por otra parte, sea cual sea la

longitud del formulario, si no se indica nada, el usuario puede introducir el número de

caracteres que quiera. Se puede limitar esto, incluyendo en la etiqueta el atributo

MAXLENGTH="número".

También se puede hacer que el texto introducido no sea reconocible, es decir que

todos los caracteres se representen por asteriscos. Basta con cambiar en la etiqueta

INPUT TYPE="text" por INPUT TYPE="password". En el último ejemplo, podemos

cambiar la etiquea correspondiente por:

<INPUT TYPE="password" NAME="Apellido" SIZE="10" MAXLENGTH="12">

64

a-1) Introducción por medio de texto (múltiples líneas)

Cuando el texto a introducir puede alcanzar una gran longitud, por ejemplo un

comentario, es conveniente utilizar un formulario de texto de múltiples líneas.

Esto se consigue con la etiqueta de inicio: <TEXTAREA NAME="yyy" ROWS="número" COLS="número">

(en donde no se utiliza INPUT TYPE y donde ROWS representa el número de filas, y

COLS el de columnas).

y la de cierre: </TEXTAREA>

Ejemplo: un formulario solicitando los comentarios del usuario:

<FORM

ACTION="mailto:dirección_de_email"

METHOD="POST" ENCTYPE="TEXT/PLAIN">

Introduce tus comentarios:

<BR><TEXTAREA NAME="Comentarios"

ROWS="6" COLS="40">

</TEXTAREA>

</FORM>

b) Introducción por medio de menús

Si queremos que el usuario, en vez de introducir un texto, como hemos visto en

los casos anteriores, escoja entre varias opciones que le presentamos nosotros, haremos

uso de un formulario en forma de menú.

Se consigue con la etiqueta de inicio <SELECT NAME="yyy"> y la de cierre

</SELECT>. Las distintas opciones a escoger se consiguen con la etiqueta

<OPTION>.

Ejemplo: Pedimos al usuario que elija su color preferido:



¿Cuál es tu color preferido?

<BR><SELECT NAME="ColorPreferido">

<OPTION>Rojo

<OPTION>Verde

<OPTION>Azul

<OPTION>Amarillo

</SELECT >

</FORM>

En el ejemplo anterior, sólo es visible en el formulario una opción. Si queremos

que sean visibles múltiples opciones a la vez, añadimos en la etiqueta los atributos

MÚLTIPLE SIZE="número", donde especificamos el número de opciones visibles.

65

Si cambiamos en el ejemplo anterior la etiqueta correspondiente por:

<SELECT NAME="ColorPreferido" MULTIPLE SIZE="2">

Obtenemos:

b-1) Formulario de confirmación (checkbox)

Si queremos que el usuario confirme una opción determinada, podemos hacer

uso de un formulario de confirmación, o checkbox, que se consigue con la etiqueta:

<INPUT TYPE="checkbox" NAME="yyy">

Ejemplo: Solicitamos al usuario que confirme su inclusión en una lista de correo:



<INPUT TYPE="checkbox"

NAME="Lista">

Sí, deseo ser incluido en la

lista de correo.

</FORM>

Si queremos que el formulario aparezca inicialmente como marcado (el usuario

no necesitará hacerlo), basta con añadir el atributo CHECKED dentro de la etiqueta. En

el ejemplo anterior sustituimos la etiqueta equivalente por:

<INPUT TYPE="checkbox" NAME="Lista" CHECKED>

b-2) Botones de radio

66

Cuando queremos que el usuario elija una única opción entre varias, podemos

hace uso de los botones de radio, que se consiguen con la etiqueta:

<INPUT TYPE="radio" NAME="yyy" VALUE="zzz">

Donde yyy es el nombre que le ponemos a la variable que se trata de elegir, y

zzz es el nombre de cada una de las opciones en concreto.

Ejemplo: solicitamos al usuario que defina cuál es su sistema operativo preferido:



¿Cuál es tu sistema operativo preferido?

<BR>

<INPUT TYPE="radio" NAME="SistemaOperativo" VALUE="Windows"

CHECKED> Windows

<INPUT TYPE="radio" NAME="SistemaOperativo" VALUE="Mac"> MacOs

<INPUT TYPE="radio" NAME="SistemaOperativo" VALUE="Unix"> Unix

</FORM>

Que resulta:

Obsérvese el atributo opcional CHECKED que se ha añadido en la primera

etiqueta. Esa será la opción que aparece marcada por defecto. Obsérvese también que no

es posible escoger más de una opción.

c) Botones de envío y de borrado

Hasta ahora, en todos los ejemplos que hemos visto, faltaba un elemento

esencial en cualquier formulario, y es el botón de envío de los datos, que se consigue

con la etiqueta:

<INPUT TYPE="submit" VALUE="zzz">

En donde zzz es el texto que queremos que aparezca en el botón.

67

Vamos a añadirlo al primer ejemplo, en el que se solicitaba el apellido del

usuario:



Escribe tu apellido:

<BR><INPUT TYPE="text"

NAME="Apellido">

<P><INPUT TYPE="submit"

VALUE="Enviar datos">

</FORM>

Otro botón interesante es el de

borrado de los datos introducidos, muy conveniente en un formulario con muchos

elementos. Es muy similar al de envío, pues se consigue con la etiqueta:

<INPUT TYPE="reset" VALUE="zzz">

En donde zzz es el texto que queremos que aparezca en el botón.

Si añadimos al ejemplo anterior la etiqueta:

<P><INPUT TYPE="reset" VALUE="Borrar datos">

resulta:

Práctica 8.

Vamos a añadir un "libro de visitas". Para ello, añadimos lo siguiente, entre las

etiquetas <HR> y </BODY> situadas al final, lo siguiente:

<P><CENTER>

<H2>Libro de visitas</H2>

<P><FORM ACTION="mailto:[email protected]" METHOD="POST"


68

Tu nombre:

<BR><INPUT TYPE="text" NAME="Nombre">

<P>Escribe tus comentarios:

<BR><TEXTAREA NAME="Comentarios" ROWS="6" COLS="40">

</TEXTAREA>

<P><INPUT TYPE="submit" VALUE="Enviar datos">

<INPUT TYPE="reset" VALUE="Borrar datos">

</FORM>

<P>

<HR>

El resultado es:

9. Frames

Frames (en inglés, marcos o cuadros) es un procedimiento del lenguaje HTML

para dividir la pantalla en diferentes zonas, o ventanas, que pueden actuar

independientemente unas de otras, como si se trataran de páginas diferentes, pues

incluso cada una de ellas pueden tener sus propias barras deslizadoras.

Una de sus características más importantes es que pulsando un enlace situado en

un frame, se puede cargar en otro frame una página determinada. Esto se utiliza

frecuentemente para tener un frame estrecho en la parte lateral (o superior) con un

índice del contenido en forma de diferentes enlaces, que, al ser pulsados cargan en la

ventana principal las distintas páginas.

De esta manera se facilita la navegación entre las páginas, pues aunque se vaya

pasando de unas a otras, siempre estará a la vista el índice del conjunto.

Para comprender los distintos conceptos vamos a desarrollar un ejemplo,

creando una página con dos frames. El de la izquierda va a servir de índice de lo que

veamos en el de la derecha, y en éste veremos inicialmente una página de presentación.

Se podrá acceder también aquí a la página personal creada en los epígrafes anteriores ,

si se pulsa un enlace en el frame de la izquierda.

Documento de definición de los frames

69

Lo primero que tenemos que hacer es crear un documento HTML en el que

definiremos cuántas zonas va a haber, qué distribución y tamaño van a tener, y cuál va

ser el contenido de cada una de ellas.

En el ejemplo que vamos a desarrollar, la página va a tener dos frames

distribuidos en columnas (es decir, uno al lado del otro, en vez de uno encima del otro,

lo que sería una distribución en filas).

Con respecto al tamaño, haremos que el primero (el del izquierda) ocupe el 20%

del ancho de la pantalla, y el otro, el 80% restante.

Y con respecto al contenido, el frame de la izquierda va a contener un

documento HTML que va a servir de índice de lo que veamos en el otro (y que vamos a

llamar mipagind.html), y el de la derecha otro documento HTML que va a servir de

página de presentación (al que llamaremos mipagpre.html).

Todo lo anterior se refleja en el siguiente documento HTML:

<HTML>

<HEAD>

<TITLE>Mi pagina con frames</TITLE>

</HEAD>

<FRAMESET COLS="20%, 80%">

<FRAME SRC="mipagind.html">

<FRAME SRC="mipagpre.html" NAME="principal">

</FRAMESET>

</HTML>

Ya se ha definido el número de frames, su distribución y su tamaño, pero falta

por definir el contenido de cada frame. Esto se hace con las etiquetas:

<FRAME SRC="mipagind.html"> <FRAME SRC="mipagpre.html" NAME="principal">

Con esto se define que el contenido del primer frame (el de la izquierda) sea el

documento HTML mipagind.html y el del segundo (el de la derecha) sea el documento

HTML mipagpre.html.

Obsérvese que en la etiqueta del segundo se ha incluido el atributo

NAME="principal", pero no así en el primero. El motivo es que se necesita dar un

nombre al segundo frame, pues, como veremos a continuación, en el documento del

primer frame va a haber unos enlaces que van a ir dirigidos hacia él. En este caso sólo

tenemos dos frames, pero podría haber más, y es necesario distinguirlos unos de otros.

Y el primero no necesita nombre, pues no va a haber enlaces en el segundo dirigidos

hacia él.

Documentos HTML de cada frame

70

Necesitamos ahora confeccionar el documento HTML de cada uno de los

frames. Recuérdese que son como páginas independientes, que pueden tener cada una

su propio fondo, etc., y todo lo que queramos añadir en ellos y que hemos aprendido

hasta ahora.

Documento del frame de la izquierda

Va a tener un fondo amarillo, y va a contener dos enlaces dirigidos al frame de

la derecha. Además, como muestra de que se puede añadir cualquier cosa en un frame.

<HTML>

<HEAD>

<TITLE> Indice </TITLE>

</HEAD>

<BODY BGCOLOR="#FFBB00">

<P><A HREF="mipagpre.html" TARGET="principal"> Presentación </A>

<P><A HREF="mipag13.html" TARGET="principal"> Mi página </A>

<P><IMG SRC="imagen1.gif">

</BODY>

</HTML>

Dentro de las etiquetas de los enlaces podemos observar algo nuevo, y es el

atributo TARGET (en inglés: objetivo, blanco), que sirve para hacer que al ser activado

el enlace no se cargue en el propio frame, sino en otro, precisamente en el que hayamos

llamado con ese nombre en el documento de definición de los frames.

En nuestro caso, le hemos dado el nombre de "principal" al frame de la derecha,

y es por tanto ahí donde se van a cargar los documentos HTML.

Guardamos este documento con el nombre de mipagind.html. Además,

capturamos la imagen y la guardamos junto con el documento.

Documento del frame de la derecha

Va a tener un fondo negro, y va a contener sólamente un texto.

<HTML>

<HEAD>

<TITLE> Presentacion </TITLE>

</HEAD>

<BODY BGCOLOR="#000000" TEXT="#0000FF">

<CENTER>

<FONT SIZE=+3><STRONG>

<P>ESTA ES LA VERSION

<BR><FONT COLOR="#FF0000">CON FRAMES</FONT>

<BR>DE MI PAGINA

</STRONG>

</FONT>

</CENTER>

</BODY>

</HTML>

Guardamos este documento con el nombre de mipagpre.html

71

Si lo cargamos, este es el resultado con frames (para los navegadores que los soportan).

Se puede comprobar cómo cambiamos de página en el frame de la derecha, según el

enlace que pulsemos en el frame de la izquierda.

Atributos de la etiqueta <FRAMESET>

La etiqueta FRAMESET, como hemos visto en el ejemplo, es la que define la

distribución, el número y tamaño de los frames. Tiene dos atributos: COLS (columnas)

y ROWS (filas):

<FRAMESET COLS="xx, yy, zz, ..">

<FRAMESET ROWS="xx, yy, zz, ..">

Define la distribución de los frames en columnas o en filas, según se use uno u

otro atributo.

Define el número de frames que habrá, pues, por ejemplo:

<FRAMESET COLS="xx, yy"> (habrá dos frames en columnas)

<FRAMESET COLS="xx, yy, zz"> (habrá tres frames en columnas)

Define el tamaño de los frames, según el valor que demos a xx, yy, zz.... Este

valor se puede expresar en:

Un porcentaje del ancho del pantalla (para las columnas), o del alto de la

pantalla (para las filas). Así, por ejemplo:

<FRAMESET COLS="%20, %80"> (la columna de la izquierda ocupará

el 20% del ancho de la pantalla, y la de la derecha el

80% restante)

<FRAMESET ROWS="%10, %70, %20"> (la fila superior ocupará el 10%

del alto de la pantalla, la del medio el 70%, y la inferior el

20%)

72

Un número absoluto que representa el número de pixels que ocupará cada frame

a lo ancho o a lo alto (según sean filas o columnas). Así, por ejemplo:

<FRAMESET COLS="40, 600"> (la columna de la izquierda

tendrá 40 pixels de ancho y la de la derecha 600).

Es peligroso utilizar sólo valores absolutos, pues el tamaño de la pantalla varía

de un usuario a otro. Si se va a usar algún valor absoluto para un frame, es mejor

mezclarlo con alguno relativo, como los que vamos a ver a continuación, para que se

ajuste el total a la pantalla del usuario.

Un valor relativo que se consigue poniendo un asterisco (*), en vez de un

número. Esto se interpreta como que ese frame debe tener el espacio restante.

Por ejemplo: <FRAMESET ROWS="100,*,100"> (Habrá tres filas, la superior y la inferior de una altura fija de 100 pixels, y la del medio

obtendrá el espacio restante).

Si hay más de un frame con asterisco, ese espacio restante se dividirá por igual

entre ellos.

Si hay un número antes del asterisco, ese frame obtiene esa cantidad más de

espacio relativo. Así "2*,*" daría dos tercios para el primer frame y un tercio para el

otro.

Frames sin bordes

Si se desea que no haya un borde de separación entre los frames, se deben incluir el

atributo FRAMEBORDER=0 dentro de la etiqueta FRAMESET.

Para que también desaparezcan los huecos de separación entre frames hay que

añadir otros dos atributos (el primero es para el Explorer y el segundo para el Netscape):

FRAMESPACING=0 y BORDER=0. con lo que la etiqueta completa quedaría:

<FRAMESET FRAMEBORDER=0 FRAMESPACING=0 BORDER=0 COLS="xx,

yy">

Atributos de la etiqueta <FRAME>

Esta etiqueta define las cararacterísticas de un frame concreto, no del conjunto

de los frames, como era el caso con la etiqueta <FRAMESET>. Puede tener los

siguientes posibles atributos, que van dentro de la etiqueta <FRAME>:

SRC="dirección". Esta dirección puede ser la de un documento HTML (tal

como hemos utilizado en el ejemplo), o cualquier otro recurso del Web (o URL). Con

este atributo se indica lo que se cargará inicialmente en el frame.

Si no se le pone este atributo a la etiqueta <FRAME>, entonces dicho frame

aparecerá inicialmente vacío, aunque tendrá las dimensiones asignadas.

73

NAME="nombre_de_la_ventana". Este atributo se usa para asignar un nombre a

un frame. El atributo NAME es opcional. Por defecto, todas las ventanas carecen de

nombre. Los nombres que se escojan deben comenzar por un carácter alfanumérico

(una letra o un número, pero no otro tipo de símbolo).

MARGINWIDTH="número". Se utiliza este atributo cuando se quiere controlar la el

ancho de los márgenes dentro de un frame. El número que se ponga representa los

pixels de los márgenes. Este atributo es opcional.

MARGINHEIGHT="número". Igual que el anterior, pero referido a los márgenes en

altura.

SCROLLING="yes|no|auto". Este atributo se utiliza para decidir si el frame

tendrá o no una barra deslizadora. Si se escoje "yes" tendrá siempre una barra

deslizadora. Si se escoje "no" no la tendrá nunca, y si se escoje "auto", será el

navegador quien decida si la tendrá o no. Este atributo es opcional. Su valor por defecto

es "auto".

NORESIZE. A este atributo no se le asigna un valor numérico, como a los demás. Es

un indicador para que la ventana no se pueda re-dimensionar (en inglés, resize) por

parte del usuario. Es un atributo opcional. Por defecto, todos los frames son re-

dimensionables.

FRAMEBORDER="no". Este atributo elimina el borde en un frame, pero si se

quiere que se elimine completamente, también hay que ponérselo al frame contiguo. Si

se quiere eliminar los bordes de todos los frames, se debe colocar en la etiqueta

FRAMESET, como hemos visto anteriormente.

El atributo TARGET

En el ejemplo hemos visto que, como queríamos que los enlaces situados en el

frame de la izquierda surtieran efecto no en él mismo, sino en otro frame, teníamos que

poner dentro de cada enlace el atributo TARGET="principal", siendo "principal" el

nombre que habíamos dado al segundo frame, en el documento de definición de frames.

Es decir, hemos utilizado este atributo de esta manera:

TARGET="nombre_dado_a_otro_frame".

Estos nombres, que los escogemos nosotros, pueden ser cualquiera, pero con la

condición que el primer carácter sea alfanumérico (letra o número).

Pero hay unos nombres reservados (es decir, que no se pueden usar para

denominar a un frame), que hacen que este atributo efectúe unas funciones especiales.

Para que cumplan su cometido, es imprescindible escribir estas palabras reservadas

(blank, self y top) en minúsculas.

74

TARGET="_blank". Hace que se abra una nueva copia del navegador, y el enlace

activado se carga en ella, a pantalla completa. Es decir, tendríamos dos copias del

navegador (Netscape, Explorer, etc.) funcionando a la vez.

TARGET="_self". Hace que el enlace se cargue en el propio frame.

TARGET="_top". Hace que el enlace se cargue a pantalla completa, suprimiendo

todos los frames, pero sin que se cargue una nueva copia del navegador. Este es

particularmente útil. Un error muy común es olvidarse de poner este atributo en los

enlaces que están en un frame, con lo que resulta que al ser activados, la página llamada

se carga dentro del propio frame, lo cual es muy molesto si esa página pertenece a otro

sitio del Web, y aún más grave si esa página tiene a su vez frames. Este inconveniente

se evita poniendo este atributo dentro de las etiquetas de los enlaces.

Frames anidados dentro de otros frames

Hasta ahora hemos contemplado sólo la posibilidad de tener una distribución de

los frames bien en filas o bien en columnas, (dependiendo que se utilice el atributo

ROWS o COLS en la etiqueta FRAMESET), pero no ambos a la vez.

Se pueden obtener distribuciones más complejas anidando filas dentro de una

columna, o a la inversa, columnas dentro de una fila.

Supongamos que queremos la siguiente distribución:

Un frame estrecho en horizontal en la parte superior, de lado a lado de la pantalla

(altura, el 15%)

Otro frame estrecho en vertical en la parte izquierda, debajo del anterior (anchura, el

20%)

Un tercero ocupando el resto de la pantalla.

Vemos que, en realidad, esto equivale a la siguiente distribución:

Dos filas. La superior ocupa el 15% y la inferior el resto.

La fila inferior está a su vez dividida en dos columnas. La primera (la de la izquierda)

ocupa el 20% y la otra, el resto.

El documento de definición de las dos filas (olvidémonos de momento que la de

abajo está subdividida), sería:

<HTML>

<HEAD>

<TITLE>Pagina con dos filas</TITLE>

</HEAD>

75

<FRAMESET ROWS="15%, *">

<FRAME SRC="documento_fila_superior">

<FRAME SRC="documento_fila_inferior">

</FRAMESET>

</HTML>

Como la fila inferior, en realidad, son dos columnas (con una distribución del

20% y resto), sustituimos (anidando) la etiqueta <FRAME

SRC="documento_fila_inferior"> por:

<FRAMESET COLS="20%, *">

<FRAME SRC="documento_columna_izqda">

<FRAME SRC="documento_columna_dcha">

</FRAMESET>

Con lo que queda el documento definitvo así:

<HTML>

<HEAD>

<TITLE>Pagina con fila superior y dos columnas

inferiores</TITLE>

</HEAD>

<FRAMESET ROWS="15%, *">

<FRAME SRC="documento_fila_superior">

<FRAMESET COLS="20%, *">

<FRAME SRC="documento_columna_izqda">

<FRAME SRC="documento_columna_dcha">

</FRAMESET>

</FRAMESET>

</HTML>

La distribución quedaría así :

10. Sonidos.

Una página del Web puede tener sonidos incorporados, bien sea como un fondo

sonoro que se ejecuta automáticamente al cargar la página, o como una opción para que

la active el propio usuario.

Fondo sonoro para el Microsoft Internet Explorer

76

Para las versiones 2.0 en adelante, se utiliza la etiqueta:

<BGSOUND SRC="fichero_de_sonido" LOOP=n>

El fichero de sonido puede estar en formato .mid o .wav.

El atributo LOOP (en inglés, lazo) sirve para especificar el número (n) de veces

que se debe ejecutar el fichero de sonido. Si se escoje el número n=-1 o se pone

LOOP=infinite, el sonido se ejecutará indefinidamente. Se puede omitir este atributo, y

entonces el fichero se ejecutará una sola vez.

Ejemplo 1

La etiqueta para que se ejecute el fichero prv89.mid dos veces en el Explorer es:

<BGSOUND SRC="prv89.mid" LOOP=2>

Fondo sonoro para el Netscape

La etiqueta básica para el Netscape es:

<EMBED SRC="fichero_de_sonido" WIDTH=xxx HEIGHT=yy>

donde WIDTH es la anchura y HEIGHT la altura de una consola que aparece, y que

tiene diferentes teclas (play, stop, pausa, etc.). Más adelante veremos los valores xxx e

yy que debemos atribuirles.

El fichero de sonido puede estar en formato .mid o .wav, pero recuérdese la

advertencia hecha anteriormente, de que estos formatos deben estar configurados como

MIME por el servidor donde esté alojada la página.

Dentro de la etiqueta se pueden añadir los siguientes atributos opcionales:

AUTOSTART="true" (arranca automáticamente)

LOOP="true" (se ejecuta ininterrumpidamente)

Activación del sonido por el propio usuario

Hasta aquí hemos visto cómo poner un sonido de fondo en una página. Hay otra

opción, mucho más sencilla, y es la de poner un enlace a un fichero de sonido, de tal

manera, que al pulsarlo se ejecute el fichero. (Ver el Epígrafe 3, en el que se explica

cómo crear enlaces).

Por ejemplo, vamos a poner un enlace al fichero prv89.mid:

Escucha esta <A HREF="prv89.mid">musica</A>

77

Al pulsar el enlace se activa, en una ventana aparte, el programa que ejecuta el

sonido. Esto es válido para todos los navegadores, incluso las versiones más antiguas,

con la única condición de que se haya configurado un programa auxiliar capaz de

ejecutar ficheros .mid o .wav.

78

Etiquetamiento(Tagging) Especial

Formatos de archivo etiquetado

Algunos formatos de archivo como el formato HMTL y el XML contienen un tipo de

marcas especiales. Las etiquetas contienen información explícita sobre la representación

del texto y la estructura del contenido de un documento. Se trata de texto sencillo,

generalmente entre paréntesis (del tipo < y >). Una porción de texto o información

estructural encerrada entre corchetes constituye una etiqueta (en inglés "tag"). Los

formatos de este tipo, Tagged file formats o archivo de formato con etiquetas, pueden

ser leídos por cualquier editor de textos.

Texto de origen en Inglés en formato HMTL en un buscador de Internet:

http://ecolore.leeds.ac.uk/xml/materials/overview/glossary.xml?lang=es#tag

http://ecolore.leeds.ac.uk/xml/materials/overview/glossary.xml?lang=es#file_format

79

El mismo texto presentado en formato de texto sencillo en un editor de texto estándar

como el Notepad...:

80

... y el mismo texto en el editor de un sistema de Memoria de Traducción (se ve también

la traducción al griego en proceso):

81

El resultado del texto traducido al griego como se lo ve en el buscador de Internet:

Mientras que el HMTL está formado por una serie de etiquetas muy precisas, que no

pueden ser modificadas por el usuario, el XML es mucho más flexible. Provee una serie

de reglas para desarrollar variedades individuales del XML que se adecúan a distintos

documentos y a las necesidades del usuario. Mientras que es relativamente fácil para un

programador de software desarrollar un programa que identifique las etiquetas del

HMTL automáticamente y las proteja de posibles modificaciones, hacer lo mismo con

las etiquetas XML en un archivo de este tipo, puede requerir un poco más de trabajo por

parte del usuario. Todas las etiquetas de un archivo XML están definidas en una

definición de tipo de documento (DTD). Para identificar correctamente y traducir

documentos de XML, es importante obtener la DTD asociada al archivo de XML. El

filtro XML que viene incorporado con el sistema de Memoria de Traducción (MT)

puede leer esta definición DTD e intentar identificar las etiquetas en el texto de origen.

Sin embargo, interpretar la DTD puede requerir la intervención del usuario. Si no hay

ninguna DTD disponible, el mecanismo de filtro tendrá que crear una lista de etiquetas

(analizando el texto de origen) o, en el peor de los casos, el usuario tendrá que

completar una lista con todas las etiquetas contenidas en el documento de origen.

Cómo convertir otros formatos en un archivo con etiquetas.

En algunas MT los editores usan un formato de XML personalizado. Esto quiere decir

que los documentos de cualquier formato que sea (por ej. documentos de programas

DTP del tipo FrameMaker o Interleaf) deben ser convertidos a este formato de

82

etiquetas, de modo tal que el procesador de texto o editor de marca registrada usado por

la MT pueda leer los archivos. El sistema de MT debe ofrecer herramientas especiales

de conversión o de filtros de formato. Habría que ejecutar la conversión o usar el filtro

de formato en los archivos antes o mientras se los carga en la MT. Cuando se haya

finalizado y revisado la traducción, los nuevos archivos traducidos serán reconvertidos

al formato original

Segmentación

¿En qué consiste?

La segmentación es la subdivisión automática de un texto en unidades más cortas. Un

segmento es un elemento del texto que la MT considera la unidad mínima traducible. En

general, en el entorno de la MT dichas unidades son oraciones, pero también pueden ser

encabezamientos o elementos de una enumeración. Cuando traduce un texto, la MT

busca, para cada segmento, una correspondencia en la base de datos de la MT a fin de

recuperar posibles traducciones anteriores. Los siguientes elementos de un texto son

caracteres típicos que la MT reconoce como separadores de segmentos:

marcas de final de párrafo

final de oración (punto, signo de interrogación o exclamación seguido de un

espacio)

final de celda (en una planilla).

¿Qué hacer?

1. Controlar el texto de origen antes de segmentarlo

Para lograr que un texto se divida correctamente en segmentos, controle que el

texto no contenga ninguno de los siguientes elementos:

o marcas de final de párrafo en medio de la oración

EJEMPLO:

Ejemplo de formato incoherente entre el texto de partida y el texto de llegada.

Problema: En este ejemplo, las diferencias entre los separadores de segmentos de

ambos textos causan errores de alineación. El título del documento en inglés está

dividido en cuatro segmentos debido al uso incorrecto del tabulador.

Solución: Para que la alineación sea precisa es indispensable que los textos de partida y

de llegada usen separadores de segmentos correctos e idénticos. Los textos de partida y

de llegada deben ser revisados atentamente antes de comenzar la alineación.

83

Parte de un texto de partida en inglés...

... y su segmento correspondiente en el texto de llegada en alemán

84

Textos de partida y de llegada con alineación errónea (TRADOS WinAlign)

o guiones mal ubicados

o planillas creadas con el tabulador

o signos de corrección

o señaladores o marcas en el medio de una oración o palabra

2. Si los resultados de la segmentación no son aceptables, modifique las reglas

de segmentación

Los sistemas de memoria de traducción por lo general permiten al usuario

cambiar y adaptar estas reglas. Se pueden agregar separadores adicionales y

crear archivos que contengan abreviaciones como "Sr." o "ej." en las que el

punto no debe ser considerado un separador de segmentos.

Nota:

La segmentación es un pre requisito para la alineación de traducciones ya realizadas con

sus correspondientes textos de origen para crear una base de datos de la MT. En este

caso, ambos textos, el de origen y el traducido, serán divididos en segmentos y deberán

controlarse antes de proceder a la alineación.

Pre Traducción

¿En qué consiste?

Pre-traducción de segmentos del texto de origen

La pre-traducción (también llamada traducción por lotes o batch translation) consiste en

comparar un texto de origen completo con la base de datos de la Memoria de

Traducción (MT) e insertar automáticamente las traducciones de todas las

correspondencias exactas que se hayan encontrado en la base de datos. El resultado es

85

un híbrido que contiene segmentos pre-traducidos y segmentos sin traducir. Todos los

segmentos para los cuales no se haya encontrado una correspondencia, deberán ser

traducidos por un traductor humano o -si se lo tiene a disposición y se lo considera útil-

usando un sistema de traducción automática.

Pre-traducción de términos

Para aquellos casos en los que no se encuentre una equivalencia en la base de datos de

la MT, algunos sistemas de MT permiten pre-traducir términos. Los segmentos del texto

de origen serán comparados con la base terminológica y todas las correspondencias

equivalentes que se encuentren en dicha base terminológica serán incorporadas

automáticamente al texto de origen. El resultado son segmentos híbridos del texto de

origen.

¿Para qué sirve?

Algunas compañías de localización prefieren pre-traducir los textos antes de enviárselos

a sus traductores. La pre-traducción de segmentos del texto de origen suele ser necesaria

para manejar la enorme cantidad de contenidos electrónicos en proyectos de

localización. La pre-traducción de términos se podría usar para que los traductores

externos que no estén utilizando el sistema de MT puedan acceder a la terminología

pertinente. Sin embargo, la pre-traducción de términos generalmente lleva a un exceso

de trabajo de post-edición.

Lo que hay que tener en cuenta:

En algunas aplicaciones de MT el usuario puede definir el parámetro de

correspondencia de una pre-traducción por debajo del 100%. Sin embargo, no es

aconsejable usar correspondencias aproximadas en la etapa de pre-traducción, porque

esto hará que la etapa de post-edición sea más difícil y lenta.

Pero aún restringiendo automáticamente la pre-traducción a las equivalencias exactas se

pueden crear errores serios. En primer lugar, cualquier error de traducción presente en

las unidades de la base de datos de la MT se puede multiplicar y "repetir

indefinidamente" a través del proceso de pre-traducción. En segundo lugar, inlcuso las

traducciones de las correspondencias exactas podrían no corresponder con contexto del

nuevo texto de origen, ya que las bases de datos de la MT son sólo una amalgama de

unidades de traducción aisladas de su contexto.

Ejemplo de Pre-Traducción

El siguiente ejemplo corto demuestra las dificultades que se presentan durante la pre-

traducción automática.

Mientras que en inglés, una frase como "It may be hot" puede ser reutilizada en la

mayoría de los casos, sin saber a qué hace referencia el pronombre it, no sucede lo

mismo en las traducciones hacia otros idiomas que tienen distintos géneros

gramaticales. Por lo tanto, las referencias pronominales entre oraciones pueden causar

problemas graves en la pre-traducción automática.

86

Texto de origen en inglés:

Texto traducido al alemán:

Los dos pares de oraciones dan lugar a dos entradas en la MT:

Nuevo texto de origen en inglés: La segunda oración es una correspondencia exacta.

Nuevo texto de origen: La traducción al alemán de la correspondencia exacta no resulta

adecuada en el nuevo contexto:

87

Nuevo texto traducido con la equivalencia exacta corregida:

Aunque algunas aplicaciones de MT estén equipadas con funciones que permiten tener

en cuenta el contexto, haciendo referencia a todo el documento traducido previamente

como base para la pre-traducción, cualquier texto pre-traducido debe ser controlado

cuidadósamente por un traductor humano.

Algunos sistemas también ofrecen la opción de extraer de un texto solamente los

segmentos que no pueden ser pre-traducidos. En este caso, se recibiría un listado de

oraciones que no constituye un texto completo. Sería conveniente pedir al cliente que le

envíe una copia del texto completo junto con las partes pre-traducidas. De no ser así, en

la mayor parte de los casos, es muy difícil lograr una traducción de buena calidad.

La pre-traducción de términos para los traductores externos no tiene sentido si ellos

cuentan con una herramienta de terminología adecuada. En ese caso los traductores

deberán recibir la base de datos terminológica en cuestión o una parte de esta que sea

relevante al proyecto.

88

GLOSARIO DE TÉRMINOS Glosario de términos relacionados con la localización de contenidos electrónicos

Alineación

El proceso de alineación consiste en comparar el texto de origen y su traducción,

haciendo coincidir los segmentos correspondientes y uniéndolos como unidades

de traducción de una MT.

Autoedición (en inglés DTP, de "Desktop Publishing")

El diseño de textos y gráficos por computadora para imprimir revistas, boletines,

folletos, etc. Un buen sistema de autoedición por lo general ofrece, entre otras

cosas, la posibilidad de adaptar un texto a distintas medidas y formas.

(FOLDOC (Free On-Line Dictionary Of Computing): Diccionario de

computación gratuito en línea)

Base de datos terminológica

Un conjunto de entradas terminológicas en el cual se pueden efectuar búsquedas

electrónicamente. (Adaptado de Bowker 2002, 154)

Concordancia automática

Es un dispositivo de algunos sistemas de MT que busca automáticamente

fragmentos por debajo del nivel oracional. Se puede activar cuando no se

encuentra una correspondencia exacta o aproximada en la base de datos de la

MT. Esta función busca la correspondencia más larga posible entre el segmento

del texto de origen que será traducido y los segmentos presentes en la MT y

recupera en la base de datos todas las apariciones de las frases repetidas. Véase

también: Herramienta de Concordancia.

Configuración Terminológica

Creación de bases de datos terminológicas durante la preparación de un

proyecto.

Contenido Electrónico

Información digital con una vida útil electrónica, es decir, material creado,

distribuido, utilizado y finalmente descartado en forma exclusivamente

electrónica. El término es usado con un significado más amplio e incluye

material que se crea electrónicamente, aunque su distribución o uso sea en forma

impresa, como es el caso de muchos manuales de uso de productos de software.

Correspondencia aproximada

Cualquier correspondencia entre dos segmentos, uno de origen que debe ser

traducido y un segmento que se encuentra almacenado en la MT, que no sea una

correspondencia exacta.

89

Correspondencia Exacta

Una correspondencia exacta, carácter por carácter, entre dos segmentos, uno de

origen que debe ser traducido y un segmento que se encuentra almacenado en la

Memoria de Traducción.

Entrada terminológica

Una entrada o anotación que contiene toda la información terminológica relativa

a un único concepto. Esto significa que toda la información relativa al mismo

concepto (incluidos, por ejemplo los sinónimos) son recogidos en una única

entrada terminológica. La información relativa a conceptos diferentes debe ser

archivada bajo entradas distintas.

Error de Concordancia

Una penalidad aplicada al valor de concordancia de algunos tipos de unidades de

traducción recuperados de una memoria de traducción. Podría tratarse de

traducciones hechas por un sistema de traducción automática, unidades creadas

por una herramienta de alineación, traducciones de segmentos idénticos del texto

de origen para distintos clientes, etc. En algunos sistemas de memoria de

traducción los valores de penalidad pueden ser definidos por el usuario, otros

aplican automáticamente valores predefinidos.

Exportar

Guardar una copia de un archivo bajo el formato requerido por una aplicación

distinta de la actual. Es posible que el proceso de conversión no sea siempre

perfecto. Véase también: Importar (Bowker 2002, 146)

Extracción terminológica

Proceso asistido por ordenador para extraer una lista de términos potenciales de

una selección de textos electrónicos. El listado resultante (a veces llamados

"téminos candidatos") debe ser revisado por un traductor o lingüista. La

extracción de términos puede ser bilingüe o monolingüe.

Nota: a menudo este proceso se conoce también como reconocimiento de

términos. No obstante, la extracción y el reconocimiento de términos son dos

tareas distintas que se llevan a cabo en diferentes fases del proceso de

localización.

Filtro de formato de archivo (también: filtro de formato, filtro, rutina o herramienta de

conversión)

Una función del software que cambia un formato de archivo por otro.

Formato de un Archivo

90

La distribución, diseño y organización de la información en un archivo. Existen

cientos de formatos patentados y las aplicaciones específicas necesitan que un

archivo esté organizado de una cierta manera para poder leer la información que

contiene. (Bowker 2002, 146)

Gestión terminológica

Todas las actividades relacionadas con la preparación, elaboración,

documentación y uso de un léxico especializado. Estas actividades se llevan a

cabo usando herramientas especializadas como los sistema de gestión de

terminología. (Portal terminológico del alemán)

Herramienta de concordancia de textos

En los programas de Memoria de Traducción (MT): Las herramientas de

concordancia bilingües permiten recuperar todas las partes de una secuencia

específica de búsqueda (palabras sueltas, grupos de palabras, frases, etc.) de una

base de datos de una Memoria de Traducción (MT) y visualizar las veces que

aparece o se repite, al igual que con su contexto.

HMTL (Hypertext Markup Language)

El lenguaje de marcas usado para definir el formato de presentación del

documento usado en el World Wide Web. Los sitios en la red se construyen con

etiquetas de HMTL, o marcas, incrustados en el texto. El lenguaje HMTL define

la disposición de la página, el tipo de carácter y los elementos gráficos así como

también los enlaces de hipertexto a otros documentos de la red. (Bowker2002,

147)

Importar

Leer el archivo en un formato creado por una aplicación dferente a la que se está

usando. Véase también: exportar. (Bowker 2002, 147)

Kit de traducción o Kit de Localización.

Conjunto de todo el material relacionado con un proyecto de traducción que

compila el Proveedor de Localización. Ademas de los documentos de origen, o

sea, el material a ser traducido, el kit incluye todo tipo de información técnica y

lingüística, como las memorias de traducción, las bases de datos terminológicas

o glosarios, los manuales de estilo, etc.

Locale

Término inglés que designa una combinación de idioma y región. En primer

lugar esta combinación reconoce que en un país o región tal vez se use más de

un idioma. En segundo lugar, también reconoce que aunque en distintas regiones

o países se hable oficialmente el mismo idioma, es muy probable que existan

amplias diferencias, lingüisticas o no lingüisticas, que requieren un tratamiento

especial.

91

Localización (L10N)

Adaptación de un producto para que cumpla los requisitos lingüísticos,

culturales, etc. de un mercado específico (lo que se entiende como "locale")

(FOLDOC: Free On-Line Dictionary of Computing). Véase también:

Localización de contenidos electrónicos

Localización de contenidos electrónicos

Traducción y adaptación cultural de la información digital para los mercados

locales.

Memoria de traducción

La finalidad de una memoria de traducción es guardar los originales y las

traducciones de textos de eContent en un ordenador, divididos en unidades

manejables, normalmente en frases. A lo largo del tiempo, se va recopilando en

el sistema una enorme cantidad de oraciones con sus correspondientes

traducciones. Los sistemas de memoria de traducción permiten reciclar estos

segmentos ya traducidos proponiendo automáticamente una traducción

recuperada de la memoria siempre que aparece la misma frase (correspondencia

exacta) o una frase similar (correspondencia aproximada) en el texto que se está

traduciendo.

Objeto incrustado

Un objeto (por ejemplo, una imagen o un diagrama de flujo) creado mediante el

software de una aplicación que luego se incrusta en un documento creado con

otra aplicación. Incrustar el objeto, en lugar de simplemente insertarlo o pegarlo,

garantiza el mantenimiento del formato original. De hecho, es posible modificar

el objeto incrustado con la aplicación original. (Adaptado de Webopedia).

Post-edición

Corrección de un texto traducido mediante traducción automática por parte de

un traductor o un revisor.

Pre-traducción (también llamada "batch translation" o traducción por lotes)

La pre-traducción (también llamada traducción por lotes o batch translation)

consiste en comparar un texto de origen completo con la base de datos de la

Memoria de Traducción (MT) e insertar automáticamente las traducciones de

todas las correspondencias exactas que se hayan encontrado en la base de datos.

El resultado es un híbrido que contiene segmentos pre-traducidos y segmentos

sin traducir.

Proveedor de Localización

Empresa que ofrece servicios de localización de contenidos electrónicos.

92

Reconocimiento de términos (también: búsqueda automática de términos)

Proceso de búsqueda automática, en una base de datos terminológica, de todos

los términos que aparecen en el texto con el cual el traductor está trabajando.

Nota: se trata de un proceso distinto del de extracción de términos.

Repetición Interna

Son los segmentos que aparecen más de una vez en el texto de origen pero que

aún no han sido traducidos, es decir, aún no están almacenadas como unidades

de traducción en una Memoria de Traducción. Véase también: repeticiones

internas, correspondencia exacta y análisis estadístico del texto de origen.

Repeticiones externas

Segmentos que aparecen más de una vez en dos o más textos de origen pero que

aún no han sido traducidos, es decir, todavía no han sido registrados como

unidades de traducción en una Memoria de Traducción. Véase también:

repeticiones internas, correspondencia exacta y análisis estadístico del texto de

origen.

Revisión

Todos los pasos llevados a cabo para verificar la precisión de una traducción,

con especial atención puesta en el control de errores, omisiones, adiciones,

nombres y títulos, cifras y gráficos, etc.

Segmentación

El proceso de subdividir un texto en segmentos.

Segmento

Una unidad de texto predefinida que puede ser alineada con su traducción

correspondiente. Normalmente la unidad básica de segmentación es una frase,

aunque otras unidades también se pueden definir como segmentos, por ejemplo

titulares, elementos de una lista, celdas de una tabla o párrafos. (Bowker 2002,

152)

Sistema de gestión de terminología

Aplicación de software que permite crear, archivar y recuperar entradas

terminológicas. (Adaptado de Bowker 2002, 154)

Sistema de memoria de traducción

Aplicación que integra una serie de herramientas que ayudan durante el proceso

de traducción. Además de la memoria de traducción estos sistemas incluyen

93

herramientas de gestión terminológica, procesadores de textos, herramientas de

gestión de proyectos y de control de calidad.

Tag o etiqueta.

Una especie de etiqueta, adjunta a un elemento, que contiene información

relacionada con dicho elemento (por ejemplo, información sobre la presentación

gráfica). Un conjunto de etiquetas constituyen el marcado; en los lenguajes de

marcado como el HMTL y el XML las etiquetas aparecen escritas entre signos

de mayor y menor (por ejemplo, <CURSIVA>.) (Adaptado de Bowker 2002,

153)

Término

La designación de un concepto definido en una lengua particular mediante una

expresión linguística. Un término puede estar compuesto por una sola palabra o

por dos o más palabras; la característica que distingue al término es que designa

un solo concepto, en contraposición con la unidad fraseológica, que combina

más de un concepto de manera lexicalizada para expresar situaciones complejas.

(ISO 12620 (1999): Computer Applications in Terminology - Data Categories.

Geneva: International Organization for Standardization)

TMX (Formato de intercambio de memorias de traducción)

Formato estándar para memorias de traducción desarrollado por LISA

(Localization Industry Standards Association) con el objetivo de facilitar el

intercambio de memorias de traducción entre los distintos programas de

software y/o entre los proveedores de servicios de localización. Para mayores

detalles véase la página principal TMX.

Traducción Automática

Traducción llevada a cabo mediante ordenador. En este proceso el ordenador

tiene la responsabilidad principal en la traducción de un texto. un traductor

humano puede ayudar durante el proceso con tareas de pre- o post-edición, pero

es el ordenador, en lugar de la persona, quien produce la primera traducción en

borrador. (Bowker 2002, 147)

Unidad de traducción

En una memoria de traducción, segmento del texto de origen y su traducción

correspondiente. (adaptado de Bowker 2002, 155).

Valor de Concordancia

Se refiere al grado de similaridad entre el segmento del texto de origen a ser

traducido y una unidad de traducción recuperada por el sistema de una memoria

de traducción; en general se presenta como un porcentaje.

XML (eXtensible Markup Language)

94

Lenguaje de marcado que sirve para mejorar la funcionalidad del Web, ya que

ofrece una modalidad de identificación de la información flexible y fácilmente

adaptable. Se llama "extensible" ya que no es un formato fijo ni un lenguaje de

marcado predefinido único como lo es el HMTL. Al contrario, el XML es en

realidad un "metalenguaje", es decir un lenguaje que se utiliza para describir

otros lenguajes, y permite definir un marcado personalizado adaptable a un

número infinito de tipos de documentos. (Adaptado de Peter Flynn "The XML

FAQ".)

Date post:	16-Oct-2018
Category:	Documents
Upload:	phamdan
View:	218 times
Download:	1 times

I. Fundamentos - Universidad de Córdobalr1maalm/apuntesherramientasarchivo1.pdf · componentes de...

Documents