Post on 07-Jul-2015
transcript
DEUTSCHE TEXTKORPORA
TIC aplicadas a la Traducción
LIMAS-Korpus
LIMAS-Korpus es un corpus compuesto por más de un millón de tokens
procedentes de 500 fuentes diferentes. Los textos son de diversos tipos (33 en
total) entre los que encontramos textos sobre medicina, política, psicología,
astronomía, ciencias naturales, historia, geografía, química, antropología, pero,
sobre todo, textos literarios.
En el apartado de Inhaltsverzeichnis podemos ver todos los textos y modificar
cómo queremos que aparezca la información y los títulos.
En el apartado Suchen:
-„Einfache Suche“: permite buscar una o más palabras sencillas.
Resultados de la búsqueda
Como veis, el resultado indica lafuente donde se encuentra eltexto, Rubrik/categoría del texto,la línea en la que aparece y elcontexto.
Si clicáis en “Quelle” veréis eltexto completo.
-„Kontextsuche“: permite la búsqueda de una o más palabras y otras
palabras que aparezcan en su contexto.
Resultados de la búsqueda
-„Phrasensuche“: podemos buscar frases completas en el corpus.
Resultados de la búsqueda
Operadores de búsqueda y comodines
Los operadores nos permiten realizar una búsqueda más exacta, estos
operadores podemos combinarlos con comodines. Los operadores deben
estar entre dos términos de búsqueda separados:
- or: Busca uno de los dos términos.
- and: Busca los dos términos en la
misma fuente.
- ? : cero o un carácter
- * : cero o más carácteres
El KORPUS C4 es una iniciativa que reúne los corpus del Digitalen
Wörterbuch der deutschen Sprache des 2. Jahrhunderts (DWDS), el
Austrian Academy Corpus (ACC), el Korpus Südtirol y el Schweizer
Textkorpus (CHTK).
Este corpus online es muy útil y tiene varias opciones para clasificar
la información.
Filtros/Filter:
Puedes reducir los textos a un año o un período concreto, puedes elegir la
categoría de los textos (textos literarios, periodísticos…), puedes buscar textos de
un autor en concreto, así como el título, etc.
Clasificación/Sortieren:
La función de exportación/Export es solo para usuarios. Se recomiendaregistrarse en la página (es gratuito hacerlo) para un mayor aprovechamiento dela herramienta.
Opciones/Optionen:
Puedes modificar las opciones de visualización de las búsquedas (numero de
resultados por página, información que aparece en cada columna…).
Ejemplos/Beispiele:
En este apartado se explica
cómo realizar una búsqueda
de forma óptima.
Hemos aplicado el filtro de categoría textual (textos literarios) y clasificado la
información por el año (descendente).
En las dos columnas de la izquierda vemos la procedencia del texto y el año. Al
clicar sobre “Zeit” podemos ver la palabra en su contexto, además de la fuente
(título, autor, editorial, año y página).
Resultados de la búsqueda
La web del Digitalen Wörterbuch der deutschen Sprache es una de las más
completas. En ella encontraremos un diccionario, un diccionario
etimológico, Open-Thesaurus y los siguientes corpus:
a) DWDS-Kerncorpusb) ZEIT-Corpusc) Berliner Tagesspiegel, Berliner Zeitungd) DDR-Corpuse) Corpus jüdischer Periodikag) gesprochene Spracheh) Berliner Wendecorpus
Además, DWDS te permite crear tu propio corpus online con solo registrarte
(es gratuito) al que podrás ir exportando textos de DWDS o descargarlos en
formato txt para usarlos con un programa de concordancias.
Este es el portal actual de DWDS, pero existe otro anterior, el Retro-Web
(esquina superior derecha).
Os dejo unas capturas para que veáis el resultado de búsqueda en elportal actual, pero en adelante os explicaré como funciona Retro-Webseite.
Podemos modificar la presentación
y filtrar los resultados.
Podéis ver los comodines y operadores de búsqueda aquí: http://www.dwds.de/help/ddc/
El portal Retro-Webseite de DWDS tiene algunas funciones propias de programas
de concordancia como las Kollokationen.
La desventaja de este portal es que solo puedes visualizar las búsquedas de un
corpus cada vez y no de todos como en el nuevo portal.
Bajo el nombre de cada corpus se muestra el
número de tokens que tiene.
Los corpus están clasificados en corpus de
referencia, corpus de periódicos, corpus de
lengua hablada y corpus temáticos.
Opciones de filtro y presentación (ver diapositiva 15)
Resultado de la búsqueda
Podéis ver los comodines y operadores de
búsqueda aquí:
http://retro.dwds.de/HilfeSuche/index
Wortverlauf:
Este apartado muestra una gráfica con la frecuencia
de aparición del término buscado por año y
categoría textual.
Kollokationen:
En este apartado se nos
muestra la posición de la
palabra buscada y una palabra
en segunda posición.
Nos dice la frecuencia de
aparición de las palabras por
separado y juntas.
Export:
Podrás descargar en formatotxt los resultados de labúsqueda.
Os dejo este link
http://www.youtube.com/watch?v=6pTW26PJeIc
(Export DWDS (Retro-Webseite) in Libre Office)
viel Spaß!
ESPERAMOS QUE OS SEA DE UTILIDAD