+ All Categories
Home > Documents > Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology ›...

Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology ›...

Date post: 29-Jun-2020
Category:
Upload: others
View: 1 times
Download: 0 times
Share this document with a friend
24
Joaquim Llisterri Grup de Fonètica, Departament de Filologia Espanyola Ciclo “Las aplicaciones de la fonética” Departamento de Filología Española, Universidad Autónoma de Madrid 24 de abril de 2007 Las tecnologías del habla Joaquim Llisterri Grup de Fonètica, Departament de Filologia Espanyola, Universitat Autònoma de Barcelona [email protected] http://liceu.uab.cat/~joaquim Joaquim Llisterri Grup de Fonètica, Departament de Filologia Espanyola Ciclo “Las aplicaciones de la fonética” Departamento de Filología Española, Universidad Autónoma de Madrid 24 de abril de 2007 Materiales en Internet http://liceu.uab.cat/ ~joaquim/ speech_technology/ UAM_07/UAM_07.html Joaquim Llisterri Grup de Fonètica, Departament de Filologia Espanyola Las tecnologías del habla Las tecnologías del habla La conversión de texto en habla El reconocimiento automático del habla Los sistemas de diálogo La comunicación mediatizada por ordenador Joaquim Llisterri Grup de Fonètica, Departament de Filologia Espanyola Las tecnologías del habla Las tecnologías del habla La conversión de texto en habla El reconocimiento automático del habla Los sistemas de diálogo La comunicación mediatizada por ordenador
Transcript
Page 1: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Ciclo “Las aplicaciones de la fonética”Departamento de Filología Española, Universidad Autónoma de Madrid

24 de abril de 2007

Las tecnologías del hablaJoaquim Llisterri

Grup de Fonètica, Departament de FilologiaEspanyola, Universitat Autònoma de Barcelona

[email protected]

http://liceu.uab.cat/~joaquim

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Ciclo “Las aplicaciones de la fonética”Departamento de Filología Española, Universidad Autónoma de Madrid

24 de abril de 2007

Materiales en Internet

http://liceu.uab.cat/~joaquim/

speech_technology/UAM_07/UAM_07.html

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del habla

Las tecnologías del hablaLa conversión de texto en hablaEl reconocimiento automático delhablaLos sistemas de diálogoLa comunicación mediatizada porordenador

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del habla

Las tecnologías del hablaLa conversión de texto en hablaEl reconocimiento automático delhablaLos sistemas de diálogoLa comunicación mediatizada porordenador

Page 2: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Objetivos de un sistema de diálogo

HCI, Human - Computer

Interaction

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del habla

• Objetivo

• Facilitar la comunicación oralentre personas y sistemasinformáticos

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Tecnologías del habla

• Salida vocal

Síntesis del habla

• Entrada vocal

Reconocimiento del habla

• Interacción vocal

Sistemas de diálogoJoaquim Llisterri

Grup de Fonètica, Departament de Filologia Espanyola

Del texto ... … al habla

Las tecnologías del hablaLa síntesis del habla

Page 3: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del hablaEl reconocimiento del habla

Del habla … … al texto

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del hablaLos sistemas de diálogo

Eh, pues mire, queríasaber a qué hora salela… el último tren, eh…hacia Barcelona, desdeMadrid, el sábado

Reconocimiento Comprensión

PETICIÓN, DESTINO=“Barcelona”,ORIGEN=“Madrid”, Fecha: DÍA=“28”,

HORA=“Último”

Generación de respuesta

El último tren sale a las11 y 53 minutos de la noche

Síntesis

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del habla en español

Las tecnologías del hablaLa conversión de texto en hablaEl reconocimiento automático delhablaLos sistemas de diálogoLa comunicación mediatizada porordenador

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de tratamientolingüístico de un conversor

de texto en habla

Page 4: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Unidades de síntesis

Difonema• Segmento acústico que incluye la transición

entre dos fonemas consecutivos, formado porla parte estacionaria del primero, latransición del primero al segundo y la parteestacionaria del segundo

/kasa/ - /k/ + /ka/ + /as/ + /sa/ + /a/

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Síntesis basada en corpus

• Corpus-based speech synthesis

• Sistemas de síntesis basados en laselección de unidades (unit selection) delongitud variable (non-uniform)

• Las unidades de síntesis están recogidasen un corpus y se concatenan una vezrealizada la selección

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Síntesis basada en corpus

Selección de unidades• El corpus de síntesis constituye el inventario de

unidades• Se selecciona la cadena fonética más larga que

corresponde al texto de entrada del sistema desíntesis

• Se minimiza el número de concatenaciones y sebusca la adecuación prosódica

• Diseño y evaluación de algoritmos de selección

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Síntesis basada en corpus

Diseño del corpus

• Definición del inventario de alófonos y desus combinaciones

• Cobertura de los alófonos y de suscombinaciones (difonemas)

• Cobertura de los fenómenos prosódicos

Page 5: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

LLISTERRI, J.- MACHUCA, M.- MADRIGAL, N.- MANCINI, F.- MASSIMINO, P.- de la MOTA, C.- RIERA, M.- RÍOS, A. (2004)"Aspectos lingüísticos en el diseño de un conversor de texto en habla en castellano y en catalán: El sistema LoquendoTTS®", in VI

Congreso de Lingüística General. Universidade de Santiago de Compostela, Santiago. 3-7 de mayo de 2004. Universidade de Santiago deCompostela, Facultade de Filoloxía, Área de Lingüística Xeral. pp. 521-522.

http://liceu.uab.es/~joaquim/publicacions/Llisterri_et_al_04_Conversor_Texto_Habla_Castellano_Catalan_Loquendo.pdf

• Corpus inicial de 3 millones de palabrasextraídas de textos periodísticos, literarios,culturales, científicos, didácticos, etc.

• Selección automática de secuencias que seacerquen al equilibrio fonético teniendo encuenta el contexto de aparición de los alófonos

• Edición manual de 200 frases enunciativas einterrogativas para ajustar el equilibrio y laestructura sintáctica

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

LLISTERRI, J.- MACHUCA, M.- MADRIGAL, N.- MANCINI, F.- MASSIMINO, P.- de la MOTA, C.- RIERA, M.- RÍOS, A. (2004)"Aspectos lingüísticos en el diseño de un conversor de texto en habla en castellano y en catalán: El sistema LoquendoTTS®", in VI

Congreso de Lingüística General. Universidade de Santiago de Compostela, Santiago. 3-7 de mayo de 2004. Universidade de Santiago deCompostela, Facultade de Filoloxía, Área de Lingüística Xeral. pp. 521-522.

http://liceu.uab.es/~joaquim/publicacions/Llisterri_et_al_04_Conversor_Texto_Habla_Castellano_Catalan_Loquendo.pdf

• Selección del locutor en función de lavariedad lingüística, la elocución y laplasticidad: locutores profesionales

• Control lingüístico de la grabación de las200 frases

• Correspondencia entre la realización dellocutor y la transcripción fonéticagenerada por el sistema

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

LLISTERRI, J.- MACHUCA, M.- MADRIGAL, N.- MANCINI, F.- MASSIMINO, P.- de la MOTA, C.- RIERA, M.- RÍOS, A. (2004)"Aspectos lingüísticos en el diseño de un conversor de texto en habla en castellano y en catalán: El sistema LoquendoTTS®", in VI

Congreso de Lingüística General. Universidade de Santiago de Compostela, Santiago. 3-7 de mayo de 2004. Universidade de Santiago deCompostela, Facultade de Filoloxía, Área de Lingüística Xeral. pp. 521-522.

http://liceu.uab.es/~joaquim/publicacions/Llisterri_et_al_04_Conversor_Texto_Habla_Castellano_Catalan_Loquendo.pdf

• Base de datos acústica de unos 200 Mbcodificada a 16 kHz en PCM (Pulse Code

Modulation)

• Reducción del tamaño mediante técnicas decodificación de la señal

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

GTH, Grupo de Tecnologías del Habla,Universidad Politécnica de Madrid

http://www-gth.die.upm.es/research/synthesis/synth-form-concat-e.html/

Conversión de texto en habla por concatenación

Page 6: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

GTP, Grup de Tractament de la Parla,Universitat Politècnica de Catalunya

http://gps-tsc.upc.es/veu/soft/demos/tts.php3

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

GTS, Grupo de Tratamiento de la Señal, Universidade de Vigohttp://www.gts.tsc.uvigo.es/cotovia/

Conversión de textoen habla basada encorpus

Conversión de textoen habla basada endifonemas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Telefónica I+D, Madrid

Conversión de texto en habla basada enconcatenación de unidades (1996)

Conversión de texto en habla basada en corpus(2003)

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Verbio Technologies SLhttp://www.verbio.com/webverbio2/html/demos_ttsonline.php

Page 7: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Verbio Technologies SLhttp://www.verbio.com/webverbio2/html/demos_news.php

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Actor, Loquendohttp://actor.loquendo.com/actordemo/

Es, m, f

EsCh, f

EsMx, f

EsAr, m

Cat, f Cat, m

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Loquendo Gilded TTShttp://actor.loquendo.com/actordemo/

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

AT&T Labs Natural Voiceshttp://www.naturalvoices.att.com/demos/

EspMx, f

Page 8: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

AT&T Labs Natural Voiceshttp://www.naturalvoices.att.com/demos/

EspMx, f

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

RealSpeak, Nuancehttp://www.nuance.com/realspeak/demo/default.asp

Eng, f

EsMx, f

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Acapela Grouphttp://demo.acapela-group.com/

Es, f

En, f

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del habla

Las tecnologías del hablaLa conversión de texto en hablaEl reconocimiento automático delhablaLos sistemas de diálogoLa comunicación mediatizada porordenador

Page 9: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

• Reconocimiento depalabras aisladas

• Reconocimiento depalabras conectadas

• Reconocimiento de hablacontinua+ dificultad

- dificultad

Tipo de enunciado

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

• Sistemas dependientesdel locutor

• Sistemasindependientes dellocutor

+ dificultad

- dificultad

Número de locutores

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

•Vocabulariorestringido

•Vocabulario sinrestricciones

+ dificultad

- dificultad

Tamaño del vocabulario

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

• Entorno silencioso• Entorno con ruido

predictible• Entorno con ruido

aleatorio+ dificultad

- dificultad

Entorno

Page 10: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Desarrollo histórico del reconocimiento del hablaJUANG, B.-H. - RABINER, L. R. (2006) "Automatic speech recognition: History", in BROWN, K.

(Ed.) Encyclopedia of Language & Linguistics. Amsterdam: Elsevier. pp. 806-819.

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Speech-Enabled Interactive Voice Response Systems. Web ProForum Tutorials,International Engineering Consortium.

http://www.iec.org/online/tutorials/speech_enabled/index.html

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Esquema básico de un sistema dereconocimiento automático del habla

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Modelo de reconocimiento de habla continuaMariño (1999)

Page 11: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Reconocimiento de palabras aisladas

• Control delsistemaoperativo de unordenador

http://www.youtube.com/watch?v=SKm-g7hUSag

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Windows VistaPrimera presentación pública

http://www.youtube.com/watch?v=G-dYiTc88Pc

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Dragon Naturally Speaking

• Edición estándar y profesional

• Vocabulario legal

• Vocabulario médico

• Versión en español

http://www.nuance.com/naturallyspeaking/

http://spain.nuance.com/naturallyspeaking/

Dictado automático

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Dragon Naturally Speakinghttp://www.nuance.com/talk/

Page 12: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Gestión y dictado de correos electrónicosDragon Naturally Speaking

http://www.nuance.com/naturallyspeaking/demos/

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Nuance Mobile Dictation“The amazing race”

http://www.youtube.com/watch?v=-L4Jk6GDud0

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

IBM Via Voice

• 300.000 palabras

• Vocabulario legal

• Vocabulario médico

• Primeras versiones en español

http://www-306.ibm.com/software/voice/viavoice/

http://www.nuance.com/viavoice/

Dictado automático

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Audio Information Retrieval

Recuperación de información sonora

• TRANSCRIGAL, Grupo de Tecnologíasde la Señal, Universidade de Vigo

http://www.webapps.gts.tsc.uvigo.es/Transcrigal/

• Transcripción automática yrecuperación de contenido entelediarios en castellano y en gallego

Page 13: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

TRANSCRIGALhttp://www.webapps.gts.tsc.uvigo.es/Transcrigal/

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

TRANSCRIGALhttp://www.webapps.gts.tsc.uvigo.es/Transcrigal/

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Audio Information Retrieval

Recuperación de información sonora

• Nuance Dragon Audio Mininghttp://www.nuance.com/audiomining/

• Producto comercial para la búsquedade información mediante palabrasclave o frases en bases de datos sonoras

• Versión en español

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Nuance Dragon Audio Mininghttp://www.nuance.com/audiomining/

Page 14: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Reconocimiento automático del habla y enseñanza de lapronunciación asistida por ordenador

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

LAFFORD, B.A. (2004) "Review of Tell Me More Spanish",Language Learning and Technology 8, 3: 21-34.

http://llt.msu.edu/vol8num3/pdf/review1.pdf

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Ordinate Corporation, Menlo Park, Californiahttp://www.ordinate.com/

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del habla en español

Las tecnologías del habla

La conversión de texto en habla

El reconocimiento automático del habla

Los sistemas de diálogo

La situación de las tecnologías del hablaen España

Page 15: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Los sistemas de diálogo

Eh, pues mire, queríasaber a qué hora salela… el último tren, eh…hacia Barcelona, desdeMadrid, el sábado

Reconocimiento Comprensión

PETICIÓN, DESTINO=“Barcelona”,ORIGEN=“Madrid”, Fecha: DÍA=“28”,

HORA=“Último”

Generación de respuesta

El último tren sale a las11 y 53 minutos de la noche

Síntesis

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de un sistema de diálogo

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de un sistema de diálogo

Módulo de reconocimiento del habla

• Convierte la señal sonora de entrada -continua- en una representación escrita -discreta - de las palabras reconocidas

Tecnologías del habla

• Reconocimiento automático del habla(ASR, Automatic Speech Recognition)

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de un sistema de diálogo

Módulo de interpretación semántica

• Determina el “significado” (contenido) dela secuencia de palabras reconocida

Procesamiento del lenguaje natural

• Comprensión del lenguaje (NLU,Natural Language Understanding)

Page 16: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de un sistema de diálogo

Comprensión del contenidoComprensión del lenguaje natural (NLU)

Eh, pues mire, quería saber a qué horasale la… el último tren, eh… haciaBarcelona, desde Madrid, el sábado

PETICIÓN, DESTINO=“Barcelona”, ORIGEN=“Madrid”, FECHA:DÍA=“28”, HORA=“Último”

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de un sistema de diálogo

Módulo de gestión del diálogo

• Gestiona la interacción entre la persona yel sistema para la realización de la tareadeseada

• Módulo central de control en un sistemade diálogo

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de un sistema de diálogo

Módulo de generación de lenguaje

• Crea un enunciado bien formado a partirde la representación internaproporcionada por el sistema

Procesamiento del lenguaje natural

• Generación del lenguaje (NLG, Natural

Language Generation)

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de un sistema de diálogo

Creación de respuestas

Generación de lenguaje natural (NLG)

PETICIÓN, DESTINO=“Barcelona”,ORIGEN=“Madrid”, Fecha: DÍA=“28”,HORA=“Último”

El último tren sale a las 11 y 53minutos de la noche

Page 17: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Módulos de un sistema de diálogo

Módulo de conversión de texto en habla

• Transforma en una señal sonoracontinua- el texto creado por el módulode generación de respuestas -discreto-

Tecnologías del habla

• Conversión de texto en habla (TTS,Tex-to-Speech Synthesis)

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

BASURDE (1998-2001)Sistema de diálogo oral en dominios restringidos

http://gps-tsc.upc.es/veu/basurde/Home.htm

• Reconocimiento• “Para conseguir una tasa de reconocimiento

aceptable es deseable que la frase se pronuncieevitando ruidos y a una velocidad de locuciónnormal”

• Comprensión• Información telefónica de horarios y precios de

trenes regionales y de grandes líneas

• Salida vocal

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Acceso al ordenador mediante el teléfono

• Portales de voz

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Portal de voz

Selección por voz

Restaurantes

Farmacias de guardia

Reconocimientodel habla

Palabras aisladas

Page 18: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Portal de voz

Grabación previa

Selección por voz

Informaciónsolicitada

Restaurantes

Restaurantes de Ávila

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Portal de voz

Sistema automático

Selección por voz

Informaciónsolicitada

Farmacias de guardia

Existe unafarmacia…

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Portal de voz

ochoHe encontrado nueve

diez

Existe una farmacia de guardia

Mensajes pregrabadospara insertar palabras

procedentes de una lista

Conversión de texto escrito en habla

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Venta de entradas

CineEntradasYdilo Advanced Voice Solutions

http://www.ydilo.com/esp/caseStudies.html

Page 19: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Banca Telefónica

BpT, Banca por TeléfonoNatural Vox

http://www.natvox.es/demos_bpt.html

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Gestión del correo electrónico

TelCorreoUniversidade de VigoUniversidade de Santiago de

CompostelaSistema de diálogo para acceso telefónico a

servicios telemáticoshttp://www.gts.tsc.uvigo.es/telcorreo/

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Cita previahttp://www.verbio.com/webverbio/html/demos_basic.php

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del habla

Las tecnologías del hablaLa conversión de texto en hablaEl reconocimiento automático delhablaLos sistemas de diálogoLa comunicación mediatizada porordenador

Page 20: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

La comunicación persona-personamediatizada por una máquina

CMM, Computer-Mediated Communication

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

La comunicación persona-personamediatizada por una máquina

• Traducción entre modalidades• Escrito - Escrito

Traducción automática de textos(MT, Machine Translation)

• Oral - OralTraducción automática del habla(SLT, Spoken Language Translation)

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Traducción automática del hablaSpoken Language Translation

Reconocimiento del habla

Gestión del diálogo

Traducción automática de textos

Conversión de texto en habla

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Traducción automática del hablahttp://www.is.cs.cmu.edu/papers/speech/1996/COMPUTER-alex.ps.gz

“...sí sí el viernes diecinueve puedo sí porque sabes me

voy de viaje d hoy la verdad así es

que este mes es muy viajero me voy el día seis de viaje

y estoy hasta el doce así que el día

diecinueve me viene muy bien francamente...”

yes yes on friday nineteen can yes because know I go

me of trip D today the truth such is

that this month is very traveler I go me the day six of trip

and I am until the twelve as soon

as the day nineteen comes me very well outspokenly

Page 21: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Verbmobilhttp://verbmobil.dfki.de/overview-us.html

• Sistema móvil de traducción de diálogosespontáneos (1993-2000)

• Dominios restringidos: citas, preparaciónde viajes, reservas de hotel

• Lenguas: alemán, inglés y japonés

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

WAHLSTER, W. (2000) "Mobile Speech-to-Speech Translation of Spontaneous Dialogs: AnOverview of the Final Verbmobil System", in WAHLSTER, W. (Ed.) Verbmobil: Foundations of

Speech-to-Speech Translation. Heidelberg - New York: Springer Verlag (Artificial Intelligence).http://verbmobil.dfki.de/ww.html

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Verbmobilhttp://verbmobil.dfki.de/overview-us.html

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

La comunicación persona-personamediatizada por una máquina

• Traducción entre modalidades• Escrito - Oral

Conversión de texto en habla (TTS, Text-to-Speech Synthesis)

• Oral - EscritoReconocimiento automático del habla(ASR, Automatic Speech Recognition)

Page 22: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

La comunicación persona-personamediatizada por una máquina

• Traducció entre modalidades• Lengua oral - Movimientos

labialesReconocimiento del hablaGeneración de movimientoslabiales a partir delreconocimiento

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

TelefaceDepartment of Speech, Music and Hearing, KTH, 2002

http://www.speech.kth.se/teleface/

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

La comunicación persona-personamediatizada por una máquina

• Traducción entre modalidades• Lengua oral - Lengua de señas

Reconocimiento del habla o de laimagenTraducción de/a lengua de señasConversión de texto en habla o detexto a señas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

eSign, Essential Sign Language Information onGovernment Networks

http://www.sign-lang.uni-hamburg.de/esign/

Generaciónautomáticade traduccióna lengua deseñas paraprogramas detelevisión

Page 23: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

iCommunicatorhttp://www.myicommunicator.com/

Reconocimientodel hablaConversión de

texto en hablaTraducción de

lengua oral alengua de señas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

La comunicación persona-personamediatizada por una máquina

Traducción entre modalidades

• Acceso a la información en otras lenguas

• Acceso a la información mediante lamodalidad más adecuada a lasnecesidades específicas de cada usuario

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Otras aplicaciones de las tecnologías delhabla…

http://www.youtube.com/watch?v=YhWmzTjScfA

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Las tecnologías del habla

Las tecnologías del hablaLa conversión de texto en hablaEl reconocimiento automático delhablaLos sistemas de diálogoLa comunicación mediatizada porordenador

Page 24: Las tecnologías del habla - UAB Barcelonaliceu.uab.cat › ~joaquim › speech_technology › UAM_07 › TecnolHabla_UAM_07.pdf• Edición manual de 200 frases enunciativas e interrogativas

Joaquim LlisterriGrup de Fonètica, Departament de Filologia Espanyola

Ciclo “Las aplicaciones de la fonética”Departamento de Filología Española, Universidad Autónoma de Madrid

24 de abril de 2007

Materiales en Internet

http://liceu.uab.cat/~joaquim/

speech_technology/UAM_07/UAM_07.html


Recommended