COMPARACIÓN DE AURALIZACIONES DINÁMICAS GENERADAS
A PARTIR DE RESPUESTAS AL IMPULSO MEDIDAS Y SIMULADAS
JOHNATHAN DANIEL ROSADO SARABIA
UNIVERSIDAD DE SAN BUENAVENTURA MEDELLÍN
FACULTAD DE INGENIERÍAS
INGENIERÍA DE SONIDO
MEDELLÍN
2016
COMPARACIÓN DE AURALIZACIONES DINÁMICAS GENERADAS A PARTIR DE
RESPUESTAS AL IMPULSO MEDIDAS Y SIMULADAS
JOHNATHAN DANIEL ROSADO SARABIA
Trabajo de grado presentado para optar al título de Ingeniero de Sonido
Asesores: Diana Garza Agudelo, Ingeniera de Sonido
Héctor García Mayén, Magíster (MSc) en Sonido y vibraciones
UNIVERSIDAD DE SAN BUENAVENTURA MEDELLÍN
FACULTAD DE INGENIERÍAS
INGENIERÍA DE SONIDO
MEDELLÍN
2016
Dedicatoria
Este trabajo está dedicado a mi familia, especialmente a mis padres por su apoyo incondicional y
confianza, a mis amigos por el respaldo y la compañía de siempre y a mis profesores por brindarme
las herramientas y conocimientos necesarios durante la carrera profesional.
Agradecimientos
Agradezco a mis asesores: Diana María Garza Agudelo y Héctor García Mayen, por el
acompañamiento durante el proceso, su paciencia y disponibilidad en cada una de las asesorías.
Agradezco también al Ingeniero Luis Alberto Tafur Jiménez, por las orientaciones brindadas.
Contenido
Resumen ........................................................................................................................................... 9
1. Introducción ............................................................................................................................ 11
1.1. Planteamiento del Problema ............................................................................................ 11
1.2. Justificación ..................................................................................................................... 11
2. Objetivos ................................................................................................................................. 13
2.1. Objetivo General .............................................................................................................. 13
2.2. Objetivos Específicos ...................................................................................................... 13
3. Marco Teórico ......................................................................................................................... 14
3.1. Parámetros Acústicos de la Sala ...................................................................................... 14
3.1.1. Tiempo de reverberación (RT) ................................................................................. 14
3.1.2. Tiempo de decaimiento temprano (EDT por sus siglas en inglés) ........................... 15
3.1.3. Claridad musical (C80) ............................................................................................ 15
3.1.4. Correlación cruzada interaural IACC ....................................................................... 15
3.2. Convolución..................................................................................................................... 15
3.3. Respuesta al Impulso de la Sala (RIR) ............................................................................ 16
3.4. Respuesta al Impulso Binaural en la Sala (BRIR) ........................................................... 16
3.5. Función de Transferencia Relacionada con la Cabeza y Respuesta al Impulso Relacionada
con la Cabeza (HRTF, HRIR) .................................................................................................... 17
3.6. Diferencias Interaurales de Tiempo (IDT) y de Intensidad (IID) .................................... 18
3.7. Distancia crítica ............................................................................................................... 18
3.8. Auralización ..................................................................................................................... 19
3.8.1. Generación: .............................................................................................................. 19
3.8.2. Transmisión: ............................................................................................................. 19
3.8.3. Reproducción ........................................................................................................... 20
3.9. Conceptos Estadísticos .................................................................................................... 23
3.9.1. Estadística descriptiva e inferencia estadística ......................................................... 24
3.9.2. Pruebas paramétricas y no paramétricas. ................................................................. 24
3.9.3. Población y muestra ................................................................................................. 24
3.9.4. Medidas de posición y de tendencia central ............................................................. 25
3.9.5. Formulación de hipótesis estadísticas ...................................................................... 26
3.9.6. Nivel de significación ............................................................................................... 26
4. Estado del Arte ........................................................................................................................ 27
5. Metodología ............................................................................................................................ 29
5.1. Medición del Tiempo de Reverberación y Ruido de Fondo ............................................ 29
5.2. Medición de las Respuestas al Impulso Binaurales del Recinto ..................................... 30
5.3. Simulación de Respuestas al Impulso y Comparación de los Parámetros Objetivos ...... 31
5.4. Creación de las Auralizaciones Dinámicas ..................................................................... 32
5.5. Descripción General de la Prueba Subjetiva ................................................................... 33
5.5.1. Selección de la población y determinación del tamaño de la muestra. .................... 33
6. Resultados ............................................................................................................................... 35
6.1. Comparación Objetiva ..................................................................................................... 35
6.2. Prueba de escucha crítica ................................................................................................. 38
6.2.1. Coeficientes de asimetría y de variación .................................................................. 39
6.3. Contraste No Paramétrico ................................................................................................ 39
6.3.1. Contraste en Medición A .......................................................................................... 39
6.3.2. Contraste en Simulación A ....................................................................................... 41
6.3.3. Contraste en Medición y Simulación B .................................................................... 42
6.3.4. Prueba de Wilcoxon para muestras pareadas ........................................................... 43
7. Discusión ................................................................................................................................. 45
7.1. Prueba Objetiva ............................................................................................................... 45
7.2. Prueba de escucha crítica ................................................................................................. 45
8. Conclusiones ........................................................................................................................... 47
9. Referencias .............................................................................................................................. 48
10. Anexo A. Informe de Medición: Tiempo de Reverberación ............................................... 50
11. Anexo B. Informe de Medición: Respuesta a Impulso Binaural ......................................... 51
12. Anexo C. Código de MATLAB .......................................................................................... 54
13. Anexo D. Formato para la Prueba Subjetiva ....................................................................... 56
14. Anexo E. Certificado de Calibración .................................................................................. 57
Lista de Tablas
Tabla 1. Coeficientes de absorción de materiales, librería del software Catt-Acoustic. ................ 32
Tabla 2. Coeficiente de asimetría para resoluciones espaciales en configuraciones A y B. .......... 39
Tabla 3. Coeficiente de variación para resoluciones espaciales en configuraciones A y B. .......... 39
Tabla 4. Resultados de la prueba Kruskall-Wallis para la medición A. ......................................... 41
Tabla 5. Resultados de la prueba Kruskall-Wallis para la simulación A. ...................................... 42
Tabla 6. Resultados de la prueba Kruskall-Wallis para la medición y simulación B. ................... 43
Tabla 7. Resultados de la Prueba de Wilcoxon para muestras pareadas. ....................................... 44
Tabla 8. Área y material de las superficies del aula 402 E. ........................................................... 50
Tabla 9. Tiempo de reverberación T30 [s] y desviación estándar para el promedio. .................... 50
Lista de Figuras
Figura 1. Crosstalk. Las señales del altavoz YL y YR deberían representar a ZL y ZR. .............. 20
Figura 2. Principio del sistema OPSODIS. .................................................................................... 21
Figura 3. Patrón de radiación de sonido el OPSODIS (300 Hz a 20kHz). ..................................... 22
Figura 4. Radiación de sonido por pares de transductores de control con referencia a la direcciones
del receptor [24]. ........................................................................................................................... 23
Figura 5. Diagrama de la metodología del proyecto ...................................................................... 29
Figura 6. Foto de medición de ruido de fondo. .............................................................................. 30
Figura 7. Vista en planta de ubicaciones de fuente y receptor en el recinto. ................................. 31
Figura 8. Gráficas de EDT para el aula 402E. ............................................................................... 35
Figura 9. Gráficas de T30 para el aula 402E. ................................................................................. 36
Figura 10. Gráficas de IACC para el aula 402E. ............................................................................ 37
Figura 11: Gráficas de C80 para el aula 402E. .............................................................................. 38
Figura 12. Boxplot de puntuación vs grado de resolución, en medición A. .................................. 40
Figura 13. Boxplot de la puntuación vs grado de resolución, en simulación A ............................. 41
Figura 14. Puntuación mediana vs grados de resolución, medición B y simulación B ................. 42
Figura 15. Configuración para la medición de la respuesta al impulso binaural. .......................... 51
Figura 16. Foto de la medición A de las respuestas al impulso binaural. ...................................... 52
Figura 17. Foto de la medición B de la respuesta al impulso binaural. ......................................... 53
9
Resumen
Auralización es un método que permite crear sonidos que representan las características acústicas
de una sala, llevando al oyente a que produzca una sensación de inmersión en la misma. En este
proyecto, se busca comparar las auralizaciones dinámicas creadas mediante la medición de la
respuesta al impulso de la sala, y las creadas con el software de predicción acústico Catt-Acoustic;
ambas reproducidas en el sistema Optimal Source Distribution (OPSODIS). Como primer paso, se
midió la respuesta al impulso binaural en puntos discretos de una trayectoria semi-circular en el
aula 402E de la Universidad de San Buenaventura, seccional Medellín, sede San Benito.
Posteriormente, se obtuvieron las auralizaciones mediante la convolución de éstas con material
sonoro grabado de manera “semi-anecóica” en cada uno de los puntos medidos.
Luego se obtuvo el modelo en Catt-Acoustic, se calibró con respecto a las mediciones a través de
la comparación objetiva de los parámetros acústicos EDT, T30, C80 e IACC y se crearon las
auralizaciones simuladas. Estos archivos de audio fueron procesados en Matlab, en donde se
fragmentaron de acuerdo con diferentes resoluciones espaciales y se concatenaron de manera que
cada fragmento representara una posición en la trayectoria, para finalmente crear la sensación de
movimiento del receptor. Dichas auralizaciones dinámicas, fueron evaluadas mediante una prueba
de escucha crítica y los resultados mostraron que no existen diferencias significativas entre las
auralizaciones con diferentes resoluciones espaciales, es decir, no existen diferencias en la
sensación de continuidad en el movimiento para la sala y la trayectoria establecidas.
Palabras clave: Auralización, respuesta al impulso, OPSODIS.
10
Abstract
Auralization is a method that allows to create sounds that represent the acoustic characteristics of
specific a room, bringing the listener to a sensation of immersion. This project, seeks to compare
the dynamic auralization created by measuring the room impulse response, with those created by
means of the acoustical prediction software Catt-Acoustic, both of them reproduced in an
OPSODIS system. As a first step, binaural impulse response at discrete points in a semi-circle in
the classroom 402E of the University of San Buenaventura, Medellin, San Benito building, were
measured. Secondly, the auralizations were obtained by convolving these impulse responses with
audio material recorded in a "semi-anechoic" way for each of the measured points.
An Catt-Acoustic model was then obtained, it was calibrated regarding the measurements through
the objective comparison of the acoustic parameters EDT, T30, C80 and IACC. It was then
simulated and auralizations were created. These audio files were processed in Matlab, they were
fragmented by different spatial resolutions, and concatenated so that each fragment representing a
position on the path to create the sensation of movement of the receiver. These dynamics
auralizations were evaluated by a critical listening test and the results showed no significative
differences between auralizations with different spatial resolutions, i.e. there is no difference in the
sensation of continuity in the movement for the living and the path set.
Keywords: Auralization, Response Impulse, OPSODIS.
11
1. Introducción
1.1. Planteamiento del Problema
Los avances en la tecnología, permiten el desarrollo de nuevas herramientas que facilitan los
procesos ingenieriles en cuanto al diseño acústico de recintos y las auralizaciones son, uno de los
métodos novedosos en dicho tema. Esta es una técnica que permite crear escenarios acústicos
audibles de datos numéricos que pueden ser simulados, sintetizados o medidos y sus componentes
se obtienen mediante la simulación por medio de un ordenador. En otras palabras, es una
representación auditiva del espacio y el objetivo es sintetizar sonidos que produzcan en el oyente
una sensación de inmersión en la sala simulada [1].
Durante las últimas décadas, se han reportado varias formas de auralizaciones en tiempo real con
movimientos o rotación de la cabeza, pero con algunas limitaciones en los mismos, solo con
movimientos verticales y horizontales de la cabeza (azimut y elevación), pero existen pocas
referencias de investigaciones sobre auralizaciones dinámicas donde el receptor o la fuente se estén
desplazando por alguna trayectoria dentro del recinto [2].
A pesar de que el software Catt-Acoustic tiene dentro de sus módulos de predicción uno llamado
Catt-Walker, en el cual se pueden simular las auralizaciones dinámicas o con desplazamientos del
receptor dentro de la sala, no se pudo tener acceso a dicho modulo. En consecuencia, se planteó
una nueva configuración para lograr crear sensaciones de movimiento en los receptores para las
auralizaciones de la sala evaluada.
1.2. Justificación
Este proyecto, ofrece una metodología para obtener auralizaciones dinámicas, a partir de la
medición de las respuestas al impulso en puntos discretos sobre una trayectoria dentro de un
recinto, contribuyendo al desarrollo de futuras investigaciones, para las cuales no se tenga acceso
al software especializado para dicha temática.
También se cuenta con un sistema de reproducción de audio 3D, llamado OPSODIS, desarrollado
a partir de la teoría Optimal Source Distribution. Este es un sistema de dos vías que usa dos o tres
transductores por canal, la información de cada canal es divida en bandas de frecuencia y enviada
a los altavoces cuya separación se da de acuerdo al rango de frecuencias que reproducen. Así en
lugar de tener un sistema de altavoces que varíen su posición en función de la frecuencia, se crea
12
un sistema de altavoces con distancias fijas que dependen del rango de frecuencias que reproducen.
El sistema de reproducción OPSODIS presenta ventajas importantes con relación a otros sistemas
de reproducción binaural como cancelación del efecto crosstalk sin generar pérdidas y permitir
múltiples usuarios [3].
13
2. Objetivos
2.1. Objetivo General
Comparar las auralizaciones dinámicas en términos de continuidad en el movimiento, generadas a
partir de respuestas al impulso medidas y simuladas; y reproducidas en el sistema OPSODIS.
2.2. Objetivos Específicos
Medir las respuestas al impulso binaurales en diferentes puntos a lo largo de una trayectoria
semicircular en el aula 402E de la Universidad de San Buenaventura.
Simular la respuesta al impulso binaural de la sala, a través del software Catt-Acoustic,
aplicando la misma configuración usada en la medición.
Generar las auralizaciones en cada uno de los puntos medidos y simulados mediante la
convolución de las respuestas al impulso binaurales obtenidas con material sonoro “semi-
anecóico”.
Generar las auralizaciones dinámicas a través de la fragmentación y concatenación de las
auralizaciones realizadas en cada punto de la trayectoria.
Evaluar a través de una prueba de escucha crítica, la sensación de continuidad en la trayectoria,
de acuerdo con las resoluciones espaciales establecidas, para las auralizaciones medidas y
simuladas, reproducidas en el sistema OPSODIS.
14
3. Marco Teórico
En un recinto, con disposición de una fuente sonora, una persona recibe tanto los aportes del sonido
directo, como los aportes de la sala. A este fenómeno se le denomina comúnmente, la respuesta
impulsiva de la sala (RIR), que caracteriza acústicamente un entorno para posiciones específicas
de fuente – receptor. A partir de estas, es posible conseguir la mayoría de los parámetros acústicos
que caracterizan un recinto. Cuando este proceso es medido mediante un sistema binaural (cabeza
binaural), que es semejante a como realmente ocurre el fenómeno de la audición, se puede obtener
la Respuesta al Impulso Binaural (BRIR). Estas varían para cada ubicación de fuente-receptor y de
acuerdo con la geometría del espacio y materiales que lo componen, entre otros [4]. Los parámetros
acústicos pueden ser simulados virtual o físicamente a través de un proceso llamado auralización,
producto de la convolución de las BRIR con una señal de audio anecóico. Para este proyecto las
auralizaciones se evaluaron desde la sensación de movimiento en el receptor. A continuación, se
definen algunos conceptos relacionados con dicho proceso.
3.1. Parámetros Acústicos de la Sala
Uno de los parámetros acústicos más estudiados y utilizados para la valoración de recintos, es el
tiempo de reverberación, pero en la actualidad se ha aceptado que dicho parámetro a pesar de ser
muy útil, por sí solo es insuficiente para caracterizar un recinto. Aparecen entonces otros conceptos
como tiempo de decaimiento temprano (EDT), Claridad musical C80, definición de la voz D50,
IACC, entre otros, que se describen brevemente a continuación [5].
3.1.1. Tiempo de reverberación (RT)
Se define como el tiempo que transcurre desde que la fuente sonora se detiene, hasta que el nivel
de presión sonora cae 60 dB con respecto a su valor inicial. Este depende de la frecuencia. Cuando
se establece un único valor recomendado de TR para un recinto dado, se hace referencia al obtenido
de la media aritmética de los valores correspondientes a las bandas de 500 Hz y 1 kHz (𝑇𝑅𝑚𝑖𝑑).
En general, el valor más adecuado de TR, depende de la actividad destinada para el recinto y del
volumen de este. En la ecuación (1) se muestra la definición del 𝑇𝑅𝑚𝑖𝑑 [5].
𝑇𝑅𝑚𝑖𝑑 =𝑇𝑅(500 𝐻𝑧)+𝑇𝑅(1000𝐻𝑧)
2 [𝑠] (1)
15
3.1.2. Tiempo de decaimiento temprano (EDT por sus siglas en inglés)
Se define como el tiempo que transcurre desde que la fuente sonora deja de radiar, hasta que el
nivel de presión sonora decae 10dB. Al igual que el RT, el EDT varía en función de la frecuencia
[5]. El EDT está más relacionado con la impresión subjetiva de viveza que el RT utilizado
tradicionalmente, es decir, que en los puntos de la sala con un EDT significativamente menor que
el RT, la sala resultará, subjetivamente, más apagada de lo que se deduciría del valor TR [5].
3.1.3. Claridad musical (C80)
Este parámetro se utiliza para valorar el grado de separación que se puede apreciar entre los
diferentes sonidos de una composición musical y se define como el cociente entre la energía sonora
recibida durante los primeros 80 ms desde la llegada del sonido directo y la energía que llega
después de dicho tiempo. Esta se calcula en cada banda de frecuencia entre 125 Hz y 4kHz, como
muestra la ecuación (2) [5].
𝐶80 = 10 log∫ 𝑝2(𝑡)𝑑𝑡
0.080
∫ 𝑝2(𝑡)𝑑𝑡∞
0.08
[𝑑𝐵] (2)
3.1.4. Correlación cruzada interaural IACC
Se define como la correlación entre las respuestas al impulso calculadas en ambos oídos, e indica
el grado de similitud existente entre ambas señales. Para el caso en el que las dos señales son
iguales, el IACC valdrá 1, y en el caso en que las señales sean aleatorias independientes, el IACC
valdrá 0. Se definen dos IACC [5]:
IACCE (Early): Corresponde a los primeros 80 ms desde la llegada del sonido directo.
IACCL (Late): Calculado desde los 80 ms hasta 1s.
Las bandas de frecuencias más significativas son las de 500Hz, 1kHz y 2kHz. De esto surgen las
definiciones IACCE3 y IACCL3, que son las medias aritméticas de IACCE y IACCL en esas
bandas de frecuencia. Aunque no existe un valor óptimo para IACCE3, Beranek propone para la
sala vacía un valor aproximado de 0,70 [5].
3.2. Convolución
La convolución es un proceso matemático donde se operan dos funciones f y g, para dar como
resultado una tercera función que está dada por la magnitud de la superposición de f con una versión
16
invertida y trasladada de g. En el caso de los sistemas lineales invariantes en el tiempo, la
convolución permite conocer la respuesta del sistema ante cualquier entrada, partiendo del
conocimiento de la respuesta del sistema ante una única entrada en particular, es decir, el impulso.
Si la respuesta al impulso del sistema se define como h(t), la salida del sistema LTI, excitado con
una entrada cualquiera x(t), estará dada por la ecuación (3) [6].
𝑦(𝑡) = ∫ 𝑥(𝜏)ℎ(𝑡 − 𝜏)𝑑𝜏 = ∫ 𝑥(𝑡 − 𝜏)ℎ(𝜏)𝑑𝜏∞
−∞
∞
−∞ (3)
Siendo y (t), la convolución entre las funciones x (t) y h (t).
3.3. Respuesta al Impulso de la Sala (RIR)
La respuesta al impulso es la señal resultante al aplicar una función delta o impulso unitario a un
sistema en particular. Es así como se puede saber el comportamiento del sistema al aplicarle
cualquier señal de impulso. Para el caso específico de la acústica, la respuesta al impulso muestra
cómo responde un recinto al aplicarle una señal de muy corta duración y con un nivel alto de
intensidad como, por ejemplo, explotar un globo o el sonido de un disparo [7].
3.4. Respuesta al Impulso Binaural en la Sala (BRIR)
El fenómeno de la audición es un proceso binaural, es decir, que las señales de audio que llegan a
los tímpanos de ambos oídos, llevan información que el ser humano utiliza, entre otras, para la
localización de una fuente sonora en el espacio. Cuando se obtiene la respuesta impulsiva de la sala
(RIR), ésta caracteriza una posición de la sala para una localización especifica de la fuente,
adicionalmente, la RIR se caracteriza para un sonido y un receptor concreto, obteniendo lo que se
conoce como Respuesta Impulsiva Binaural o Binaural Room Impulse Response (BRIR). La BRIR
introduce las características del receptor a la RIR mediante la aplicación de Funciones de
Transferencia Relacionadas con la Cabeza, las cuales modelan el efecto causado por el pabellón
auricular, las reflexiones sobre la cabeza y el torso [4, 8].
Conceptualmente, la respuesta al impulso binaural de una sala puede dividirse en tres partes: el
sonido directo, las primeras reflexiones y la cola de reverberación. Los tiempos de llegada al
receptor y las propiedades de estas, estarán influenciadas por la geometría de la sala, las posiciones
de la fuente y el receptor, las características direccionales y las propiedades de los objetos
reflectantes [9].
17
Además, las diferentes partes de una BRIR transportan información adicional sobre la calidad
acústica del mismo, determinando una serie de sensaciones psicoacústicas tales como la impresión
espacial, envolvencia, entre otras [8].
3.5. Función de Transferencia Relacionada con la Cabeza y Respuesta al Impulso
Relacionada con la Cabeza (HRTF, HRIR)
Anteriormente se creía que las relaciones entre las Diferencias Interaurales de Tiempo (ITD), las
Diferencias Interaurales de Intensidad (IID) y la localización espacial eran predecibles, sin
embargo, los científicos encontraron problemas para relacionar la percepción espacial de los
sonidos con su variación en el contenido espectral mediante expresiones matemáticas. El primer
paso para la comprensión de los cambios de contenido espectral con la escucha directiva, fue la
realización de modelos físicos, medidas, experimentos empíricos y simulaciones computacionales
para la obtención de la variación del contenido espectral dependiente de la dirección obtenida
directamente de las orejas físicas de una persona. A estas medidas se les denominó Head Related
Transfer Functions (HRTF) y definen el filtrado acústico dependiente de la dirección producida
por la cabeza y el torso sobre un sonido emitido en campo libre [10].
Explícitamente, las HRTF se definen como la respuesta en frecuencia en campo lejano de un oído,
ya sea el izquierdo o derecho, específico de cada individuo, medido desde un punto del campo libre
a un punto del oído de la persona, normalmente para un radio fijado de distancia desde la cabeza
del oyente. Estas medidas se hacen para diferentes variaciones del punto de emisión en grados o
radianes, del plano frontal o la elevación, y del plano horizontal o de azimut. Lo que quiere decir,
que la HRTF es una función de cuatro variables, tres coordenadas espaciales y la frecuencia. Como
la mayoría de las medidas de la HRTF se hacen en campo lejano, no se tiene en cuenta la distancia
entre la cabeza y la fuente, lo que reduce la HRTF a una función de la frecuencia, la elevación y el
azimut. Mediante la Transformada de Fourier Inversa se consigue la expresión análoga en el
dominio del tiempo llamada Head Related Impulse Response (HRIR) [10].
Las HRIR se definen como filtros de Respuesta al Impulso Finita o FIR y suman la información de
los sistemas de IID e ITD de tal forma que los retardos de tiempo, o la información de ITD, son
codificados en el espectro en la fase del filtro y la información de las diferencias de niveles, es
codificada en el módulo en función de la frecuencia del filtro [10].
18
3.6. Diferencias Interaurales de Tiempo (IDT) y de Intensidad (IID)
Estas se producen a partir de las diferentes distancias que las ondas sonoras recorren para llegar a
cada uno de los oídos y, por ende, de las diferentes atenuaciones que sufren durante la trayectoria,
incluyendo la sombra acústica generada por la cabeza y los retrasos entre las señales captadas por
cada uno de los oídos [10].
En frecuencias altas, mayores a 1000 Hz, la longitud de onda es menor a la mitad del radio de la
cabeza, lo que convierte a ésta, en un obstáculo para las frecuencias altas. En consecuencia, se ha
demostrado que la cabeza humana se comporta como un filtro acústico pasa bajo [7]. Por esta
razón, la localización para este grupo de frecuencias, se debe fundamentalmente a la intensidad con
la que llega la onda sonora a cada oído; mientras que, para las bajas frecuencias, menores a 800
Hz, la localización es debida a la diferencia de fases o tiempo de retardos en ambos oídos, debido
a la orientación de la cabeza y la longitud de onda de los sonidos captados. Para la localización de
las frecuencias medias, el ser humano utiliza tanto fase como nivel de intensidad, es decir que
utiliza ambas de forma simultánea y combinada [10].
3.7. Distancia crítica
En un campo acústico, hay una distancia para la cual el nivel de presión sonora es igual tanto para
la energía del sonido directo como para el reflejado. A esta distancia se le llama distancia crítica y
se calcula mediante la ecuación (4) [26]
𝑟 = 0.14√𝐾. 𝑄 (4)
Donde:
𝑟 es la distancia crítica, en m.
𝐾es la constante del local, en m2
𝑄es el factor de directividad.
La constante de un local, K mide la capacidad de un recinto para la absorción del sonido, y se
calcula como lo muestra la ecuación (5).
𝐾 = 𝑎𝑚 ∗ 𝑆1 − 𝑎𝑚 (5)
Donde 𝛼𝑚 es el coeficiente de absorción, que se calcula de acuerdo con la ecuación (6).
19
𝛼𝑚 =𝑠1.𝛼1 + 𝑠2.𝛼2 +⋯+𝑠𝑛.𝛼𝑛
𝑠1+𝑠2+⋯+𝑠𝑛 (6)
Donde S es la superficie en m2.
El factor de directividad se define como la relación existente entre la presión sonora cuadrática
media existente a una distancia dada y en una dirección determinada, y la presión sonora cuadrática
media en el mismo punto, pero considerando la onda esférica [26].
Si la fuente sonora está suspendida en el espacio abierto, sin reflexiones, radiará su energía en todas
las direcciones. Así, su directividad esférica es total y Q=1. Si está en el suelo, todo el ruido se
radiará a través de una semiesfera (sin considerar la energía absorbida por el suelo, con lo que la
densidad de energía acústica será del doble, y Q=2. Igualmente, si la fuente sonora está contra una
pared, Q=4, y si está en una esquina será Q=8.
3.8. Auralización
La auralización es la técnica mediante la cual se obtiene un archivo de audio a partir de datos
numéricos que pueden ser sintetizados, medidos o simulados [1]. Es el proceso mediante el cual se
simula la sensación de escucha tridimensional del sonido en el interior de una sala, para una
posición dada del oyente y de las posibles fuentes y para unas determinadas señales. Las etapas de
este proceso se describen a continuación y son: Generación, transmisión y reproducción [4].
3.8.1. Generación:
Las señales de entrada para este proceso o generación del sonido, son señales específicas, como
una voz humana, instrumentos musicales o una máquina que genera ruido. Estas, deben estar libres
de reverberación y de otras señales generadas por la transmisión sonora en la sala. Generalmente,
se obtienen grabando la fuente en una cámara anecóica o bien, en un espacio acondicionado donde
la absorción sea muy alta [1].
3.8.2. Transmisión:
Después de que se tienen las señales anecóicas, producto de la primera etapa del proceso, se deberá
medir y/o modelar las respuestas al impulso de la sala, para obtener una señal de salida resultante
(auralización) calculada mediante un proceso llamado convolución. Generalmente, los modelos
20
computacionales utilizados para la simulación de la trasmisión sonora, son basados en la acústica
geométrica [1].
La acústica geométrica Se entiende como el método en donde la energía propagada desde la fuente
sonora hasta la superficie más cercana del recinto ocurre en línea recta, la cual va a ser reflejada
nuevamente en otra dirección siguiendo la ley de Snell, y así sucesivamente hasta reducir su
intensidad. Esta es la base para los diferentes métodos de predicción acústica utilizados en la
actualidad tales como el de trazado de rayos y el de fuentes imagen [1].
En la trasmisión sonora de los modelos geométricos, las respuestas al impulso obtenidas en la
simulación, son procesadas con una HRTF, la cual permite tener en cuenta las diferencias en la
presión sonora producto de las difracciones que se generan por la cabeza y el torso de una persona
[1].
3.8.3. Reproducción
En la reproducción de las auralizaciones, generalmente se utilizan transductores de salida como los
auriculares, pero también existen otros sistemas de reproducción binaural como los altavoces. Estos
deben actuar como “auriculares virtuales”, es decir, las señales binaurales obtenidas, por ejemplo,
con grabaciones con la cabeza binaural, deben alimentar las dos orejas del oyente, por lo tanto, una
configuración estéreo debería funcionar bien. Sin embargo, esto no ocurre debido al efecto de la
diafonía, en el cual hay una interferencia de las señales independientes que deberían llegar a cada
oído, como se muestra en la Figura 1 [1].
Figura 1. Crosstalk. Las señales del altavoz YL y YR deberían representar a ZL y ZR.
La interferencia ocurre sobre las trayectorias HLR y HRL. Adaptado de [1].
Esta situación puede arreglarse con un proceso al que se le conoce como inversión del sistema o
cancelación de la diafonía. No obstante, en este proceso las señales de audio de los altavoces se
21
anulan entre sí. La pérdida de rango dinámico y la calidad es típicamente alrededor de 30 dB, por
lo tanto, la relación señal a ruido de las señales en las orejas se convierte en baja. Puesto que los
altavoces están produciendo un sonido mucho más potente de lo habitual para producir el nivel de
sonido necesario en los oídos, la distorsión no lineal se vuelve más importante y es a menudo
audible [25].
Para superar estos inconvenientes, Takeuchi y Nelson [24] presentaron un sistema de reproducción
en el cual dos transductores cambian su amplitud angular de acuerdo con la frecuencia, como se
muestra en la Figura 2, el cual llamaron OPSODIS (Sistema de Distribución de Fuentes Óptimo).
Éste modifica el procesamiento de la señal de cancelacion de crosstalk, haciendo que la
interferencia sea constructiva en vez de destructiva y de esta manera, evitar pérdidas en el rango
dinámico, lo que indica ventajas en cuanto a calidad comparado con otros sistemas. Además, las
reflexiones del ambiente se reducen, ya que la radiación del sistema en direcciones diferentes a las
del receptor es mínima [24].
Figura 2. Principio del sistema OPSODIS.
La Figura 3, muestra que la radiación de sonido por los transductores del OPSODIS en todas las
direcciones es siempre menor que los que están en las direcciones del receptor. El patrón de
radiación se vuelve constante en frecuencia y se repite periódicamente en el espacio de escucha.
Por lo tanto, múltiples oyentes también pueden percibir señales binaurales casi correctas. Los filtros
inversos tienen una respuesta de frecuencia plana para que no haya coloración en cualquier
ubicación en la sala de escucha. Cuando el oyente está muy lejos de la posición de escucha prevista,
la información espacial percibida puede no ser ideal. Sin embargo, el espectro de las señales de
sonido no se cambia por los filtros inversos. Por lo tanto, el oyente puede percibir todavía la
producción natural de sonido [25].
22
Figura 3. Patrón de radiación de sonido el OPSODIS (300 Hz a 20kHz).
Adaptado de [25].
Sin embargo, se debe considerar que los reflejos de los objetos en el lugar de reproducción, como
paredes, pisos y techos, afectan el rendimiento del sistema. Estos efectos se han estudiado con
modelos de fuente de imagen y experimentos subjetivos. Los aspectos de percepción de la
localización del sonido, sugieren que el rendimiento de este tipo de sistema se mantendrá en cierta
medida, pero el sonido reflejado con un nivel mucho mayor que el sonido que llega directamente
a los oidos del oyente, destruye la percepción correcta. Sin embargo, el nivel relativo de la radiacion
de sonido en distintas direcciones hacia los oidos del oyente, es una muy buena medida de la
resistencia del sistema a las reflexiones [24].
23
Figura 4. Radiación de sonido por pares de transductores de control con referencia a la direcciones del receptor [24].
No obstante, para algunas frecuencias la radiación del sonido en direcciones diferentes a las del
receptor puede ser significativamente mayor, tipicamente entre +30 dB y -40dB, que los de las
direcciones del receptor (0dB y -∞dB) como se muestra en la Figura 4. Cuando se trabaja en
ambientes no anecóicos, da lugar a reflexiones graves y el rendimiento de control del sistema se
deteriora. Además, el sonido radiado en direcciones distintas de la de receptor tiene una respuesta
de frecuencia con picos debido a la respuesta de matriz inversa y normalmente resultará en una
coloración severa del sonido [24].
3.9. Conceptos Estadísticos
La palabra estadística hace referencia a un método usado en la recolección, organización, análisis
y descripción numérica de la información. En otras palabras, la estadística estudia el
comportamiento de hechos o fenómenos de grupos [11].
24
3.9.1. Estadística descriptiva e inferencia estadística
La estadística descriptiva se encarga de describir las características de los sujetos que hacen parte
del estudio para presentar la información de forma organizada y resumida, por ejemplo, qué
proporción de niños y niñas hay en un colegio, sus edades, etc. y la inferencia estadística trata de
verificar hipótesis a partir de los datos de la muestra para poder ser generalizados a la población.
Dicha generalización está directamente relacionada con la selección de la muestra y su tamaño
[12].
3.9.2. Pruebas paramétricas y no paramétricas.
Las pruebas paramétricas se utilizan con variables cuantitativas y con una muestra suficiente de
sujetos, por lo menos 30 casos por grupo. Estos requisitos son necesarios para obtener una
distribución normal. Las pruebas no paramétricas se utilizan con variables dependientes
cualitativas, o cuando se cuenta con variables cuantitativas pero no se alcanza el tamaño de la
muestra recomendado [12].
Para poder emplear el tipo de prueba paramétrica, las variables deben cumplir una serie de
supuestos [12]:
Variables cuantitativas: que sean medidas en escalas de intervalo o razón. Para algunos casos,
las variables cuantitativas ordinales pueden considerarse cuantitativas si cumplen con el
supuesto de normalidad.
Normalidad de las puntuaciones: las variables en estudio deben tener una distribución normal.
Este supuesto se puede comprobar a través de la prueba Kolmorogov – Smirnov, siempre y
cuando se cuente con variables cuantitativas y un tamaño de muestra suficiente.
Independencia de las observaciones: En la recogida de la información, las respuestas de una
persona en un test, no debe depender de las respuestas de otra persona.
3.9.3. Población y muestra
La población, llamada también universo o colectivo, es el conjunto de todos los elementos que
tienen una característica común. Puede ser finita o infinita, la primera se da cuando está delimitada
y se conoce el número que la integran; la segunda se da cuando ocurre lo contrario. La muestra es
25
un subconjunto de la población y es representativa cuando todos y cada uno de los elementos de la
población tienen la misma oportunidad de ser tomados en cuenta para formar dicha muestra [13].
3.9.4. Medidas de posición y de tendencia central
Estas medidas, denominadas también como promedios, permiten determinar la posición de un valor
respecto a un conjunto de datos, el cual se considera como típico representativo para el total de las
observaciones [11].
Media aritmética, mediana y moda. La media, es el promedio aritmético de las observaciones,
es decir, el cociente entre la suma de todos los datos y el número de ellos; la mediana es el valor
que separa por la mitad las observaciones ordenadas de mayor a menor de tal forma que el 50% de
estas, son menores que la mediana y el otro 50% son mayores. Se tiene en cuenta que el número
de datos es impar, la mediana será el valor central y si es par, se toma como mediana, la media
aritmética de los dos valores centrales. Por otro lado, y la moda se define como el valor de la
variable que más se repite o el valor que presenta la máxima frecuencia [13].
Medidas de dispersión. Las medidas de dispersión son indicadas cuando se quiere evaluar dos o
más promedios. Con estas medidas, es posible determinar si hay concentración de datos alrededor
de un promedio, lo cual indicará una buena aplicación, o si por el contrario una gran dispersión,
estaría indicando poca representatividad [11].
Varianza y desviación típica o estándar. Se define como la media aritmética de los cuadrados de
las diferencias (o desviaciones) entre los valores que toma la variable y su media aritmética y su
símbolo es s2. Por otro lado, la desviación típica es la raíz cuadrada de la varianza, considerada
siempre con signo positivo y se representa con s [11]. En las ecuaciones (8) y (9), se muestran estos
conceptos:
𝑠2 =∑ 𝑥𝑖
2
𝑛− 𝑥2 (8)
𝑠 = √𝑠2 (9)
26
Coeficiente de variación. Conocido también como variación relativa. Esta compara la variabilidad
de dos series de datos. En ocasiones ocurre que ambas series están expresadas en diferentes
unidades de medidas, por lo que no se podrán comparar sus varianzas o desviaciones típicas; o
también puede darse el caso que, a pesar de tener la misma unidad de medida, nos interesa
determinar la variación respecto a una base. Para estos casos, se usa el coeficiente de variación y
se define con la ecuación (10) [11]:
𝐶𝑉 = 𝑑 = 𝑠
𝑥× 100 (10)
Coeficiente de asimetría. Mide el grado de asimetría de la distribución con respecto a la media.
Si el valor de este indicador es positivo, significa que la distribución se encuentra sesgada hacia la
izquierda y un resultado negativo, quiere decir que la distribución esta sesgada a la derecha [11].
3.9.5. Formulación de hipótesis estadísticas
El análisis estadístico inferencial, se lleva a cabo para probar algún tipo de hipótesis, por ejemplo,
probar la relación entre variables y en todos los casos es necesario formular una hipótesis que se
confirmará o no, en función de los resultados de los análisis. Una hipótesis estadística es una
afirmación sobre las características de una distribución de probabilidad y surge de la hipótesis de
investigación formulada. Éstas son siempre dos: la hipótesis nula y la alternativa. La primera, es
siempre la que se somete a contraste, cuando se comparan los resultados de dos o más grupos, o de
negación, cuando se trata de correlación, es decir, que no hay correlación entre variables [12].
3.9.6. Nivel de significación
Cada estadístico estimado en un contraste de hipótesis, siempre se acompaña de su probabilidad de
ocurrencia de la hipótesis nula (p-valor). Esta probabilidad asociada al estadístico, indica el número
de ocasiones que se cumplirá la hipótesis nula. Ese valor se debe comparar con un valor de
probabilidad, que establece el límite para considerar que una hipótesis se cumple. Ese valor de
comparación es el nivel de significación o nivel de error que se espera cometer, y este lo da el
investigador basándose en las consecuencias prácticas y su situación específica[12].
27
4. Estado del Arte
Para hablar de simulaciones acústicas, escucha espacial, audio 3D o sonido holofónico, es necesario
conocer el concepto de auralización, que como ya se dijo, se refiere a una representación auditiva
del espacio. En el estudio de las auralizaciones, se requieren conocimientos sobre física acústica,
procesamiento digital de señales, psicoacústica y acústica de recintos [16].
En las primeras investigaciones en cuanto a auralizaciones, se buscaba una representación
totalmente fiel de la realidad en un entorno virtual, lo que conllevaba a invertir un alto costo
computacional. En la actualidad, las investigaciones se han centrado en el desarrollo de ambientes
plausibles, donde lo que se quiere es conseguir una percepción semejante, más que lograr una
autentica representación de las características físicas-acústicas del ambiente real [16].
Para la obtención de las respuestas al impulso, el estándar ISO 3382-2 incluye varias señales para
excitar la sala acústicamente. En la evaluación de las características acústicas de un recinto,
tradicionalmente se ha utilizado como señal de excitación, ráfagas de ruido filtrados por bandas y
disparos de pistola, lo que generaba bajos niveles en relación señal a ruido debido a que la
intensidad de la señal se concentra en un periodo de tiempo corto. La solución a este inconveniente
es la utilización de técnicas indirectas que utilizan señales continuas y post-procesamiento digital
de señales, como las Series binarias de Máxima Longitud (MLS) y los Barridos de Frecuencia. De
acuerdo con S. Ferreyra y O. Ramos 2008 [8] que estudiaron la obtención de las BRIRs,
concluyeron en su investigación, que cualquier tipo de señal continua de excitación (MLS o barrido
de frecuencia), con el objeto de obtener la BRIR, deberá exceder en duración el valor del T60
estimado.
Por otra parte, M. Jeub, M. Schafer, y P. Vary [17] describen una nueva base de datos de respuestas
impulsivas binaurales de un recinto, la cual denominaron Impulse Response Aachen (AIR). El
objetivo principal es la evaluación de algoritmos de mejora del habla y algoritmos de reverberación
para señales de voz y de audio en particular. Las mediciones se realizaron con un maniquí o cabeza
binaural en diferentes ambientes acústicos (una sala de oficina, sala de reuniones y sala de
conferencias). Se ha demostrado que las mediciones binaurales son esenciales para la evaluación
de algoritmos de reverberación binaural debido a los efectos de sombreado de una cabeza humana.
La explotación de estos efectos puede causar mejoras audibles. Este estudio concluyó, que las
respuestas al impulso binaurales de una sala, dan resultados más fiables cuando se desarrollan para
28
auralizaciones que son reproducidas en sistemas con técnicas binaurales como los audífonos, el
sistema OPSODIS, etc.
Como se mencionó ya, la aplicación de métodos numéricos en acústica, ha permitido la predicción
de los parámetros acústicos que miden la calidad de una sala, mediante el estudio de la respuesta
al impulso. J. Segura, L. Vera y compañía [18], en un proyecto de investigación, realizaron
diferentes auralizaciones binaurales en un recinto de múltiple uso ubicado en el Paraninfo de la
Universidad Politécnica de Valencia, y se estudiaron diferentes parámetros de calidad sonora para
analizar la respuesta sonora de la auralización en el recinto. En este experimento se calcularon
cuatro parámetros psicoacústicos (intensidad sonora o volumen, nitidez o agudeza, rugosidad de la
señal y la tonalidad). Las fuentes utilizadas para tal fin, son el habla y la música. Con estos
parámetros mencionados, se ha permitido comprobar que, para el caso del habla, hay un patrón
constante en los resultados psicoacústicos, mientras que para la música hay una variación de estos,
efecto que le atribuyen al volumen de la sala.
En una investigación hecha por Crawford-Emery y H. Lee en Reino Unido sobre las longitudes de
las Respuestas al Impulso Binaural de recintos, que fueron convolucionados con señales de audio
estereofónico, se realizaron pruebas de escucha para evaluar cómo la longitud de las BRIRs afectan
el efecto de auralización percibida y la coloración tonal del audio. Los resultados mostraron
correlaciones estadísticamente significativas entre la longitud de las BRIRs y estos dos parámetros
mencionados. El objetivo general de esta investigación, fue contribuir a la producción de un efecto
más eficaz y agradable en las auralizaciones. Como trabajo futuro basado en esta investigación,
sería la producción de modelos BRIR artificiales de 20 ms a 40 ms de longitud. Con ellos se podrá
experimentar con variables como la fase, la amplitud, el tiempo y como afectan estas las
auralizaciones [19].
Con respecto a la sensación de continuidad en el movimiento, se ha demostrado que generalmente,
la gente adulta es capaz de diferenciar entre dos fuentes sonoras separadas por 1° y 2° en el
hemisferio frontal. Con esta resolución espacial se puede generar una percepción suave cuando se
cambia de una HRIR a otra conforme al movimiento de la cabeza del oyente y al momento de
reproducir un sonido continuo y realizar un cambio de las HRIRs, no se escucharán clics audibles
[20].
29
5. Metodología
Para el desarrollo de los objetivos de este proyecto, se planteó la metodología mostrada en la Figura
5. La sala escogida para recrear las auralizaciones dinámicas, es el salón 402E de la Universidad
de San Buenaventura, Medellín, ya que en estos existen referencias de mediciones realizadas en
otros proyectos de investigación [21].
Figura 5. Diagrama de la metodología del proyecto
5.1. Medición del Tiempo de Reverberación y Ruido de Fondo
El tiempo de reverberación T30, se obtuvo de acuerdo con el estándar ISO 3382-2 con el método
de la respuesta impulsiva. Se midió el tiempo de reverberación para tres posiciones de micrófono
y una de fuente, con un micrófono de medición tipo 1, fuente omnidireccional, una interfaz de
audio y un computador portátil. Como señal de excitación se utilizó un barrido de frecuencias (sine
sweep) de 22 a 20000 Hz, el cual se generó con el software Adobe Audition. La respuesta al
impulso se obtuvo mediante el pluguin Aurora en el mismo software. En el anexo A, se muestra el
informe detallado para dicha medición. La medición del ruido de fondo, se hizo para tres posiciones
30
de micrófono durante 10 minutos cada una, para un LAeq = 50.5 dB. La figura 6 muestra la foto de
la medición de ruido de fondo.
Figura 6. Foto de medición de ruido de fondo.
5.2. Medición de las Respuestas al Impulso Binaurales del Recinto
Para medir las respuestas al impulso binaural, se siguió el procedimiento estipulado en el estándar
ISO 3382-2, con el salón completamente vacío, pero teniendo en cuenta que se tomó solo una
posición de fuente, ubicada en el centro del recinto y 91 posiciones de micrófonos, (cabeza
binaural), primero con dirección a la parte delantera de la sala en todos los puntos (Medición A), y
luego con la cabeza binaural mirando hacia la parte posterior de la sala en todos los puntos
31
(Medición B), los cuales estaban distribuidos sobre una trayectoria semi circular con un
espaciamiento de 2° entre los puntos, como se muestra en la Figura 7. Se utilizó también una fuente
direccional, y como señal de excitación, un barrido de frecuencias (sweep) de 22 a 20000 Hz. La
directividad de dicho parlante se tomó de Henriquez y Londoño [21]. En el anexo B se muestran
los detalles de esta medición.
Figura 7. Vista en planta de ubicaciones de fuente y receptor en el recinto.
5.3. Simulación de Respuestas al Impulso y Comparación de los Parámetros Objetivos
Se modeló el recinto en Catt-Acoustic, se tomaron en cuenta los coeficientes de absorción de los
materiales presentes en la sala 402E, los cuales se muestran en la Tabla 1, las posiciones de la
fuente y micrófonos, y a través del módulo prediction del software, se obtuvieron las respuestas al
impulso en cada uno de los puntos de la trayectoria. Se utilizó la directividad de la fuente JBL EON
15G2, medida previamente por Henríquez y Londoño [21].
32
Tabla 1. Coeficientes de absorción de materiales, librería del software Catt-Acoustic.
Superficie Área
Frecuencias Por Bandas de Octava (Hz)
125 250 500 1000 2000 4000
Coeficiente de Absorción Material Referencia
Piso 65,80 0,02 0,02 0,02 0,03 0,03 0,03 Baldosa Karlen
Puertas 2,00 0,20 0,25 0,20 0,17 0,20 0,10 Madera Petersen
Ventanas 10,40 0,30 0,30 0,25 0,15 0,15 0,02 Vidrio Lawrence
Tablero 6,00 0,30 0,20 0,15 0,13 0,10 0,08 Acrílico Lawrence
(Hardboard)
Paredes 74,90 0,01 0,01 0,01 0,02 0,02 0,02 Hormigón Petersen
Techo 110,30 0,01 0,01 0,01 0,02 0,02 0,02 Hormigón Petersen
Para la comparación objetiva de los parámetros acústicos de los modelos medido y simulado, se
midió la respuesta al impulso monoaural en tres posiciones de micrófono (0°, 90° y 180°) y una
posición de fuente, se utilizó un micrófono de medición, una fuente direccional, y como señal de
excitación, un barrido de frecuencias (sweep).
Una vez obtenidas las respuestas al impulso, se consiguieron los parámetros acústicos T30, C80,
IACC y EDT a través del pluguin Aurora, el cual calcula dichos parámetros de acuerdo con el
estándar ISO 3382 y a través de Catt-Acoustic para el modelo simulado y se compararon para
calibrar este último.
5.4. Creación de las Auralizaciones Dinámicas
Para obtener las auralizaciones, se aplicó el proceso de convolución entre cada una de las respuestas
al impulso medidas, con la señal de audio “semi-anecóica”, (bombardino) a través del Pluguin
Aurora. Este archivo de audio fue grabado previamente en el estudio A de la Universidad de San
Buenaventura, en un cubículo acondicionado con material absorberte, para lograr en lo posible,
una grabación sin efectos de reverberación. Las auralizaciones simuladas, se obtuvieron a través
del módulo Tuct de Catt-Acoustic.
Una vez se tuvieron las auralizaciones medidas y simuladas en los 91 puntos en la sala,
correspondientes a una trayectoria de 0° a 180° de un semicírculo, estas fueron procesadas en
MATLAB, en el cual fueron fragmentados de forma que dividiera la trayectoria con diferentes
ángulos de separación o resolución espacial: 2°, 6°, 12°, 18° y 30°. Seguidamente, a cada fracción
se le atribuyó una posición correspondiente en un vector desplazamiento y fueron concatenados,
para representar la orientación del oyente en un punto de la sala. En el anexo C se muestra el código
33
en MATLAB utilizado. El efecto Doppler no se tuvo en cuenta, por lo que cada medición se realizó
de manera independiente.
5.5. Descripción General de la Prueba Subjetiva
Con la prueba subjetiva, se evaluó la sensación de continuidad en el movimiento del receptor a
diferentes resoluciones espaciales en las auralizaciones creadas en Catt-Acoustic a partir de la
secuencia de puntos discretos, reproducidas en el sistema OPSODIS.
Para esta prueba, el encuestado evaluó la sensación de cambio continuo para audios con diferentes
resoluciones espaciales entre puntos: 2°, 6°, 12°, 18° y 30° de separación y se reprodujeron
aleatoriamente. Se utilizó también una ayuda visual con el recorrido realizado por el receptor en la
sala, para lograr una mejor identificación de la localización; y unos paneles acústicos para
contrarrestar, según Takeuchi y Nelson [24], las posibles reflexiones que se podrían presentar en
ambientes no anecóicos, como es el caso, y evitar así falencias en la percepción correcta del sonido.
Se utilizó el método diferencial semántico para la elaboración del test. Este consiste en la
utilización de una escala, que en este caso fue de 1 a 4, donde 1 es la puntuación mínima y
representa la idea más pobre, y 4 es la puntuación máxima y representa el ideal de reproducción
más parecido con respecto al audio de referencia [22].
5.5.1. Selección de la población y determinación del tamaño de la muestra.
Para este caso, en la prueba de escucha crítica se escogió una población (N) de 80, pertenecientes
al número de estudiantes de séptimo, octavo, noveno y décimo semestre de ingeniería de sonido
para el periodo 2015-1. Se escogió esta población debido a que éstos presentan algún tipo de
experiencia en la temática expuesta en este proyecto y en entrenamiento auditivo. Para determinar
el número de la muestra, se eligió un nivel de confianza (Z) del 95%, que es la desviación del valor
medio que se acepta para lograr el nivel de confianza deseado, en este caso Z=1,96 según la
distribución normal; el margen de error máximo admitido (e), fue del 5% y una proporción (p) del
50%, que es el valor usado típicamente. Así, el tamaño de la muestra (n), está dado por la ecuación
(7). [14]:
𝑛 =𝑁𝑍2𝑝(1−𝑝)
(𝑁−1)𝑒2+𝑍2𝑝(1−𝑝) (7)
34
Lo que da como resultado, una muestra de 66 personas. No obstante, debido a la falta de tiempo,
disponibilidad de estudiantes y espacios, se recogió una muestra de 50 personas.
35
6. Resultados
6.1. Comparación Objetiva
A continuación, se muestran los resultados de la comparación objetiva del recinto medido y
simulado, así como los de la prueba de escucha crítica. El modelo se ajustó en términos del T30
medido en la sala. En las figuras 8 a 11, se muestran las gráficas de dichas comparaciones. En las
gráficas del T30, se observa que el tiempo de reverberación más alto fue de 4 segundos
aproximadamente en la banda de 250 Hz para las posiciones de 0°, 90° y 180° tanto en la medición
como en la simulación; y en la banda de 4kHz, disminuyó por debajo de los 3 segundos para las
mismas posiciones.
Figura 8. Gráficas de EDT para el aula 402E.
A) Posición 0°, B) Posición 90°, C) Posición 180°.
36
Figura 9. Gráficas de T30 para el aula 402E.
A) Posición 0°, B) Posición 90°, C) Posición 180°.
37
Figura 10. Gráficas de IACC para el aula 402E.
A) Posición 0°, B) Posición 90°, C) Posición 180°.
38
Figura 11: Gráficas de C80 para el aula 402E.
A) Posición 0°, B) Posición 90°, C) Posición 180°.
6.2. Prueba de escucha crítica
La prueba de escucha crítica se realizó para 50 estudiantes de los últimos semestres de ingeniería
de sonido de la Universidad de San Buenaventura Medellín, (7° a 10° semestre). Se les solicitó
evaluar la sensación de continuidad en el movimiento de una fuente en una trayectoria semicircular
de 180°. Los encuestados escucharon 20 audios, correspondientes a auralizaciones dinámicas con
diferentes resoluciones espaciales, tanto para la configuración A, como para la configuración B y
evaluaron en una escala de 1 a 4 donde:
1.- Ninguna sensación de continuidad
2: Poca sensación de continuidad
3: Moderada sensación de continuidad
4: Mucha sensación de continuidad
En el anexo D, se puede encontrar el formato completo utilizado para realizar esta encuesta.
39
6.2.1. Coeficientes de asimetría y de variación
Se analizaron los resultados en términos de los coeficientes de asimetría y de variación.
Tabla 2. Coeficiente de asimetría para resoluciones espaciales en configuraciones A y B.
Resol. Espacial Med. A Sim. A Med. B Sim. B
2° -0,16 -0,18 -0,21 0,00
6° -0,33 -0,23 -0,18 0,06
12° -0,22 -0,54 -0,12 -0,12
18° 0,00 0,06 -0,20 0,38
30° 0,12 0,00 -0,06 0,12
Tabla 3. Coeficiente de variación para resoluciones espaciales en configuraciones A y B.
Resol. Espacial Med. A Sim. A Med. B Sim. B
2° 39,18 41,75 37,60 42,95
6° 37,01 39,06 41,75 42,84
12° 37,90 33,07 41,84 34,31
18° 41,40 44,39 37,27 31,69
30° 44,83 42,52 41,88 45,33
6.3. Contraste No Paramétrico
Dado que no todas las muestras, de calificación de continuidad, provienen de una distribución
normal; se contrastará la diferencia entre muestras –tanto en las distribuidas normalmente como
las que no– a través de pruebas no paramétricas, las cuales no exigen los supuestos clásicos de
normalidad.
6.3.1. Contraste en Medición A
Los 50 encuestados calificaron los audios en una escala Likert de 1 a 4 –siendo 1 la calificación
subjetiva mínima y 4 la máxima–, comparando la continuidad de cada uno con la de un audio piloto
–el cual tiene una resolución espacial de 2°, correspondiente al de mayor continuidad–.
La Figura 12 evidencia la puntuación mediana según ángulo de resolución espacial además del
rango inter cuartílico de dicha puntuación.
40
Figura 12. Boxplot de puntuación vs grado de resolución, en medición A.
Ahora bien, se realizó una prueba ANOVA no paramétrica de Kruskall-Wallis para muestras
pareadas, (que compara medianas en vez de medias), para contrastar si existen diferencias
significativas entre calificaciones de acuerdo con cada ángulo de resolución y la calificación piloto
correspondiente al ángulo de dos grados sexagesimales.
Hipótesis estadística: A menor ángulo de resolución espacial, la sensación de continuidad en el
movimiento del receptor, es mejor percibida que en el resto de casos.
Hipótesis Nula (H0): No existen diferencias significativas en las medianas de la variable sensación
de continuidad del movimiento, entre auralizaciones medidas, simuladas y con diferentes
configuraciones en cuanto a la posición del receptor.
Hipótesis Alterna (HA): Sí existen diferencias significativas en las puntuaciones de la variable
sensación de continuidad en el movimiento entre auralizaciones medidas, simuladas y con
diferentes configuraciones en cuanto a la posición del receptor.
Prueba ANOVA
𝐻0: 𝑀𝑒𝑖 = 𝑀𝑒𝑗 ∀ 𝑖 ≠ 𝑗 𝑖, 𝑗 = 2°, 6°, 12°, 18°, 30°
𝐻𝐴: 𝑀𝑒𝑖 ≠ 𝑀𝑒𝑗 ∀ 𝑖 ≠ 𝑗
30181262
4.0
3.5
3.0
2.5
2.0
1.5
1.0
Ángulo
Cali
ficacio
n_M
A
Boxplot of Calificacion_MA
41
Se obtuvo el siguiente resultado (software SPSS®):
Tabla 4. Resultados de la prueba Kruskall-Wallis para la medición A.
Ángulo N Mean Rank
Medición A
2 25 152.10
6 50 134.99
12 50 110.27
18 50 96.85
30 50 90.34
Total 225
Valor p = 0.000
El valor-p del estadístico de prueba, sugiere que se rechaza la hipótesis nula en favor de la
alternativa con una confianza del 95%. Entonces se realizaron pruebas pareadas para saber si
existen diferencias significativas entre cada par de resoluciones espaciales.
6.3.2. Contraste en Simulación A
La Figura 13 representa la calificación mediana de percepción de continuidad en la simulación.
Los audios emulados tienden a ser menos precisos que los medidos, por ello las variaciones de las
puntuaciones son mayores en la simulación que en la medición, como se muestra en la Tabla 4.
Figura 13. Boxplot de la puntuación vs grado de resolución, en simulación A
Análogamente al experimento de medición, se contrastó un test no paramétrico de Kruskall-Wallis,
a fin de estimar si hay diferencias significativas entre puntuaciones en la simulación.
30181262
4.0
3.5
3.0
2.5
2.0
1.5
1.0
Ángulo
Cali
ficacio
n_S
A
Boxplot of Calificacion_SA
42
𝐻0: 𝑀𝑒𝑖 = 𝑀𝑒𝑗 ∀ 𝑖 ≠ 𝑗 𝑖, 𝑗 = 2°, 6°, 12°, 18°, 30°
𝐻𝐴: 𝑀𝑒𝑖 ≠ 𝑀𝑒𝑗 ∀ 𝑖 ≠ 𝑗
Se obtuvo el siguiente resultado (software SPSS®):
Tabla 5. Resultados de la prueba Kruskall-Wallis para la simulación A.
Ángulo N Mean Rank
Simulación A
2 25 136.58
6 50 138.20
12 50 117.77
18 50 91.87
30 50 92.37
Total 225
P-Value = 0.000
Con un 95% de confianza, se rechaza la hipótesis nula entre auralizaciones para la sensación de
continuidad en movimiento.
6.3.3. Contraste en Medición y Simulación B
En la Figura 14 se presenta las gráficas de puntuación de sensación de continuidad en la mediación
y simulación ‘B’; éstas difieren de sus homólogas ‘A’ en que la fuente de sonido está detrás del
receptor.
Figura 14. Puntuación mediana vs grados de resolución, medición B y simulación B
Se contrastó un test no paramétrico de Kruskall-Wallis a fin de estimar si hay diferencias
significativas entre las puntuaciones, tanto mediciones como simulaciones, de diferentes
auralizaciones.
30181262
4.0
3.5
3.0
2.5
2.0
1.5
1.0
Ángulo
Cali
ficacio
n_M
B
Boxplot of Calificacion_MB
30181262
4.0
3.5
3.0
2.5
2.0
1.5
1.0
Ángulo
Cali
ficacio
n_S
B
Boxplot of Calificacion_SB
43
𝐻0: 𝑀𝑒𝑖 = 𝑀𝑒𝑗 𝑖, 𝑗 = 2°, 6°, 12°, 18°, 30°
𝐻𝐴: 𝑀𝑒𝑖 ≠ 𝑀𝑒𝑗 ∀ 𝑖 ≠ 𝑗
Se obtuvieron los resultados mostrados en la tabla 6. (software SPSS®):
Tabla 6. Resultados de la prueba Kruskall-Wallis para la medición y simulación B.
Ángulo N Mean Rank
Medición B
2 25 130.92
6 50 123.71
12 50 105.96
18 50 110.03
30 50 103.34
Total 225
Valor-P: 0.088
Ángulo N Mean Rank
Simulación B
2 25 134.74
6 50 119.50
12 50 118.42
18 50 107.24
30 50 95.97
Total 225
Valor-P: 0.245
Tanto para los audios emulados como los medidos, existe suficiente evidencia para afirmar que las
puntuaciones medianas de sensación de continuidad son iguales entre diferentes grados de
resolución espacial, con un 95% de confianza.
6.3.4. Prueba de Wilcoxon para muestras pareadas
La prueba no paramétrica de Wilcoxon permite comparar muestras pareadas. De este modo la
mediana de la puntuación asignada, según cada ángulo, se contrasta contra la del ángulo de
referencia: dos grados sexagesimales.
Así, la hipótesis nula es que la mediana de cada puntuación (según ángulo) no difiere
significativamente de la puntuación mediana del ángulo de referencia (2°).
𝐻0: 𝑀𝑒2° = 𝑀𝑒𝑖 𝑖 = 2°, 6°, 12°, 18°, 30°
𝐻𝐴: 𝑀𝑒2° ≠ 𝑀𝑒𝑖
Así, se tiene un mejor contraste al comparar variable por variable. Los resultados de las pruebas
son (software STATA®):
44
Tabla 7. Resultados de la Prueba de Wilcoxon para muestras pareadas.
Experimento Contraste Valor-P Experimento Contraste Valor-P
Medición A
2° vs 6° 0.5694
Medición B
2° vs 6° 0.9412
2° vs 12° 0.7249 2° vs 12° 0.8390
2° vs 18° 0.2586 2° vs 18° 0.8972
2° vs 30° 0.1316 2° vs 30° 0.5127
Simulación A
2° vs 6° 0.7250
Simulación B
2° vs 6° 0.8949
2° vs 12° 0.1057 2° vs 12° 0.1668
2° vs 18° 0.4298 2° vs 18° 0.6497
2° vs 30° 0.3524 2° vs 30° 0.4624
Homólogamente, a la prueba ANOVA de Kruskall-Wallis la mayoría de las pruebas pareadas de
Wilcoxon resultaron en diferencias no significativas al 80% de confiabilidad, a excepción de 30°
en la medición A, 12° en la simulación A y 12° en la simulación B.
Por ello, hay suficiente evidencia estadística para concluir que las medianas de cada una de las
puntuaciones no difieren significativamente respecto a la mediana de la puntuación de referencias
(2 grados sexagesimales).
45
7. Discusión
7.1. Prueba Objetiva
Con el fin de ajustar el modelo simulado para que fuera similar al recinto medido, se obtuvieron
los parámetros acústicos EDT, C80, y T30, a través de las respuestas al impulso monoaurales y
además, el parámetro IACC, que se obtuvo de las respuestas al impulso binaurales, en ambos casos
para las posiciones 0°, 90° y 180°.
Los resultados de la simulación, muestran una respuesta similar a la sala en términos del tiempo de
reverberación, en frecuencias bajas con valores entre 3 y 4 segundos, cuando la mayoría de
estándares y recomendaciones especifican un máximo entre 0.4 y 0.8 segundos en las bandas de
500, 1k y 2k Hz o para el promedio aritmético en estas bandas (TRmedio) para las aulas de clase.
No obstante, sólo Bélgica, ASHA, el Reino unido, Australia, Nueva Zelanda y ANSI especifican
que este tiempo de reverberación es para salones desocupados [27]; y en frecuencias altas por
debajo de los 3 segundos como se muestra en la Figura 9. Para el caso del EDT simulado, los
resultados muestran una diferencia aproximadamente de 1 segundo (ver Figura 8), es decir, que
está ligeramente por debajo del tiempo de decaimiento temprano medido pero con tendencia similar
y en el caso del IACC y C80, existen mayores discrepancias (ver figuras 10 y 11). El parámetro
C80 da valores negativos, por lo que se puede inferir de acuerdo con la definición, que no es muy
representativo para evaluar la sala ya que ésta es demasiado viva de acuerdo con el tiempo de
reverberación. El IACC en las frecuencias bajas, tiende a 1 lo que indica que hay una mejor
correlación en estas frecuencias entre ambos oídos, contrario a lo que pasa en las frecuencias altas
que tiene un valor entre 0 y 0,2 aproximadamente en las posiciones 0° y 180° para medición y
simulación.
7.2. Prueba de escucha crítica
Después de obtener los resultados de la prueba de escucha crítica, se analizaron los coeficientes de
asimetría y variación para cada una de las resoluciones espaciales en las configuraciones A y B.
En general, el coeficiente de asimetría es muy cercano a 0, lo que indica que existe la misma
concentración de valores a la derecha y a la izquierda de la media. De igual manera, el coeficiente
de variación para los mismos datos, no supera el 50% lo que indica que hay una tendencia a que
exista homogeneidad en la variable.
46
Para verificar si esas diferencias entre las resoluciones espaciales medidas y simuladas son
estadísticamente significativas, debe observarse el valor de probabilidad asociado (p), es decir que
la hipótesis nula tiene mucha probabilidad de ocurrencia y por lo tanto no se rechaza. En
consecuencia, las diferencias entre las mediciones y simulaciones para la mayoría de las
resoluciones espaciales no son significativas. Esto quiere decir que las personas encuestadas no
percibieron diferencias en la sensación de continuidad para la trayectoria y el recinto establecido
de acuerdo con los resultados de la encuesta. Sin embargo, se debe considerar el hecho de que los
oyentes sí notaron movimiento del receptor en la sala evaluada, de lo que se infiere que el método
utilizado en este proyecto para realizar las auralizaciones dinámicas funciona.
47
8. Conclusiones
La sensación de continuidad en el movimiento del receptor en términos de la resolución espacial,
para una trayectoria semi circular de 180°, que para el caso fueron respuestas al impulso tomadas
cada 2° 6°, 12°, 18°, y 30°, no se percibe en la sala evaluada, de acuerdo con los resultados de la
prueba de escucha crítica, debido a que como se observa en la prueba objetiva, los parámetros
acústicos medidos y simulados son similares, sobre todo el en tiempo de reverberación T30, por lo
que los encuestados no notaron diferencias significativas en la continuidad del movimiento con
dichas resoluciones espaciales.
Además, el sistema de reproducción OPSODIS no está diseñado para que el receptor escuche
adecuadamente cuando la fuente se ubica detrás del receptor, esto podría explicar la dificultad de
los encuestados para notar diferencias en la continuidad del movimiento para el caso de la
configuración B, en la cual el receptor estaba de espaldas a la fuente.
Se puede observar que, en la prueba pareada para la medición A, existe diferencia significativa con
80% de confianza para 30° De la misma manera que para 12° en las simulaciones A y B. Sin
embargo, estos resultados se tomaron como casos aislados porque son los únicos que se presentaron
con diferencia significativa (3 casos de 16 posibles).
El método mostró ser adecuado para representar movimiento relativo de la fuente, pues las personas
encuestadas notaron la diferencia en los cambios de posición de la misma, independientemente de
la resolución espacial que se estuviera considerando, esto a pesar de que no se contaba con el
módulo de Catt-Acoustic especializado en realizar este tipo de auralizaciones dinámicas.
Se recomienda para trabajos futuros, realizar las mediciones y simulaciones en otro tipo de sala
con menor tiempo de reverberación y analizar la sensación de continuidad de acuerdo con la
resolución espacial, para evaluar y comparar el método y las configuraciones utilizadas en este
proyecto.
48
9. Referencias
[1] M. Vorländer, “Signal processing for auralization”, en Auralization: Fundamentals of
Acoustics, Modelling, Simulation, Algorithms and Acoustic Virtual Reality, Ed. Springer: Aachen,
2008, pp. 103-106.
[2] B.I Dalenbäck, M. Strömberg “real time walkthrough auralization - the first Year”, Proceedings
of the Institute of Acoustics, Vol 28, pp. 2, 2006.
[3] Reproduccion de audio 3D con sistema opsodis. [En linea]. Disponible:
http://www.docfoc.com/reproduccion-de-audio-3d-con-sistema-opsodis
[4] R. E. Montell Serrano, “Sistemas De Realidad Virtual Para El Estudio Del Campo Acústico De
Edificios Del Patrimonio Artístico-Cultural”, Tesina de Máster, Dep. de Física aplicada,
Universidad Politécnica de Valencia, Valencia, 2010.
[5] M. Abad Sorbet, “Estudio Acústico y electroacústico de la sala de concierto Ritmo y Compás
(Madrid)”, Trabajo fin de Máster, Dep. Ing. Acústica, Politécnica, Madrid.
[6] U.N.S, “Análisis de Fourier”, en Procesamiento Digital de Señales, Buenos Aires, 2011, pp.
141-169.
[7] L. A. Teyssier, “Reverberación por convolución utilizando un fpga. Capitulo 2” 2009. [En
línea]. Disponible en [Último acceso: 31 01 2014]:
http://catarina.udlap.mx/u_dl_a/tales/documentos/lep/teyssier_r_la/capitulo2.pdf.
[8] S. Ferreyra y R. Oscar, “Análisis Físico-Acústico-Espacial De Respuestas Impulsivas
Binaurales (Brir) Obtenidas Por Métodos Indirectos” 6° Congreso Iberoamericano de Acústica -
FIA 2008, vol. 6, pp. 11, noviembre, 2008.
[9] M. Kittiphong y H. Dorte, “The time when the reverberation tail in a binaural room impulse
response begins”, Audio Engineering Society, p. 9, 2003.
[10] K. Usategi de la Peña, “Procesador de sonido y estudio de métodos de interpolación de la
localización de fuentes basados en HRTFs para la generación de audio 3D”, Tesis de Máster,
Universidad Politécnica de Valencia, Gandia, 2010.
[11] C. Martínez, “Conceptos Generales”, en Estadistica y Muestreo, Ed. ECOE ediciones Ltda:
Bogotá, 2012, pp. 2.
[12] E. Navarro, “Guía para la interpretacion de resultados en el contraste de hipotesis estadisticas”
[En linea]. Disponible en: http://es.slideshare.net/navarroenrique/gua-contraste-de-hiptesis-blog.
[13] M. Suarez, y F. Tapia, “Interaprendizaje de Estadística Básica”, UniversidadTécnica de Norte
Ibarra, Ecuador 2012.
[14] C. Ochoa, “NETQUEST”, [En línea]. Disponible en: http://www.netquest.com/es/blog/que-
tamano-de-muestra-necesito/. [Último acceso: 30 Enero 2015].
49
[15] J. Serret, “Distribucion de probabilidad”, en Procedimientos estadisticos con statgraphics, Ed.
ESIC Editorial: Madrid, 1998, pp. 150.
[16] F. Tommasini, A. Mariano y R. Oscar, “Auralización en tiempo real: implementación del
modelo del oyente”, 2° Congreso Internacional de Acústica UNTREF, vol. 2, pp. 10, Septiembre,
2010.
[17] M. Jeub, M. Schafer y P. Vary, “A Binaural Room Impulse Response Database For The
Evaluation Of Dereverberation Algorithms”, Institute of Communication Systems and Data
Processing, pp. 5, 2009.
[18] J. Segura, L. Vera, A. Barba, R. G. A. Lakatis, M. Fernández, R. Cibrián, S. Cerdá y J. Romero,
“Estudio de parámetros de calidad sonora de señal música y habla auralizada en una sala de uso
múltiple”, Cádiz 2009, pp. 7, 2009.
[19] R. Crawford-Emery y H. Lee, “The subjective effect of BRIR length perceived headphone
sound externalisation and tonal colouration”, Audio Engineering Society, pp. 9, 2014.
[20] F. Tommasini, “Sistema de simulación acústica virtual en tiempo real”, Tesis Doctoral, Dep.
Ciencias Exactas, Físicas y Naturales, Universidad Nacional de Córdoba, Córdoba, 2012.
[21] Henriquez Romero, Mario Alfonso and Londoño Rentería, Ángel David, “Evaluación de
auralizaciones creadas mediante métodos numéricos basados en acústica geométrica y
reproducidas en el sistema de reproducción binaural OPSODIS,” Proyecto de grado, Universidad
de San Buenaventura, 2014.
[22] M. Yepes y S. Bayer, “Estudio Comparativo De Prototipos De Pabellón Auditivo Para Captura
Binaural”, Medellín: Biblioteca digital Universidad de San Buenaventura, 2014.
[23] D. Urrego “impacto de las condiciones acústicas en la inteligibilidad y la dificultad de escucha
en tres aulas de la universidad de san buenaventura medellín, sede san benito”, Medellín: Biblioteca
digital Universidad de San Buenaventura, 2014.
[24] T. Takeuchi y P. Nelson, “Optimal source distribution for binaural synthesis over
loudspeakers,” Journal of the Acoustical Society of America, vol. 112, no. 6, pp. 2786–2797, 2002.
[25]T. Takeuchiy P. Nelson,“Extension of the optimal source distribution for binaural sound
reproduction,” Acta Acustica united with Acustica, vol. 94, pp. 981–987, 2008.
[26] Ditutor. (2010) Ditutor. [Online].
http://www.ditutor.com/distribucion_binomial/distribucion_binomial.html
[27] C. L. C. Lam, “Improving the speech intelligibility in classrooms,” Tesis para PhD, The Hong
Kong Polytechnic University, 2010.
50
10. Anexo A. Informe de Medición: Tiempo de Reverberación
Fecha y hora de la medición: 06 / 05 / 2015 9:00 a.m. – 12:00 p.m.
Aula 402E: Aula con un volumen de 200 m3 aprox. Localizada en el edificio de ingenierías de la
universidad de San Buenaventura bloque E. En la tabla 8, se muestra el área y material de las
superficies que componen dicho recinto.
Tabla 8. Área y material de las superficies del aula 402 E.
Superficie Material Área
Piso Baldosa 64.4
Puerta Madera 2.34
Ventanas Vidrio 10.73
Tableros - 5.8
Paredes Concreto pintado 94.03
Techo Concreto 83.96
La medición del tiempo de reverberación se realizó por el método de la respuesta impulsiva de la
sala, como lo estipula la norma ISO 3382-2:2008, sin presencia de personas y sillas (Sala vacía).
Se utilizó un micrófono de medición tipo 1, una fuente omnidireccional 01dB OMNI12, una
interfaz de audio M-Audio MobilePre y dos computadores portátiles para la reproducción de la
señal de excitación y la captura de la señal emitida. Esta señal correspondió a un barrido de
frecuencias (sweep) de 22 a 20000 Hz. La cantidad de puntos seleccionados corresponde a tres
posiciones de micrófono y una de fuente, debido a que se basó en la configuración de la trayectoria
estipulada para este proyecto. Las respuestas al impulso obtenidas, se procesaron a través del
pluguin Aurora en Adobe Audition. En la tabla 9, se muestran los resultados, para cada una de las
frecuencias.
Tabla 9. Tiempo de reverberación T30 [s] y desviación estándar para el promedio.
De acuerdo a la ISO 3382-2.
Banda [Hz] Pos 1 [0°] Pos 2 [90°] Pos 3 [180°] Promedio
125 3,45 3,79 3,20 3.48 ± 0,29
250 3,92 4,08 3,50 3,83 ± 0,29
500 3,61 3,81 3,73 3,72 ± 0,10
1000 3,48 3,29 3,42 3,40 ± 0,09
2000 3,05 2,92 3,04 3,00 ± 0,07
4000 2,67 2,67 2,64 2,66 ± 0,01
51
11. Anexo B. Informe de Medición: Respuesta a Impulso Binaural
Fecha y hora de medición A: 06 / 05 / 2015 9:00 a.m. – 12:00 p.m.
Fecha y hora de medición B: 07 / 09 / 2015 10:00 a.m. – 2:00 p.m.
EQUIPOS UTILIZADOS
Un parlante JBL EON 15 G2
Una interfaz de audio M-Audio MobilePre
Dos computadores portátiles
Una cabeza binaural 01 dB Cortex Mk2b
Interfaz 01dB Symphonie Pro 280
En la figura 15, se muestra la configuración utilizada para la medición de la respuesta al impulso
binaural.
Figura 15. Configuración para la medición de la respuesta al impulso binaural.
Las señales capturadas por los micrófonos de la cabeza binaural, fueron procesadas con los pluguin
Aurora en el software Adobe Audition donde se obtuvieron la respuesta al impulso binaural en los
puntos establecidos a lo largo de la trayectoria. En las figuras 16 y 17, se muestran las fotos de la
sala 402E durante la medición.
52
Figura 16. Foto de la medición A de las respuestas al impulso binaural.
53
Figura 17. Foto de la medición B de la respuesta al impulso binaural.
54
12. Anexo C. Código de MATLAB
% Pedir al usuario ingresar el paso en grados
step = input ('Ingrese la densidad espacial para la cual quiere separar el audio: [2,6,12,18,30]: ');
pasos = 0:step:180;
numeroAuralizaciones = length(pasos);
% Aquí se obtiene un vector de nombres de archivos para la resolución elegida
nombres = cell(numeroAuralizaciones,1);
for k=1:numeroAuralizaciones
nombreArchivo = sprintf('POS %i°.wav',pasos(k));
nombres{k} = nombreArchivo;
end
%% Leer archivos de audio
[primerArchivo,fs] = audioread(nombres{1});
numeroMuestras = length(primerArchivo);
t = numeroMuestras/fs;
t = t-2.2;
numeroMuestras = t*fs;
matrizAuralizaciones = cell(numeroAuralizaciones,1);
for i=1:numeroAuralizaciones
matrizAuralizaciones(i) = {audioread(nombres{i})};
end
% Son los audios de la misma longitud si no recortar a una longitud de 15 * 44100
%% Función para partir cada reducir matriz
% Nota se coge cada [2,6,12,18,30] grados así que la matriz de
% auralizaciones tendrá [91,31,16,11,7] columnas.
55
longitudVentana = floor(numeroMuestras / numeroAuralizaciones);
bloques = cell(numeroAuralizaciones,1);
for i = 1:numeroAuralizaciones
rangoDeLectura = longitudVentana*(i-1):longitudVentana*i;
rangoDeLecturaInicial = 1:longitudVentana;
if (i-1) ~= 0 && i ~= numeroAuralizaciones
bloque = matrizAuralizaciones{i}(rangoDeLectura,(1:2));
bloques(i) = {bloque};
elseif i == numeroAuralizaciones
bloque = matrizAuralizaciones{i}(longitudVentana*(i-1):end,1:2);
bloques(i) = {bloque};
else
bloque = matrizAuralizaciones{i}(rangoDeLecturaInicial,1:2);
bloques(i) = {bloque};
end
end
%% Escribir archivo de audio
nombreArchivoEscritura = sprintf('archivoFinal %i.wav',step);
audioFinal = cell2mat(bloques);
audiowrite(nombreArchivoEscritura,audioFinal,fs);
56
13. Anexo D. Formato para la Prueba Subjetiva
PRUEBA DE ESCUCHA CRÍTICA
INVESTIGACIÓN: ANÁLISIS DE AURALIZACIONES DINÁMICAS BASADAS EN
ACÚSTICA GEOMÉTRICA Y REPRODUCIDAS EN EL SISTEMA OPSODIS.
Fecha (D-M-A): ____-____-______
Género: Femenino____ Masculino____
Edad (años): 16-20___ 21-25___ 26-30___ 31-35___ 35-40___
OBJETIVO: Evaluar las auralizaciones dinámicas en términos de la sensación de continuidad en
el movimiento, a través de la escucha crítica.
A continuación, se reproducirán 20 audios, correspondientes a un bombardino, los cuales recorren
una trayectoria semi-circular de 180°, como se muestra en el video. Por favor califique según su
criterio, la sensación de continuidad en el movimiento para dicha trayectoria. Entiéndase esto,
como la capacidad que tiene usted de percibir si en el movimiento de la fuente sonora ocurren
saltos, notables o no, en el recorrido de la misma en el espacio. Marque la casilla correspondiente
según la escala de 1 a 4 donde:
1: Ninguna sensación de continuidad
2: Poca sensación de continuidad
3: Moderada sensación de continuidad
4: Mucha sensación de continuidad
Nota: A modo de sugerencia, usted puede tomar como referencia el primer archivo de audio
reproducido, y pedir al responsable de la prueba, repetir cada uno de los audios las veces que
considere necesario.
Audio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Continuidad
57
14. Anexo E. Certificado de Calibración