COMPARACIÓN DE AURALIZACIONES DINÁMICAS GENERADAS A …

COMPARACIÓN DE AURALIZACIONES DINÁMICAS GENERADAS

A PARTIR DE RESPUESTAS AL IMPULSO MEDIDAS Y SIMULADAS

JOHNATHAN DANIEL ROSADO SARABIA

UNIVERSIDAD DE SAN BUENAVENTURA MEDELLÍN

FACULTAD DE INGENIERÍAS

INGENIERÍA DE SONIDO

MEDELLÍN

2016

COMPARACIÓN DE AURALIZACIONES DINÁMICAS GENERADAS A PARTIR DE

RESPUESTAS AL IMPULSO MEDIDAS Y SIMULADAS

JOHNATHAN DANIEL ROSADO SARABIA

Trabajo de grado presentado para optar al título de Ingeniero de Sonido

Asesores: Diana Garza Agudelo, Ingeniera de Sonido

Héctor García Mayén, Magíster (MSc) en Sonido y vibraciones

UNIVERSIDAD DE SAN BUENAVENTURA MEDELLÍN

FACULTAD DE INGENIERÍAS

INGENIERÍA DE SONIDO

MEDELLÍN

2016

Dedicatoria

Este trabajo está dedicado a mi familia, especialmente a mis padres por su apoyo incondicional y

confianza, a mis amigos por el respaldo y la compañía de siempre y a mis profesores por brindarme

las herramientas y conocimientos necesarios durante la carrera profesional.

Agradecimientos

Agradezco a mis asesores: Diana María Garza Agudelo y Héctor García Mayen, por el

acompañamiento durante el proceso, su paciencia y disponibilidad en cada una de las asesorías.

Agradezco también al Ingeniero Luis Alberto Tafur Jiménez, por las orientaciones brindadas.

Contenido

Resumen ........................................................................................................................................... 9

1. Introducción ............................................................................................................................ 11

1.1. Planteamiento del Problema ............................................................................................ 11

1.2. Justificación ..................................................................................................................... 11

2. Objetivos ................................................................................................................................. 13

2.1. Objetivo General .............................................................................................................. 13

2.2. Objetivos Específicos ...................................................................................................... 13

3. Marco Teórico ......................................................................................................................... 14

3.1. Parámetros Acústicos de la Sala ...................................................................................... 14

3.1.1. Tiempo de reverberación (RT) ................................................................................. 14

3.1.2. Tiempo de decaimiento temprano (EDT por sus siglas en inglés) ........................... 15

3.1.3. Claridad musical (C80) ............................................................................................ 15

3.1.4. Correlación cruzada interaural IACC ....................................................................... 15

3.2. Convolución..................................................................................................................... 15

3.3. Respuesta al Impulso de la Sala (RIR) ............................................................................ 16

3.4. Respuesta al Impulso Binaural en la Sala (BRIR) ........................................................... 16

3.5. Función de Transferencia Relacionada con la Cabeza y Respuesta al Impulso Relacionada

con la Cabeza (HRTF, HRIR) .................................................................................................... 17

3.6. Diferencias Interaurales de Tiempo (IDT) y de Intensidad (IID) .................................... 18

3.7. Distancia crítica ............................................................................................................... 18

3.8. Auralización ..................................................................................................................... 19

3.8.1. Generación: .............................................................................................................. 19

3.8.2. Transmisión: ............................................................................................................. 19

3.8.3. Reproducción ........................................................................................................... 20

3.9. Conceptos Estadísticos .................................................................................................... 23

3.9.1. Estadística descriptiva e inferencia estadística ......................................................... 24

3.9.2. Pruebas paramétricas y no paramétricas. ................................................................. 24

3.9.3. Población y muestra ................................................................................................. 24

3.9.4. Medidas de posición y de tendencia central ............................................................. 25

3.9.5. Formulación de hipótesis estadísticas ...................................................................... 26

3.9.6. Nivel de significación ............................................................................................... 26

4. Estado del Arte ........................................................................................................................ 27

5. Metodología ............................................................................................................................ 29

5.1. Medición del Tiempo de Reverberación y Ruido de Fondo ............................................ 29

5.2. Medición de las Respuestas al Impulso Binaurales del Recinto ..................................... 30

5.3. Simulación de Respuestas al Impulso y Comparación de los Parámetros Objetivos ...... 31

5.4. Creación de las Auralizaciones Dinámicas ..................................................................... 32

5.5. Descripción General de la Prueba Subjetiva ................................................................... 33

5.5.1. Selección de la población y determinación del tamaño de la muestra. .................... 33

6. Resultados ............................................................................................................................... 35

6.1. Comparación Objetiva ..................................................................................................... 35

6.2. Prueba de escucha crítica ................................................................................................. 38

6.2.1. Coeficientes de asimetría y de variación .................................................................. 39

6.3. Contraste No Paramétrico ................................................................................................ 39

6.3.1. Contraste en Medición A .......................................................................................... 39

6.3.2. Contraste en Simulación A ....................................................................................... 41

6.3.3. Contraste en Medición y Simulación B .................................................................... 42

6.3.4. Prueba de Wilcoxon para muestras pareadas ........................................................... 43

7. Discusión ................................................................................................................................. 45

7.1. Prueba Objetiva ............................................................................................................... 45

7.2. Prueba de escucha crítica ................................................................................................. 45

8. Conclusiones ........................................................................................................................... 47

9. Referencias .............................................................................................................................. 48

10. Anexo A. Informe de Medición: Tiempo de Reverberación ............................................... 50

11. Anexo B. Informe de Medición: Respuesta a Impulso Binaural ......................................... 51

12. Anexo C. Código de MATLAB .......................................................................................... 54

13. Anexo D. Formato para la Prueba Subjetiva ....................................................................... 56

14. Anexo E. Certificado de Calibración .................................................................................. 57

Lista de Tablas

Tabla 1. Coeficientes de absorción de materiales, librería del software Catt-Acoustic. ................ 32

Tabla 2. Coeficiente de asimetría para resoluciones espaciales en configuraciones A y B. .......... 39

Tabla 3. Coeficiente de variación para resoluciones espaciales en configuraciones A y B. .......... 39

Tabla 4. Resultados de la prueba Kruskall-Wallis para la medición A. ......................................... 41

Tabla 5. Resultados de la prueba Kruskall-Wallis para la simulación A. ...................................... 42

Tabla 6. Resultados de la prueba Kruskall-Wallis para la medición y simulación B. ................... 43

Tabla 7. Resultados de la Prueba de Wilcoxon para muestras pareadas. ....................................... 44

Tabla 8. Área y material de las superficies del aula 402 E. ........................................................... 50

Tabla 9. Tiempo de reverberación T30 [s] y desviación estándar para el promedio. .................... 50

Lista de Figuras

Figura 1. Crosstalk. Las señales del altavoz YL y YR deberían representar a ZL y ZR. .............. 20

Figura 2. Principio del sistema OPSODIS. .................................................................................... 21

Figura 3. Patrón de radiación de sonido el OPSODIS (300 Hz a 20kHz). ..................................... 22

Figura 4. Radiación de sonido por pares de transductores de control con referencia a la direcciones

del receptor [24]. ........................................................................................................................... 23

Figura 5. Diagrama de la metodología del proyecto ...................................................................... 29

Figura 6. Foto de medición de ruido de fondo. .............................................................................. 30

Figura 7. Vista en planta de ubicaciones de fuente y receptor en el recinto. ................................. 31

Figura 8. Gráficas de EDT para el aula 402E. ............................................................................... 35

Figura 9. Gráficas de T30 para el aula 402E. ................................................................................. 36

Figura 10. Gráficas de IACC para el aula 402E. ............................................................................ 37

Figura 11: Gráficas de C80 para el aula 402E. .............................................................................. 38

Figura 12. Boxplot de puntuación vs grado de resolución, en medición A. .................................. 40

Figura 13. Boxplot de la puntuación vs grado de resolución, en simulación A ............................. 41

Figura 14. Puntuación mediana vs grados de resolución, medición B y simulación B ................. 42

Figura 15. Configuración para la medición de la respuesta al impulso binaural. .......................... 51

Figura 16. Foto de la medición A de las respuestas al impulso binaural. ...................................... 52

Figura 17. Foto de la medición B de la respuesta al impulso binaural. ......................................... 53

9

Resumen

Auralización es un método que permite crear sonidos que representan las características acústicas

de una sala, llevando al oyente a que produzca una sensación de inmersión en la misma. En este

proyecto, se busca comparar las auralizaciones dinámicas creadas mediante la medición de la

respuesta al impulso de la sala, y las creadas con el software de predicción acústico Catt-Acoustic;

ambas reproducidas en el sistema Optimal Source Distribution (OPSODIS). Como primer paso, se

midió la respuesta al impulso binaural en puntos discretos de una trayectoria semi-circular en el

aula 402E de la Universidad de San Buenaventura, seccional Medellín, sede San Benito.

Posteriormente, se obtuvieron las auralizaciones mediante la convolución de éstas con material

sonoro grabado de manera “semi-anecóica” en cada uno de los puntos medidos.

Luego se obtuvo el modelo en Catt-Acoustic, se calibró con respecto a las mediciones a través de

la comparación objetiva de los parámetros acústicos EDT, T30, C80 e IACC y se crearon las

auralizaciones simuladas. Estos archivos de audio fueron procesados en Matlab, en donde se

fragmentaron de acuerdo con diferentes resoluciones espaciales y se concatenaron de manera que

cada fragmento representara una posición en la trayectoria, para finalmente crear la sensación de

movimiento del receptor. Dichas auralizaciones dinámicas, fueron evaluadas mediante una prueba

de escucha crítica y los resultados mostraron que no existen diferencias significativas entre las

auralizaciones con diferentes resoluciones espaciales, es decir, no existen diferencias en la

sensación de continuidad en el movimiento para la sala y la trayectoria establecidas.

Palabras clave: Auralización, respuesta al impulso, OPSODIS.

10

Abstract

Auralization is a method that allows to create sounds that represent the acoustic characteristics of

specific a room, bringing the listener to a sensation of immersion. This project, seeks to compare

the dynamic auralization created by measuring the room impulse response, with those created by

means of the acoustical prediction software Catt-Acoustic, both of them reproduced in an

OPSODIS system. As a first step, binaural impulse response at discrete points in a semi-circle in

the classroom 402E of the University of San Buenaventura, Medellin, San Benito building, were

measured. Secondly, the auralizations were obtained by convolving these impulse responses with

audio material recorded in a "semi-anechoic" way for each of the measured points.

An Catt-Acoustic model was then obtained, it was calibrated regarding the measurements through

the objective comparison of the acoustic parameters EDT, T30, C80 and IACC. It was then

simulated and auralizations were created. These audio files were processed in Matlab, they were

fragmented by different spatial resolutions, and concatenated so that each fragment representing a

position on the path to create the sensation of movement of the receiver. These dynamics

auralizations were evaluated by a critical listening test and the results showed no significative

differences between auralizations with different spatial resolutions, i.e. there is no difference in the

sensation of continuity in the movement for the living and the path set.

Keywords: Auralization, Response Impulse, OPSODIS.

11

1. Introducción

1.1. Planteamiento del Problema

Los avances en la tecnología, permiten el desarrollo de nuevas herramientas que facilitan los

procesos ingenieriles en cuanto al diseño acústico de recintos y las auralizaciones son, uno de los

métodos novedosos en dicho tema. Esta es una técnica que permite crear escenarios acústicos

audibles de datos numéricos que pueden ser simulados, sintetizados o medidos y sus componentes

se obtienen mediante la simulación por medio de un ordenador. En otras palabras, es una

representación auditiva del espacio y el objetivo es sintetizar sonidos que produzcan en el oyente

una sensación de inmersión en la sala simulada [1].

Durante las últimas décadas, se han reportado varias formas de auralizaciones en tiempo real con

movimientos o rotación de la cabeza, pero con algunas limitaciones en los mismos, solo con

movimientos verticales y horizontales de la cabeza (azimut y elevación), pero existen pocas

referencias de investigaciones sobre auralizaciones dinámicas donde el receptor o la fuente se estén

desplazando por alguna trayectoria dentro del recinto [2].

A pesar de que el software Catt-Acoustic tiene dentro de sus módulos de predicción uno llamado

Catt-Walker, en el cual se pueden simular las auralizaciones dinámicas o con desplazamientos del

receptor dentro de la sala, no se pudo tener acceso a dicho modulo. En consecuencia, se planteó

una nueva configuración para lograr crear sensaciones de movimiento en los receptores para las

auralizaciones de la sala evaluada.

1.2. Justificación

Este proyecto, ofrece una metodología para obtener auralizaciones dinámicas, a partir de la

medición de las respuestas al impulso en puntos discretos sobre una trayectoria dentro de un

recinto, contribuyendo al desarrollo de futuras investigaciones, para las cuales no se tenga acceso

al software especializado para dicha temática.

También se cuenta con un sistema de reproducción de audio 3D, llamado OPSODIS, desarrollado

a partir de la teoría Optimal Source Distribution. Este es un sistema de dos vías que usa dos o tres

transductores por canal, la información de cada canal es divida en bandas de frecuencia y enviada

a los altavoces cuya separación se da de acuerdo al rango de frecuencias que reproducen. Así en

lugar de tener un sistema de altavoces que varíen su posición en función de la frecuencia, se crea

12

un sistema de altavoces con distancias fijas que dependen del rango de frecuencias que reproducen.

El sistema de reproducción OPSODIS presenta ventajas importantes con relación a otros sistemas

de reproducción binaural como cancelación del efecto crosstalk sin generar pérdidas y permitir

múltiples usuarios [3].

13

2. Objetivos

2.1. Objetivo General

Comparar las auralizaciones dinámicas en términos de continuidad en el movimiento, generadas a

partir de respuestas al impulso medidas y simuladas; y reproducidas en el sistema OPSODIS.

2.2. Objetivos Específicos

Medir las respuestas al impulso binaurales en diferentes puntos a lo largo de una trayectoria

semicircular en el aula 402E de la Universidad de San Buenaventura.

Simular la respuesta al impulso binaural de la sala, a través del software Catt-Acoustic,

aplicando la misma configuración usada en la medición.

Generar las auralizaciones en cada uno de los puntos medidos y simulados mediante la

convolución de las respuestas al impulso binaurales obtenidas con material sonoro “semi-

anecóico”.

Generar las auralizaciones dinámicas a través de la fragmentación y concatenación de las

auralizaciones realizadas en cada punto de la trayectoria.

Evaluar a través de una prueba de escucha crítica, la sensación de continuidad en la trayectoria,

de acuerdo con las resoluciones espaciales establecidas, para las auralizaciones medidas y

simuladas, reproducidas en el sistema OPSODIS.

14

3. Marco Teórico

En un recinto, con disposición de una fuente sonora, una persona recibe tanto los aportes del sonido

directo, como los aportes de la sala. A este fenómeno se le denomina comúnmente, la respuesta

impulsiva de la sala (RIR), que caracteriza acústicamente un entorno para posiciones específicas

de fuente – receptor. A partir de estas, es posible conseguir la mayoría de los parámetros acústicos

que caracterizan un recinto. Cuando este proceso es medido mediante un sistema binaural (cabeza

binaural), que es semejante a como realmente ocurre el fenómeno de la audición, se puede obtener

la Respuesta al Impulso Binaural (BRIR). Estas varían para cada ubicación de fuente-receptor y de

acuerdo con la geometría del espacio y materiales que lo componen, entre otros [4]. Los parámetros

acústicos pueden ser simulados virtual o físicamente a través de un proceso llamado auralización,

producto de la convolución de las BRIR con una señal de audio anecóico. Para este proyecto las

auralizaciones se evaluaron desde la sensación de movimiento en el receptor. A continuación, se

definen algunos conceptos relacionados con dicho proceso.

3.1. Parámetros Acústicos de la Sala

Uno de los parámetros acústicos más estudiados y utilizados para la valoración de recintos, es el

tiempo de reverberación, pero en la actualidad se ha aceptado que dicho parámetro a pesar de ser

muy útil, por sí solo es insuficiente para caracterizar un recinto. Aparecen entonces otros conceptos

como tiempo de decaimiento temprano (EDT), Claridad musical C80, definición de la voz D50,

IACC, entre otros, que se describen brevemente a continuación [5].

3.1.1. Tiempo de reverberación (RT)

Se define como el tiempo que transcurre desde que la fuente sonora se detiene, hasta que el nivel

de presión sonora cae 60 dB con respecto a su valor inicial. Este depende de la frecuencia. Cuando

se establece un único valor recomendado de TR para un recinto dado, se hace referencia al obtenido

de la media aritmética de los valores correspondientes a las bandas de 500 Hz y 1 kHz (𝑇𝑅𝑚𝑖𝑑).

En general, el valor más adecuado de TR, depende de la actividad destinada para el recinto y del

volumen de este. En la ecuación (1) se muestra la definición del 𝑇𝑅𝑚𝑖𝑑 [5].

𝑇𝑅𝑚𝑖𝑑 =𝑇𝑅(500 𝐻𝑧)+𝑇𝑅(1000𝐻𝑧)

2 [𝑠] (1)

15

3.1.2. Tiempo de decaimiento temprano (EDT por sus siglas en inglés)

Se define como el tiempo que transcurre desde que la fuente sonora deja de radiar, hasta que el

nivel de presión sonora decae 10dB. Al igual que el RT, el EDT varía en función de la frecuencia

[5]. El EDT está más relacionado con la impresión subjetiva de viveza que el RT utilizado

tradicionalmente, es decir, que en los puntos de la sala con un EDT significativamente menor que

el RT, la sala resultará, subjetivamente, más apagada de lo que se deduciría del valor TR [5].

3.1.3. Claridad musical (C80)

Este parámetro se utiliza para valorar el grado de separación que se puede apreciar entre los

diferentes sonidos de una composición musical y se define como el cociente entre la energía sonora

recibida durante los primeros 80 ms desde la llegada del sonido directo y la energía que llega

después de dicho tiempo. Esta se calcula en cada banda de frecuencia entre 125 Hz y 4kHz, como

muestra la ecuación (2) [5].

𝐶80 = 10 log∫ 𝑝2(𝑡)𝑑𝑡

0.080

∫ 𝑝2(𝑡)𝑑𝑡∞

0.08

[𝑑𝐵] (2)

3.1.4. Correlación cruzada interaural IACC

Se define como la correlación entre las respuestas al impulso calculadas en ambos oídos, e indica

el grado de similitud existente entre ambas señales. Para el caso en el que las dos señales son

iguales, el IACC valdrá 1, y en el caso en que las señales sean aleatorias independientes, el IACC

valdrá 0. Se definen dos IACC [5]:

IACCE (Early): Corresponde a los primeros 80 ms desde la llegada del sonido directo.

IACCL (Late): Calculado desde los 80 ms hasta 1s.

Las bandas de frecuencias más significativas son las de 500Hz, 1kHz y 2kHz. De esto surgen las

definiciones IACCE3 y IACCL3, que son las medias aritméticas de IACCE y IACCL en esas

bandas de frecuencia. Aunque no existe un valor óptimo para IACCE3, Beranek propone para la

sala vacía un valor aproximado de 0,70 [5].

3.2. Convolución

La convolución es un proceso matemático donde se operan dos funciones f y g, para dar como

resultado una tercera función que está dada por la magnitud de la superposición de f con una versión

16

invertida y trasladada de g. En el caso de los sistemas lineales invariantes en el tiempo, la

convolución permite conocer la respuesta del sistema ante cualquier entrada, partiendo del

conocimiento de la respuesta del sistema ante una única entrada en particular, es decir, el impulso.

Si la respuesta al impulso del sistema se define como h(t), la salida del sistema LTI, excitado con

una entrada cualquiera x(t), estará dada por la ecuación (3) [6].

𝑦(𝑡) = ∫ 𝑥(𝜏)ℎ(𝑡 − 𝜏)𝑑𝜏 = ∫ 𝑥(𝑡 − 𝜏)ℎ(𝜏)𝑑𝜏∞

−∞

∞

−∞ (3)

Siendo y (t), la convolución entre las funciones x (t) y h (t).

3.3. Respuesta al Impulso de la Sala (RIR)

La respuesta al impulso es la señal resultante al aplicar una función delta o impulso unitario a un

sistema en particular. Es así como se puede saber el comportamiento del sistema al aplicarle

cualquier señal de impulso. Para el caso específico de la acústica, la respuesta al impulso muestra

cómo responde un recinto al aplicarle una señal de muy corta duración y con un nivel alto de

intensidad como, por ejemplo, explotar un globo o el sonido de un disparo [7].

3.4. Respuesta al Impulso Binaural en la Sala (BRIR)

El fenómeno de la audición es un proceso binaural, es decir, que las señales de audio que llegan a

los tímpanos de ambos oídos, llevan información que el ser humano utiliza, entre otras, para la

localización de una fuente sonora en el espacio. Cuando se obtiene la respuesta impulsiva de la sala

(RIR), ésta caracteriza una posición de la sala para una localización especifica de la fuente,

adicionalmente, la RIR se caracteriza para un sonido y un receptor concreto, obteniendo lo que se

conoce como Respuesta Impulsiva Binaural o Binaural Room Impulse Response (BRIR). La BRIR

introduce las características del receptor a la RIR mediante la aplicación de Funciones de

Transferencia Relacionadas con la Cabeza, las cuales modelan el efecto causado por el pabellón

auricular, las reflexiones sobre la cabeza y el torso [4, 8].

Conceptualmente, la respuesta al impulso binaural de una sala puede dividirse en tres partes: el

sonido directo, las primeras reflexiones y la cola de reverberación. Los tiempos de llegada al

receptor y las propiedades de estas, estarán influenciadas por la geometría de la sala, las posiciones

de la fuente y el receptor, las características direccionales y las propiedades de los objetos

reflectantes [9].

17

Además, las diferentes partes de una BRIR transportan información adicional sobre la calidad

acústica del mismo, determinando una serie de sensaciones psicoacústicas tales como la impresión

espacial, envolvencia, entre otras [8].

3.5. Función de Transferencia Relacionada con la Cabeza y Respuesta al Impulso

Relacionada con la Cabeza (HRTF, HRIR)

Anteriormente se creía que las relaciones entre las Diferencias Interaurales de Tiempo (ITD), las

Diferencias Interaurales de Intensidad (IID) y la localización espacial eran predecibles, sin

embargo, los científicos encontraron problemas para relacionar la percepción espacial de los

sonidos con su variación en el contenido espectral mediante expresiones matemáticas. El primer

paso para la comprensión de los cambios de contenido espectral con la escucha directiva, fue la

realización de modelos físicos, medidas, experimentos empíricos y simulaciones computacionales

para la obtención de la variación del contenido espectral dependiente de la dirección obtenida

directamente de las orejas físicas de una persona. A estas medidas se les denominó Head Related

Transfer Functions (HRTF) y definen el filtrado acústico dependiente de la dirección producida

por la cabeza y el torso sobre un sonido emitido en campo libre [10].

Explícitamente, las HRTF se definen como la respuesta en frecuencia en campo lejano de un oído,

ya sea el izquierdo o derecho, específico de cada individuo, medido desde un punto del campo libre

a un punto del oído de la persona, normalmente para un radio fijado de distancia desde la cabeza

del oyente. Estas medidas se hacen para diferentes variaciones del punto de emisión en grados o

radianes, del plano frontal o la elevación, y del plano horizontal o de azimut. Lo que quiere decir,

que la HRTF es una función de cuatro variables, tres coordenadas espaciales y la frecuencia. Como

la mayoría de las medidas de la HRTF se hacen en campo lejano, no se tiene en cuenta la distancia

entre la cabeza y la fuente, lo que reduce la HRTF a una función de la frecuencia, la elevación y el

azimut. Mediante la Transformada de Fourier Inversa se consigue la expresión análoga en el

dominio del tiempo llamada Head Related Impulse Response (HRIR) [10].

Las HRIR se definen como filtros de Respuesta al Impulso Finita o FIR y suman la información de

los sistemas de IID e ITD de tal forma que los retardos de tiempo, o la información de ITD, son

codificados en el espectro en la fase del filtro y la información de las diferencias de niveles, es

codificada en el módulo en función de la frecuencia del filtro [10].

18

3.6. Diferencias Interaurales de Tiempo (IDT) y de Intensidad (IID)

Estas se producen a partir de las diferentes distancias que las ondas sonoras recorren para llegar a

cada uno de los oídos y, por ende, de las diferentes atenuaciones que sufren durante la trayectoria,

incluyendo la sombra acústica generada por la cabeza y los retrasos entre las señales captadas por

cada uno de los oídos [10].

En frecuencias altas, mayores a 1000 Hz, la longitud de onda es menor a la mitad del radio de la

cabeza, lo que convierte a ésta, en un obstáculo para las frecuencias altas. En consecuencia, se ha

demostrado que la cabeza humana se comporta como un filtro acústico pasa bajo [7]. Por esta

razón, la localización para este grupo de frecuencias, se debe fundamentalmente a la intensidad con

la que llega la onda sonora a cada oído; mientras que, para las bajas frecuencias, menores a 800

Hz, la localización es debida a la diferencia de fases o tiempo de retardos en ambos oídos, debido

a la orientación de la cabeza y la longitud de onda de los sonidos captados. Para la localización de

las frecuencias medias, el ser humano utiliza tanto fase como nivel de intensidad, es decir que

utiliza ambas de forma simultánea y combinada [10].

3.7. Distancia crítica

En un campo acústico, hay una distancia para la cual el nivel de presión sonora es igual tanto para

la energía del sonido directo como para el reflejado. A esta distancia se le llama distancia crítica y

se calcula mediante la ecuación (4) [26]

𝑟 = 0.14√𝐾. 𝑄 (4)

Donde:

𝑟 es la distancia crítica, en m.

𝐾es la constante del local, en m2

𝑄es el factor de directividad.

La constante de un local, K mide la capacidad de un recinto para la absorción del sonido, y se

calcula como lo muestra la ecuación (5).

𝐾 = 𝑎𝑚 ∗ 𝑆1 − 𝑎𝑚 (5)

Donde 𝛼𝑚 es el coeficiente de absorción, que se calcula de acuerdo con la ecuación (6).

19

𝛼𝑚 =𝑠1.𝛼1 + 𝑠2.𝛼2 +⋯+𝑠𝑛.𝛼𝑛

𝑠1+𝑠2+⋯+𝑠𝑛 (6)

Donde S es la superficie en m2.

El factor de directividad se define como la relación existente entre la presión sonora cuadrática

media existente a una distancia dada y en una dirección determinada, y la presión sonora cuadrática

media en el mismo punto, pero considerando la onda esférica [26].

Si la fuente sonora está suspendida en el espacio abierto, sin reflexiones, radiará su energía en todas

las direcciones. Así, su directividad esférica es total y Q=1. Si está en el suelo, todo el ruido se

radiará a través de una semiesfera (sin considerar la energía absorbida por el suelo, con lo que la

densidad de energía acústica será del doble, y Q=2. Igualmente, si la fuente sonora está contra una

pared, Q=4, y si está en una esquina será Q=8.

3.8. Auralización

La auralización es la técnica mediante la cual se obtiene un archivo de audio a partir de datos

numéricos que pueden ser sintetizados, medidos o simulados [1]. Es el proceso mediante el cual se

simula la sensación de escucha tridimensional del sonido en el interior de una sala, para una

posición dada del oyente y de las posibles fuentes y para unas determinadas señales. Las etapas de

este proceso se describen a continuación y son: Generación, transmisión y reproducción [4].

3.8.1. Generación:

Las señales de entrada para este proceso o generación del sonido, son señales específicas, como

una voz humana, instrumentos musicales o una máquina que genera ruido. Estas, deben estar libres

de reverberación y de otras señales generadas por la transmisión sonora en la sala. Generalmente,

se obtienen grabando la fuente en una cámara anecóica o bien, en un espacio acondicionado donde

la absorción sea muy alta [1].

3.8.2. Transmisión:

Después de que se tienen las señales anecóicas, producto de la primera etapa del proceso, se deberá

medir y/o modelar las respuestas al impulso de la sala, para obtener una señal de salida resultante

(auralización) calculada mediante un proceso llamado convolución. Generalmente, los modelos

20

computacionales utilizados para la simulación de la trasmisión sonora, son basados en la acústica

geométrica [1].

La acústica geométrica Se entiende como el método en donde la energía propagada desde la fuente

sonora hasta la superficie más cercana del recinto ocurre en línea recta, la cual va a ser reflejada

nuevamente en otra dirección siguiendo la ley de Snell, y así sucesivamente hasta reducir su

intensidad. Esta es la base para los diferentes métodos de predicción acústica utilizados en la

actualidad tales como el de trazado de rayos y el de fuentes imagen [1].

En la trasmisión sonora de los modelos geométricos, las respuestas al impulso obtenidas en la

simulación, son procesadas con una HRTF, la cual permite tener en cuenta las diferencias en la

presión sonora producto de las difracciones que se generan por la cabeza y el torso de una persona

[1].

3.8.3. Reproducción

En la reproducción de las auralizaciones, generalmente se utilizan transductores de salida como los

auriculares, pero también existen otros sistemas de reproducción binaural como los altavoces. Estos

deben actuar como “auriculares virtuales”, es decir, las señales binaurales obtenidas, por ejemplo,

con grabaciones con la cabeza binaural, deben alimentar las dos orejas del oyente, por lo tanto, una

configuración estéreo debería funcionar bien. Sin embargo, esto no ocurre debido al efecto de la

diafonía, en el cual hay una interferencia de las señales independientes que deberían llegar a cada

oído, como se muestra en la Figura 1 [1].

Figura 1. Crosstalk. Las señales del altavoz YL y YR deberían representar a ZL y ZR.

La interferencia ocurre sobre las trayectorias HLR y HRL. Adaptado de [1].

Esta situación puede arreglarse con un proceso al que se le conoce como inversión del sistema o

cancelación de la diafonía. No obstante, en este proceso las señales de audio de los altavoces se

21

anulan entre sí. La pérdida de rango dinámico y la calidad es típicamente alrededor de 30 dB, por

lo tanto, la relación señal a ruido de las señales en las orejas se convierte en baja. Puesto que los

altavoces están produciendo un sonido mucho más potente de lo habitual para producir el nivel de

sonido necesario en los oídos, la distorsión no lineal se vuelve más importante y es a menudo

audible [25].

Para superar estos inconvenientes, Takeuchi y Nelson [24] presentaron un sistema de reproducción

en el cual dos transductores cambian su amplitud angular de acuerdo con la frecuencia, como se

muestra en la Figura 2, el cual llamaron OPSODIS (Sistema de Distribución de Fuentes Óptimo).

Éste modifica el procesamiento de la señal de cancelacion de crosstalk, haciendo que la

interferencia sea constructiva en vez de destructiva y de esta manera, evitar pérdidas en el rango

dinámico, lo que indica ventajas en cuanto a calidad comparado con otros sistemas. Además, las

reflexiones del ambiente se reducen, ya que la radiación del sistema en direcciones diferentes a las

del receptor es mínima [24].

Figura 2. Principio del sistema OPSODIS.

La Figura 3, muestra que la radiación de sonido por los transductores del OPSODIS en todas las

direcciones es siempre menor que los que están en las direcciones del receptor. El patrón de

radiación se vuelve constante en frecuencia y se repite periódicamente en el espacio de escucha.

Por lo tanto, múltiples oyentes también pueden percibir señales binaurales casi correctas. Los filtros

inversos tienen una respuesta de frecuencia plana para que no haya coloración en cualquier

ubicación en la sala de escucha. Cuando el oyente está muy lejos de la posición de escucha prevista,

la información espacial percibida puede no ser ideal. Sin embargo, el espectro de las señales de

sonido no se cambia por los filtros inversos. Por lo tanto, el oyente puede percibir todavía la

producción natural de sonido [25].

22

Figura 3. Patrón de radiación de sonido el OPSODIS (300 Hz a 20kHz).

Adaptado de [25].

Sin embargo, se debe considerar que los reflejos de los objetos en el lugar de reproducción, como

paredes, pisos y techos, afectan el rendimiento del sistema. Estos efectos se han estudiado con

modelos de fuente de imagen y experimentos subjetivos. Los aspectos de percepción de la

localización del sonido, sugieren que el rendimiento de este tipo de sistema se mantendrá en cierta

medida, pero el sonido reflejado con un nivel mucho mayor que el sonido que llega directamente

a los oidos del oyente, destruye la percepción correcta. Sin embargo, el nivel relativo de la radiacion

de sonido en distintas direcciones hacia los oidos del oyente, es una muy buena medida de la

resistencia del sistema a las reflexiones [24].

23

Figura 4. Radiación de sonido por pares de transductores de control con referencia a la direcciones del receptor [24].

No obstante, para algunas frecuencias la radiación del sonido en direcciones diferentes a las del

receptor puede ser significativamente mayor, tipicamente entre +30 dB y -40dB, que los de las

direcciones del receptor (0dB y -∞dB) como se muestra en la Figura 4. Cuando se trabaja en

ambientes no anecóicos, da lugar a reflexiones graves y el rendimiento de control del sistema se

deteriora. Además, el sonido radiado en direcciones distintas de la de receptor tiene una respuesta

de frecuencia con picos debido a la respuesta de matriz inversa y normalmente resultará en una

coloración severa del sonido [24].

3.9. Conceptos Estadísticos

La palabra estadística hace referencia a un método usado en la recolección, organización, análisis

y descripción numérica de la información. En otras palabras, la estadística estudia el

comportamiento de hechos o fenómenos de grupos [11].

24

3.9.1. Estadística descriptiva e inferencia estadística

La estadística descriptiva se encarga de describir las características de los sujetos que hacen parte

del estudio para presentar la información de forma organizada y resumida, por ejemplo, qué

proporción de niños y niñas hay en un colegio, sus edades, etc. y la inferencia estadística trata de

verificar hipótesis a partir de los datos de la muestra para poder ser generalizados a la población.

Dicha generalización está directamente relacionada con la selección de la muestra y su tamaño

[12].

3.9.2. Pruebas paramétricas y no paramétricas.

Las pruebas paramétricas se utilizan con variables cuantitativas y con una muestra suficiente de

sujetos, por lo menos 30 casos por grupo. Estos requisitos son necesarios para obtener una

distribución normal. Las pruebas no paramétricas se utilizan con variables dependientes

cualitativas, o cuando se cuenta con variables cuantitativas pero no se alcanza el tamaño de la

muestra recomendado [12].

Para poder emplear el tipo de prueba paramétrica, las variables deben cumplir una serie de

supuestos [12]:

Variables cuantitativas: que sean medidas en escalas de intervalo o razón. Para algunos casos,

las variables cuantitativas ordinales pueden considerarse cuantitativas si cumplen con el

supuesto de normalidad.

Normalidad de las puntuaciones: las variables en estudio deben tener una distribución normal.

Este supuesto se puede comprobar a través de la prueba Kolmorogov – Smirnov, siempre y

cuando se cuente con variables cuantitativas y un tamaño de muestra suficiente.

Independencia de las observaciones: En la recogida de la información, las respuestas de una

persona en un test, no debe depender de las respuestas de otra persona.

3.9.3. Población y muestra

La población, llamada también universo o colectivo, es el conjunto de todos los elementos que

tienen una característica común. Puede ser finita o infinita, la primera se da cuando está delimitada

y se conoce el número que la integran; la segunda se da cuando ocurre lo contrario. La muestra es

25

un subconjunto de la población y es representativa cuando todos y cada uno de los elementos de la

población tienen la misma oportunidad de ser tomados en cuenta para formar dicha muestra [13].

3.9.4. Medidas de posición y de tendencia central

Estas medidas, denominadas también como promedios, permiten determinar la posición de un valor

respecto a un conjunto de datos, el cual se considera como típico representativo para el total de las

observaciones [11].

Media aritmética, mediana y moda. La media, es el promedio aritmético de las observaciones,

es decir, el cociente entre la suma de todos los datos y el número de ellos; la mediana es el valor

que separa por la mitad las observaciones ordenadas de mayor a menor de tal forma que el 50% de

estas, son menores que la mediana y el otro 50% son mayores. Se tiene en cuenta que el número

de datos es impar, la mediana será el valor central y si es par, se toma como mediana, la media

aritmética de los dos valores centrales. Por otro lado, y la moda se define como el valor de la

variable que más se repite o el valor que presenta la máxima frecuencia [13].

Medidas de dispersión. Las medidas de dispersión son indicadas cuando se quiere evaluar dos o

más promedios. Con estas medidas, es posible determinar si hay concentración de datos alrededor

de un promedio, lo cual indicará una buena aplicación, o si por el contrario una gran dispersión,

estaría indicando poca representatividad [11].

Varianza y desviación típica o estándar. Se define como la media aritmética de los cuadrados de

las diferencias (o desviaciones) entre los valores que toma la variable y su media aritmética y su

símbolo es s2. Por otro lado, la desviación típica es la raíz cuadrada de la varianza, considerada

siempre con signo positivo y se representa con s [11]. En las ecuaciones (8) y (9), se muestran estos

conceptos:

𝑠2 =∑ 𝑥𝑖

2

𝑛− 𝑥2 (8)

𝑠 = √𝑠2 (9)

26

Coeficiente de variación. Conocido también como variación relativa. Esta compara la variabilidad

de dos series de datos. En ocasiones ocurre que ambas series están expresadas en diferentes

unidades de medidas, por lo que no se podrán comparar sus varianzas o desviaciones típicas; o

también puede darse el caso que, a pesar de tener la misma unidad de medida, nos interesa

determinar la variación respecto a una base. Para estos casos, se usa el coeficiente de variación y

se define con la ecuación (10) [11]:

𝐶𝑉 = 𝑑 = 𝑠

𝑥× 100 (10)

Coeficiente de asimetría. Mide el grado de asimetría de la distribución con respecto a la media.

Si el valor de este indicador es positivo, significa que la distribución se encuentra sesgada hacia la

izquierda y un resultado negativo, quiere decir que la distribución esta sesgada a la derecha [11].

3.9.5. Formulación de hipótesis estadísticas

El análisis estadístico inferencial, se lleva a cabo para probar algún tipo de hipótesis, por ejemplo,

probar la relación entre variables y en todos los casos es necesario formular una hipótesis que se

confirmará o no, en función de los resultados de los análisis. Una hipótesis estadística es una

afirmación sobre las características de una distribución de probabilidad y surge de la hipótesis de

investigación formulada. Éstas son siempre dos: la hipótesis nula y la alternativa. La primera, es

siempre la que se somete a contraste, cuando se comparan los resultados de dos o más grupos, o de

negación, cuando se trata de correlación, es decir, que no hay correlación entre variables [12].

3.9.6. Nivel de significación

Cada estadístico estimado en un contraste de hipótesis, siempre se acompaña de su probabilidad de

ocurrencia de la hipótesis nula (p-valor). Esta probabilidad asociada al estadístico, indica el número

de ocasiones que se cumplirá la hipótesis nula. Ese valor se debe comparar con un valor de

probabilidad, que establece el límite para considerar que una hipótesis se cumple. Ese valor de

comparación es el nivel de significación o nivel de error que se espera cometer, y este lo da el

investigador basándose en las consecuencias prácticas y su situación específica[12].

27

4. Estado del Arte

Para hablar de simulaciones acústicas, escucha espacial, audio 3D o sonido holofónico, es necesario

conocer el concepto de auralización, que como ya se dijo, se refiere a una representación auditiva

del espacio. En el estudio de las auralizaciones, se requieren conocimientos sobre física acústica,

procesamiento digital de señales, psicoacústica y acústica de recintos [16].

En las primeras investigaciones en cuanto a auralizaciones, se buscaba una representación

totalmente fiel de la realidad en un entorno virtual, lo que conllevaba a invertir un alto costo

computacional. En la actualidad, las investigaciones se han centrado en el desarrollo de ambientes

plausibles, donde lo que se quiere es conseguir una percepción semejante, más que lograr una

autentica representación de las características físicas-acústicas del ambiente real [16].

Para la obtención de las respuestas al impulso, el estándar ISO 3382-2 incluye varias señales para

excitar la sala acústicamente. En la evaluación de las características acústicas de un recinto,

tradicionalmente se ha utilizado como señal de excitación, ráfagas de ruido filtrados por bandas y

disparos de pistola, lo que generaba bajos niveles en relación señal a ruido debido a que la

intensidad de la señal se concentra en un periodo de tiempo corto. La solución a este inconveniente

es la utilización de técnicas indirectas que utilizan señales continuas y post-procesamiento digital

de señales, como las Series binarias de Máxima Longitud (MLS) y los Barridos de Frecuencia. De

acuerdo con S. Ferreyra y O. Ramos 2008 [8] que estudiaron la obtención de las BRIRs,

concluyeron en su investigación, que cualquier tipo de señal continua de excitación (MLS o barrido

de frecuencia), con el objeto de obtener la BRIR, deberá exceder en duración el valor del T60

estimado.

Por otra parte, M. Jeub, M. Schafer, y P. Vary [17] describen una nueva base de datos de respuestas

impulsivas binaurales de un recinto, la cual denominaron Impulse Response Aachen (AIR). El

objetivo principal es la evaluación de algoritmos de mejora del habla y algoritmos de reverberación

para señales de voz y de audio en particular. Las mediciones se realizaron con un maniquí o cabeza

binaural en diferentes ambientes acústicos (una sala de oficina, sala de reuniones y sala de

conferencias). Se ha demostrado que las mediciones binaurales son esenciales para la evaluación

de algoritmos de reverberación binaural debido a los efectos de sombreado de una cabeza humana.

La explotación de estos efectos puede causar mejoras audibles. Este estudio concluyó, que las

respuestas al impulso binaurales de una sala, dan resultados más fiables cuando se desarrollan para

28

auralizaciones que son reproducidas en sistemas con técnicas binaurales como los audífonos, el

sistema OPSODIS, etc.

Como se mencionó ya, la aplicación de métodos numéricos en acústica, ha permitido la predicción

de los parámetros acústicos que miden la calidad de una sala, mediante el estudio de la respuesta

al impulso. J. Segura, L. Vera y compañía [18], en un proyecto de investigación, realizaron

diferentes auralizaciones binaurales en un recinto de múltiple uso ubicado en el Paraninfo de la

Universidad Politécnica de Valencia, y se estudiaron diferentes parámetros de calidad sonora para

analizar la respuesta sonora de la auralización en el recinto. En este experimento se calcularon

cuatro parámetros psicoacústicos (intensidad sonora o volumen, nitidez o agudeza, rugosidad de la

señal y la tonalidad). Las fuentes utilizadas para tal fin, son el habla y la música. Con estos

parámetros mencionados, se ha permitido comprobar que, para el caso del habla, hay un patrón

constante en los resultados psicoacústicos, mientras que para la música hay una variación de estos,

efecto que le atribuyen al volumen de la sala.

En una investigación hecha por Crawford-Emery y H. Lee en Reino Unido sobre las longitudes de

las Respuestas al Impulso Binaural de recintos, que fueron convolucionados con señales de audio

estereofónico, se realizaron pruebas de escucha para evaluar cómo la longitud de las BRIRs afectan

el efecto de auralización percibida y la coloración tonal del audio. Los resultados mostraron

correlaciones estadísticamente significativas entre la longitud de las BRIRs y estos dos parámetros

mencionados. El objetivo general de esta investigación, fue contribuir a la producción de un efecto

más eficaz y agradable en las auralizaciones. Como trabajo futuro basado en esta investigación,

sería la producción de modelos BRIR artificiales de 20 ms a 40 ms de longitud. Con ellos se podrá

experimentar con variables como la fase, la amplitud, el tiempo y como afectan estas las

auralizaciones [19].

Con respecto a la sensación de continuidad en el movimiento, se ha demostrado que generalmente,

la gente adulta es capaz de diferenciar entre dos fuentes sonoras separadas por 1° y 2° en el

hemisferio frontal. Con esta resolución espacial se puede generar una percepción suave cuando se

cambia de una HRIR a otra conforme al movimiento de la cabeza del oyente y al momento de

reproducir un sonido continuo y realizar un cambio de las HRIRs, no se escucharán clics audibles

[20].

29

5. Metodología

Para el desarrollo de los objetivos de este proyecto, se planteó la metodología mostrada en la Figura

5. La sala escogida para recrear las auralizaciones dinámicas, es el salón 402E de la Universidad

de San Buenaventura, Medellín, ya que en estos existen referencias de mediciones realizadas en

otros proyectos de investigación [21].

Figura 5. Diagrama de la metodología del proyecto

5.1. Medición del Tiempo de Reverberación y Ruido de Fondo

El tiempo de reverberación T30, se obtuvo de acuerdo con el estándar ISO 3382-2 con el método

de la respuesta impulsiva. Se midió el tiempo de reverberación para tres posiciones de micrófono

y una de fuente, con un micrófono de medición tipo 1, fuente omnidireccional, una interfaz de

audio y un computador portátil. Como señal de excitación se utilizó un barrido de frecuencias (sine

sweep) de 22 a 20000 Hz, el cual se generó con el software Adobe Audition. La respuesta al

impulso se obtuvo mediante el pluguin Aurora en el mismo software. En el anexo A, se muestra el

informe detallado para dicha medición. La medición del ruido de fondo, se hizo para tres posiciones

30

de micrófono durante 10 minutos cada una, para un LAeq = 50.5 dB. La figura 6 muestra la foto de

la medición de ruido de fondo.

Figura 6. Foto de medición de ruido de fondo.

5.2. Medición de las Respuestas al Impulso Binaurales del Recinto

Para medir las respuestas al impulso binaural, se siguió el procedimiento estipulado en el estándar

ISO 3382-2, con el salón completamente vacío, pero teniendo en cuenta que se tomó solo una

posición de fuente, ubicada en el centro del recinto y 91 posiciones de micrófonos, (cabeza

binaural), primero con dirección a la parte delantera de la sala en todos los puntos (Medición A), y

luego con la cabeza binaural mirando hacia la parte posterior de la sala en todos los puntos

31

(Medición B), los cuales estaban distribuidos sobre una trayectoria semi circular con un

espaciamiento de 2° entre los puntos, como se muestra en la Figura 7. Se utilizó también una fuente

direccional, y como señal de excitación, un barrido de frecuencias (sweep) de 22 a 20000 Hz. La

directividad de dicho parlante se tomó de Henriquez y Londoño [21]. En el anexo B se muestran

los detalles de esta medición.

Figura 7. Vista en planta de ubicaciones de fuente y receptor en el recinto.

5.3. Simulación de Respuestas al Impulso y Comparación de los Parámetros Objetivos

Se modeló el recinto en Catt-Acoustic, se tomaron en cuenta los coeficientes de absorción de los

materiales presentes en la sala 402E, los cuales se muestran en la Tabla 1, las posiciones de la

fuente y micrófonos, y a través del módulo prediction del software, se obtuvieron las respuestas al

impulso en cada uno de los puntos de la trayectoria. Se utilizó la directividad de la fuente JBL EON

15G2, medida previamente por Henríquez y Londoño [21].

32

Tabla 1. Coeficientes de absorción de materiales, librería del software Catt-Acoustic.

Superficie Área

Frecuencias Por Bandas de Octava (Hz)

125 250 500 1000 2000 4000

Coeficiente de Absorción Material Referencia

Piso 65,80 0,02 0,02 0,02 0,03 0,03 0,03 Baldosa Karlen

Puertas 2,00 0,20 0,25 0,20 0,17 0,20 0,10 Madera Petersen

Ventanas 10,40 0,30 0,30 0,25 0,15 0,15 0,02 Vidrio Lawrence

Tablero 6,00 0,30 0,20 0,15 0,13 0,10 0,08 Acrílico Lawrence

(Hardboard)

Paredes 74,90 0,01 0,01 0,01 0,02 0,02 0,02 Hormigón Petersen

Techo 110,30 0,01 0,01 0,01 0,02 0,02 0,02 Hormigón Petersen

Para la comparación objetiva de los parámetros acústicos de los modelos medido y simulado, se

midió la respuesta al impulso monoaural en tres posiciones de micrófono (0°, 90° y 180°) y una

posición de fuente, se utilizó un micrófono de medición, una fuente direccional, y como señal de

excitación, un barrido de frecuencias (sweep).

Una vez obtenidas las respuestas al impulso, se consiguieron los parámetros acústicos T30, C80,

IACC y EDT a través del pluguin Aurora, el cual calcula dichos parámetros de acuerdo con el

estándar ISO 3382 y a través de Catt-Acoustic para el modelo simulado y se compararon para

calibrar este último.

5.4. Creación de las Auralizaciones Dinámicas

Para obtener las auralizaciones, se aplicó el proceso de convolución entre cada una de las respuestas

al impulso medidas, con la señal de audio “semi-anecóica”, (bombardino) a través del Pluguin

Aurora. Este archivo de audio fue grabado previamente en el estudio A de la Universidad de San

Buenaventura, en un cubículo acondicionado con material absorberte, para lograr en lo posible,

una grabación sin efectos de reverberación. Las auralizaciones simuladas, se obtuvieron a través

del módulo Tuct de Catt-Acoustic.

Una vez se tuvieron las auralizaciones medidas y simuladas en los 91 puntos en la sala,

correspondientes a una trayectoria de 0° a 180° de un semicírculo, estas fueron procesadas en

MATLAB, en el cual fueron fragmentados de forma que dividiera la trayectoria con diferentes

ángulos de separación o resolución espacial: 2°, 6°, 12°, 18° y 30°. Seguidamente, a cada fracción

se le atribuyó una posición correspondiente en un vector desplazamiento y fueron concatenados,

para representar la orientación del oyente en un punto de la sala. En el anexo C se muestra el código

33

en MATLAB utilizado. El efecto Doppler no se tuvo en cuenta, por lo que cada medición se realizó

de manera independiente.

5.5. Descripción General de la Prueba Subjetiva

Con la prueba subjetiva, se evaluó la sensación de continuidad en el movimiento del receptor a

diferentes resoluciones espaciales en las auralizaciones creadas en Catt-Acoustic a partir de la

secuencia de puntos discretos, reproducidas en el sistema OPSODIS.

Para esta prueba, el encuestado evaluó la sensación de cambio continuo para audios con diferentes

resoluciones espaciales entre puntos: 2°, 6°, 12°, 18° y 30° de separación y se reprodujeron

aleatoriamente. Se utilizó también una ayuda visual con el recorrido realizado por el receptor en la

sala, para lograr una mejor identificación de la localización; y unos paneles acústicos para

contrarrestar, según Takeuchi y Nelson [24], las posibles reflexiones que se podrían presentar en

ambientes no anecóicos, como es el caso, y evitar así falencias en la percepción correcta del sonido.

Se utilizó el método diferencial semántico para la elaboración del test. Este consiste en la

utilización de una escala, que en este caso fue de 1 a 4, donde 1 es la puntuación mínima y

representa la idea más pobre, y 4 es la puntuación máxima y representa el ideal de reproducción

más parecido con respecto al audio de referencia [22].

5.5.1. Selección de la población y determinación del tamaño de la muestra.

Para este caso, en la prueba de escucha crítica se escogió una población (N) de 80, pertenecientes

al número de estudiantes de séptimo, octavo, noveno y décimo semestre de ingeniería de sonido

para el periodo 2015-1. Se escogió esta población debido a que éstos presentan algún tipo de

experiencia en la temática expuesta en este proyecto y en entrenamiento auditivo. Para determinar

el número de la muestra, se eligió un nivel de confianza (Z) del 95%, que es la desviación del valor

medio que se acepta para lograr el nivel de confianza deseado, en este caso Z=1,96 según la

distribución normal; el margen de error máximo admitido (e), fue del 5% y una proporción (p) del

50%, que es el valor usado típicamente. Así, el tamaño de la muestra (n), está dado por la ecuación

(7). [14]:

𝑛 =𝑁𝑍2𝑝(1−𝑝)

(𝑁−1)𝑒2+𝑍2𝑝(1−𝑝) (7)

34

Lo que da como resultado, una muestra de 66 personas. No obstante, debido a la falta de tiempo,

disponibilidad de estudiantes y espacios, se recogió una muestra de 50 personas.

35

6. Resultados

6.1. Comparación Objetiva

A continuación, se muestran los resultados de la comparación objetiva del recinto medido y

simulado, así como los de la prueba de escucha crítica. El modelo se ajustó en términos del T30

medido en la sala. En las figuras 8 a 11, se muestran las gráficas de dichas comparaciones. En las

gráficas del T30, se observa que el tiempo de reverberación más alto fue de 4 segundos

aproximadamente en la banda de 250 Hz para las posiciones de 0°, 90° y 180° tanto en la medición

como en la simulación; y en la banda de 4kHz, disminuyó por debajo de los 3 segundos para las

mismas posiciones.

Figura 8. Gráficas de EDT para el aula 402E.

A) Posición 0°, B) Posición 90°, C) Posición 180°.

36

Figura 9. Gráficas de T30 para el aula 402E.


37

Figura 10. Gráficas de IACC para el aula 402E.


38

Figura 11: Gráficas de C80 para el aula 402E.


6.2. Prueba de escucha crítica

La prueba de escucha crítica se realizó para 50 estudiantes de los últimos semestres de ingeniería

de sonido de la Universidad de San Buenaventura Medellín, (7° a 10° semestre). Se les solicitó

evaluar la sensación de continuidad en el movimiento de una fuente en una trayectoria semicircular

de 180°. Los encuestados escucharon 20 audios, correspondientes a auralizaciones dinámicas con

diferentes resoluciones espaciales, tanto para la configuración A, como para la configuración B y

evaluaron en una escala de 1 a 4 donde:

1.- Ninguna sensación de continuidad

2: Poca sensación de continuidad

3: Moderada sensación de continuidad

4: Mucha sensación de continuidad

En el anexo D, se puede encontrar el formato completo utilizado para realizar esta encuesta.

39

6.2.1. Coeficientes de asimetría y de variación

Se analizaron los resultados en términos de los coeficientes de asimetría y de variación.

Tabla 2. Coeficiente de asimetría para resoluciones espaciales en configuraciones A y B.

Resol. Espacial Med. A Sim. A Med. B Sim. B

2° -0,16 -0,18 -0,21 0,00

6° -0,33 -0,23 -0,18 0,06

12° -0,22 -0,54 -0,12 -0,12

18° 0,00 0,06 -0,20 0,38

30° 0,12 0,00 -0,06 0,12

Tabla 3. Coeficiente de variación para resoluciones espaciales en configuraciones A y B.

Resol. Espacial Med. A Sim. A Med. B Sim. B

2° 39,18 41,75 37,60 42,95

6° 37,01 39,06 41,75 42,84

12° 37,90 33,07 41,84 34,31

18° 41,40 44,39 37,27 31,69

30° 44,83 42,52 41,88 45,33

6.3. Contraste No Paramétrico

Dado que no todas las muestras, de calificación de continuidad, provienen de una distribución

normal; se contrastará la diferencia entre muestras –tanto en las distribuidas normalmente como

las que no– a través de pruebas no paramétricas, las cuales no exigen los supuestos clásicos de

normalidad.

6.3.1. Contraste en Medición A

Los 50 encuestados calificaron los audios en una escala Likert de 1 a 4 –siendo 1 la calificación

subjetiva mínima y 4 la máxima–, comparando la continuidad de cada uno con la de un audio piloto

–el cual tiene una resolución espacial de 2°, correspondiente al de mayor continuidad–.

La Figura 12 evidencia la puntuación mediana según ángulo de resolución espacial además del

rango inter cuartílico de dicha puntuación.

40

Figura 12. Boxplot de puntuación vs grado de resolución, en medición A.

Ahora bien, se realizó una prueba ANOVA no paramétrica de Kruskall-Wallis para muestras

pareadas, (que compara medianas en vez de medias), para contrastar si existen diferencias

significativas entre calificaciones de acuerdo con cada ángulo de resolución y la calificación piloto

correspondiente al ángulo de dos grados sexagesimales.

Hipótesis estadística: A menor ángulo de resolución espacial, la sensación de continuidad en el

movimiento del receptor, es mejor percibida que en el resto de casos.

Hipótesis Nula (H0): No existen diferencias significativas en las medianas de la variable sensación

de continuidad del movimiento, entre auralizaciones medidas, simuladas y con diferentes

configuraciones en cuanto a la posición del receptor.

Hipótesis Alterna (HA): Sí existen diferencias significativas en las puntuaciones de la variable

sensación de continuidad en el movimiento entre auralizaciones medidas, simuladas y con

diferentes configuraciones en cuanto a la posición del receptor.

Prueba ANOVA

𝐻0: 𝑀𝑒𝑖 = 𝑀𝑒𝑗 ∀ 𝑖 ≠ 𝑗 𝑖, 𝑗 = 2°, 6°, 12°, 18°, 30°

𝐻𝐴: 𝑀𝑒𝑖 ≠ 𝑀𝑒𝑗 ∀ 𝑖 ≠ 𝑗

30181262

4.0

3.5

3.0

2.5

2.0

1.5

1.0

Ángulo

Cali

ficacio

n_M

A

Boxplot of Calificacion_MA

41

Se obtuvo el siguiente resultado (software SPSS®):

Tabla 4. Resultados de la prueba Kruskall-Wallis para la medición A.

Ángulo N Mean Rank

Medición A

2 25 152.10

6 50 134.99

12 50 110.27

18 50 96.85

30 50 90.34

Total 225

Valor p = 0.000

El valor-p del estadístico de prueba, sugiere que se rechaza la hipótesis nula en favor de la

alternativa con una confianza del 95%. Entonces se realizaron pruebas pareadas para saber si

existen diferencias significativas entre cada par de resoluciones espaciales.

6.3.2. Contraste en Simulación A

La Figura 13 representa la calificación mediana de percepción de continuidad en la simulación.

Los audios emulados tienden a ser menos precisos que los medidos, por ello las variaciones de las

puntuaciones son mayores en la simulación que en la medición, como se muestra en la Tabla 4.

Figura 13. Boxplot de la puntuación vs grado de resolución, en simulación A

Análogamente al experimento de medición, se contrastó un test no paramétrico de Kruskall-Wallis,

a fin de estimar si hay diferencias significativas entre puntuaciones en la simulación.

30181262

4.0

3.5

3.0

2.5

2.0

1.5

1.0

Ángulo

Cali

ficacio

n_S

A

Boxplot of Calificacion_SA

42

𝐻0: 𝑀𝑒𝑖 = 𝑀𝑒𝑗 ∀ 𝑖 ≠ 𝑗 𝑖, 𝑗 = 2°, 6°, 12°, 18°, 30°


Se obtuvo el siguiente resultado (software SPSS®):

Tabla 5. Resultados de la prueba Kruskall-Wallis para la simulación A.

Ángulo N Mean Rank

Simulación A

2 25 136.58

6 50 138.20

12 50 117.77

18 50 91.87

30 50 92.37

Total 225

P-Value = 0.000

Con un 95% de confianza, se rechaza la hipótesis nula entre auralizaciones para la sensación de

continuidad en movimiento.

6.3.3. Contraste en Medición y Simulación B

En la Figura 14 se presenta las gráficas de puntuación de sensación de continuidad en la mediación

y simulación ‘B’; éstas difieren de sus homólogas ‘A’ en que la fuente de sonido está detrás del

receptor.

Figura 14. Puntuación mediana vs grados de resolución, medición B y simulación B

Se contrastó un test no paramétrico de Kruskall-Wallis a fin de estimar si hay diferencias

significativas entre las puntuaciones, tanto mediciones como simulaciones, de diferentes

auralizaciones.

30181262

4.0

3.5

3.0

2.5

2.0

1.5

1.0

Ángulo

Cali

ficacio

n_M

B

Boxplot of Calificacion_MB

30181262

4.0

3.5

3.0

2.5

2.0

1.5

1.0

Ángulo

Cali

ficacio

n_S

B

Boxplot of Calificacion_SB

43

𝐻0: 𝑀𝑒𝑖 = 𝑀𝑒𝑗 𝑖, 𝑗 = 2°, 6°, 12°, 18°, 30°


Se obtuvieron los resultados mostrados en la tabla 6. (software SPSS®):

Tabla 6. Resultados de la prueba Kruskall-Wallis para la medición y simulación B.

Ángulo N Mean Rank

Medición B

2 25 130.92

6 50 123.71

12 50 105.96

18 50 110.03

30 50 103.34

Total 225

Valor-P: 0.088

Ángulo N Mean Rank

Simulación B

2 25 134.74

6 50 119.50

12 50 118.42

18 50 107.24

30 50 95.97

Total 225

Valor-P: 0.245

Tanto para los audios emulados como los medidos, existe suficiente evidencia para afirmar que las

puntuaciones medianas de sensación de continuidad son iguales entre diferentes grados de

resolución espacial, con un 95% de confianza.

6.3.4. Prueba de Wilcoxon para muestras pareadas

La prueba no paramétrica de Wilcoxon permite comparar muestras pareadas. De este modo la

mediana de la puntuación asignada, según cada ángulo, se contrasta contra la del ángulo de

referencia: dos grados sexagesimales.

Así, la hipótesis nula es que la mediana de cada puntuación (según ángulo) no difiere

significativamente de la puntuación mediana del ángulo de referencia (2°).

𝐻0: 𝑀𝑒2° = 𝑀𝑒𝑖 𝑖 = 2°, 6°, 12°, 18°, 30°

𝐻𝐴: 𝑀𝑒2° ≠ 𝑀𝑒𝑖

Así, se tiene un mejor contraste al comparar variable por variable. Los resultados de las pruebas

son (software STATA®):

44

Tabla 7. Resultados de la Prueba de Wilcoxon para muestras pareadas.

Experimento Contraste Valor-P Experimento Contraste Valor-P

Medición A

2° vs 6° 0.5694

Medición B

2° vs 6° 0.9412

2° vs 12° 0.7249 2° vs 12° 0.8390

2° vs 18° 0.2586 2° vs 18° 0.8972

2° vs 30° 0.1316 2° vs 30° 0.5127

Simulación A

2° vs 6° 0.7250

Simulación B

2° vs 6° 0.8949

2° vs 12° 0.1057 2° vs 12° 0.1668

2° vs 18° 0.4298 2° vs 18° 0.6497

2° vs 30° 0.3524 2° vs 30° 0.4624

Homólogamente, a la prueba ANOVA de Kruskall-Wallis la mayoría de las pruebas pareadas de

Wilcoxon resultaron en diferencias no significativas al 80% de confiabilidad, a excepción de 30°

en la medición A, 12° en la simulación A y 12° en la simulación B.

Por ello, hay suficiente evidencia estadística para concluir que las medianas de cada una de las

puntuaciones no difieren significativamente respecto a la mediana de la puntuación de referencias

(2 grados sexagesimales).

45

7. Discusión

7.1. Prueba Objetiva

Con el fin de ajustar el modelo simulado para que fuera similar al recinto medido, se obtuvieron

los parámetros acústicos EDT, C80, y T30, a través de las respuestas al impulso monoaurales y

además, el parámetro IACC, que se obtuvo de las respuestas al impulso binaurales, en ambos casos

para las posiciones 0°, 90° y 180°.

Los resultados de la simulación, muestran una respuesta similar a la sala en términos del tiempo de

reverberación, en frecuencias bajas con valores entre 3 y 4 segundos, cuando la mayoría de

estándares y recomendaciones especifican un máximo entre 0.4 y 0.8 segundos en las bandas de

500, 1k y 2k Hz o para el promedio aritmético en estas bandas (TRmedio) para las aulas de clase.

No obstante, sólo Bélgica, ASHA, el Reino unido, Australia, Nueva Zelanda y ANSI especifican

que este tiempo de reverberación es para salones desocupados [27]; y en frecuencias altas por

debajo de los 3 segundos como se muestra en la Figura 9. Para el caso del EDT simulado, los

resultados muestran una diferencia aproximadamente de 1 segundo (ver Figura 8), es decir, que

está ligeramente por debajo del tiempo de decaimiento temprano medido pero con tendencia similar

y en el caso del IACC y C80, existen mayores discrepancias (ver figuras 10 y 11). El parámetro

C80 da valores negativos, por lo que se puede inferir de acuerdo con la definición, que no es muy

representativo para evaluar la sala ya que ésta es demasiado viva de acuerdo con el tiempo de

reverberación. El IACC en las frecuencias bajas, tiende a 1 lo que indica que hay una mejor

correlación en estas frecuencias entre ambos oídos, contrario a lo que pasa en las frecuencias altas

que tiene un valor entre 0 y 0,2 aproximadamente en las posiciones 0° y 180° para medición y

simulación.

7.2. Prueba de escucha crítica

Después de obtener los resultados de la prueba de escucha crítica, se analizaron los coeficientes de

asimetría y variación para cada una de las resoluciones espaciales en las configuraciones A y B.

En general, el coeficiente de asimetría es muy cercano a 0, lo que indica que existe la misma

concentración de valores a la derecha y a la izquierda de la media. De igual manera, el coeficiente

de variación para los mismos datos, no supera el 50% lo que indica que hay una tendencia a que

exista homogeneidad en la variable.

46

Para verificar si esas diferencias entre las resoluciones espaciales medidas y simuladas son

estadísticamente significativas, debe observarse el valor de probabilidad asociado (p), es decir que

la hipótesis nula tiene mucha probabilidad de ocurrencia y por lo tanto no se rechaza. En

consecuencia, las diferencias entre las mediciones y simulaciones para la mayoría de las

resoluciones espaciales no son significativas. Esto quiere decir que las personas encuestadas no

percibieron diferencias en la sensación de continuidad para la trayectoria y el recinto establecido

de acuerdo con los resultados de la encuesta. Sin embargo, se debe considerar el hecho de que los

oyentes sí notaron movimiento del receptor en la sala evaluada, de lo que se infiere que el método

utilizado en este proyecto para realizar las auralizaciones dinámicas funciona.

47

8. Conclusiones

La sensación de continuidad en el movimiento del receptor en términos de la resolución espacial,

para una trayectoria semi circular de 180°, que para el caso fueron respuestas al impulso tomadas

cada 2° 6°, 12°, 18°, y 30°, no se percibe en la sala evaluada, de acuerdo con los resultados de la

prueba de escucha crítica, debido a que como se observa en la prueba objetiva, los parámetros

acústicos medidos y simulados son similares, sobre todo el en tiempo de reverberación T30, por lo

que los encuestados no notaron diferencias significativas en la continuidad del movimiento con

dichas resoluciones espaciales.

Además, el sistema de reproducción OPSODIS no está diseñado para que el receptor escuche

adecuadamente cuando la fuente se ubica detrás del receptor, esto podría explicar la dificultad de

los encuestados para notar diferencias en la continuidad del movimiento para el caso de la

configuración B, en la cual el receptor estaba de espaldas a la fuente.

Se puede observar que, en la prueba pareada para la medición A, existe diferencia significativa con

80% de confianza para 30° De la misma manera que para 12° en las simulaciones A y B. Sin

embargo, estos resultados se tomaron como casos aislados porque son los únicos que se presentaron

con diferencia significativa (3 casos de 16 posibles).

El método mostró ser adecuado para representar movimiento relativo de la fuente, pues las personas

encuestadas notaron la diferencia en los cambios de posición de la misma, independientemente de

la resolución espacial que se estuviera considerando, esto a pesar de que no se contaba con el

módulo de Catt-Acoustic especializado en realizar este tipo de auralizaciones dinámicas.

Se recomienda para trabajos futuros, realizar las mediciones y simulaciones en otro tipo de sala

con menor tiempo de reverberación y analizar la sensación de continuidad de acuerdo con la

resolución espacial, para evaluar y comparar el método y las configuraciones utilizadas en este

proyecto.

48

9. Referencias

[1] M. Vorländer, “Signal processing for auralization”, en Auralization: Fundamentals of

Acoustics, Modelling, Simulation, Algorithms and Acoustic Virtual Reality, Ed. Springer: Aachen,

2008, pp. 103-106.

[2] B.I Dalenbäck, M. Strömberg “real time walkthrough auralization - the first Year”, Proceedings

of the Institute of Acoustics, Vol 28, pp. 2, 2006.

[3] Reproduccion de audio 3D con sistema opsodis. [En linea]. Disponible:

http://www.docfoc.com/reproduccion-de-audio-3d-con-sistema-opsodis

[4] R. E. Montell Serrano, “Sistemas De Realidad Virtual Para El Estudio Del Campo Acústico De

Edificios Del Patrimonio Artístico-Cultural”, Tesina de Máster, Dep. de Física aplicada,

Universidad Politécnica de Valencia, Valencia, 2010.

[5] M. Abad Sorbet, “Estudio Acústico y electroacústico de la sala de concierto Ritmo y Compás

(Madrid)”, Trabajo fin de Máster, Dep. Ing. Acústica, Politécnica, Madrid.

[6] U.N.S, “Análisis de Fourier”, en Procesamiento Digital de Señales, Buenos Aires, 2011, pp.

141-169.

[7] L. A. Teyssier, “Reverberación por convolución utilizando un fpga. Capitulo 2” 2009. [En

línea]. Disponible en [Último acceso: 31 01 2014]:

http://catarina.udlap.mx/u_dl_a/tales/documentos/lep/teyssier_r_la/capitulo2.pdf.

[8] S. Ferreyra y R. Oscar, “Análisis Físico-Acústico-Espacial De Respuestas Impulsivas

Binaurales (Brir) Obtenidas Por Métodos Indirectos” 6° Congreso Iberoamericano de Acústica -

FIA 2008, vol. 6, pp. 11, noviembre, 2008.

[9] M. Kittiphong y H. Dorte, “The time when the reverberation tail in a binaural room impulse

response begins”, Audio Engineering Society, p. 9, 2003.

[10] K. Usategi de la Peña, “Procesador de sonido y estudio de métodos de interpolación de la

localización de fuentes basados en HRTFs para la generación de audio 3D”, Tesis de Máster,

Universidad Politécnica de Valencia, Gandia, 2010.

[11] C. Martínez, “Conceptos Generales”, en Estadistica y Muestreo, Ed. ECOE ediciones Ltda:

Bogotá, 2012, pp. 2.

[12] E. Navarro, “Guía para la interpretacion de resultados en el contraste de hipotesis estadisticas”

[En linea]. Disponible en: http://es.slideshare.net/navarroenrique/gua-contraste-de-hiptesis-blog.

[13] M. Suarez, y F. Tapia, “Interaprendizaje de Estadística Básica”, UniversidadTécnica de Norte

Ibarra, Ecuador 2012.

[14] C. Ochoa, “NETQUEST”, [En línea]. Disponible en: http://www.netquest.com/es/blog/que-

tamano-de-muestra-necesito/. [Último acceso: 30 Enero 2015].

49

[15] J. Serret, “Distribucion de probabilidad”, en Procedimientos estadisticos con statgraphics, Ed.

ESIC Editorial: Madrid, 1998, pp. 150.

[16] F. Tommasini, A. Mariano y R. Oscar, “Auralización en tiempo real: implementación del

modelo del oyente”, 2° Congreso Internacional de Acústica UNTREF, vol. 2, pp. 10, Septiembre,

2010.

[17] M. Jeub, M. Schafer y P. Vary, “A Binaural Room Impulse Response Database For The

Evaluation Of Dereverberation Algorithms”, Institute of Communication Systems and Data

Processing, pp. 5, 2009.

[18] J. Segura, L. Vera, A. Barba, R. G. A. Lakatis, M. Fernández, R. Cibrián, S. Cerdá y J. Romero,

“Estudio de parámetros de calidad sonora de señal música y habla auralizada en una sala de uso

múltiple”, Cádiz 2009, pp. 7, 2009.

[19] R. Crawford-Emery y H. Lee, “The subjective effect of BRIR length perceived headphone

sound externalisation and tonal colouration”, Audio Engineering Society, pp. 9, 2014.

[20] F. Tommasini, “Sistema de simulación acústica virtual en tiempo real”, Tesis Doctoral, Dep.

Ciencias Exactas, Físicas y Naturales, Universidad Nacional de Córdoba, Córdoba, 2012.

[21] Henriquez Romero, Mario Alfonso and Londoño Rentería, Ángel David, “Evaluación de

auralizaciones creadas mediante métodos numéricos basados en acústica geométrica y

reproducidas en el sistema de reproducción binaural OPSODIS,” Proyecto de grado, Universidad

de San Buenaventura, 2014.

[22] M. Yepes y S. Bayer, “Estudio Comparativo De Prototipos De Pabellón Auditivo Para Captura

Binaural”, Medellín: Biblioteca digital Universidad de San Buenaventura, 2014.

[23] D. Urrego “impacto de las condiciones acústicas en la inteligibilidad y la dificultad de escucha

en tres aulas de la universidad de san buenaventura medellín, sede san benito”, Medellín: Biblioteca

digital Universidad de San Buenaventura, 2014.

[24] T. Takeuchi y P. Nelson, “Optimal source distribution for binaural synthesis over

loudspeakers,” Journal of the Acoustical Society of America, vol. 112, no. 6, pp. 2786–2797, 2002.

[25]T. Takeuchiy P. Nelson,“Extension of the optimal source distribution for binaural sound

reproduction,” Acta Acustica united with Acustica, vol. 94, pp. 981–987, 2008.

[26] Ditutor. (2010) Ditutor. [Online].

http://www.ditutor.com/distribucion_binomial/distribucion_binomial.html

[27] C. L. C. Lam, “Improving the speech intelligibility in classrooms,” Tesis para PhD, The Hong

Kong Polytechnic University, 2010.

http://www.ditutor.com/distribucion_binomial/distribucion_binomial.html

50

10. Anexo A. Informe de Medición: Tiempo de Reverberación

Fecha y hora de la medición: 06 / 05 / 2015 9:00 a.m. – 12:00 p.m.

Aula 402E: Aula con un volumen de 200 m3 aprox. Localizada en el edificio de ingenierías de la

universidad de San Buenaventura bloque E. En la tabla 8, se muestra el área y material de las

superficies que componen dicho recinto.

Tabla 8. Área y material de las superficies del aula 402 E.

Superficie Material Área

Piso Baldosa 64.4

Puerta Madera 2.34

Ventanas Vidrio 10.73

Tableros - 5.8

Paredes Concreto pintado 94.03

Techo Concreto 83.96

La medición del tiempo de reverberación se realizó por el método de la respuesta impulsiva de la

sala, como lo estipula la norma ISO 3382-2:2008, sin presencia de personas y sillas (Sala vacía).

Se utilizó un micrófono de medición tipo 1, una fuente omnidireccional 01dB OMNI12, una

interfaz de audio M-Audio MobilePre y dos computadores portátiles para la reproducción de la

señal de excitación y la captura de la señal emitida. Esta señal correspondió a un barrido de

frecuencias (sweep) de 22 a 20000 Hz. La cantidad de puntos seleccionados corresponde a tres

posiciones de micrófono y una de fuente, debido a que se basó en la configuración de la trayectoria

estipulada para este proyecto. Las respuestas al impulso obtenidas, se procesaron a través del

pluguin Aurora en Adobe Audition. En la tabla 9, se muestran los resultados, para cada una de las

frecuencias.

Tabla 9. Tiempo de reverberación T30 [s] y desviación estándar para el promedio.

De acuerdo a la ISO 3382-2.

Banda [Hz] Pos 1 [0°] Pos 2 [90°] Pos 3 [180°] Promedio

125 3,45 3,79 3,20 3.48 ± 0,29

250 3,92 4,08 3,50 3,83 ± 0,29

500 3,61 3,81 3,73 3,72 ± 0,10

1000 3,48 3,29 3,42 3,40 ± 0,09

2000 3,05 2,92 3,04 3,00 ± 0,07

4000 2,67 2,67 2,64 2,66 ± 0,01

51

11. Anexo B. Informe de Medición: Respuesta a Impulso Binaural

Fecha y hora de medición A: 06 / 05 / 2015 9:00 a.m. – 12:00 p.m.

Fecha y hora de medición B: 07 / 09 / 2015 10:00 a.m. – 2:00 p.m.

EQUIPOS UTILIZADOS

Un parlante JBL EON 15 G2

Una interfaz de audio M-Audio MobilePre

Dos computadores portátiles

Una cabeza binaural 01 dB Cortex Mk2b

Interfaz 01dB Symphonie Pro 280

En la figura 15, se muestra la configuración utilizada para la medición de la respuesta al impulso

binaural.

Figura 15. Configuración para la medición de la respuesta al impulso binaural.

Las señales capturadas por los micrófonos de la cabeza binaural, fueron procesadas con los pluguin

Aurora en el software Adobe Audition donde se obtuvieron la respuesta al impulso binaural en los

puntos establecidos a lo largo de la trayectoria. En las figuras 16 y 17, se muestran las fotos de la

sala 402E durante la medición.

52

Figura 16. Foto de la medición A de las respuestas al impulso binaural.

53

Figura 17. Foto de la medición B de la respuesta al impulso binaural.

54

12. Anexo C. Código de MATLAB

% Pedir al usuario ingresar el paso en grados

step = input ('Ingrese la densidad espacial para la cual quiere separar el audio: [2,6,12,18,30]: ');

pasos = 0:step:180;

numeroAuralizaciones = length(pasos);

% Aquí se obtiene un vector de nombres de archivos para la resolución elegida

nombres = cell(numeroAuralizaciones,1);

for k=1:numeroAuralizaciones

nombreArchivo = sprintf('POS %i°.wav',pasos(k));

nombres{k} = nombreArchivo;

end

%% Leer archivos de audio

[primerArchivo,fs] = audioread(nombres{1});

numeroMuestras = length(primerArchivo);

t = numeroMuestras/fs;

t = t-2.2;

numeroMuestras = t*fs;

matrizAuralizaciones = cell(numeroAuralizaciones,1);

for i=1:numeroAuralizaciones

matrizAuralizaciones(i) = {audioread(nombres{i})};

end

% Son los audios de la misma longitud si no recortar a una longitud de 15 * 44100

%% Función para partir cada reducir matriz

% Nota se coge cada [2,6,12,18,30] grados así que la matriz de

% auralizaciones tendrá [91,31,16,11,7] columnas.

55

longitudVentana = floor(numeroMuestras / numeroAuralizaciones);

bloques = cell(numeroAuralizaciones,1);

for i = 1:numeroAuralizaciones

rangoDeLectura = longitudVentana*(i-1):longitudVentana*i;

rangoDeLecturaInicial = 1:longitudVentana;

if (i-1) ~= 0 && i ~= numeroAuralizaciones

bloque = matrizAuralizaciones{i}(rangoDeLectura,(1:2));

bloques(i) = {bloque};

elseif i == numeroAuralizaciones

bloque = matrizAuralizaciones{i}(longitudVentana*(i-1):end,1:2);


else

bloque = matrizAuralizaciones{i}(rangoDeLecturaInicial,1:2);


end

end

%% Escribir archivo de audio

nombreArchivoEscritura = sprintf('archivoFinal %i.wav',step);

audioFinal = cell2mat(bloques);

audiowrite(nombreArchivoEscritura,audioFinal,fs);

56

13. Anexo D. Formato para la Prueba Subjetiva

PRUEBA DE ESCUCHA CRÍTICA

INVESTIGACIÓN: ANÁLISIS DE AURALIZACIONES DINÁMICAS BASADAS EN

ACÚSTICA GEOMÉTRICA Y REPRODUCIDAS EN EL SISTEMA OPSODIS.

Fecha (D-M-A): ____-____-______

Género: Femenino____ Masculino____

Edad (años): 16-20___ 21-25___ 26-30___ 31-35___ 35-40___

OBJETIVO: Evaluar las auralizaciones dinámicas en términos de la sensación de continuidad en

el movimiento, a través de la escucha crítica.

A continuación, se reproducirán 20 audios, correspondientes a un bombardino, los cuales recorren

una trayectoria semi-circular de 180°, como se muestra en el video. Por favor califique según su

criterio, la sensación de continuidad en el movimiento para dicha trayectoria. Entiéndase esto,

como la capacidad que tiene usted de percibir si en el movimiento de la fuente sonora ocurren

saltos, notables o no, en el recorrido de la misma en el espacio. Marque la casilla correspondiente

según la escala de 1 a 4 donde:

1: Ninguna sensación de continuidad

2: Poca sensación de continuidad

3: Moderada sensación de continuidad

4: Mucha sensación de continuidad

Nota: A modo de sugerencia, usted puede tomar como referencia el primer archivo de audio

reproducido, y pedir al responsable de la prueba, repetir cada uno de los audios las veces que

considere necesario.

Audio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Continuidad

57

14. Anexo E. Certificado de Calibración

Date post:	04-Nov-2021
Category:	Documents
Upload:	others
View:	5 times
Download:	0 times

COMPARACIÓN DE AURALIZACIONES DINÁMICAS GENERADAS A …

Documents