ES2399160A1 - Métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico - Google Patents

Métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico Download PDF

Info

Publication number
ES2399160A1
ES2399160A1 ES201130637A ES201130637A ES2399160A1 ES 2399160 A1 ES2399160 A1 ES 2399160A1 ES 201130637 A ES201130637 A ES 201130637A ES 201130637 A ES201130637 A ES 201130637A ES 2399160 A1 ES2399160 A1 ES 2399160A1
Authority
ES
Spain
Prior art keywords
sound
space
virtual
amplitude
environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
ES201130637A
Other languages
English (en)
Other versions
ES2399160B2 (es
Inventor
Antonio Raúl LEAL RAMÍREZ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to ES201130637A priority Critical patent/ES2399160B2/es
Publication of ES2399160A1 publication Critical patent/ES2399160A1/es
Application granted granted Critical
Publication of ES2399160B2 publication Critical patent/ES2399160B2/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

Se han definido una serie de conceptos, métodos y aparatos con el objetivo de facilitar el control y tratamiento de sonidos en un sistema de sonido envolvente multicanal. La principal aplicación considerada es la optimización de la "localización virtual" de una fuente sonora en cualquier entorno acústico en donde se disponga de un sistema de sonido multicanal y de los medios adecuados para implementar los métodos aquí considerados. Para ello, en primer lugar, se procede a la caracterización del entorno acústico y el sistema reproductor multicanal durante el proceso de "calibración espacial" del sistema, tras lo cual se diseñan mediante diversos algoritmos las mejores estrategias de codificación de sonidos en dicho entorno, dejando siempre el control final de estos parámetros a cada usuario particular del sistema. Posteriormente, durante el proceso de reproducción, el sistema podrá localizar virtualmente las fuentes sonoras en el entorno acústico con la máxima calidad posible en función del número de altavoces del sistema reproductor y su distribución física por dicho entorno. Los conceptos presentados en la exposición de la presente invención pueden ser extendidos y aplicados a numerosos aspectos del tratamiento general de sonidos en sistemas de sonido multicanal, tales como el diseño de novedosos efectos sonoros mediante la manipulación de espacios sonoros virtuales, la creación de nuevas técnicas para la simulación de recintos virtuales así como de fuentes sonoras localizadas virtualmente tanto dentro como fuera del entorno acústico, o el desarrollo de una codificación espacial de sonidos que es una síntesis de las técnicas utilizadas por los sistemas WFS y HOA.

Description

Métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico.
Sector de la técnica
La presente invención hace referencia a una serie de conceptos, métodos y aparatos para el tratamiento de señales sonoras en sistemas de sonido envolvente multicanales y, más concretamente, a la aplicación de éstos en el diseño y optimización de la síntesis de fuentes sonoras virtuales utilizando este tipo de sistemas (tanto para configuraciones 2D como 3D) en cualquier clase de recinto o entorno acústico.
Estado de la técnica
El tratamiento de sonidos en sistemas de sonido envolvente multicanales trata habitualmente con el problema de cómo recrear un determinado campo sonoro original en un cierto entorno, incluyendo la información de en dónde se encuentran localizadas las fuentes sonoras en dicho espacio. Existen numerosos algoritmos (también llamados ‘codificaciones’ o simplemente ‘sistemas’) para conseguir este objetivo que pueden dividirse en dos grandes familias: Los llamados ‘Sistemas Locales’ que intentan recrear el campo sonoro incidente en un punto particular del espacio, ejemplos de tales sistemas serían el sistema Estereofónico, el sistema Ambisónico [M.A. Gerzon, 1973], o el sistema VBAP [V. Pulkki, 1997] (del inglés ‘Vector Based Amplitude Panning’). Por otro lado, existen también los llamados ‘Sistemas Globales’ los cuales intentan recrear un determinado campo sonoro en una cierta área extensa, tales como el sistema WFS [A. J. Berkhout, D. de Vries, P. Vogel, 1988] (del inglés ‘Wave Field Synthesis’), los sistemas HOA [J. Daniel, R. Nicol, S. Moreau, 2003] (del inglés ‘High Order Ambisonics’), o la técnica de Audio Holofónico [M.
A. Polletti, 2000].
La calidad en los sistemas de sonido envolvente puede medirse por los conceptos de homogeneidad, precisión y estabilidad [D.G. Malham, 1999]. Un sistema de sonido envolvente ideal no debe tratar preferentemente a ninguna dirección del espacio particular (homogéneo), debe situar exactamente la localización de fuentes sonoras en el espacio (preciso), y debe asegurar que esa pretendida localización espacial se mantenga estable respecto al movimiento del oyente (coherente o estable). Además, estos sistemas deberán cumplir el requisito de “alta fidelidad” (“Hi-Fi” en inglés) que en su sentido más amplio significa fidelidad a las intenciones originales del compositor musical y, por lo tanto, los sistemas de sonido tendrían que incluir todos los aspectos espaciales de la representación sonora, además de los más obvios requerimientos de respuesta en frecuencia plana y baja distorsión.
Cada uno de los sistemas desarrollados hasta el momento tiene sus propias ventajas e inconvenientes en cuanto a la calidad ofrecida en la localización espacial de fuentes sonoras. En general, la calidad de los Sistemas Globales, tales como WFS, Holofónico o HOA, es muy superior con respecto a los Sistemas Locales, pero al costo de requerir un número extra de canales de audio para una reproducción de sonidos óptima. Estos sistemas funcionan reconstruyendo físicamente el campo sonoro original sobre una cierta área de escucha, al menos hasta una determinada frecuencia óptima de funcionamiento que depende de la disposición y número de altavoces del sistema reproductor. Aunque estos sistemas fueron concebidos partiendo de planteamientos muy diferentes están íntimamente relacionados entre sí, tal y como ha sido demostrado [M.A. Polletti, 2000].
En los Sistemas Locales, la principal técnica de simulación de la localización virtual de fuentes sonoras utilizada se conoce con el nombre de ‘Panorámico de Amplitud’ [S. Bleda Pérez, 2000], [V. Pulkki, 1997] que consiste en posicionar una fuente sonora controlando el escalado en amplitud de la misma señal entre un par de altavoces de manera que la potencia sonora permanezca constante en todas las posiciones intermedias entre ambos. Comercialmente, los sistemas estándar de sonido envolvente (formatos 5.1, 6.1, 7.1, etc.) utilizan una codificación bastante deficiente en cuanto a la calidad ofrecida según los parámetros comentados anteriormente, hasta el punto de poder afirmarse que estos sistemas son no homogéneos, imprecisos y poco coherentes. Esto se debe a que en su desarrollo histórico provienen de un Sistema Local, extensión del ‘Sistema Estereofónico’, y cuya principal aplicación fue, y sigue siendo, la reproducción de sonidos para películas y material audiovisual.
Existen numerosas propuestas para optimizar el espacio sonoro recreado por un sistema de sonido envolvente multicanal mediante un método de calibración (véanse por ejemplo [US Patent No. 7123731, 2001], [US Patent No. 6856688, 2001]), diseñadas con el propósito de afectar la posición del llamado ‘sweet spot’, el cual hace referencia a la región de escucha óptima en un Sistema Local. Ninguna de estas propuestas se ocupa de cómo aplicar la calibración del entorno acústico para el diseño de una codificación de sonidos Global, o investigan las profundas implicaciones que tal calibración supone para un entorno acústico en donde se encuentra emplazado un sistema de sonido envolvente multicanal.
Sería por tanto deseable la obtención de un método para el tratamiento de sonidos en sistemas de sonido multicanal que proporcionara la máxima calidad posible independientemente del entorno acústico, o del número y características de los altavoces del sistema reproductor utilizado. Este método debería integrar y utilizar los diferentes tipos de codificación espacial existentes (tanto Locales como Globales), permitiendo la elección de los parámetros de localización de sonidos al usuario final del sistema (dependiendo de la aplicación que se le va a dar al sistema de forma más inmediata), y adaptándose de manera óptima a cada entorno de reproducción automáticamente.
La presente descripción define pues una serie de conceptos que permiten construir un método de tratamiento de sonidos organizado en procesos jerárquicos para aplicar a cualquier sistema reproductor de sonidos multicanal formado por una multiplicidad de altavoces distribuidos en un entorno físico, uno o varios micrófonos, y un procesador para realizar cálculos y manipulación de señales. Más aún, los conceptos presentados pueden ser empleados para proponer un modelo conceptual que sirve de marco ideal para investigar y explorar las posibilidades que ofrece el tratamiento de fuentes sonoras en el espacio.
Además de los objetivos comentados, el método de tratamiento de sonidos propuesto permite la creación de ‘composiciones sonoras espacializadas’ (concebidas como aquellas composiciones de sonidos en donde las fuentes sonoras están localizadas en diferentes puntos del espacio, o cuyas densidades de energía se encuentran distribuidas espacialmente de manera controlada) en un espacio idílico de referencia que posteriormente será reconstruido en un entorno de reproducción particular de la forma más fiel posible, permitiendo simultáneamente el control total sobre dicha reconstrucción al usuario final del sistema, y aislando al compositor de los detalles del entorno físico en donde se reproduzca su creación.
Breve descripción de los dibujos
La invención se describirá a continuación en relación con ciertas realizaciones preferidas, con referencia a las figuras ilustrativas siguientes, para que pueda ser comprendida en su totalidad. En los dibujos:
-
la figura 1 es una ilustración de un ‘espacio coherente homogéneo envolvente sonoro’, y de los elementos que lo modelan física y conceptualmente;
-
la figura 2 es una representación figurativa de las transformaciones que es posible aplicar a un espacio sonoro virtual dentro de un entorno acústico;
-
la figura 3 es una ilustración simbólica de la caracterización de un entorno mediante un ‘espacio base de referencia’;
- la figura 4 es un diagrama esquemático del método de tratamiento de señales en capas que se propone;
-
la figura 5 es un esquema de los elementos del sistema, así como de su disposición durante el proceso de calibración espacial, según el diseño realizado como prototipo preferido;
-
la figura 6 representa un diagrama de flujo con las diversas fases del proceso de calibración espacial para ser aplicado utilizando el prototipo preferido;
-
la figura 7 es una representación del arreglo circular de micrófonos utilizado en el prototipo preferido, en donde se muestran también figurativamente los diagramas polares de los micrófonos empleados;
-
la figura 8 es una ilustración de diferentes superficies sonoras virtuales que pueden ser obtenidas mediante transformaciones geométricas del espacio virtual de referencia;
-
la figura 9 es un diagrama de bloques que representa el procesamiento aplicado a las muestras de una señal sonora cuando ésta es reproducida por el sistema;
-
la figura 10 es una representación ilustrativa de los diferentes tipos de fuentes sonoras virtuales que puede recrear el método de optimización de localización virtual de fuentes sonoras propuesto.
Descripción detallada de la invención
En la discusión precedente sobre el estado de la técnica actual se ha comentado la existencia de diversas propuestas para calibrar las señales procedentes de los altavoces de un sistema reproductor de sonidos multicanal respecto a un área de referencia espacial en donde se sitúan uno o varios micrófonos. Este procedimiento permite ecualizar los valores de amplitud y tiempo de llegada de las señales de los distintos altavoces para afectar la posición del llamado ‘sweet spot’ o área de escucha óptima, término normalmente empleado en los sistemas que utilizan una codificación espacial de sonidos ‘Local’. En la presente descripción el término ‘calibración espacial’ de un entorno acústico se refiere, en cambio, a la ecualización de la amplitud y fase de las señales acústicas provenientes de cada una de las direcciones espaciales que rodean a la región de referencia en donde se lleva a cabo dicha calibración.
Este insignificante, en apariencia, cambio de perspectiva en el objetivo de la calibración acústica permite la concepción de nuevos métodos, algoritmos y esquemas conceptuales para el tratamiento de fuentes sonoras en el espacio. En primer lugar serán presentados estos esquemas conceptuales de los cuales se deriva naturalmente la necesidad de definir algunos métodos para la calibración espacial de un entorno acústico. Posteriormente, se analizará un ‘prototipo preferido’ propuesto para implementar tanto los conceptos presentados como algunos de los métodos de calibración espacial diseñados y, por último, se estudiará en detalle un caso de aplicación práctica de dichos métodos con el objetivo de optimizar la localización virtual de fuentes sonoras en cualquier tipo de entorno acústico.
Con referencia concreta a los detalles mostrados en las siguientes descripciones y figuras, se hace constar que dichos detalles particulares se muestran tan sólo a modo de ejemplo, y con los propósitos de ilustrar el examen de las realizaciones preferidas de la presente invención, siendo ofrecidos con el objeto de que se comprenda más fácilmente la descripción de los principios y aspectos conceptuales de la misma, pero se debe hacer hincapié en la existencia de multitud de diferentes opciones para la implementación de los métodos desarrollados en la presente descripción, algunas de las cuales serán comentadas durante la siguiente exposición.
La figura 1 permite ‘visualizar’ el concepto de un ‘Espacio Coherente Homogéneo Envolvente Sonoro’ (ECHOES, por abreviación) como una superficie virtual 102, determinada por una cierta forma geométrica y de dimensiones relativas a una región de referencia espacial 100, sobre la que se ecualizan una serie de parámetros relacionados con la distribución de la energía acústica, de manera homogénea e isotrópicamente respecto del área de referencia 100, de las señales provenientes de los altavoces 103 de un sistema de sonido multicanal distribuidos en un entorno de reproducción 101 cualquiera.
Las características principales de un ECHOES son las de homogeneidad y coherencia, en donde el significado de estos términos es un tanto diferente al que tienen en el contexto de la calidad ofrecida por los sistemas de sonido envolvente. En este otro contexto la ‘homogeneidad’ se refiere a la ecualización de la densidad de potencia sonora (amplitud de las señales acústicas), respecto al punto de referencia espacial y de forma isotrópica, sobre la superficie virtual que define una figura geométrica con formas y dimensiones cualesquiera. El término ‘coherencia’ significa que, al estar controladas las fases de todas las señales acústicas que convergen sobre la superficie virtual (ecualización de fase) y al estar también determinadas las dimensiones físicas de la región del espacio contenida por dicha superficie, se pueden sincronizar los campos acústicos que provienen desde la superficie virtual sobre el área de referencia desde cualquier dirección del espacio.
Una vez establecida en el espacio la estructura virtual sonora que es un ECHOES, éste puede ser tratado y manipulado como una entidad en sí misma, a la que pueden ser aplicadas las transformaciones o movimientos representados figurativamente en la figura 2. Estos espacios sonoros virtuales pueden variar de forma y dimensiones, o incluso ‘desplazarse’ dentro de ese entorno de forma coherente, y crear así estructuras de campos sonoros estacionarios y estables. Las transformaciones que puede sufrir un espacio sonoro virtual están representadas en la misma figura y consisten en: cambio de forma (de 200 a 201), expansión o compresión 202, rotación o inclinación 203 y traslación 204. Una primera ventaja del modelo propuesto consiste en permitir la aplicación de las técnicas y cálculos de la geometría analítica para determinar cómo afectan estas transformaciones matemáticas a los factores proporcionales de amplitud y retardo entre los diferentes canales del sistema reproductor, y poder así implementar estos movimientos.
El método para crear un ECHOES implica el ajuste en amplitud y fase de las señales provenientes de todas las fuentes acústicas que se encuentran en un entorno con el objeto de establecer una región en el espacio desde la cual se recibe una densidad de potencia sonora cuyos valores de amplitud y tiempo de llegada son constantes en todas las direcciones que la rodean. Para ello, será necesario definir un procedimiento de calibración espacial cuyo objetivo consiste en caracterizar un entorno acústico, junto con las particularidades del sistema multicanal utilizado, en el sentido de cómo deben ser modificadas en amplitud y fase las señales de los canales del sistema reproductor para poder simular un espacio coherente y homogéneo totalmente esférico (en el caso 3D), o circular (2D), con respecto a un lugar de referencia en dicho entorno.
Se puede entender la tarea de este proceso de calibración espacial como la medida de la ‘no-idealidad’ del entorno sonoro real respecto de un hipotético ‘entorno sonoro ideal’, la cual será posteriormente compensada mediante un tratamiento de señales adecuado para todos y cada uno de los canales del sistema reproductor. Una vez así establecido este espacio ideal de referencia, es posible controlar las diferencias en amplitud y fase entre los canales del sistema reproductor para que la energía acústica se distribuya en el espacio de manera proporcional a las dimensiones y geometría de un deseado espacio sonoro virtual coherente y homogéneo.
La figura 3 es una ilustración del concepto de espacio sonoro virtual de referencia, o simplemente ‘espacio base’, el cual caracteriza un entorno acústico mediante el modelo de un ECHOES esférico (o circular) resultado del proceso de calibración. Nótese que esta estructura caracteriza un entorno acústico para todas las direcciones del espacio 301 respecto de un punto particular de referencia 300. Existirá también un cierto área 302 en donde el espacio de referencia puede ser trasladado o movido dentro de esa región de tal forma que los campos sonoros reproducidos en su interior se mantengan constantes y estables. En general, se le pueden aplicar al espacio base las mismas transformaciones que se han definido anteriormente para el caso de un ECHOES.
Un entorno físico en donde se pretenda reproducir un espacio virtual sonoro coherente y homogéneo queda caracterizado entonces por una serie de parámetros geométricos (formas y dimensiones de la región del espacio que conforma la superficie virtual en torno al área de referencia, distancias de los altavoces al punto de referencia, posiciones de los altavoces en el entorno de reproducción, etc.), y un conjunto de parámetros físico-acústicos (nivel de potencia sonora a la que se ecualiza la superficie virtual, margen dinámico de los altavoces, respuesta en frecuencia del recinto “visto” por cada uno de los altavoces del sistema reproductor, etc.).
Con estos elementos y conceptos se ha diseñado un método general para la manipulación de sonidos en sistemas de sonido multicanal que describe un procesamiento de señales modelado en ‘capas’, en donde se establece una jerarquía de niveles lógicos para el tratamiento del sonido, destinado a la creación, edición y reproducción de espacios sonoros virtuales coherentes y homogéneos tal y como se muestra en la figura 4.
Según este modelo se definen tres niveles de manipulación de la información sonora: el Nivel Físico, correspondiente al sistema de sonido envolvente multicanal y al entorno en donde se encuentra emplazado; el Nivel de Adaptación al medio, en donde se modela un ‘espacio base de referencia’ que simula un entorno homogéneo y coherente ideal para la reproducción de sonidos; y el Nivel de Composición, en donde se diseñan los espacios virtuales para ser recreados por el sistema.
También se definen las operaciones de interacción entre estas capas. Así, la Proyección es la operación por la que se reproducen los ECHOES del nivel de composición sobre un espacio base determinado. Nótese que el sistema permite la proyección simultánea de múltiples ECHOES sobre un mismo espacio base. A su vez, el espacio de referencia se modela mediante el proceso de Calibración del sistema, durante el cual se realizan diversas mediciones en el entorno acústico que determinan su estructura de datos. Finalmente, el espacio de referencia controla a su vez la Reproducción en el entorno acústico, alimentando los altavoces del sistema multicanal con la señal de audio procesada (escalada en amplitud y fase entre los diferentes canales) en función de la información proporcionada por los parámetros del ECHOES proyectado y del propio espacio base de referencia.
El Nivel Físico hace referencia a una capa lógica que incluye la gestión y sincronización de los diversos medios de reproducción y grabación de sonidos de los que se disponen, permitiendo la integración simultánea de diversos sistemas de sonido envolvente multicanales en un mismo entorno. Este nivel permite aislar de los detalles de los sistemas reproductores utilizados a los niveles superiores del modelo, organizando y manipulando los medios acústicos necesarios para efectuar la calibración espacial y la reproducción de sonidos en el entorno.
El Nivel de Adaptación corresponde al modelo de un espacio virtual de referencia, establecido mediante el procedimiento de calibración espacial del sistema en el entorno, lo cual permite caracterizar un nivel físico particular respecto de las mediciones realizadas sobre una cierta región del entorno y generalizar los parámetros así obtenidos para la manipulación de las dimensiones de dicha región mediante un tratamiento de señales adecuado. Este procedimiento permite al usuario del sistema controlar la región del espacio en donde se proyecta el contenido sonoro de forma totalmente independiente a dicho contenido, y proporciona un espacio de referencia ideal sobre el que proyectar los espacios virtuales diseñados en el nivel superior.
Por último, en el Nivel de Composición, se diseñan los espacios sonoros virtuales a ser recreados. Esto puede hacerse, por ejemplo, considerando la concentración de la densidad de potencia acústica como distribuida sobre una superficie virtual de formas y dimensiones arbitrarias, la cual puede ser construida mediante una manipulación adecuada de las amplitudes y retardos aplicados a los diferentes canales del sistema reproductor. Estas superficies virtuales pueden ser definidas de manera continua o discreta. En el primer caso, la densidad de potencia acústica se distribuye de forma homogénea, pero proporcionalmente a las dimensiones de un deseado espacio virtual, rodeando completamente el entorno acústico. En el segundo caso, dicha superficie virtual se define mediante concentraciones ‘puntuales’ de la densidad de energía acústica en torno a la región espacial de referencia. Además, se permiten los movimientos y transformaciones del espacio virtual de manera relativa al espacio de referencia, así como la proyección simultánea de diversos espacios virtuales sobre un mismo entorno.
Con el objeto de simplificar al máximo la comprensión de la presente descripción se considerará en lo que sigue el caso específico de una configuración 2D para el nivel físico, en donde los altavoces del sistema reproductor multicanal están distribuidos en un plano horizontal rodeando completamente una cierta área de escucha dentro de un entorno físico. Sin embargo, se debe hacer constancia de que todos los conceptos desarrollados en la siguiente exposición pueden ser aplicados equivalentemente a un sistema multicanal en configuración 3D de forma evidente para un experto en la materia.
Existen diversas alternativas para el diseño de un sistema capaz de implementar el modelo de tratamiento de sonidos propuesto. En la figura 5 se representan los elementos de un cierto prototipo preferido para el proceso de calibración espacial, en donde se dispone de un arreglo o ‘array’ de micrófonos 500 para captar las señales acústicas del entorno de reproducción 501, un procesador 502 para realizar cálculos y tratamiento de señales, y uno
o varios sistemas de audio multicanal 503 para la reproducción de sonidos.
El arreglo de micrófonos 500 está compuesto en el caso más general de M micrófonos con directividad supercardioide (6 en el caso del prototipo preferido considerado en la figura) situados sobre una circunferencia de radio conocido y en ángulos equiespaciados con respecto al centro de referencia del array. La direccionalidad de los micrófonos debe ser conocida y deben poseer las mismas características de sensibilidad. En estas condiciones es posible emplear las características geométricas y simétricas de la disposición espacial de los micrófonos en la adquisición de los parámetros necesarios para caracterizar el entorno acústico. El arreglo de micrófonos 500 está conectado con el procesador 502 mediante medios cableados o inalámbricos.
El procesador 502 se conecta a su vez con el sistema de reproducción multicanal 503 mediante una o varias tarjetas de sonido estéreo o multicanal, controladas por el procesador, y que envían las señales acústicas a cada uno de los altavoces del sistema reproductor mediante medios de transmisión apropiados. Además, el procesador 502 dispone de los medios necesarios para implementar los algoritmos de calibración, proyección, y reproducción de sonidos anteriormente comentados.
El sistema de reproducción de sonidos multicanal 503, a su vez, está constituido por N altavoces (junto con sus distintos elementos de amplificación de señales) distribuidos de forma aproximadamente regular en un entorno particular 501, en donde pueden encontrarse dispuestos tanto en una configuración 2D como 3D, y conectados a la(s) tarjeta(s) de sonido. El arreglo de micrófonos 500 y el sistema reproductor 503 interactúan al estar inmersos en el entorno de reproducción 501, cuyas características dependen no sólo del posible recinto en donde se sitúa dicho sistema multicanal, incluyendo la posibilidad de encontrarse el sistema ‘al aire libre’, sino también de la posición relativa de cada uno de los altavoces respecto de la región espacial de referencia en donde se sitúa el array de micrófonos.
En la figura 6 se representa el diagrama de flujo del proceso de Calibración espacial para el prototipo preferido anteriormente descrito, en donde se han indicado mediante flechas el orden temporal de ejecución de las diferentes etapas en las que se ha organizado dicha operación, señalando mediante bloques de líneas discontinuas aquellos procesos u operaciones que se consideran opcionales. La principal novedad que presenta la aplicación del concepto de ECHOES a la calibración acústica de un entorno es la caracterización tanto de la densidad como del tiempo de llegada de la energía acústica de forma isotrópica respecto de un punto de referencia en el espacio. Para determinar la información que caracteriza espacialmente al entorno acústico se puede analizar el proceso de calibración espacial dividido en varias etapas o fases diferentes:
La primera etapa del proceso de calibración, denominada ‘Calibración de Canales’, consiste en una ecualización en amplitud y fase (opcionalmente incluyendo también las características espectrales) de cada una de las señales provenientes de los “canales” del sistema reproductor 506 sobre una cierta región de referencia en donde se sitúa el arreglo de micrófonos 500. El término “canal” incluye, en este contexto, los posibles efectos de todos los elementos intermedios entre cada salida de una tarjeta de sonido y su correspondiente altavoz del sistema reproductor (incluyendo amplificadores, cables, etc.), además de las posibles características físicas del camino acústico entre cada altavoz y el área de referencia (muebles, obstáculos, etc.). Durante esta fase se procede pues a la realización de ciertas mediciones en el entorno acústico, utilizando el array de micrófonos 500, de la amplitud y el tiempo de llegada de las señales provenientes de cada uno de los altavoces cuando se reproduce secuencialmente por cada uno de ellos una señal piloto (de amplitud, duración y frecuencia conocidas). Estas medidas son posteriormente compensadas con el objeto de igualar los valores de amplitud y tiempo de llegada de estas señales sobre el área de referencia espacial en donde está emplazado dicho array de micrófonos.
Matemáticamente, este proceso de medición se corresponde con un muestreo en M (micrófonos) direcciones del espacio sobre una superficie determinada por la geometría del arreglo 500 utilizado. Se obtendrán por tanto un total de N x M señales, M por cada altavoz del sistema reproductor. Teóricamente con esta información es posible caracterizar espacialmente al sistema formado por la combinación del recinto y el sistema multicanal empleado. Para ello, por ejemplo, se pueden obtener dos matrices caracterizadoras de las N X M señales captadas en el proceso anterior. Una es la Matriz de Amplitudes RMS (del inglés ‘Root Mean Square’) de estas señales, y la otra es la Matriz de Tiempos de llegada. La Matriz de Amplitudes se calcula obteniendo la ‘amplitud rms’ de la señal recogida por cada micrófono para cada uno de los altavoces:
En donde snm representa la señal captada por el micrófono m para el altavoz n de L muestras de longitud. Estas señales son discretizadas mediante un conversor A/D que utiliza una frecuencia de muestreo Fs.
Nótese que la pauta propuesta para determinar el tiempo de llegada es encontrar la primera muestra en un canal en donde se alcanza el valor de la amplitud cuadrática medida para ese mismo canal. Esta estrategia permitirá comparar adecuadamente las diferencias en tiempos de llegada de la señal de un mismo altavoz a los diferentes micrófonos del array, con una exactitud que dependerá del valor escogido para Fs. El orden de las columnas de las matrices coincide con la numeración asignada a los micrófonos del array (véase figura 7), lo cual proporciona un criterio para ordenar la localización de los altavoces en el entorno acústico de forma relativa al espacio de referencia impuesto por el array de micrófonos 500.
Con la Matriz TLL se ecualiza el tiempo de llegada de las señales de todos los altavoces sobre el área de referencia. Para ello, basta con determinar los valores mínimos de los tiempos de llegada para cada altavoz entre todos los micrófonos, y determinar el máximo valor de entre los obtenidos para todos los altavoces. Las señales de los demás altavoces serán retardadas para igualar sus tiempos de llegada en el área de referencia en función del altavoz más lejano respecto de dicha área. Los retardos relativos para cada uno de los altavoces conforman el llamado “Vector de Adaptación de Retardos”:
De forma equivalente, con la matriz ARMS se ecualiza la densidad de potencia media de las señales para todos los altavoces sobre el área de referencia. Un criterio para ello consiste en calcular la potencia media captada por todos los micrófonos para cada uno de los altavoces, obtener la media de entre todos los valores calculados para los N altavoces, y determinar un coeficiente de corrección de amplitud por altavoz, de manera que se reciba el valor medio de potencia sonora desde cada uno de ellos. Con los coeficientes así obtenidos se calcula un “Vector de Adaptación de Ganancias”:
Opcionalmente, se pueden incorporar en esta fase medidas de las características espectrales de cada uno de los canales del sistema reproductor mediante un ‘Análisis de RTF’ (del inglés ‘Room Transfer Function’) utilizando un algoritmo adecuado como el de LMS. Las medidas espectrales realizadas pueden ser compensadas posteriormente mediante el diseño de un filtrado inverso de dicha RTF, cuyos parámetros en general serán un tanto diferentes para cada uno de los canales del sistema, y proporcionar así una respuesta espectral plana en un rango de frecuencias adecuado al sistema auditivo humano. También es posible medir el margen dinámico para cada uno de los canales mediante, por ejemplo, un ‘Análisis de Distorsión Armónica’ monitorizando la relación entre las potencias para diferentes armónicos de la señal piloto mientras se varía la amplitud de dicha señal, y encontrando el valor máximo de amplitud que provoca un umbral de distorsión permitida. El margen dinámico del peor canal determina el área de variación 302 del espacio de referencia, y limita las características acústicas del sistema formado por todos los altavoces distribuidos en un mismo entorno.
La segunda fase del procedimiento, denominada ‘Calibración Direccional’, consiste en caracterizar el espacio acústico respecto del área de referencia en donde se lleva a cabo la calibración. El objetivo es, una vez ecualizados los valores de amplitud y el tiempo de llegada de las señales provenientes de los altavoces sobre el área de referencia durante la etapa anterior, determinar las ganancias relativas entre altavoces para poder recrear un valor de densidad de potencia sonora constante en todas las direcciones del espacio en torno a dicha región de referencia. Para ello, será indispensable determinar la densidad de potencia proveniente de una dirección particular respecto al área de referencia, empleándose para ello la disposición de la geometría impuesta por la superficie del array de micrófonos en donde se realiza el muestreo espacial del entorno acústico. Los detalles de dicha disposición se muestran en la figura 7 para el caso del prototipo preferido propuesto. Los micrófonos 702 están distribuidos equidistantemente siguiendo una circunferencia de radio conocido y espaciados un ángulo 701 (en el caso mostrado en la figura el valor de este ángulo es de 60 grados) entre ellos.
También se representa de forma figurativa la forma de los diagramas polares 703 de los micrófonos, que determinan el valor de la densidad de potencia recibida en cualquier dirección espacial 700 mediante la aplicación de unos factores de corrección a los valores de la potencia acústica medidos en los micros en función de la dirección del espacio analizada. El valor de estos factores de corrección puede ser obtenido de los diagramas polares sin más que compensar las pérdidas en el valor de la potencia calculada para cada micrófono respecto a la deseada dirección espacial. Estos factores dependen sólo de las características direccionales de los micrófonos y de su disposición en el arreglo, así que pueden ser pre-calculados para un array determinado. Incluso, por ejemplo, se podría caracterizar la respuesta direccional del array de micrófonos en un laboratorio, y determinar el valor de los factores de corrección de forma empírica en función de las mediciones realizadas en estas condiciones controladas.
Durante esta etapa, se vuelve a emitir la señal piloto por cada uno de los altavoces del sistema reproductor pero escalando cada canal en función de los coeficientes de adaptación en amplitud y retardo de los vectores VAG y VAR. Pero además, en esta ocasión, se procede a la reproducción de la señal piloto distribuida entre altavoces consecutivos de forma que se simule la localización espacial de la fuente sonora que genera dicha señal piloto en diferentes posiciones virtuales. Para ello, se deberá asegurar que la potencia total transmitida en la dirección de interés se mantenga constante respecto al resto de direcciones, para lo cual es posible hacer uso de las leyes del panorámico de amplitud que determinan la amplitud relativa entre altavoces localizados en ángulos Ф1 y Ф2 para cualquier localización Ф entre ellos (Ф1 <= Ф <= Ф2) como:
Este procedimiento se lleva a cabo para un número determinado de posiciones estratégicas, recreando lo que se podría considerar como ‘altavoces virtuales’. Se obtienen en este caso N* X M señales, en donde N* es el número de direcciones del espacio caracterizadas. Con estas señales se vuelve a obtener la matriz de amplitud rms, esta vez normalizada, aplicando los mismos cálculos de la fase anterior. Con esta nueva matriz
se realiza la estimación de la densidad de energía acústica recibida en cada dirección del espacio para cada una de las filas (altavoces) de la matriz, utilizando los factores de corrección para estimar el valor de la potencia acústica recibida en ángulos situados entre micrófonos consecutivos del arreglo. Matemáticamente, la amplitud rms en una dirección del espacio con ángulo Ѳ, comprendida entre micrófonos localizados en Ѳ1 y Ѳ2, para el altavoz n-ésimo puede determinarse mediante la expresión:
En función de una elección acertada de los factores de corrección Fm(Ѳ). Se establece entonces una
25 correspondencia entre el espacio de ‘altavoces virtuales’ (Ф) y el de ‘micrófonos virtuales’ (Ѳ), creando una matriz de adaptación direccional MAD de orden N X 360 que indica los coeficientes de amplitud relativos para cada altavoz que reproducen un valor de densidad de potencia acústica deseado en una dirección particular, con una resolución angular en el caso propuesto de un grado, respecto del área de referencia. Este proceso se realiza interpolando cuadráticamente los factores de amplitud entre altavoces consecutivos para direcciones del espacio no caracterizadas directamente durante el proceso de calibración. El procedimiento descrito puede repetirse de manera recursiva hasta que el valor de la densidad de potencia sea tan homogéneo cómo se desee para todas las direcciones del espacio.
Opcionalmente, puede llevarse a cabo una etapa adicional en el proceso de calibración denominada ‘Calibración Panorámica’ que consiste en comprobar que el valor de la densidad de potencia sonora permanece
35 homogéneo, para todas las direcciones del espacio en torno a la región de referencia, cuando la señal piloto se reproduce mediante un movimiento panorámico continuo alrededor de dicha región. Para ello, se procede a la reproducción de la señal piloto en los altavoces adecuados escalada en amplitud por los valores de la matriz de adaptación direccional, calculándose la densidad de potencia recibida en la dirección deseada, y corrigiendo el valor de dicha potencia mediante el ajuste del valor de los coeficientes relativos de dicha matriz para esa dirección particular. Al igual que en las etapas anteriores, este proceso puede repetirse hasta que la densidad de potencia acústica en todas las direcciones del espacio esté dentro de un rango de valores que definen un intervalo de tolerancia especificado.
Una comprensión adecuada del problema de la calibración espacial así planteado hace evidente el hecho de que existen multitud de alternativas a la hora de efectuar dicho procedimiento en un entorno acústico. El objetivo del
45 proceso de calibración puede entenderse como la ecualización de la densidad de potencia acústica para todas las direcciones del espacio sobre la superficie virtual definida por las contribuciones relativas de los diagramas polares de los micrófonos que en la figura 7 se representa como la superficie 704. Esta superficie virtual constituye el espacio base que posteriormente será manipulado por el sistema para recrear multitud de diversos espacios sonoros virtuales.
Es posible, empleando el mismo prototipo preferido, aplicar diversas técnicas alternativas al problema de cómo determinar la densidad de potencia acústica proveniente de una determinada dirección del espacio. Por ejemplo, la solución propuesta basada en estimar la densidad de potencia en función de los diagramas polares de los micrófonos puede entenderse como una alternativa a un proceso que más generalmente se denomina ‘Beamforming’, y que es utilizado de forma rutinaria en equipos de comunicaciones basados en arrays de antenas.
55 Entonces, es posible hacer uso de algunas de estas técnicas para alterar el diagrama polar del array de micrófonos, y seleccionar las señales provenientes exclusivamente de cada dirección del espacio mediante un procesamiento adecuado de las señales captadas por los micrófonos del array.
Más aún, existen procedimientos basados en principios totalmente diferentes de los mencionados hasta el momento, y que pueden ser considerados como métodos más ‘directos’ de medir la densidad de potencia acústica
5 en cada dirección del espacio. Considérese, por ejemplo, como ‘prototipo alternativo’, un sistema que no empleara un arreglo de micrófonos, utilizando en su lugar un solo micrófono de direccionalidad variable montado sobre una plataforma giratoria controlada directamente, mediante un motor paso a paso, por el procesador 502. En este caso, la primera etapa de calibración se realiza con el micrófono en modo omnidireccional, midiéndose y ecualizando el valor de la amplitud y el tiempo de llegada de cada uno de los altavoces al área de referencia. Para la segunda etapa, el micrófono se dispone en modo direccional y se selecciona la dirección del espacio preferente que se recibe en cada instante mediante la rotación de la plataforma giratoria en donde se encuentra emplazado el micrófono. El objetivo y resultados de cada una de las etapas del procedimiento permanecen inalterados, variando tan sólo los detalles de cómo se lleva a cabo dicho proceso en cada caso.
Una vez finalizado el proceso de calibración, e independientemente de los detalles de cómo se lleve a cabo, se
15 obtienen como resultado una serie de datos estructurados que son los vectores de adaptación de retardos y ganancias, y la matriz de adaptación direccional (VAR, VAG y MAD). Con esta información se caracteriza completamente el espacio en torno a la región de referencia, en donde se ha realizado la calibración, mediante el establecimiento de un ECHOES base. Más aún, el espacio base de referencia puede ser considerado como el modelo de un ‘espacio afín’, sobre el cual se puede superponer un ‘espacio métrico’ sobre E3 (espacio Euclídeo de R3), estableciendo de esta manera un sistema de referencia matemático sobre dicho espacio.
Nótese que mediante la estructura de datos definida el espacio base de referencia puede ser manipulado independientemente de los espacios sonoros virtuales que están siendo proyectados sobre él mediante la manipulación de los vectores VAG y VAR, que dependen del centro de referencia del espacio base, y la matriz MAD que proporciona la información direccional. Los ‘movimientos’ del espacio base se modelan como isometrías
25 (transformaciones) del espacio de referencia sobre sí mismo, tales como la traslación del centro de referencia o la rotación del espacio. En el caso del giro angular, éste equivale a un desplazamiento del índice de la fila de la matriz de adaptación direccional que esté asignada a una dirección del espacio particular, reordenándose las filas de la matriz mediante esta transformación. En cuanto a la traslación, existen diversas alternativas en cuanto a la interpretación de esta transformación:
En el sentido más general, para realizar un movimiento de traslación del centro de referencia será necesario repetir el proceso de calibración del entorno acústico en diferentes localizaciones, de tal manera que se disponga de un conjunto de espacios base definidos sobre el entorno. La traslación del espacio de referencia se puede efectuar entonces mediante una interpolación lineal entre los coeficientes de los diferentes vectores de adaptación en ganancias y retardos, y las matrices de adaptación direccional entre los espacios de referencia deseados,
35 determinando el tamaño en muestras de dicha interpolación la velocidad del movimiento de traslación. Se permite de esta manera que el espacio de referencia se ‘desplace’ dentro de un entorno, o incluso que ocupe regiones del espacio en donde no se ha realizado el proceso de calibración espacial de forma directa.
También es posible realizar pequeños ajustes en la posición del centro de referencia alterando tan sólo los vectores de adaptación, y sin afectar a los coeficientes de la matriz de adaptación direccional. Para ello, basta con considerar el efecto que tal traslación supone para los coeficientes de los vectores de adaptación considerando los espacios de amplitud y retardo asociados al espacio métrico de referencia, de tal manera que la traslación desde el
punto origen a otro punto de coordenadas (∆x, ∆y) venga dada por:
(6)
En donde dA y dR son los parámetros que relacionan las métricas del espacio de referencia respecto de los espacios de amplitud y retardos respectivamente, y en general dependen de las unidades en las que venga expresada el desplazamiento D. Al no afectar a la matriz MAD el valor de D debe ser pequeño respecto a las dimensiones del entorno acústico para que sea válida, y su valor máximo dependerá a su vez del margen dinámico de los altavoces del sistema reproductor. Una vez determinados los coeficientes de los nuevos vectores de adaptación, es posible llevar a cabo el proceso de interpolación lineal entre ellos de forma equivalente al caso anterior.
La siguiente operación del sistema a considerar es la Proyección de los espacios sonoros virtuales sobre el
espacio base de referencia. Una primera interpretación de esta operación consiste en considerar el modelo de
espacio afín, impuesto por el espacio base de calibración, como un sistema de referencia sobre el ‘espacio físico’ para determinar exactamente la localización de las fuentes sonoras en el entorno. Siguiendo este razonamiento, la proyección consiste en expresar las localizaciones de las fuentes sonoras en el entorno respecto del sistema de coordenadas impuesto por el espacio base, y determinar los coeficientes de amplitud y fase entre altavoces en función de dicha localización espacial. Este modelo será utilizado posteriormente en la aplicación del método de tratamiento de sonidos propuesto para la optimización de la localización virtual de fuentes sonoras en un entorno.
Una interpretación alternativa de esta operación consiste en trabajar con la superficie virtual del ECHOES base establecido mediante el proceso de calibración, y permite calcular directamente la modificación que sufren los coeficientes de la matriz de adaptación direccional de un particular espacio base cuando a la superficie virtual que conforma dicho espacio de referencia se le aplican transformaciones geométricas, tales como escalamientos, traslaciones y deformaciones (estiramientos, estrechamientos, etc.). En este otro sentido, la proyección consiste en calcular los nuevos coeficientes de la matriz de adaptación direccional que establecen un espacio virtual deseado, mediante una transformación que, matemáticamente, puede ser expresada como una serie de productos escalares de la siguiente manera:
El objetivo es determinar las matrices MADG y MADR que expresan los coeficientes en amplitud y retardo que deben aplicarse a los canales en función del espacio virtual deseado. Para ello es necesario calcular en primer lugar los vectores TDG y TDR, los cuales pueden ser obtenidos sin más que considerar el vector T de transformación geométrica que indica la proporción entre las dimensiones del espacio base y el espacio virtual proyectado en cada dirección del espacio. En la figura 8 se representa el sistema de referencia impuesto sobre el entorno después del proceso de calibración, en donde se ha establecido un espacio base de referencia dado por la superficie 800. Partiendo de esta forma geométrica es posible aplicarle transformaciones afines (traslaciones, rotaciones, escalamientos, etc.) de manera que se obtengan, por ejemplo, las superficies virtuales dadas por las figuras geométricas 801 y 802. El vector T puede entenderse entonces como la relación existente entre los radios de las figuras geométricas del espacio base con el deseado espacio virtual transformado para cada una de las direcciones del espacio en torno al área de calibración. Un espacio sonoro virtual queda definido entonces únicamente por su vector de transformación isotrópica T, el cual es utilizado durante la operación de proyección para el cálculo de los coeficientes de amplitud y retardo para cada altavoz que recrean la superficie virtual de dicho espacio sonoro en el entorno.
Finalmente, mediante la operación de Reproducción una señal sonora es recreada en el espacio de tal forma que su densidad de energía acústica se localiza para una dirección Ѳ según la geometría particular de un determinado espacio virtual. Para una señal s[l] reproducida en esa dirección del espacio, esta operación equivale al cálculo de las diferentes señales que alimentan a cada uno de los altavoces del sistema reproductor haciendo uso de la expresión:
(8)
En la figura 9 puede verse el diagrama de bloques que implementa el procesamiento aplicado secuencialmente a las muestras de una señal digital s[n] 900 durante el proceso de reproducción. En la figura se ha considerado que a la señal se le aplica un banco de filtros 902 que en el caso representado dispone tan sólo de un filtro paso bajo y paso alto, pero que en general puede estar constituido por un número arbitrario de filtros ‘sintonizados’ en diferentes bandas de frecuencia. Las muestras calculadas son procesadas en N (903) bloques paralelos idénticos, en donde a cada una de las bandas frecuenciales se le aplican los coeficientes de los respectivos espacios virtuales asignados a esas bandas mediante la multiplicación de las muestras por 904/912 ó 905/913 según los coeficientes asociados a cada canal en la matriz MADG, y retardados según los factores 906/914 y 907/915 dados por los coeficientes asociados a cada canal en la matriz MADR, para la dirección Ѳ deseada. Posteriormente, las muestras pertenecientes a las distintas bandas son sumadas antes de ser multiplicadas y retardadas nuevamente según los valores de los vectores de adaptación de ganancia y de retardo VAGn 908/916 y VARn 909/917 para el n-ésimo altavoz. Nótese que en el sumador pueden concurrir muestras de señales que están siendo procesadas en paralelo, en la misma o en diferentes localizaciones virtuales del espacio, y cuyas contribuciones son superpuestas para cada uno de los canales del sistema reproductor. Opcionalmente, las muestras pueden ser tratadas con los filtros conformadores 910/918 cuya respuesta en frecuencia Hc es la respuesta inversa del sistema formado entre cada canal de reproducción y el área de referencia, y cuyas características fueron determinadas en tiempo de calibración. Finalmente las señales obtenidas en cada bloque 911/919 son alimentadas a sus respectivos altavoces. En la práctica, el procesamiento por muestras propuesto puede ser empleado junto con una estrategia de doble o triple buffer para efectuar un tratamiento de señales en tiempo real, y los elementos de retardo ilustrados pueden ser sustituidos por interpoladores lineales que permiten implementar el retardo por un número de muestras no entero.
El método de tratamiento de sonidos propuesto proporciona multitud de implicaciones y nuevas posibilidades para el trabajo con el sonido en el espacio. Considérese, en primer lugar, el cómo se implementaría el concepto de espacio coherente y homogéneo envolvente sonoro aplicado de manera literal a una fuente sonora. Esto significa que se deberá distribuir la potencia sonora de esa señal de forma homogénea sobre una superficie virtual de geometría arbitraria alrededor del área de referencia respecto a la cual se llevó a cabo el proceso de calibración espacial. Para ello, es posible localizar virtualmente cada muestra de la señal en una posición ligeramente diferente de la recreada para la muestra anterior, y escalada adecuadamente tanto en amplitud como en fase en cada dirección del espacio en función de la forma geométrica del deseado espacio sonoro virtual. Así, por ejemplo, la fuente sonora puede ser reproducida como realizando un movimiento panorámico alrededor del entorno acústico a una velocidad angular de una muestra por grado o, lo que es lo mismo, la fuente virtual describirá un total de Fs / 360 vueltas por segundo alrededor de la región de referencia.
Debido a la alta velocidad de giro de la señal sonora, el cerebro humano será incapaz de percibir el movimiento del sonido alrededor del entorno, sintiéndose en este caso el oyente completamente envuelto por la fuente sonora, y produciéndose la ilusión de estar siendo rodeado por una ‘malla’ continua de sonido. Más aún, este concepto permite definir diversos tipos de fuentes sonoras en el espacio, tales como fuentes puntuales (localizadas en un lugar particular del espacio), fuentes lineales (distribuidas a lo largo de una recta de forma continuada), fuentes planares (en un plano) y fuentes volumétricas. Existen infinitud de otras posibilidades en las que el concepto de ECHOES puede ser empleado en la creación de efectos sonoros. Considérese, por ejemplo, lo que ocurre cuando un espacio virtual es transformado en otro diferente mientras la fuente sonora permanece constante. La manipulación de la superficie virtual del ECHOES producirá variaciones en los detalles del patrón de vibración del campo sonoro reproducido sobre el área de referencia. Las dimensiones y formas geométricas de los espacios sonoros virtuales se traducen así en modificaciones y alteraciones del campo ondulatorio sonoro, el cual puede ser manipulado y controlado indirectamente mediante las transformaciones aplicadas a los espacios virtuales de una forma novedosa y muy intuitiva.
Otra de las aplicaciones del método propuesto de especial mención consiste en su utilización en la ‘Auralización’ de entornos acústicos. Este campo de la acústica estudia el efecto en las señales sonoras que provoca sobre ellas el recinto en el cual se encuentran localizadas, y se emplea principalmente en la ecualización en frecuencia de los sonidos para simular su inmersión en un entorno acústico determinado. El concepto de ECHOES puede emplearse en este contexto para simular las reflexiones que sufre una señal sonora distribuyendo fuentes secundarias sobre las superficies que definen las paredes virtuales del recinto acústico que se desea simular.
Sin embargo, la principal aplicación considerada a continuación consiste en el empleo del método propuesto para el diseño y optimización de la codificación espacial aplicada a una señal sonora, con el objetivo de simular la localización virtual de su fuente en algún lugar del espacio. Resulta evidente que, una vez calibrado un entorno espacialmente, tal y como ha sido descrito, el ‘espacio base’ ofrece un marco de referencia ideal para establecer la situación de las fuentes sonoras en el espacio, sin más que considerar sus posiciones relativas respecto al origen de coordenadas impuesto por dicho espacio de referencia. Por otra parte, aplicando la teoría de la acústica lineal se conoce que el campo sonoro encerrado en un volumen V, el cual se ha generado únicamente por fuentes sonoras externas a la superficie S que delimita dicho volumen, puede ser determinado reemplazando las fuentes sonoras externas por una distribución de fuentes secundarias sobre la superficie S. Por tanto, es posible recrear artificialmente el campo sonoro en el interior de V mediante la distribución de potencia sonora sobre la superficie S que depende de la relación entre las localizaciones espaciales de la fuente sonora original y el volumen V. Esta última afirmación se puede cuantificar matemáticamente mediante la integral de Kirchhoff-Helmholtz, la cual es utilizada en la teoría del sistema Holofónico. Alternativamente, es posible considerar el espacio de referencia como una cavidad acústica y reconstruir los campos sonoros en su interior mediante la aplicación de un análisis matemático de los llamados ‘armónicos esféricos’ o modos de vibración en modos (de amplitud o fase) dentro de dicha cavidad, estrategia empleada en los sistemas Ambisónico y HOA. Para cualquiera de estas interpretaciones el método propuesto a continuación implica que se consideren las dimensiones virtuales del espacio de referencia creado en tiempo de calibración como el área de reproducción deseada para la localización espacial de fuentes sonoras. Así, tanto el centro como el radio y dimensiones del espacio virtual de referencia pueden ser manipulados y controlados en todo momento por el usuario final del sistema, alterando los parámetros del método de codificación de sonidos empleado.
El algoritmo de codificación espacial determina el cómo se calculan los coeficientes de amplitud y fase para las señales de cada uno de los altavoces del sistema reproductor que simulan la localización virtual de la fuente sonora deseada. El método propuesto es capaz de hacer esto para diferentes ‘casos particulares’, representados en la figura 10, que dependen de la relación entre la distancia virtual de la fuente sonora a la posición central del espacio base y de sus dimensiones físicas determinadas mediante el radio virtual R. Además, se emplea una estrategia de codificación diferente en función de la relación entre la frecuencia de las fuentes sonoras a reconstruir y las dimensiones del espacio base utilizado. En general, para señales de baja frecuencia (o con una longitud de onda mayor que las dimensiones del espacio virtual sonoro) se puede considerar el espacio acústico contenido en el espacio de referencia como de dimensiones despreciables, y aplicar directamente la reconstrucción del campo sonoro mediante su descomposición en armónicos esféricos respecto de la posición central de dicho espacio virtual.
Mientras que, para señales acústicas de alta frecuencia (de una longitud de onda menor que las dimensiones del espacio de referencia), se deberán modificar los coeficientes de codificación de tal forma que se concentre la energía acústica exclusivamente sobre la dirección de la pretendida localización espacial de la fuente sonora. En todos los casos, el problema planteado consiste en determinar el coeficiente de localización CLn para el n-ésimo altavoz del sistema reproductor que vendrá determinado por la expresión:
En donde tanto el coeficiente de amplitud CAn como el de retardo τn dependen de los valores del ángulo (Ѳ) y distancia virtual de la fuente sonora al centro del espacio base (DV), así como del ángulo (Ѳn) y distancia al centro (DVn) del altavoz n-ésimo. Existirán, además, un coeficiente para el rango de bajas frecuencias y otro para el de altas frecuencias los cuales han de ser calculados para localizar virtualmente un sonido en una posición particular del espacio.
El primer escenario de localización virtual corresponde a fuentes sonoras de ondas planas que están situadas muy lejos de la superficie del espacio base, y cuyas señales acústicas llegan como un frente de ondas perpendicular a la dirección de propagación (1000). En esta situación, si la longitud de onda de la señal es mucho mayor que el radio virtual del espacio de referencia, es posible aplicar la reconstrucción del campo ondulatorio por medio de los armónicos esféricos dentro de ese espacio, tal y como explica la teoría del sistema Ambisónico. Esta estrategia permite calcular los coeficientes que escalan la señal sonora a reproducir entre los canales del sistema de sonido multicanal de forma equivalente a los de un sistema HOA con altavoces equidistantes del punto central de reconstrucción del campo sonoro. Si, por el contrario, la longitud de onda de la señal a recrear es comparable o menor que las dimensiones del radio virtual del espacio de referencia, esta aproximación no puede ser aplicada satisfactoriamente y en su lugar se hace uso de los coeficientes del mapa de adaptación direccional determinados en tiempo de calibración. En ambos rangos del espectro se simula la distancia de las fuentes sonoras al área de reproducción mediante una curva de variación de la amplitud sonora que depende de forma logarítmica del valor de esa distancia, mimetizando la respuesta del sistema oído-cerebro humano. Entonces, para bajas frecuencias:
;
(10)
En donde N es el número de altavoces del sistema reproductor, M el orden de los armónicos esféricos utilizados en la reconstrucción y la diferencia ( ) representa la distancia de la fuente sonora al centro de referencia
(1003), la cual es inversamente proporcional al valor de este coeficiente. Para el rango de alta frecuencia, la energía acústica deberá concentrarse sobre la pretendida localización espacial de la fuente sonora especificada mediante un ángulo (Ѳ):
(11)
En el primer caso de localización virtual de fuentes de ondas planas no existen retardos relativos entre los distintos altavoces y por tanto τn = 0 para ambos rangos de frecuencia.
El segundo caso es el que trata de recrear fuentes sonoras localizadas en el exterior del círculo de altavoces que determina la frontera virtual del espacio de referencia (1001), pero esta vez a una distancia comparable a las dimensiones de dicho espacio sonoro virtual. Al igual que en el caso anterior la codificación utilizada dependerá de la frecuencia de la señal sonora a reconstruir, así, para longitudes de onda más grandes que las dimensiones del espacio base se utiliza de nuevo la técnica de reconstrucción por armónicos esféricos, pero se añade un retardo a los canales dependiendo de la relación entre la deseada localización virtual de la fuente sonora y la distancia virtual de cada altavoz. Para señales de alta frecuencia se emplean a su vez los coeficientes del mapa de adaptación direccional, pero estos coeficientes son ponderados en función de la distribución de densidad de potencia acústica que producen las señales procedentes de la deseada fuente sonora sobre la superficie virtual del espacio de referencia. Así, en este caso, la distancia de las fuentes sonoras se determina no sólo por la amplitud de la señal de audio sino también por las características espaciales de la distribución de su energía acústica sobre la frontera del espacio virtual sonoro que se utiliza en la reproducción. Para bajas frecuencias respecto a las dimensiones del espacio base:
;
(12)
Y en alta frecuencia se emplea:
(13)
En donde la medida
representa la distancia de la deseada posición de la fuente sonora respecto de la
situación espacial del n-ésimo altavoz (1004), la cual no sólo influye en el valor de la amplitud sino también en el del retardo aplicado a cada altavoz:
(14)
Siendo c la velocidad el sonido en el aire a temperatura ambiente y τn el retardo en segundos que ha de aplicarse al canal n-ésimo, por lo que se deberá multiplicar este valor por la frecuencia de muestreo de la señal digitalizada para calcular el retardo en muestras para dicho canal.
El último caso de localización virtual (1002) es para fuentes sonoras localizadas en el interior del anillo de altavoces que forman parte del sistema reproductor multicanal. En estas condiciones el modelo proporciona dos opciones posibles para la interpretación de la posición virtual de una fuente sonora. La primera opción consiste en crear un ECHOES focalizado en la deseada localización virtual de la fuente interna. Nótese que, usando esta interpretación, una fuente sonora localizada en el interior del espacio de referencia equivale a emitir la señal acústica compensada entre los canales de tal forma que llegue con el mismo volumen y al mismo tiempo al punto pretendido de localización de dicha fuente proveniente desde todos los altavoces del sistema. La segunda opción consiste en calcular las distancias de la pretendida localización virtual de la fuente sonora a cada uno de los altavoces del sistema reproductor (1005) y escalar tanto la amplitud como el retardo en cada uno de ellos en función de estas distancias virtuales, es decir, aplicar el esquema del caso 1001 a las fuentes internas al arreglo de altavoces de reproducción, pero sin distinguir entre diferentes bandas de frecuencia.
La principal ventaja del método propuesto respecto del estado de la técnica actual reside en la posibilidad de controlar el entorno acústico por parte del usuario final del sistema mediante la manipulación del centro de referencia y orientación del espacio base, así como de la dimensión virtual R de dicho espacio. El parámetro R determina por un lado las distancias virtuales de los altavoces consideradas para el cálculo del retardo relativo a aplicar entre ellos en los casos 1001 y 1002. Además, para los escenarios 1000 y 1001 la frecuencia límite para distinguir las altas de las bajas frecuencias depende también de este parámetro R, el cual puede alterar las características de la codificación espacial aplicada a las fuentes sonoras en cada momento. Un posible criterio para determinar esta frecuencia límite viene dado por la siguiente expresión:
(15)
En donde c es la velocidad del sonido en el aire, R el radio virtual del espacio de referencia y M el orden de los armónicos esféricos reproducidos. Este parámetro se aplica tan sólo en el caso de que el valor del radio virtual sea mayor o igual a 1. Para valores de R menores se considera que el oyente se encuentra exactamente localizado en el centro de referencia del espacio base y, por tanto, la frecuencia límite será de 0 Hz, empleándose solamente los coeficientes de localización calculados para las altas frecuencias, y que dependen de la matriz de adaptación direccional determinada en tiempo de calibración.
Siguiendo el método de tratamiento de sonidos propuesto los espacios virtuales del nivel de composición pueden ser tratados como una descripción de las posiciones de las fuentes sonoras en un formato adecuado, esta información será posteriormente interpretada durante la operación de proyección efectuándose el cálculo de los coeficientes de localización en función de las características de la fuente sonora y los parámetros del espacio base utilizado. En la operación de reproducción el esquema de la figura 9 sigue siendo válido, sin más que reemplazar los coeficientes de la matriz de adaptación direccional en ganancia (MADG) por los coeficientes de localización a bajas 905/913 y altas 904/912 frecuencias, y los retardos de la matriz de adaptación en retardos (MAD R) por los desfases relativos
en 906/907/914/915. La frecuencia de corte de los filtros 902 será la frecuencia límite anteriormente calculada en (15), la cual depende del radio virtual del espacio de referencia 901, es decir, del tamaño del área de reproducción del sistema elegida por el usuario final. Una vez filtrada, la señal es procesada en N bloques paralelos en función del número de altavoces 903. A cada una de las bandas se le aplican los coeficientes de localización y el retardo apropiados, si es necesario, antes de ser sumadas y aplicar a cada canal los coeficientes de escalamiento en amplitud 908/916 y fase 909/917 dados por los vectores de adaptación al centro de referencia.
De esta manera, de la concepción inicial de un ECHOES y su aplicación a la caracterización de un entorno acústico mediante el concepto de ‘espacio base de referencia’, se ha llegado a proponer un método para la síntesis de fuentes sonoras virtuales que combina de manera natural y lógica los principales algoritmos de codificación espacial de sonidos existentes. El método propuesto utiliza principios comunes a los sistemas WFS al aplicar a cada canal del sistema reproductor un escalado en amplitud y fase, pero generalizando su aplicación a entornos con unos pocos altavoces discretos y dispuestos en geometrías arbitrarias.
Esta generalización se consigue haciendo uso del esquema aportado por el sistema ambisónico de orden superior y su tratamiento del espacio acústico mediante armónicos esféricos, pero añadiéndose en este caso un retardo a los coeficientes de los armónicos esféricos que permite manipular virtualmente el área de reproducción deseada para el sistema. También, en el caso de las altas frecuencias, se emplea la técnica del panorámico de intensidad entre los altavoces más cercanos a la pretendida localización virtual del sonido, pero esta vez los coeficientes de la codificación aplicada son determinados en tiempo de calibración para cada una de las direcciones del espacio con respecto al centro de referencia, y puede ser considerado como un ‘panorámico de amplitud optimizado’ a cada entorno de reproducción particular.
Comercialmente, la aplicación práctica de los métodos de calibración espacial, tratamiento de sonidos y optimización de la localización espacial de fuentes sonoras propuestos implican la definición de un sistema de sonido envolvente ideal, que se ajusta de manera automatizada al entorno acústico en donde se encuentra inmerso, permitiendo simultáneamente el control del espacio acústico de reproducción al usuario final del sistema y aislando a los compositores de los detalles particulares del entorno en donde se reproducen sus creaciones. Por lo tanto, los métodos descritos pueden ser empleados en todas las aplicaciones de los sistemas de sonido envolvente multicanales incluyendo la creación musical, realidad virtual, videojuegos, cine, instalaciones artísticas interactivas, etc. Más aún, los conceptos desarrollados en la exposición de la presente invención pretenden servir como marco conceptual ideal para facilitar el trabajo con el sonido en el espacio, alentándose de esta forma la investigación de nuevas aplicaciones prácticas para este tipo de sistemas.
Referencias
M.A. Gerzon, "Periphony: With-Height Sound Reproduction", Journal of the Audio Engineering Society, vol. 21, pp. 2-10, January/February 1973.
V. Pulkki, “Virtual Sound Source Positioning Using Vector Base Amplitude Panning”, Journal of the Audio
Engineering Society, vol. 45, June 1997.
A.J.
Berkhout, D. de Vries, P. Vogel, “Acoustic Control by Wave Field Synthesis”, Journal of the Audio Engineering Society, vol. 93, pp. 977-995, 1988.
J.
Daniel, R. Nicol, S. Moreau, “Further Investigations of High Order Ambisonics and Wavefield Synthesis for Holophonic Sound Imaging”, AES Convention paper 5788, 114th Convention 2003 March.
M.A. Polletti, “A Unified Theory of Horizontal Holographic Sound Systems”, Journal of the Audio Engineering
Society, vol. 48, pp. 1155-1182, December 2000.
S. Bleda Pérez, “Contribuciones a la implementación de sistemas de Wavefield Synthesis”, Tesis Doctoral,
Universidad Politécnica de Valencia, 2000.
D.G. Malham, “Homogeneous and Nonhomogeneous Surround Sound Systems”, AES UK Conference, London, June 1999.
Y. Cohen, A. Bar On, G. Naveh, “System and method for optimization of three-dimensional audio”, US Patent No.
7123731, Washington D.C.: U.S. Patent and Trademark Office, 2001.
D. C. Cromer, J.M. Janick, H. J. Locker, J.P. Ward, “Method and System for automatic reconfiguration of a multidimension sound system”, US Patent No. 6856688, Washington D.C.: U.S. Patent and Trademark Office, 2001.

Claims (11)

  1. REIVINDICACIONES
    1.
    Un método para la calibración espacial de un entorno acústico en donde se dispone de: uno o varios sistemas de sonido multicanal que incluyen una pluralidad de altavoces distribuidos de manera arbitraria, pero aproximadamente regular, rodeando completamente una cierta área de reproducción; medios adecuados para captar y discriminar espacialmente las señales acústicas con respecto a una región del espacio en donde se sitúan dichos medios; así como medios para la ejecución de instrucciones de un programa informático y para la manipulación de las señales sonoras, conectados tanto a los medios de captación de señales como a cada uno de los canales del sistema reproductor; dicho método caracterizado por compensar las diferencias en amplitud y fase de las señales acústicas provenientes de dichos altavoces sobre el área de referencia, de manera tal que se igualen tanto el tiempo de llegada como el valor de la densidad de potencia sonora proveniente de cada una de las direcciones del espacio alrededor de dicha región de referencia, mediante un procedimiento que comprende las etapas de:
    determinar y compensar las diferencias existentes en amplitud y fase entre las señales de cada uno de los canales respecto a la región de referencia, mediante el análisis de la amplitud y el tiempo de llegada de las señales acústicas obtenidas mediante los medios de captación cuando se emite secuencialmente una señal piloto por cada uno de los altavoces, calculándose unos coeficientes de corrección de la amplitud y el tiempo de llegada para cada canal del sistema reproductor, y determinar y compensar las diferencias en amplitud de las señales acústicas provenientes de cada una de las direcciones del espacio alrededor de la región de referencia, calculando la densidad de potencia recibida cuando se emite la misma señal piloto localizada en sucesivas posiciones alrededor de la región de referencia de tal manera que la densidad de potencia acústica emitida permanezca constante para todas las localizaciones virtuales entre altavoces consecutivos del entorno, obteniéndose así los coeficientes de ponderación de la amplitud entre dichos altavoces para cada localización del espacio.
  2. 2.
    El método de acuerdo a la reivindicación 1, caracterizado por añadir, durante la primera etapa del procedimiento de calibración espacial, las operaciones de determinar y compensar la respuesta en frecuencia, así como calcular el margen dinámico para cada uno de los canales del sistema reproductor.
  3. 3.
    El método de acuerdo a cualquiera de las reivindicaciones 1 ó 2, caracterizado por añadir una etapa adicional en el procedimiento de calibración espacial, consistente en optimizar la homogeneidad del valor de la densidad de potencia acústica para todas las direcciones del espacio cuando la fuente sonora realiza un movimiento panorámico continuado alrededor del área de referencia.
  4. 4.
    El método de acuerdo a cualquiera de las reivindicaciones anteriores, en donde se utiliza como medio de captación direccional de las señales sonoras un arreglo compuesto de una multiplicidad de micrófonos, con características direccionales predeterminadas, dispuestos en el espacio siguiendo una geometría conocida; dicho método caracterizado entonces por determinar la densidad de potencia acústica recibida en cada dirección del espacio respecto del área de referencia mediante el promediado de los valores de la potencia estimados, en función de dichas características direccionales, entre los micrófonos del arreglo más cercanos a la pretendida dirección espacial a analizar.
  5. 5.
    El método de acuerdo a las reivindicaciones 1, 2 ó 3, en donde se utiliza como medio de captación direccional de las señales sonoras un sólo micrófono de direccionalidad predeterminada montado sobre una plataforma giratoria con un motor paso a paso, y conectado al dicho procesador de manera que se permita el control de la dirección a la que apunta el micrófono, dicho método caracterizado por determinar la densidad de potencia acústica recibida en cada dirección del espacio haciendo corresponder la dirección de máxima ganancia del micrófono, efectuado el giro controlado de dicho micrófono mediante el motor paso a paso, con la localización virtual de la fuente sonora pretendida cuando se reproduce la señal piloto de manera tal que su densidad de potencia permanezca constante para posiciones entre altavoces consecutivos.
  6. 6.
    Un método para el tratamiento de señales acústicas en sistemas de sonido envolvente multicanales, cuyos altavoces se encuentran distribuidos de forma arbitraria pero aproximadamente regular rodeando completamente una cierta área de reproducción, inmerso en un entorno acústico en donde se dispone de los medios necesarios para llevar a cabo la calibración espacial respecto de una cierta región de referencia contenida en dicho entorno; dicho método caracterizado por escalar dicha señal en los canales del sistema reproductor compensando las diferencias en amplitud y fase entre ellos, de tal manera que el tiempo de llegada y la densidad de potencia provenientes de cualquier dirección del espacio alrededor de dicha región de referencia se correspondan de manera directamente proporcional a las pretendidas dimensiones geométricas de un deseado espacio virtual, estableciendo así una superficie sonora virtual de formas y
    dimensiones cualesquiera en torno a dicha región de referencia; dicho método comprendiendo las
    operaciones de: calibración: realizar la calibración espacial del entorno siguiendo cualquiera de los métodos descritos en las anteriores reivindicaciones, esta calibración determina un espacio virtual de referencia o espacio base de geometría regular simétrica en torno a la región de referencia; proyección: determinar los nuevos coeficientes de amplitud relativa entre altavoces en función de los factores proporcionales entre las dimensiones geométrica del espacio virtual de referencia y el deseado espacio virtual sonoro en todas las direcciones alrededor de la región de referencia; reproducción: aplicar a dicha señal sonora los factores de amplitud y retardo calculados en función del espacio virtual en la etapa de proyección, y posteriormente aplicar los coeficientes de corrección de amplitud y fase dependientes del centro de referencia donde se ha realizado el proceso de calibración, para cada canal del sistema reproductor.
  7. 7.
    El método de acuerdo a la reivindicación 6 caracterizado por reproducir diversas señales acústicas, cada una de ellas proyectando su propio espacio sonoro virtual con formas y dimensiones cualesquiera sobre un mismo espacio de referencia resultado del proceso de calibración espacial, y en donde dichos espacios virtuales pueden realizar transformaciones de cambio de forma, traslación, rotación/inclinación o expansión/contracción relativas al espacio de referencia, mediante la manipulación de los factores proporcionales de amplitud y retardo para cada canal del sistema reproductor de forma independiente para cada una de dichas señales.
  8. 8.
    El método de acuerdo a cualquiera de las reivindicaciones 6 ó 7, en donde el proceso de calibración espacial se repite en diferentes regiones del espacio dentro de un mismo entorno, caracterizado por permitir aplicar transformaciones de traslación o rotación/inclinación al espacio base de referencia, sin que las características de los espacios virtuales que están siendo reproducidos sobre él sean modificados, mediante la interpolación lineal o paramétrica de los factores proporcionales de amplitud y fase para cada uno de los canales del sistema reproductor respecto de las diferentes regiones en donde dicho entorno ha sido calibrado.
  9. 9.
    El método de acuerdo a cualquiera de las reivindicaciones 6, 7 u 8, caracterizado por reproducir una señal sonora distribuyendo su energía acústica sobre una superficie virtual que conforma un determinado espacio virtual sonoro, de manera tal que cada una de sus muestras se codifique en una posición del espacio ligeramente diferente a la muestra anterior, dicha fuente sonora describiendo entonces un movimiento continuo panorámico alrededor del área de referencia a una velocidad angular tal que el sistema auditivo humano sea incapaz de percibir directamente el movimiento aparente de dicha fuente en el espacio, sintiendo un hipotético oyente por el contrario que la señal sonora se encuentra envolviendo completamente el área de escucha, y con una amplitud y fase proporcionales a las dimensiones del deseado espacio sonoro virtual en cada dirección del espacio alrededor del área de referencia.
  10. 10.
    Un método para optimizar y controlar la localización espacial de fuentes sonoras en un entorno acústico, en donde se dispone de los medios necesarios para realizar la calibración espacial del mismo y para poder aplicar el método de tratamiento de señales especificado en las reivindicaciones 6, 7, 8 ó 9; dicho método caracterizado por establecer un espacio base de referencia, que encierra y comprende el área de reproducción sobre la cual se desea reconstruir el campo sonoro original, mediante la calibración espacial de dicho entorno siguiendo cualquiera de los métodos descritos en las reivindicaciones 1, 2, 3, 4 ó 5, y determinando los parámetros de la codificación espacial aplicada a dichas fuentes sonoras en función de la dimensión virtual R del dicho espacio de referencia, la distancia virtual DV de la fuente sonora al espacio de referencia, y de las componentes frecuenciales de las señales acústicas a reproducir, de la siguiente manera:
    si DV >> R, es decir, si la distancia virtual de la fuente al espacio de referencia es muy grande, se considera que las señales procedentes de dicha fuente son ondas planas cuando llegan al espacio de referencia; en este caso, cuando la longitud de onda de las señales a reconstruir tiene dimensiones mayores que las del espacio base se aplica la reconstrucción del campo sonoro mediante el análisis de las componentes de los armónicos esféricos de dicho espacio de referencia; mientras que si la longitud de onda es comparable o menor en tamaño a las dimensiones del dicho espacio base se aplican factores proporcionales de amplitud entre los canales del sistema de tal forma que se concentre la energía acústica exclusivamente sobre la dirección de la pretendida localización espacial de la fuente sonora haciendo uso de los coeficientes determinados en tiempo de calibración; y siempre de manera que la ganancia en los canales del sistema sea proporcional al inverso de la distancia virtual de la fuente sonora respecto del origen del espacio de referencia;
    si DV > R, es decir, si la distancia virtual es comparable pero todavía mayor que las dimensiones del espacio de referencia, se aplica el principio de Huygens sobre la superficie sonora virtual que define dicho espacio virtual; de manera que si la longitud de onda de las señales a reconstruir tiene dimensiones mayores que las del espacio virtual de referencia se aplica la reconstrucción del campo sonoro mediante el análisis de las componentes de los armónicos esféricos de dicho espacio de referencia, mientras que si la longitud de onda es comparable o menor en tamaño a las dimensiones del dicho espacio virtual se aplican los coeficientes determinados en tiempo de calibración del sistema, pero añadiendo en ambos casos un retardo relativo entre dichas componentes para cada altavoz y un
    5 factor de proporcionalidad inversa en función de la relación entre la distancia virtual de la fuente sonora y las distancias virtuales de los altavoces en el entorno;
    si DV < R, es decir, si la pretendida localización espacial de la fuente sonora se encuentra encerrada por la superficie virtual de referencia, se ofrecen dos alternativas de tratamiento en este caso:
    reproducir la señal acústica de tal manera que las señales emitidas por los altavoces lleguen al
    10 mismo tiempo y con la misma amplitud de forma simultánea a la región del espacio en donde se pretende simular la localización virtual de la fuente sonora.
    calcular las distancias virtuales desde la deseada localización virtual de la fuente sonora a los distintos altavoces del sistema, y escalar en amplitud y retardo las señales en los altavoces de
    15 forma tal que la amplitud sea inversamente proporcional a dicha distancia, y el retardo directamente proporcional a la misma;
    OFICINA ESPAÑOLA DE PATENTES Y MARCAS
    N.º solicitud: 201130637
    ESPAÑA
    Fecha de presentación de la solicitud: 19.04.2011
    Fecha de prioridad:
    INFORME SOBRE EL ESTADO DE LA TECNICA
    51 Int. Cl. : H04S7/00 (2006.01)
    DOCUMENTOS RELEVANTES
    Categoría
    56 Documentos citados Reivindicaciones afectadas
    A A A A
    WO 0182650 A2 (KEYHOLD ENGINEERING INC) 01.11.2001 US 2008285775 A1 (CHRISTOPH MARKUS et al.) 20.11.2008 US 2010305725 A1 (BRANNMARK LARS-JOHAN et al.) 02.12.2010 US 2009285404 A1 (HSU SHOU-HSIU et al.) 19.11.2009 1,6 1,6 1,6 1,6
    Categoría de los documentos citados X: de particular relevancia Y: de particular relevancia combinado con otro/s de la misma categoría A: refleja el estado de la técnica O: referido a divulgación no escrita P: publicado entre la fecha de prioridad y la de presentación de la solicitud E: documento anterior, pero publicado después de la fecha de presentación de la solicitud
    El presente informe ha sido realizado • para todas las reivindicaciones • para las reivindicaciones nº:
    Fecha de realización del informe 12.03.2013
    Examinador M. d. González Vasserot Página 1/5
    INFORME DEL ESTADO DE LA TÉCNICA
    Nº de solicitud: 201130637
    Documentación mínima buscada (sistema de clasificación seguido de los símbolos de clasificación) H04S Bases de datos electrónicas consultadas durante la búsqueda (nombre de la base de datos y, si es posible, términos de
    búsqueda utilizados) INVENES, EPODOC, WPI
    Informe del Estado de la Técnica Página 2/5
    OPINIÓN ESCRITA
    Nº de solicitud: 201130637
    Fecha de Realización de la Opinión Escrita: 12.03.2013
    Declaración
    Novedad (Art. 6.1 LP 11/1986)
    Reivindicaciones Reivindicaciones 1-10 SI NO
    Actividad inventiva (Art. 8.1 LP11/1986)
    Reivindicaciones Reivindicaciones 1-10 SI NO
    Se considera que la solicitud cumple con el requisito de aplicación industrial. Este requisito fue evaluado durante la fase de examen formal y técnico de la solicitud (Artículo 31.2 Ley 11/1986).
    Base de la Opinión.-
    La presente opinión se ha realizado sobre la base de la solicitud de patente tal y como se publica.
    Informe del Estado de la Técnica Página 3/5
    OPINIÓN ESCRITA
    Nº de solicitud: 201130637
    1. Documentos considerados.-
    A continuación se relacionan los documentos pertenecientes al estado de la técnica tomados en consideración para la realización de esta opinión.
    Documento
    Número Publicación o Identificación Fecha Publicación
    D01
    WO 0182650 A2 (KEYHOLD ENGINEERING INC ) 01.11.2001
    D02
    US 2008285775 A1 (CHRISTOPH MARKUS et al.) 20.11.2008
    D03
    US 2010305725 A1 (BRANNMARK LARS-JOHAN et al.) 02.12.2010
    D04
    US 2009285404 A1 (HSU SHOU-HSIU et al.) 19.11.2009
  11. 2. Declaración motivada según los artículos 29.6 y 29.7 del Reglamento de ejecución de la Ley 11/1986, de 20 de marzo, de Patentes sobre la novedad y la actividad inventiva; citas y explicaciones en apoyo de esta declaración
    Los documentos citados solo muestran el estado general de la técnica, y no se consideran de particular relevancia. Así, la invención reivindicada se considera que cumple los requisitos de novedad, actividad inventiva y aplicación industrial. 1.-El objeto de la presente solicitud de patente consiste en unos métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico. Son métodos y aparatos para el tratamiento de señales sonoras en sistemas de sonido envolvente multicanales y, más concretamente, a la aplicación de éstos en el diseño y optimización de la síntesis de fuentes sonoras virtuales utilizando este tipo de sistemas (tanto para configuraciones 2D como 3D) en cualquier clase de recinto o entorno acústico. Se trata de cómo aplicar la calibración del entorno acústico para el diseño de una codificación de sonidos Global, o investigar las profundas implicaciones que tal calibración supone para un entorno acústico en donde se encuentra emplazado un sistema de sonido envolvente multicanal. Sería por tanto deseable la obtención de un método para el tratamiento de sonidos en sistemas de sonido multicanal que proporcione la máxima calidad posible independientemente del entorno acústico, o del número y características de los altavoces del sistema reproductor utilizado. 2.-El problema planteado por el solicitante es lograr un método que integre y utilice los diferentes tipos de codificación espacial existentes (tanto Locales como Globales), permitiendo la elección de los parámetros de localización de sonidos al usuario final del sistema (dependiendo de la aplicación que se le va a dar al sistema de forma más inmediata), y adaptándose de manera óptima a cada entorno de reproducción automáticamente. Se define una serie de conceptos que permiten construir un método de tratamiento de sonidos organizado en procesos jerárquicos para aplicar a cualquier sistema reproductor de sonidos multicanal formado por una multiplicidad de altavoces distribuidos en un entorno físico, uno o varios micrófonos, y un procesador para realizar cálculos y manipulación de señales. Puede ser empleado para proponer un modelo conceptual que sirve de marco ideal para investigar y explorar las posibilidades que ofrece el tratamiento de fuentes sonoras en el espacio. Además el método de tratamiento de sonidos permite la creación de “composiciones sonoras espacializadas” (concebidas como aquellas composiciones de sonidos en donde las fuentes sonoras están localizadas en diferentes puntos del espacio,
    o cuyas densidades de energía se encuentran distribuidas espacialmente de manera controlada) en un espacio idílico de referencia que posteriormente será reconstruido en un entorno de reproducción particular de la forma más fiel posible, permitiendo simultáneamente el control total sobre dicha reconstrucción al usuario final del sistema, y aislando al compositor de los detalles del entorno físico en donde se reproduzca su creación. El documento D1 puede considerarse como el representante del estado de la técnica más cercano ya que en este documento confluyen la mayoría de las características técnicas reivindicadas.
    Análisis de las reivindicaciones independientes 1,6
    D1 se diferencia del documento de solicitud de patente en que no es un método para la calibración espacial de un entorno acústico en donde se dispone de: uno o varios sistemas de sonido multicanal que incluyen una pluralidad de altavoces distribuidos de manera arbitraria, pero aproximadamente regular, rodeando completamente una cierta área de reproducción; medios adecuados para captar y discriminar espacialmente las señales acústicas con respecto a una región del espacio en donde se sitúan dichos medios; así como medios para la ejecución de instrucciones de un programa informático y para la manipulación de las señales sonoras, conectados tanto a los medios de captación de señales como a cada uno de los canales del sistema reproductor; dicho método comprende compensar las diferencias en amplitud y fase de las señales acústicas provenientes de dichos altavoces sobre el área de referencia, de manera tal que se igualen tanto el tiempo de llegada como el valor de la densidad de potencia sonora proveniente de cada una de las direcciones del espacio alrededor de dicha región de referencia, mediante un procedimiento que comprende las etapas de: determinar y compensar las diferencias existentes en amplitud y fase entre las señales de cada uno de los canales respecto a la región de referencia, mediante el análisis de la amplitud y el tiempo de llegada de las señales acústicas obtenidas mediante los medios de captación cuando se emite secuencialmente una señal piloto por cada uno de los altavoces, calculándose unos coeficientes de corrección de la amplitud y el tiempo de llegada para cada canal del sistema reproductor, y determinar y compensar las diferencias en amplitud de las señales acústicas provenientes de cada una de las direcciones del espacio alrededor de la región de referencia, calculando la densidad de potencia recibida cuando se emite la misma señal piloto localizada en sucesivas posiciones alrededor de la región de referencia de tal manera que la densidad de potencia acústica emitida permanezca constante para todas las localizaciones virtuales entre altavoces consecutivos del entorno, obteniéndose así los coeficientes de ponderación de la amplitud entre dichos altavoces para cada localización del espacio. La reivindicación 1 es nueva (Art. 6.1 LP 11/1986) y tiene actividad inventiva (Art. 8.1 LP11/1986).
    Informe del Estado de la Técnica Página 4/5
    OPINIÓN ESCRITA
    Nº de solicitud: 201130637
    D1 tampoco es un método para el tratamiento de señales acústicas en sistemas de sonido envolvente multicanales, cuyos altavoces se encuentran distribuidos de forma arbitraria pero aproximadamente regular rodeando completamente una cierta área de reproducción, inmerso en un entorno acústico en donde se dispone de los medios necesarios para llevar a cabo la calibración espacial respecto de una cierta región de referencia contenida en dicho entorno; dicho método en donde escala dicha señal en los canales del sistema reproductor compensando las diferencias en amplitud y fase entre ellos, de tal manera que el tiempo de llegada y la densidad de potencia provenientes de cualquier dirección del espacio alrededor de dicha región de referencia se correspondan de manera directamente proporcional a las pretendidas dimensiones geométricas de un deseado espacio virtual, estableciendo así una superficie sonora virtual de formas y dimensiones cualesquiera en torno a dicha región de referencia; dicho método comprende las operaciones de: calibración: realizar la calibración espacial del entorno siguiendo cualquiera de los métodos descritos en las anteriores reivindicaciones, esta calibración determina un espacio virtual de referencia o espacio base de geometría regular simétrica en torno a la región de referencia; proyección: determinar los nuevos coeficientes de amplitud relativa entre altavoces en función de los factores proporcionales entre las dimensiones geométrica del espacio virtual de referencia y el deseado espacio virtual sonoro en todas las direcciones alrededor de la región de referencia; reproducción: aplicar a dicha señal sonora los factores de amplitud y retardo calculados en función del espacio virtual en la etapa de proyección, y posteriormente aplicar los coeficientes de corrección de amplitud y fase dependientes del centro de referencia donde se ha realizado el proceso de calibración, para cada canal del sistema reproductor. Por tanto la reivindicación 6 de la solicitud es nueva (Art. 6.1 LP 11/1986) y tiene actividad inventiva (Art. 8.1 LP11/1986).
    Análisis del resto de los documentos
    De este modo, ni el documento D1, ni ninguno del resto de los documentos citados en el Informe del Estado de la Técnica, tomados solos o en combinación, revelan la invención en estudio tal y como es definida en las reivindicaciones independientes, de modo que los documentos citados solo muestran el estado general de la técnica, y no se consideran de particular relevancia. Además, en los documentos citados no hay sugerencias que dirijan al experto en la materia a una combinación que pudiera hacer evidente la invención definida por estas reivindicaciones y no se considera obvio para una persona experta en la materia aplicar las características incluidas en los documentos citados y llegar a la invención como se revela en la misma.
    Informe del Estado de la Técnica Página 5/5
ES201130637A 2011-04-19 2011-04-19 Métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico Active ES2399160B2 (es)

Priority Applications (1)

Application Number Priority Date Filing Date Title
ES201130637A ES2399160B2 (es) 2011-04-19 2011-04-19 Métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ES201130637A ES2399160B2 (es) 2011-04-19 2011-04-19 Métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico

Publications (2)

Publication Number Publication Date
ES2399160A1 true ES2399160A1 (es) 2013-03-26
ES2399160B2 ES2399160B2 (es) 2013-07-19

Family

ID=47828455

Family Applications (1)

Application Number Title Priority Date Filing Date
ES201130637A Active ES2399160B2 (es) 2011-04-19 2011-04-19 Métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico

Country Status (1)

Country Link
ES (1) ES2399160B2 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014195527A1 (es) * 2013-06-05 2014-12-11 Aratechlabs, S.L. Procedimiento de monitorización mediante realidad aumentada de fenómenos acústicos en microfonía y sistema de elementos que lo desarrollan

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001082650A2 (en) * 2000-04-21 2001-11-01 Keyhold Engineering, Inc. Self-calibrating surround sound system
US20080285775A1 (en) * 2007-04-25 2008-11-20 Markus Christoph Sound tuning method
US20090285404A1 (en) * 2008-05-15 2009-11-19 Asustek Computer Inc. Acoustic calibration sound system
US20100305725A1 (en) * 2009-05-28 2010-12-02 Dirac Research Ab Sound field control in multiple listening regions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001082650A2 (en) * 2000-04-21 2001-11-01 Keyhold Engineering, Inc. Self-calibrating surround sound system
US20080285775A1 (en) * 2007-04-25 2008-11-20 Markus Christoph Sound tuning method
US20090285404A1 (en) * 2008-05-15 2009-11-19 Asustek Computer Inc. Acoustic calibration sound system
US20100305725A1 (en) * 2009-05-28 2010-12-02 Dirac Research Ab Sound field control in multiple listening regions

Also Published As

Publication number Publication date
ES2399160B2 (es) 2013-07-19

Similar Documents

Publication Publication Date Title
Brinkmann et al. A high resolution and full-spherical head-related transfer function database for different head-above-torso orientations
Cuevas-Rodríguez et al. 3D Tune-In Toolkit: An open-source library for real-time binaural spatialisation
ES2922639T3 (es) Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente
CN105323684B (zh) 声场合成近似方法、单极贡献确定装置及声音渲染系统
US9838825B2 (en) Audio signal processing device and method for reproducing a binaural signal
ES2261994T3 (es) Metodo de tratamiento de datos sonoros y dispositivos de adquisicion sonoro que ejecuta este procedimiento.
Watanabe et al. Dataset of head-related transfer functions measured with a circular loudspeaker array
Jin et al. Design, optimization and evaluation of a dual-radius spherical microphone array
ES2609054T3 (es) Aparato y método para generar una pluralidad de transmisiones de audio paramétricas y aparato y método para generar una pluralidad de señales de altavoz
Boehm Decoding for 3-D
JP2019530302A (ja) 可変音響ラウドスピーカ
Pausch et al. SCaLAr–A surrounding spherical cap loudspeaker array for flexible generation and evaluation of virtual acoustic environments
Kashiwazaki et al. Sound field reproduction system using narrow directivity microphones and boundary surface control principle
ES2399160B2 (es) Métodos, aparatos y aplicaciones para la calibración espacial de un entorno acústico
Arend et al. Binaural reproduction of self-generated sound in virtual acoustic environments
Pinardi A human head shaped array of microphones and cameras for automotive applications
Oldfield The analysis and improvement of focused source reproduction with wave field synthesis
Lübeck et al. Perceptual evaluation of approaches for binaural reproduction of non-spherical microphone array signals
Zaunschirm et al. Auralization of high-order directional sources from first-order RIR measurements
EP4158911A1 (en) Method and system for position-dependent extrapolation of multichannel room impulse responses
JP4407467B2 (ja) 音響シミュレーション装置、音響シミュレーション方法、および音響シミュレーションプログラム
De Sena Analysis, design and implementation of multichannel audio systems
Salvador Castaneda et al. Accuracy of head-related transfer functions synthesized with spherical microphone arrays
Otani et al. Effects of spatial aliasing in sound field reproduction: Reproducibility of binaural signals
Oreinos Virtual acoustic environments for the evaluation of hearing devices

Legal Events

Date Code Title Description
FG2A Definitive protection

Ref document number: 2399160

Country of ref document: ES

Kind code of ref document: B2

Effective date: 20130719