ES2333953T3

ES2333953T3 - Metodo para el diseño de un ecualizador modal para una gama audible de frecuencias bajas, especialmente para modos posicionados muy proximos.

Info

Publication number: ES2333953T3
Application number: ES03735728T
Authority: ES
Inventors: Matti Karjalainen; Poju Antsalo; Vesa Valimaki; Aki Makivirta
Original assignee: Genelec Oy
Current assignee: Genelec Oy
Priority date: 2002-05-07
Filing date: 2003-04-22
Publication date: 2010-03-03
Anticipated expiration: 2023-04-22
Also published as: WO2003096743A2; EP1516511B1; FI20020865A7; ATE443976T1; AU2003238101A1; FI20020865A0; US20050175193A1; DE60329389D1; EP1516511A1; US7286674B2

Abstract

Método para la formación de un ecualizador modal (5) para una gama audible de frecuencias bajas, en particular para frecuencias por debajo de los 200 Hz para un espacio (1) predeterminado y una ubicación (2) en el mismo, que comprende las etapas de: - determinar los modos que se van a ecualizar al menos mediante una frecuencia central y una tasa de amortiguación de cada modo, - crear una descripción en tiempo discreto de los modos determinados, y - determinar los coeficientes del filtro ecualizador en base a la descripción en tiempo discreto de los modos determinados, y - formar el ecualizador (5) mediante un filtro digital definiendo los coeficientes del filtro en base a las propiedades de los modos, en el que dicho método está caracterizado por las etapas de - formar una función de detección de modo (G(omega)), - definir la frecuencia omega p angular del pico más alto de la función (G(omega)), - realizar un análisis autorregresivo de orden predefinido sobre la versión de fase mínima de la respuesta objetivo para resolver los polos del modo que representa la frecuencia angular del pico más elevado, - seleccionar el polo más cercano al punto e j omega p del círculo unidad, para representar con su complejo conjugado el modo más importante, - determinar el tiempo de amortiguación de dicho modo y si es superior a un nivel predeterminado, diseñar un filtro de corrección modal para dicho modo y aplicar dicho filtro de corrección modal a la respuesta que se va a ecualizar, y - repetir este procedimiento hasta que ningún tiempo de amortiguación supere el nivel predeterminado y - formar el ecualizador combinando todos los filtros de corrección modal obtenidos de esta manera en un filtro de ecualización modal en cascada.

Description

Método para el diseño de un ecualizador modal para una gama audible de frecuencias bajas, especialmente para modos posicionados muy próximos.

La presente invención se refiere a un método, de acuerdo con el preámbulo de la reivindicación 1, para formar un ecualizador modal para una gama audible de bajas frecuencias, especialmente para modos posicionados muy próximas.

El análisis y modelado paramétrico es una tarea cada vez más común en los campos de acústica y audio. En esta solicitud de patente nos centraremos en dichos problemas relacionados con el audio en los que se puede medir una respuesta de sistema objetivo y la tarea es modelarlo para una síntesis/simulación informática o para realizar un modelo inverso para su ecualización, es decir, compensar la falta de idealidad en la respuesta observada. Los ejemplos representativos del primer grupo, simulación directa para la síntesis, son el modelado de una respuesta de una sala que comprende el diseño de una reverberación artificial, o simplemente una estimación de los modos propios en bajas frecuencias en estudios acústicos de espacios cerrados, y el modelado de instrumentos musicales. La segunda categoría, el modelado inverso, es común en audio, donde la ecualización de las propiedades no ideales de la respuesta es una tarea frecuente en la reproducción de sonido de alta calidad, así como para evitar la realimentación acústica en los sistemas de refuerzo de sonido.

El comportamiento de los sistemas acústicos o de audio a bajas frecuencias se puede modelar a menudo de manera analítica y puede ser parametrizado, al menos con modelos concentrados, por ejemplo el comportamiento modal a bajas frecuencias de una sala rectangular [1], el cuerpo de un instrumento musical [2], o una envolvente de un altavoz [3]. Para estructuras irregulares y/o frecuencias más altas es más difícil o imposible encontrar modelos numéricos o analíticos que sean útiles en la práctica. En estos casos aún es posible medir las respuestas del sistema y aplicar técnicas de modelado de señales para analizar, simular o sintetizar en tiempo real una respuesta dada.

Un interés particular de este estudio se centra en las características de resonancia y reverberación de sistemas acústicos complejos. El comportamiento modal, es decir, la descomposición de los modos propios suponiendo un sistema lineal e invariante en el tiempo (LTI), puede ser extremadamente complicado. En resonadores unidimensionales, tales como cuerdas y tubos de instrumentos musicales, la densidad de los modos propios no es necesariamente alta, pero estos modos pueden presentar detalles complicados, por ejemplo, una amortiguación en dos etapas y una fuerte pulsación en una envolvente amortiguada. En resonadores de dos y tres dimensiones, tales como membranas, placas y espacios cerrados, la densidad modal aumenta hacia las frecuencias más altas, dando como resultado unas configuraciones modales densas y un comportamiento de tipo reverberativo cuando los modos propios adyacentes se superponen esencialmente. Además, el comportamiento temporal se vuelve complejo, especialmente en salas donde al sonido directo y a las primeras reflexiones les sigue un aumento de la densidad de las reflexiones que dan como resultado una reverberación tardía. De esta manera, el problema de modelar las respuestas medidas puede beneficiarse de un punto de vista de modelado en tiempo-frecuencia en el que también se tienen en cuenta las propiedades de la percepción del auditorio.

Existe una amplia literatura sobre el modelado de señales de sistemas LTI [4, 5, 6, 7] en muchas ramas de la ingeniería, ciencias de sistemas y aplicaciones. Se encuentran disponibles herramientas de programación para el modelado, por ejemplo en MATLAB. En este documento se utilizan particularmente las funciones que se encuentran en el paquete de herramientas de procesamiento de señales [8]. Otro paquete de herramientas de MATLAB que es de interés es el paquete de herramientas de identificación de sistemas [9]. En este documento se supone que el sistema objetivo y el modelo deseado son, además de lineales e invariantes en el tiempo, también estables y causales. También se supone que la respuesta medida no está demasiado contaminada por ruido, de manera que la estimación de los parámetros modales del sistema es práctica para las aplicaciones que se tratan aquí. Posteriormente, se puede aproximar la respuesta de impulso medida h(n) mediante una expresión racional en el dominio de la transformada en Z mediante

1

que hace posible simular o sintetizar el sistema de manera eficiente mediante diversas implementaciones de filtros digitales [5, 10, 11] de la función de transferencia dada.

En esta solicitud de patente se tratarán únicamente representaciones en tiempo discreto para el procesamiento digital de señales. De esta manera, la manera más fácil de "modelar" una respuesta medida h(n) o su versión truncada/parcial es tratarla directamente como un filtro FIR

2

Para sistemas complejos, la longitud de una respuesta de impulso finito requerida para una representación adecuada puede ser demasiado larga, impidiendo implementaciones en tiempo real. Por otra parte, la reducción de la longitud del filtro reduce las capacidades de identificación de las propiedades de resonancia inherentes del sistema bajo estudio. Los filtros IIR para respuesta de impulso infinito se pueden presentar en dos formas: (a) modelos totalmente polares en los que el numerador de la ecuación (1) se reduce a un único coeficiente de ganancia b_{0} o (b) modelos de polo nulo en los que tanto el numerador como el denominador son polinomios de Z no triviales.

En la ciencia de sistemas y en ingeniería, por ejemplo en la teoría de control de tareas de estimación e identificación, los términos autorregresivo (A), media móvil (MA) y media móvil autorregresiva (ARMA) han sido utilizados para procesos de modelado similares al modelado de filtros totalmente polares, FIR, y de polo nulo, respectivamente. Por motivos de una utilización adecuada de las abreviaturas AR y ARMA, así como para llamar la atención a los amplios conocimientos de otros diversos campos además del de procesamiento de señales de audio digitales, en este documento se aplican los términos MA, AR y ARMA cuando se refieren a tipos de modelos específicos.

Nuestra intención no es limitarse a obtener una aproximación útil de un sistema objetivo medido mediante una función de transferencia de la ecuación [1]. Estamos interesados en descomponerla en una descripción paramétrica de sus componentes constitutivos, particularmente los pares de polos complejos conjugados, es decir, las raíces de valores complejos del polinomio del denominador, que representan los modos propios del sistema y dan como resultado el comportamiento resonante y reverberante. En teoría son comunes en sistemas distribuidos espacialmente tales como una sala [12] o el cuerpo de un instrumento, mientras que los ceros (raíces del numerador 3 dependen esencialmente de la posición. Estamos interesados en una estimación precisa de los parámetros modales, tales como el ángulo polar y el radio o, de manera equivalente, la frecuencia del modo y el coeficiente de amortiguación.

En la ecuación [13] estudiamos este problema de la estimación de los parámetros modales utilizando las técnicas de análisis en tiempo-frecuencia tradicionales, intentando aislar, en primer lugar, las frecuencias de los modos potenciales y, posteriormente, estimando la tasa de amortiguación modal a partir de un espectrograma, tal como un análisis de Fourier de periodo corto o un espectro de amortiguación acumulativo [14]. La estimación de la tasa de amortiguación también fue aplicada a señales de banda ancha, por ejemplo para una estimación sólida del tiempo de reverberación T_{60}. El problema con dichos métodos es modelar modos superpuestos que dan como resultado una amortiguación no exponencial en cualquier intervalo de frecuencia razonable. Los enfoques AR y ARMA intentan modelar la respuesta objetivo en conjunto, minimizando un criterio de error de modelado dado, típicamente el error de mínimos cuadrados (LS). De esta manera, las interacciones de los modos superpuestos se tienen en cuenta simultánea y sistemáticamente.

Un problema de optimización directa es la poca flexibilidad de los criterios de optimización global, por ejemplo para tener en cuenta las propiedades de los diferentes modos. Además, la selección de los valores adecuados para los parámetros de orden N y P de la ecuación [1] no es fácil. Un problema práctico es que resolver las raíces (de valores complejos) de un polinomio de orden elevado es una tarea numérica difícil. Para evitar problemas con modelos de orden elevado utilizamos métodos en los que cada vez se modela una parte de la gama de frecuencias de audio dada para obtener una descripción precisa de los modos dentro de este intervalo de frecuencias. El modelado ARMA de ampliación de frecuencias (FZ-ARMA) se demuestra que es una manera potente de descomponer respuestas resonantes altamente complejas en representaciones modales, y se pueden utilizar las implementaciones de filtro IIR relacionadas para simular y sintetizar dichos sistemas. Nuestra investigación está particularmente influida por estudios anteriores sobre predicciones lineales selectivas [15], el modelado de múltiples bandas de señales musicales [16] o las respuestas de altavoces [17] y otras técnicas de modelado de sistemas de alta resolución.

Esta solicitud de patente está estructurada como se detalla a continuación. Las secciones 2 y 3 presentan una visión global de los métodos y técnicas de modelado AR y ARMA. Se dan ejemplos para ilustrar la capacidad de modelado y las limitaciones de estos enfoques básicos. La sección 4 presenta el método ARMA de ampliación de frecuencias (FZ-ARMA) que es capaz de analizar sistemas de orden elevado con modos superpuestos y distribuciones modales densas. Se describen los efectos de la ausencia de idealidad, incluyendo ruido y comportamiento no LTI. En la sección 5 se describen tres casos de aplicaciones de audio que utilizan métodos AR/ARMA/FZ-ARMA, incluyendo el modelado de respuestas medidas en salas, el modelado inverso y la ecualización de respuestas altavoces-sala y el modelado así como la síntesis del sonido de instrumentos musicales.

\vskip1.000000\baselineskip

2 Modelado AR

La respuesta de impulso de un sistema resonante muestra una o más sinusoides amortiguadas exponencialmente. Cada uno de dichos "modos" se puede modelar inherentemente mediante un par de polos complejos conjugados, lo que sugiere un modelado AR con los filtros de respuesta de impulso infinito (IIR) correspondientes. Existe una larga tradición de buscar un ajuste óptimo de mínimos cuadrados de dichos modelos para respuestas medidas de sistemas LTI, tanto para una respuesta de impulso dada o para pares de señales entrada-salida. En este documento nos referiremos brevemente a la teoría de la predicción lineal (LP) que ha encontrado aplicación especialmente como una potente técnica de modelado espectral en el procesamiento de voz [18, 19].

2.1 Predicción lineal

En la predicción lineal se supone que una muestra de señal x(n) es predecible como una combinación lineal de muestras anteriores

4

Cuando se minimiza el error de predicción de los mínimos cuadrados entre x(n) y \hat{x}(n), los coeficientes de (auto)correlación

5

juegan un papel principal.

\vskip1.000000\baselineskip

La versión utilizada más frecuentemente del análisis LP es el método de autocorrelación, en el que los parámetros del modelo óptimos a_{i} se resuelven a partir de una ecuación matricial lineal (ecuaciones normales)

6

\vskip1.000000\baselineskip

En esta ecuación, r_{k} son los coeficientes de autocorrelación r_{x}(k) de la ecuación (2) para una estructura de señales bajo estudio, y P es el orden del análisis LP (orden del filtro modelo totalmente polar). Los coeficientes a_{i} son los coeficientes polinomiales estimados del denominador de la ecuación (1), es decir,

7

siendo el numerador únicamente un coeficiente de ganancia. El análisis predictivo lineal se calcula en MATLAB mediante la función "lpc", que primero resuelve los coeficientes de autocorrelación r_{k} y posteriormente invierte la matriz de correlación de tipo Toeplitz para obtener los coeficientes de predicción a_{i} a través de la función de recurrencia de Levinson [8].

2.2 Limitaciones del modelado AR

Un problema con el modelado AR de sistemas del mundo real, en la formulación descrita anteriormente, es que el método no es capaz de realizar un ajuste en el dominio del tiempo para una respuesta objetivo dada a menos que el proceso objetivo sea estrictamente del tipo AR (totalmente polar). La figura 1 muestra esto claramente en un caso simple de un modo idealizado. Para una sinusoide amortiguada en la figura 1(a) la respuesta del modelo en la figura 1(e) es una réplica muy precisa del objetivo ya con orden de modelo 2 (un par de polos complejos conjugados). Si la fase inicial se cambia 90 grados a una función coseno amortiguada, la respuesta del modelo AR de segundo orden (línea continua) de la figura 1(f) desciende considerablemente del objetivo dado en la figura 1(b).

Se obtiene una comprensión más profunda del comportamiento del modelado AR observando que el modelo está basado totalmente en los coeficientes de autocorrelación, que en el dominio de la frecuencia corresponden al espectro de potencias. Esto significa un modelado espectral puro, mediante el cual el espectro del caso coseno de la figura 1(d) se desvía claramente del espectro de la respuesta del caso seno de la figura 1(c). Los inicios irregulares son comunes en las respuestas de sistemas acústicos, indicando de esta manera que el modelado AR simple tendrá dificultades y que se necesitan métodos más potentes para un modelado temporal preciso.

Se puede conseguir una mejor correspondencia en el extremo del coseno amortiguado mencionado anteriormente mediante el método de covarianza del análisis AR, pero se sigue teniendo el problema de correspondencia de fase y se requiere un modelado ARMA. La función del método de covarianza "ar", opción "ls", se puede encontrar en el paquete de herramientas de identificación de sistemas de Matlab.

\vskip1.000000\baselineskip

3 Modelado ARMA

El modelado ARMA, que genera un filtro de polo nulo, tiene más poder de modelado que el método AR. No obstante, es más difícil debido a que no se encuentran soluciones cerradas, requiriendo de esta manera una optimización no lineal. Los algoritmos de estimación ARMA son iterativos, comenzando por un buen modelo AR y, posteriormente, iterando hacia los valores de parámetros óptimos. Al igual que con cualquier método de optimización no lineal, pueden producirse problemas de divergencia o de convergencia a un óptimo local y se encuentran simples problemas informáticos debido a la falta de precisión numérica.

A continuación se aplican dos métodos: el método de Prony y el método Steiglitz-McBride (estos métodos se encuentran disponibles como funciones prony y stmcb del paquete de herramientas de procesamiento de señales de Matlab). Se da una breve explicación del problema de la selección del orden del modelo, seguida de la motivación de la necesidad de una resolución en frecuencia mejorada, antes de introducir la técnica ARMA de ampliación de frecuencias.

3.1 Método de Prony

El método de Prony [20, páginas 226-228] es un algoritmo de incrementos sucesivos que ajusta las N + 1 primeras muestras de una respuesta dada de manera exacta, mientras los P polos del denominador de la ecuación (1) se encargan del ajuste de la amortiguación del extremo. Debido a que la estimación de la parte AR es del tipo covarianza, el filtro resultante puede volverse inestable, incluso en los casos en los que el sistema objetivo a modelar es estable.

3.2 Iteración de Steiglitz-McBride

El método de Steiglitz-McBride [7, páginas 174-177] es un algoritmo con un prefiltrado iterativo para un ajuste de mínimos cuadrados de un modelo ARMA de la ecuación (1) de una respuesta de impulso dada o de un par entrada-salida dado (problema de identificación de sistemas). Se puede obtener una estimación inicial para el denominador por ejemplo mediante el método de Prony. Como con el método de Prony, el filtro resultante de la iteración Steiglitz-McBride puede volverse inestable especialmente con órdenes de filtro elevados incluso para sistemas objetivo estables. A menudo, la respuesta modelo comienza con una buena correspondencia con la respuesta dada en el dominio del tiempo (dado que es un ajuste LS) pero tras un tiempo comienza a crecer rápidamente debido al polo o polos situados en el exterior del círculo unidad.

3.3 Selección del orden del modelo

Tanto el modelo AR como el modelo ARMA necesitan una selección cuidadosa de los órdenes del filtro N y P
(N = 0) para modelos AR). No hay ninguna manera general y automática para seleccionar el orden u órdenes óptimos del filtro, en su lugar se pueden buscar mediante diversas reglas para obtener una correspondencia suficientemente buena a una respuesta objetivo dada [21] o se puede aproximar el orden u órdenes utilizando una información previa sobre el sistema objetivo a modelar.

En la figura 2 se muestra un ejemplo ilustrativo de cómo el orden del modelado AR (predicción lineal) afecta las frecuencias modales estimadas (ángulos polares). Se representa el espectro de magnitud de una respuesta medida de una sala en comparación con un mapa de bifurcación de la frecuencia de un polo relacionado. Para los órdenes más bajos, únicamente los rangos de pico espectral se aproximan de manera general y para órdenes de modelo crecientes estos polos se dividen en nuevos pares de polos y grupos de polos.

En este estudio nos interesa el modelado de sistemas resonantes y reverberantes mediante métodos en los que los polos y los parámetros relacionados, ángulos y radios, se pueden resolver explícitamente. Esto se necesita en aplicaciones tales como las que se explican más adelante en la sección de aplicaciones. La selección del orden del modelo es entonces más exigente que en los casos en los que es suficiente encontrar los coeficientes del numerador y el denominador. Si el orden del modelo es demasiado bajo, no todos los modos se representan adecuadamente mediante pares de polos complejos conjugados, o los radios de los polos encontrados se quedan demasiado bajos. Si el orden del modelo es demasiado alto, los modos únicos se sobremodelan a menudo, es decir, se les asignará más de un par de polos por modo.

3.4 Limitaciones del modelado ARMA

Aún siendo potente en casos simples para órdenes de modelo bajos, los métodos descritos anteriormente presentan dificultades con órdenes elevados y sistemas objetivo complejos. A menudo dichos problemas se originan como resultado de una precisión informática limitada. En el método de Prony y en la iteración de Steiglitz-McBride, la inestabilidad potencial es a menudo un problema. Aunque los polos situados en el exterior del círculo unidad se pueden reflejar en el interior del círculo unidad, generando un espectro de magnitud equivalente, la estructura temporal de la respuesta de impulso cambia.

La predicción lineal (método de autocorrelación) puede generar resultados estables y precisos con órdenes de modelo de cientos o miles, particularmente cuando los polos no se encuentran muy cerca del círculo unidad o entre sí. No obstante, si se deben resolver explícitamente los polos (y los ceros), lo cual es de interés en este estudio, la resolución de las raíces del denominador (y del numerador) es típicamente más problemática que obtener dichos polinomios en sí. El modelado selectivo de frecuencias AR y ARMA resuelve alguno de estos problemas.

La presente invención difiere de la técnica anterior en que se forma una función de detección de modo, se halla la frecuencia angular \Omega_{p} del pico más alto de la función, se realiza el análisis AR del orden predefinido para identificar los polos correspondientes, seleccionando el polo más próximo al punto e^{j\Omega p} en el círculo unidad, se determina el tiempo de amortiguación del modo, y si es superior a un nivel predeterminado, se diseña un filtro de corrección modal para dicho modo, se repite el procedimiento y si ninguno de los tiempos de amortiguación supera dicho nivel predeterminado se forma un filtro en cascada a partir de cada filtro individual.

Más específicamente, el método según la invención se caracteriza por lo que se especifica en las parte caracterizante de la reivindicación 1.

La invención ofrece beneficios sustanciales.

Con la ayuda de la invención también se pueden ecualizar de manera efectiva los modos cercanos entre sí.

\vskip1.000000\baselineskip

A continuación se describirá la invención en más detalle con referencia a las realizaciones a modo de ejemplo mostradas en los dibujos adjuntos en los que

La figura 1 muestra un modelado AR con amortiguación de un modo único con diferente fase inicial: (a) espectro de la respuesta seno, (d) espectro de la magnitud de la respuesta coseno, (e) respuesta del modelo AR para una respuesta sinusoidal con orden 2 y (f) respuesta del modelo AR para un caso coseno con orden de 2 (línea continua) y orden de 20 (línea discontinua).

La figura 2 muestra un espectro de magnitud de una respuesta medida de una sala (superior) y las frecuencias correspondientes a los ángulos de los polos obtenidas a partir de la predicción lineal de orden variable (inferior).

La figura 3 muestra el caso (A), la pulsación de amplitud debida a dos modos con frecuencias cercanas: (a) la señal sintética generada de acuerdo con la ecuación 9 con los parámetros dados en la tabla 1; (c) las envolventes de la amplitud original (línea discontinua) y de la amplitud modelada (línea continua) (curvas que se superponen casi perfectamente) y (e) la señal resintetizada basada en el modelo estimado. Los subgráficos (b), (d) y (f) se refieren a una señal modificada generada con los parámetros mostrados en la tabla 1 pero con fases sustituidas por \theta_{1} = \theta_{2} = \pi/2.

La figura 4 muestra el caso (B), una amortiguación de dos etapas debida a dos modos de igual frecuencia: (a) la señal sintética generada de acuerdo con la ecuación (9) con los parámetros dados en la tabla 2; (c) las envolventes de la amplitud original (línea discontinua) y de la amplitud modelada (línea continua) y (e) la señal resintetizada basada en el modelo estimado. Los subgráficos (b), (d) y (f) se refieren a otra señal generada con los parámetros mostrados en la tabla 2 pero con fases sustituidas por \theta_{1} = \theta_{2} = \pi/2.

La figura 5 muestra el caso (C), la pulsación de amplitud de dos modos de ruido: (a) la señal sintética generada de acuerdo con la ecuación (9) con los parámetros dados en la tabla 1 inmersa en ruido blanco; (c) las envolventes de la amplitud original (línea discontinua) y de la amplitud modelada (línea continua); y (e) la señal resintetizada basada en el modelo estimado. Los subgráficos (b), (d) y (f) se refieren a una señal modificada generada con los parámetros mostrados en la tabla 1 pero con fases sustituidas por \theta_{1} = \theta_{2} = \pi/2.

La figura 6 muestra el caso (D), la pulsación de amplitud con cambio de tono: (a) la señal sintética generada de acuerdo con la ecuación (9) con los parámetros dados en la tabla 1 pero con un cambio de tono. Los gráficos de la columna de la izquierda muestran las envolventes de la amplitud del original (línea discontinua) y del modelado (línea continua) para los modelos FZ-ENV-ARMA de órdenes: (b) ARMA(4, 4), (d) ARMA(8, 8) y (f) ARMA(12, 12). Los subgráficos (c), (e) y (g) de la columna de la derecha muestran los mismos casos excepto para el modelado FZ-ARMA con los órdenes del modelo correspondientes.

La figura 7 muestra el caso (E), la estimación de la tasa de amortiguación de la respuesta reverberante y T_{60} modelando la envolvente de amortiguación utilizando el modelo FZ-ENV-ARMA de bajo orden. La respuesta medida fue filtrada con un paso de banda (1-2 kHz), se tomó el valor absoluto de la envolvente de Hilbert y se diezmó por 500, se modeló mediante los órdenes de filtro N=6, P=6 y, finalmente, se identificó el mayor polo (real) positivo correspondiente al principal componente de amortiguación para la estimación de la pendiente.

La figura 8 muestra el caso (F): (a) el espectro de amortiguación acumulativo de la respuesta medida de una sala por debajo de los 220 Hz, para un intervalo de tiempo 0,0 ... 1,0 s; (b) el espectro de amortiguación acumulativo calculado a partir de la respuesta de impulso de un modelo AR (P=80) para la respuesta de la sala de la figura 8(a). La tasa de muestreo original de 44.100 Hz se diezmó a 400 Hz antes del modelado AR. El nivel se limitó a -50 dB.

La figura 9 muestra el caso (G), la correspondencia de la envolvente para la amortiguación del grupo modal entre 33 y 58 Hz en la respuesta de la sala de la figura 8 con órdenes de FZ-ARMA diferentes: (a) ARMA(4, 6), (c) ARMA(4, 20), (e) ARMA(6, 60). Línea continua = modelado, línea de puntos = original. Los polos (x) y los ceros (o) en el dominio z diezmado están representados en (b), (d) y (f), respectivamente. (Algunos ceros caen fuera de la gama de la representación).

La figura 10 muestra el caso (H), el ajuste a la respuesta de la sala dentro de la banda crítica 920 ... 1.080 Hz mediante los órdenes del modelo FZ-ARMA (a) ARMA(6, 6), (b) ARMA(6, 20), (c) ARMA(6, 60), descritos mediante las envolventes de la amplitud de la respuesta original (línea discontinua) y la respuesta modelada (línea continua).

La figura 11 muestra el caso (I), los espectros de amortiguación acumulativos para la ecualización de un altavoz más los modos sintéticos: (a) respuesta original más cinco modos en las frecuencias 50, 55, 100, 130 y 180 Hz, (b) los modos totalmente amortiguados, (c) el tiempo de amortiguación modal (60 dB) ecualizado a 250 ms y (d) la función G(\Omega) de detección del modo para la respuesta original. Los niveles de amortiguación están limitados a -50 dB.

La figura 12 muestra el caso (J), la ecualización de un modo único a 46 Hz de la sala analizada en la figura 8: (a) la respuesta original, (b) tras la ecualización del modo.

La figura 13 muestra el caso (K), la ecualización de la respuesta de la sala analizada en la figura 8: (a) la respuesta original, (b) tras la ecualización del modo y (c) la amortiguación de la energía integrada en sentido contrario para la respuesta original (línea discontinua) y la respuesta ecualizada (línea continua).

La figura 14a muestra un diagrama de bloques del ecualizador modal de tipo I de acuerdo con la invención utilizando la fuente de sonido primaria.

La figura 14b muestra un diagrama de bloques del ecualizador modal de tipo II de acuerdo con la invención utilizando un radiador secundario.

\vskip1.000000\baselineskip

4 Modelo ARMA de ampliación de frecuencia (FZ-ARMA)

Los problemas en la resolución de modos y grupos de modos ubicados muy próximos entre sí fue la razón en este estudio para experimentar con métodos que tienen un mejor control de la resolución de frecuencias. Existen diversas ideas disponibles para la mejora, incluyendo la deformación de frecuencias [22] y el modelado selectivo de frecuencias tal como una predicción lineal selectiva [15], técnicas AR/ARMA multibanda [16] y muchos otros métodos de modelado de señales de alta resolución.

La deformación de frecuencias es una técnica conveniente cuando tanto las frecuencias más bajas como las más altas requieren una resolución de frecuencia aumentada. Este enfoque se puede extender a los filtros Kautz que presentan propiedades interesantes de control generalizado de resolución de frecuencias [23].

El modelado selectivo de frecuencias se ha aplicado, por ejemplo, en la predicción lineal del habla. En un caso simple, una respuesta objetivo se puede filtrar mediante un filtro de paso bajo y diezmar con el objeto de modelar la parte de baja frecuencia de la respuesta. Una gama de las frecuencias más altas se puede modular reduciéndolas y diezmándolas antes de modelar de manera similar. En realidad, cualquier subbanda de una gama de frecuencias dada se puede modelar de esta manera y, finalmente, los parámetros resultantes (polos y ceros) se pueden mapear de nuevo a la gama de frecuencias originales correspondientes. Este enfoque se denomina en este documento modelado mediante ampliación de frecuencias. Se parece también a las técnicas multibanda utilizadas en [16, 17, 24].

\vskip1.000000\baselineskip

4.1 Formulación de la ampliación de frecuencias

El análisis FZ-ARMA (o FZ-AR) comienza modulando (heterodinación) la gama de frecuencias deseado reduciéndolas hasta las proximidades de la frecuencia cero [25, 26, 27] mediante

8

donde \Omega_{m} = 2\pif_{m}/f_{s}, f_{m} es la frecuencia de modulación, y f_{s} es la tasa de muestreo. En el dominio z esto significa una rotación en la dirección de las agujas del reloj de los polos z_{i} un ángulo \Omega_{m}, es decir,

9

pero manteniendo el radio del polo. La siguiente etapa para aumentar la resolución de las frecuencias es limitar la gama de frecuencias diezmando, es decir, filtrando mediante un filtro de paso bajo y muestreando con menos muestras la respuesta rotada mediante un factor de ampliación K_{zoom} para obtener una nueva tasa de muestreo f_{s,zoom} = f_{s}/K_{zoom}. Esto implica mapear a un nuevo dominio de z en el que los polos se escalan mediante la regla

\vskip1.000000\baselineskip

10

\vskip1.000000\baselineskip

Conjuntamente, los mapeados (5) y (6) generan nuevos polos. Las ecuaciones (5) y (6) caracterizan cómo las propiedades del dominio de z de una respuesta dada se cambian a través de la modulación y la reducción, pero el patrón de polo nulo estimado de un modelo ARMA se obtendrá únicamente en la siguiente etapa.

\vskip1.000000\baselineskip

11

\vskip1.000000\baselineskip

A continuación, es posible aplicar cualquier modelado AR o ARMA a la respuesta modulada y diezmada obtenida a partir de h(n). Se debe observar que esta nueva señal tiene valores complejos debido a la operación de modulación unilateral. Este enfoque se parece a las técnicas de múltiples tasas y subbandas.

La ventaja que se obtiene con la ampliación de frecuencias es que en la subbanda ampliada, el orden del análisis (ARMA) se puede reducir aumentando el factor K_{zoom} de ampliación y, en consecuencia, la solución de polos y ceros como raíces de los polinomios del denominador y del numerador de la función del modelo de la ecuación (1) se simplifica. Adicionalmente, esto significa que se puede utilizar una resolución diferente en cada subbanda, por ejemplo, basándose en el conocimiento sobre la complejidad modal en cada subbanda.

Tras resolver los polos y ceros dentro de una subbanda ampliada, se deben mapear de nuevo en la banda completa. Esto significa un escalado inverso de los radios de los polos así como una rotación de los mismos en dirección contraria a las agujas del reloj, es decir,

12

Debido a la modulación de reducción unilateral en (4), cada polo z_{i} se debe utilizar como un par complejo conjugado a efectos de obtener filtros de valores reales.

La etapa final es combinar los polos y los ceros obtenidos de las diferentes subbandas en un modelo completo. Esta no es una tarea trivial pero, por otra parte, dividiendo todo el problema y recombinándolo de nuevo proporciona un aumento de flexibilidad. Es ventajoso escoger polos y ceros únicamente en la parte central de cada subbanda (superpuesta) para evitar problemas en los límites de las subbandas debido a la limitación de banda.

En las investigaciones del modelo FZ-ARMA que se describen a continuación, el método de ampliación de frecuencias de resolución de los coeficientes ARMA es el método Steiglitz-McBride. Se debe observar también que los órdenes de filtro N y P se refieren a los filtros de valores reales con pares complejos conjugados generados a partir de ceros y polos parciales obtenidos a partir del método anterior. De esta manera los órdenes son el doble del número de ceros y polos de los procedimientos anteriores, respectivamente.

4.2 Modelado de las amortiguaciones modales de mayor orden

En esta sección, se muestra el rendimiento del método de análisis FZ-ARMA a través de señales sintéticas. En particular nos interesa investigar la capacidad de modelado cuando se trata con señales que presentan pulsación y/o amortiguación en dos etapas en sus envolventes. Las señales simples que caracterizan dichas características se pueden obtener mediante

13

donde M es el número de frecuencias modales presentes en s(n), \tau_{k} son las constantes de tiempo de amortiguación, f_{k} las frecuencias modales, f_{s} la frecuencia de muestreo y \theta_{k} las fases iniciales de los modos.

\vskip1.000000\baselineskip

Empecemos con el caso (A) en el que la envolvente de la amplitud de la señal compuesta de dos modos muestra una pulsación. Los parámetros utilizados para generar la señal así como aquellos adoptados en el modelado FZ-ARMA aparecen en la tabla 1. Las respuestas objetivo en la fase seno y coseno, sus envolventes FZ-ARMA y sus versiones resintetizadas se muestran en la figura 3. Las envolventes se obtienen a partir de las señales complejas diezma-
das.

Cada respuesta resintetizada se calcula como la respuesta de impulso del filtro que se obtiene combinando los polos y ceros complejos conjugados a partir del análisis FZ-ARMA. Se debe observar que la limitación de banda en el enfoque en frecuencia genera ceros (y polos) compensados que muestran elementos artificiales en la respuesta de impulso reconstruida. En un caso típico de enfoque sobre una banda de resonancia estrecha la respuesta de impulso reconstruida tiene un impulso de gran amplitud, dado que es su primera muestra (ver también [27]). Esto se ha eliminado en las simulaciones de la respuesta sintetizada de esta solicitud de patente. Esta eliminación tiene únicamente un efecto marginal en las propiedades espectrales de la respuesta.

En los resultados de la simulación del caso (A) de la figura 3, un modelo ARMA(4, 4) es suficiente para representar adecuadamente las amortiguaciones de la envolvente en los subgráficos (c) y (d), mientras las características de la fase inicial de la señal resintetizada en (f) se desvían de la mostrada en (b). Se debe observar que es casi imposible distinguir entre las líneas continuas y discontinuas en los subgráficos (c) y (d) de la figura 3.

En el caso (B) verificamos el modelado FZ-ARMA de una respuesta de dos modos para la cual la envolvente de la amplitud presenta una amortiguación de dos etapas. Los parámetros utilizados para generar esta señal, así como los del modelado FZ-ARMA, se resumen en la tabla 2 y los resultados del modelado se muestran en la figura 4. El modo de amortiguación más lento se modela adecuadamente aunque su nivel inicial es de 10 dB por debajo del más fuerte. Esta capacidad de análisis de la amortiguación en dos etapas puede funcionar hasta los -30 dB en un caso sintético puro.

\vskip1.000000\baselineskip

4.3 Modelado de respuestas con ruido

En la simulación del caso (C), a efectos de verificar el modelado FZ-ARMA cuando se trata con señales con ruido, contaminamos las respuestas de impulso mostradas en los gráficos (a) y (b) de la figura 3 con ruido Gaussiano blanco aditivo de media cero. En este ejemplo la varianza del ruido se elige para generar una relación señal-ruido (SNR) de -5 dB al principio de la señal. Por supuesto, la relación SNR local disminuye hacia el final de la señal.

Los resultados se muestran en la figura 5 que sigue la misma estructura que las figuras anteriores. Ahora, observando los subgráficos (c) y (d) de la figura 5 se puede ver que las envolventes de las señales modeladas (líneas continuas) difieren sustancialmente de aquellas de las señales con ruido (líneas discontinuas). Además, las señales resintetizadas basadas en los modelos calculados, mostradas en los subgráficos (e) y (f) están libres de ruido visible y siguen estrechamente sus versiones puras correspondientes, que están representadas en los subgráficos (a) y (b) de la
figura 3.

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

TABLA 1 Parámetros del caso de simulación (A)

14

TABLA 2 Parámetros del caso de simulación (B)

15

\vskip1.000000\baselineskip

El resultado altamente satisfactorio de la reducción del ruido añadido en el caso de simulación (C) se puede entender cuando se considera la ampliación de frecuencias a una banda estrecha alrededor de las frecuencias modales de interés, mediante lo cual se mejora la relación SNR mediante la proporción de ampliación, es decir, mediante 10 log_{10}200 = 23 dB en este caso. El modelado ARMA(4, 4) de bajo orden reduce además la influencia del ruido debido a la buena correspondencia con las señales modales únicamente.

\vskip1.000000\baselineskip

4.4 Envolvente del modelado de un sistema no LTI

Una suposición primaria cuando se aplica el modelado FZ-ARMA o cualquier otro modelado de sistemas LTI es que las frecuencias de los modos no cambian dentro de la duración del segmento analizado. Si no se puede satisfacer este requisito, por ejemplo, en tonos de instrumentos de cuerda punteados fuertemente que tienen un cambio de tono inicial [28], todavía se puede modelar el comportamiento de la envolvente de la señal objetivo. Si la trayectoria de la frecuencia del cambio de tono es conocida, una manera sencilla es volver a muestrear la señal, de manera que se elimina el cambio. Otra manera es aplicar un modelado FZ-ARMA pero adoptando órdenes mayores para el numerador y el denominador de manera que esto puede capturar el efecto del cambio de la frecuencia.

De manera alternativa, se puede calcular un modelo ARMA para la envolvente de una señal modulada y diezmada (FZ-ENV-ARMA). De esta manera se puede aproximar el comportamiento de la envolvente con un orden de modelo menor. El caso de simulación (D), un ejemplo que compara el modelado FZ-ARMA estándar con el FZ-ENV-ARMA, se muestra en la figura 6. La señal de prueba representada en el subgráfico (a) es una versión de la representada en la figura 3, pero ahora las frecuencias de los modos comienzan 50 Hz por encima de los valores indicados en la tabla 1 y posteriormente convergen exponencialmente con una constante de tiempo de 100 ms a los valores nominales. Los gráficos de la columna de la izquierda muestran las envolventes original y modelada para diferentes órdenes del modelo FZ-ENV-ARMA. Los gráficos de la columna de la derecha hacen lo mismo pero utilizando modelos FZ-ARMA.

Para resintetizar una señal de tono cambiante basándose en el modelo informatizado FZ-ENV-ARMA, es necesario estimar el comportamiento de su tono. Posteriormente, tras obtener un modelo para la envolvente de la amplitud, se debe utilizar una modulación de frecuencia correspondiente al cambio de frecuencia original durante la síntesis. Para un modelado FZ-ARMA directo esto no es necesario si la estimación es capaz de capturar el comportamiento dado de las frecuencias modales cambiantes.

A partir de la figura 6 se puede verificar que, al contrario de lo que ocurre en el modelado FZ-ARMA, el aumento del orden del modelo en el modelado FZ-ENV-ARMA no ayuda esencialmente a mejorar el ajuste del modelo, dado que las relaciones de fase inherentes de la señal original se han perdido en el cálculo de la envolvente que se utiliza como objetivo. Sin embargo, para un modelado de orden bajo el modelado FZ-ENV-ARMA genera un mejor ajuste de la envolvente que el modelado FZ-ARMA del mismo orden.

Si la respuesta de un sistema objetivo es altamente compleja en la densidad de los modos, tal como una respuesta de la sala a frecuencias medias o altas, una descripción modal detallada puede no ser factible o incluso deseada. En dichos casos el comportamiento de la envolvente se puede representar simplemente ajustando un modelo de orden menor a la envolvente amortiguada en una gama de frecuencias deseado mediante las técnicas FZ-ENV-ARMA. Esto puede ser útil en la estimación del tiempo de amortiguación. No obstante existen muchos métodos que están mejor motivados, por ejemplo, en la estimación RT_{60} del tiempo de reverberación [13]. El caso de simulación (E) de la figura 7 representa la envolvente de la amortiguación de un ejemplo de respuesta de una sala para la banda octava 1-2 kHz y el ajuste de una envolvente relacionada mediante el modelado FZ-ARMA de bajo orden.

\newpage

Otra forma de comportamiento no LTI es la ausencia de linealidad. Se puede aceptar un pequeño grado de no linealidad en un sistema e incluso se puede tolerar una desviación bastante severa de la linealidad si aceptamos el hecho de que los parámetros dependen de la señal, por ejemplo dependen del nivel de una señal.

\vskip1.000000\baselineskip

4.5 Selección de los parámetros de ampliación

La elección de los parámetros FZ-ARMA, es decir, \Omega_{m}, K_{zoom} y los órdenes de ARMA N y P, dependen de diversos factores. Considerando primero el factor de ampliación, se puede decir que cuanto mayor sea K_{zoom} mayor será la resolución en frecuencia. Esto favorece los casos en los que los modos están densamente distribuidos en frecuencia. Por otra parte, valores elevados de K_{zoom} implican un procedimiento de reducción de señal más exigente y menos muestras disponibles para el modelado en la señal diezmada.

Una posible estrategia es definir un f_{s,zoom} mínimo de antemano y posteriormente derivar K_{zoom}. Por ejemplo, el criterio se puede basar en el número de muestras que quedan en la señal diezmada. Otra elección natural cuando existen modos o grupos de modos relativamente aislados es seleccionar la gama de frecuencias de enfoque para cubrir dicho grupo y sus proximidades hasta que los modos o grupos vecinos empiezan a tener influencia. Se recomienda elegir la gama de enfoque de manera que los picos de resonancia no se sitúen en los extremos de las subbandas. Como regla general, una elección adecuada es fijar f_{m} = f_{r} - f_{s,zoom}/4, que lleva la frecuencia de resonancia f_{r} al punto medio de la gama de frecuencias reducido.

El orden de un modelo ARMA dependerá del número de modos asociados con cada grupo de resonancia. Los experimentos en resonancias de dos modos revelan que adoptar un modelo ARMA(4, 4) proporciona en general resultados satisfactorios para dichos casos. Se puede conseguir una mejor precisión en el modelado aumentando el orden, aunque el resultado es posible que no se pueda interpretar físicamente para un caso de dos modos. El análisis de orden elevado aumenta asimismo la probabilidad de acabar con un modelo inestable.

Se debe observar que en el modelado FZ-ARMA la frecuencia de modulación f_{m} debe corresponder al borde inferior de la gama de enfoque y el factor de ampliación K_{zoom} en relación a la tasa de muestreo determina el ancho de banda de la ampliación.

\vskip1.000000\baselineskip

5 Casos de estudio en aplicaciones de audio

El modelado AR/ARMA tiene muchas aplicaciones en el procesamiento de señales de audio actual. Los modelos lineales e invariantes en el tiempo se pueden aplicar, por ejemplo, a la acústica de salas, a la síntesis de sonido y a la reproducción de audio. Basándose en la visión general teórica anterior y en los ejemplos, en esta sección se tomarán ejemplos de estos dominios para estudiar la viabilidad de los métodos, particularmente de la técnica FZ-ARMA, en diversas aplicaciones de audio.

\vskip1.000000\baselineskip

5.1 Modelado de las respuestas impulso de una sala

Una aplicación que constituye un reto para el modelado AR/ARMA es encontrar aproximaciones compactas pero perceptivamente válidas para las respuestas de impulso de una sala [12] medidas (o calculadas). Esto se necesita, por ejemplo, en análisis modales de salas a bajas frecuencias, en diseños de reverberaciones artificiales o en la ecualización de respuestas de salas con altavoces.

Como caso de estudio (F), se lleva a cabo un análisis del comportamiento modal a bajas frecuencias de una respuesta de impulso de una sala utilizando diferentes métodos AR y FZ-ARMA. La sala tiene unas dimensiones aproximadas de 5,5 x 6,5 x 2,7 m^{3}. La figura 8(a) describe el comportamiento en tiempo-frecuencia (espectro de amortiguación acumulativo) para frecuencias por debajo de los 220 Hz tal como se calcula a partir de una respuesta de impulso medida de una sala. La sala muestra amortiguaciones modales particularmente intensas y largas de alrededor de 45 Hz.

Un modelado AR sencillo de la respuesta de impulso de la sala por debajo de los 220 Hz utilizando una predicción lineal, genera unos resultados bastante precisos cuando el orden P del filtro totalmente polar tiene un valor alrededor de 100 o superior para la gama de bajas frecuencias. La figura 8(b) muestra el gráfico de la amortiguación de la respuesta del modelo cuando P = 80. La tasa de muestreo original de 44.100 Hz se diezmó mediante un factor de 110 antes de modelar mediante AR. Una comparación con la figura 8(a) revela que los tiempos de amortiguación de los modos prominentes están bastante bien modelados pero muchos modos más débiles son demasiado cortos o están demasiado amortiguados debido al orden del modelo insuficiente.

El modelado ARMA directo mediante el método Steiglitz-McBride genera un mejor ajuste en el dominio del tiempo con un orden de denominador dado, que el modelo AR correspondiente. Por ejemplo, utilizando un orden de numerador de N = 30 y de denominador de P = 100 funcionó bastante bien para la respuesta de la sala anterior, aunque en muchos casos el algoritmo Steiglitz-McBride proporciona un resultado inestable ya con dichos órdenes de filtro moderados.

El modelo FZ-ARMA es un método potente para modelar de manera precisa el comportamiento modal en una gama de frecuencia limitado. La figura 9 representa los resultados del modelado de la región modal prominente 33...58 Hz en la respuesta de la figura 8(a). La región incluye tres modos principales en las frecuencias de 37, 46 y 55 Hz. La figura 9 muestra la envolvente de amortiguación de la región modal para la señal original (línea discontinua), y como resultado de aplicar el método de Steiglitz-McBride de diferentes órdenes (línea continua). Aumentando el orden del filtro mejora el ajuste de la envolvente pero al final puede empezar a modelar la envolvente del ruido de fondo. Los gráficos de polo nulo de la parte de la derecha indican que para un orden P = 6 los polos corresponden a los tres modos, mientras que para órdenes mayores existen polos adicionales y no es fácil asociarlos con los modos.

A frecuencias más altas, por encima de la frecuencia crítica (frecuencia de Schroeder) [29] de la sala, el comportamiento modal es difuso, es decir, la densidad modal es alta y los modos se superponen en frecuencia. El modelado AR y ARMA de la gama de audio completo es difícil, si no imposible. No obstante, es posible aplicar el análisis FZ-ARMA a una banda de frecuencia estrecha de una respuesta reverberante. La figura 10 describe un ajuste a la respuesta de la sala estudiada dentro de una banda crítica a 1 kHz (920 ... 1.080 Hz) mediante órdenes de modelo diferentes. Con el orden de modelo más elevado P = 60, el ajuste de la envolvente es bueno para los primeros 250 ms y para una gama dinámica de alrededor de 40 dB.

\vskip1.000000\baselineskip

5.2 Ecualización altavoz/sala

La ecualización de la respuesta de un altavoz o de una cadena de reproducción altavoz-sala significa corregir la respuesta del sistema más próxima al criterio técnico o de percepción deseado. El modelado AR y ARMA se ha comentado en la literatura de diversas formas para un altavoz y para una ecualización de una respuesta en frecuencia in situ, ambos en formulaciones tanto en línea como fuera de línea [30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 17, 40, 41, 42, 43, 23].

La ecualización de la respuesta en magnitud de campo libre (posiblemente incluyendo la respuesta de la fase) de un altavoz mediante DSP se puede llevar a cabo utilizando muchas técnicas conocidas. En el caso de altavoces de la más alta calidad existe apenas necesidad de mejorar su respuesta de campo libre, pero la combinación altavoz-sala puede beneficiarse en gran manera de una ecualización adecuada.

La tarea combinada de la ecualización del altavoz y de la sala también es exigente dado que es esencialmente un problema de encontrar una ecualización en tiempo-frecuencia de percepción óptima, en lugar de aplanar simplemente el espectro de magnitud y/o linealizar la fase. Parece que existe una confusión común en la que simplemente aplanando la respuesta, al menos en las frecuencias bajas en las que podría ser técnicamente posible, se lograría una solución ideal. Una mejor estrategia es mejorar el equilibrio de todos los parámetros acústicos, particularmente el del tiempo de reverberación. Tal como se ha tratado en [44], esto se puede realizar controlando los tiempos de amortiguación de modos individuales a bajas frecuencias, típicamente por debajo de los 200 Hz, para hacer coincidir el tiempo de reverberación en las frecuencias medias. Esto se denomina ecualización modal. Se puede seguir con una corrección tradicional de la envolvente de la respuesta de magnitud. La necesidad de dicha corrección activa en la acústica de salas es particularmente importante alrededor de los 100 Hz incluso en espacios designados para propósitos de audición, tales como salas para monitorización de audio [45].

\vskip1.000000\baselineskip

En [44] hemos propuesto un método para la ecualización modal. En la presente solicitud de patente sugerimos otra técnica para realizar la ecualización modal, combinada opcionalmente con la corrección de la envolvente de la magnitud. El marco general de la ecualización modal se ha tratado en detalle en documentos anteriores. Una breve descripción del procedimiento es:

1.: Medir la respuesta combinada del altavoz más la de la sala en la posición de audición de interés. Se puede aplicar cualquier técnica moderna para una medida fiable de la respuesta.

2.: Analizar el tiempo de reverberación medio RT_{60} en las frecuencias medias, por ejemplo, entre 500 Hz ... 2 kHz.

3.: Determinar un límite superior del tiempo de amortiguación modal como una función de la frecuencia para la gama de las bajas frecuencias, típicamente por debajo de los 200 Hz. Se puede permitir que este valor aumente ligeramente hacia las frecuencias más bajas [46, 47], por ejemplo linealmente mediante 0,2 s cuando la frecuencia disminuye de 300 Hz a 50 Hz.

4.: Encontrar los modos que necesitan ecualización, es decir, aquellos que tienen un mayor tiempo de amortiguación que el límite superior definido anteriormente. Si el nivel de magnitud de un modo es tan bajo que su extremo final permanece por debajo de un nivel dado, no necesita una ecualización modal ni siquiera cuando su tiempo de amortiguación es mayor que el límite superior. Estimar los valores de los parámetros modales para dichos modos, particularmente la frecuencia modal y la constante del tiempo de amortiguación, y calcular los ángulos y radios de los polos correspondientes.

\newpage

5.: Diseñar un filtro de corrección para cada modo que requiera ecualización, de manera que el filtro acorta el tiempo de amortiguación para cumplir con los criterios de límite superior especificados en la etapa 3. Esto significa anular el par de polos estimados, que representan un modo con un largo tiempo de amortiguación, mediante un par de ceros, y sustituirlo con un nuevo par de polos que tenga el tiempo de amortiguación deseado. Esto se puede realizar con un filtro IIR [44]

16

\quad: donde r y r_{c} son los radios de los polos (complejos conjugados) de la amortiguación original y de la amortiguación corregida, respectivamente, y \theta y \theta_{c} son los ángulos de los polos correspondientes.

6.: Calcular las etapas 4 y 5 tanto en un modo de lotes, es decir, en paralelo para cada modo que va a ser ecualizado, o de manera iterativa, de manera que los modos se ecualizan uno a uno, comenzando desde el más importante y volviendo a la etapa 4, para aplicarlos al resultado de la ecualización anterior. El proceso finaliza cuando todos los modos restantes cumplen el criterio del tiempo de amortiguación o cuando se ha alcanzado un límite superior predeterminado de los modos que se pueden corregir.

7.: La ecualización de magnitud tradicional se puede aplicar al resultado de la ecualización modal, en caso necesario, mediante cualquier método o técnica adecuados.

\vskip1.000000\baselineskip

En este contexto sólo nos interesa la etapa 4 como parte de un análisis en lotes o iterativo. Las demás etapas siguen el esquema general descrito en [44], en el que la búsqueda del modo y la estimación del tiempo de amortiguación se basaban en una representación en tiempo-frecuencia y en el ajuste de una amortiguación logarítmica más el modelo del ruido de fondo utilizando una optimización no lineal. Mientras que el método propuesto anteriormente era sólido para modos que estaban lo suficientemente separados, la fuerte superposición o los modos múltiples con frecuencias estrechamente similares son una dificultad inherente de dicho método. Dado que los modelos AR/ARMA buscan un óptimo global y no intentan separar los modos, son potencialmente una alternativa mejor en dichos casos.

\vskip1.000000\baselineskip

En los casos de ecualización que se muestran a continuación, la búsqueda de modos y la estimación de parámetros se llevan a cabo de manera iterativa de la siguiente manera:

1.: Calcular una función que se puede utilizar de manera sólida para encontrar los modos más importantes y sus frecuencias. Esto se puede realizar de dos maneras, por ejemplo, directamente mediante un análisis AR o ARMA y encontrando los polos con los mayores radios. Debido a que la selección del modelo adecuado puede ser problemática, primero hemos aplicado aquí una función de detección de un modos separados

17

\quad: donde H(\Omega) es la transformada de Fourier de la respuesta medida, \Omega es la frecuencia angular normalizada (ángulo en el plano z) y D es un operador de diferenciación (en el dominio de la frecuencia). Un ejemplo de la función G(\Omega) se representa en la figura 11 (d). Los picos positivos indican modos fuertes que pueden necesitar una ecualización del tiempo de amortiguación. Se debe observar que esta función combina tanto la información del nivel de magnitud como la del tiempo de amortiguación (a través de una derivación de fase). Esta es una función de detección posible y pueden existir otras funciones para dicho propósito.

2.: Encontrar la posición del pico más elevado \Omega_{p} de la función de detección G(\Omega) como el mejor candidato para la ecualización modal. Ejecutar el análisis AR de orden predefinido (aquí se han aplicado órdenes 50...70 para la gama de frecuencias por debajo de los 220 Hz) en la versión de la fase mínima de la respuesta objetivo para encontrar los polos y seleccionar el polo más cercano al punto d^{j\Omega p} en el círculo unidad. Este polo y su complejo conjugado representan ahora el modo más importante.

3.: Si el tiempo de amortiguación del modo se encuentra por debajo del límite superior y el valor de G(\Omega) se encuentra por debajo de un umbral predeterminado experimentalmente, se finaliza el proceso en la etapa 4. En caso contrario, se diseña un filtro de corrección modal de segundo orden del tipo de la ecuación (10) para cambiar el tiempo de amortiguación modal a un valor deseado por debajo del límite superior. Se aplica esto a la respuesta que se va a ecualizar y se utiliza el resultado cuando se retrocede para iterar desde la etapa 1.

4.: Finalmente, reunir los filtros de corrección en un filtro en cascada que es ahora el ecualizador modal para el sistema.

\vskip1.000000\baselineskip

Una ecualización modal simulada, caso (I), se muestra en la figura 11. Se filtra una respuesta de impulso de un altavoz para añadir cinco modos simulados en las frecuencias de 50, 55, 100, 130 y 180 Hz, con tiempos de amortiguación modal de 60 dB de 1,4, 0,8, 1,0, 0,8 y 0,7 segundos, respectivamente. El espectro de amortiguación acumulativo de esta respuesta sintética se muestra en la figura 11(a). La figura 11(b) prueba que el efecto de los modos se puede anular casi perfectamente, dejando únicamente la respuesta del altavoz, desplazando los radios de los polos para corresponder con un tiempo de amortiguación muy corto (alrededor de 60 ms) utilizando el procedimiento descrito anteriormente. En la figura 11(c) el resultado de la ecualización modal representada es más adecuado para las condiciones reales de una sala. El tiempo de amortiguación de cada modo se ecualiza a 250 ms. Los dos modos cercanos parcialmente superpuestos, en las frecuencias 50 y 55 Hz, no provocan ninguna dificultad, y la ecualización modal funciona casi perfectamente. En el caso (J) de la figura 12 el modo único más importante en los 46 Hz se ecualiza acortando el tiempo de amortiguación desde un valor superior a 1 segundo hasta alrededor de los 300 ms utilizando el algoritmo descrito anteriormente y limitando la búsqueda de modos a sólo uno. En la figura 12(b) el modo problemático original se amortigua ahora claramente de manera más rápida. Además, la respuesta ecualizada hasta los 80 Hz tiene una forma mucho más suave dado que la ecualización modal también afecta al espectro de magnitud. No obstante, los tiempos de amortiguación de algunos modos todavía son largos.

La ecualización de múltiples modos de la misma sala, el caso (K), se muestra en la figura 13. La sala es la misma que la analizada en el caso (F), figura 8. El procedimiento descrito anteriormente se itera 100 veces, generando 100 secciones de filtro de corrección de segundo orden, para acortar los tiempos de amortiguación de modos. El espectro de amortiguación acumulativo de la respuesta ecualizada resultante se muestra en la figura 13(b). El valor objetivo para el tiempo de amortiguación modal ecualizado (60 dB) ha sido de 150 ms.

En este caso el resultado no es tan perfecto como en el caso del modo único o sintético. Hay alrededor de 10 dB de amortiguación rápida al principio, tal como se muestra mediante los gráficos de integración inversa en la figura 13(c) y, a continuación, la tasa de amortiguación sigue a la original. Aunque no se consigue el acortamiento ideal del tiempo de amortiguación de manera precisa, aún así realiza una reproducción del sonido en la sala más equilibrado en los términos de reverberación. Además, el procedimiento de ecualización se puede mejorar mediante un ajuste cuidadoso de los detalles.

La etapa final, es decir, la ecualización suave de la envolvente de la respuesta en magnitud, no se trata en este documento dado que se pueden aplicar muchas técnicas conocidas para ecualizar la respuesta en magnitud. No obstante, una elección interesante es integrar la fase de ecualización de la magnitud conjuntamente con el proceso de ecualización modal AR/ARMA.

De acuerdo con la figura 14a en una implementación típica de la invención, el sistema comprende una sala de audición (1), que es bastante pequeña en relación con las longitudes de onda que se van a modificar. Típicamente, la sala (1) es una sala de control cerca de un estudio de grabación. Las dimensiones típicas de este tipo de sala son de 6 x 6 x 3 m^{3} (anchura x longitud x altura). En otras palabras, la presente invención es más adecuada para salas pequeñas. No es muy efectiva para iglesias y salas de conciertos. La intención de la invención es diseñar un ecualizador (5) para compensar los modos de resonancia en la proximidad de una posición (2) de audición predefinida.

La implementación de tipo I modifica la señal de audio alimentada al altavoz (3) principal para compensar los modos de la sala. La función de transferencia total desde el radiador principal a la posición de audición representada en el dominio de Z es

(12)H(z) = G(z) H_{m}(z)

donde G(z) es la función de transferencia del radiador principal desde la entrada eléctrica hasta una salida acústica y H_{m}(z) = B(z)/A(z) es la función de transferencia de la trayectoria desde el radiador principal a la posición de audición. El radiador principal tiene esencialmente una respuesta en magnitud plana y una amortiguación pequeña en nuestra banda de frecuencia de interés, o bien el radiador principal se puede ecualizar mediante medios convencionales y, por tanto, se puede despreciar en la siguiente descripción,

(13)G(Z) = 1

Ahora se diseña un filtro de polo nulo H_{c}(z) que tiene cero pares en las ubicaciones de los polos identificados de las resonancias modales de H_{m}(z). Esto anula los pares de polos de la respuesta de la sala (1) en A(z) sustituyéndolos con nuevos pares de polos A'(z) que generan el tiempo de amortiguación deseado en la función de transferencia modificada H_{m}'(z)

18

\newpage

Esto lleva al filtro de corrección

19

El nuevo par de polos A'(z) se elige en la misma frecuencia de resonancia pero más cerca del origen, logrando de esta manera una resonancia con un valor Q reducido. De esta manera se han desplazado los polos de resonancia modales hacia el origen y se ha reducido el valor Q del modo. La sensibilidad de este enfoque se tratará más adelante con diseños de ejemplo.

\vskip1.000000\baselineskip

Ecualización modal de tipo II

De acuerdo con la figura 14b, el método de tipo II utiliza un altavoz (4) secundario en una posición adecuada en la sala (1) para radiar sonido que interactúa con el campo sonoro generado por los altavoces (3) principales. En el siguiente tratamiento se supone que ambos altavoces (1) y (4) son similares, pero esto no se requiere para implementaciones prácticas. La función de transferencia para el radiador principal (3) es H_{m}(z) y para el radiador secundario (4) H_{1}(z). El sumatorio acústico en la sala genera una respuesta en frecuencia modificada H_{m}'(z) con las características de amortiguación deseadas

20

\vskip1.000000\baselineskip

Esto lleva a un filtro de corrección H_{c}(z) en el que H_{m}(z) y H_{m}'(z) difieren en los radios de los polos modificados

\vskip1.000000\baselineskip

21

\vskip1.000000\baselineskip

y

\vskip1.000000\baselineskip

22

\vskip1.000000\baselineskip

Se debe observar que si los radiadores principal y secundario son la misma fuente, la ecuación 16 se reduce a una formulación paralela de un filtro de corrección en cascada equivalente al del método de tipo I presentado anteriormente

\vskip1.000000\baselineskip

23

\vskip1.000000\baselineskip

Una condición necesaria pero no suficiente para que exista una solución es que el radiador secundario pueda generar un nivel de sonido en la ubicación de audición en las frecuencias en las que puede el radiador principal, dentro de la banda de frecuencia de interés

24

A bajas frecuencias en las que el tamaño de un radiador resulta pequeño en relación a la longitud de onda, es posible situar un radiador de manera que exista una frecuencia en la que el radiador no se acopla bien a la sala. A dichas frecuencias no se puede cumplir la condición de la ecuación 20 y un radiador secundario situado en dicha ubicación no podrá afectar la ecualización modal en dicha frecuencia. Debido a esto puede ser ventajoso tener múltiples radiadores secundarios en la sala. En el caso de múltiples radiadores secundarios, la ecuación 16 se modifica de la siguiente manera

25

donde N es el número de radiadores secundarios.

Una vez se han ecualizado de esta manera los tiempos de amortiguación de los modos individuales, se puede corregir la respuesta en magnitud del sistema resultante para conseguir una respuesta global plana. Se puede implementar esta corrección con cualquiera de los métodos de ecualización de la respuesta en magnitud.

En esta solicitud de patente se tratará la identificación y la parametrización de los modos y se estudiarán algunos casos de ejemplos de aplicación de la ecualización modal propuesta a diversas salas reales y sintéticas, utilizando principalmente el primer método de ecualización modal propuesto anteriormente. El uso de uno o más radiadores secundarios se dejará para un estudio futuro.

\vskip1.000000\baselineskip

6 Conclusiones

En esta solicitud de patente hemos estudiado el modelado de respuestas de sistemas acústicos y de audio que presentan propiedades resonantes y reverberantes. Particularmente, se investigan las técnicas de modelado AR y ARMA para obtener filtros totalmente polares o de polo nulo eficientes. Dicho modelado, si es lo suficientemente preciso e informáticamente económico, encuentra aplicación en la resolución de muchos problemas de audio.

La primera parte de la solicitud de patente es una vista global no teórica de los métodos de modelado AR y ARMA para demostrar sus propiedades y limitaciones inherentes.

Un interés específico de este estudio ha sido los métodos de modelado que pueden generar una buena correspondencia temporal a una respuesta objetivo dada y una elevada resolución en frecuencia, a menudo al mismo tiempo. En base a estudios anteriores, principalmente en la aplicación del método de Prony a subbandas, mostramos que el modelo ARMA (FZ-ARMA) de ampliación de frecuencias basado en la iteración de Steiglitz-McBride es una técnica potente para un modelado de alta resolución en las subbandas. Los ejemplos de simulación demuestran la capacidad de este enfoque para modelar comportamientos reverberantes y modales complejos.

\vskip1.000000\baselineskip

7 Referencias

[1] A. D. Pierce, Acústica, Introducción a sus principios físicos y aplicaciones ("An introduction to its physical principles and applications"). Woodbury, Nueva York: Sociedad acústica de América, 1989.

[2] N. H. Fletcher y T. D. Rossing, La física de los instrumentos musicales ("The physics of musical instruments"). Nueva York: Springer Verlag, 1991.

[3] M. Colloms, Altavoces de alto rendimiento ("High performance loudspeakers"). 5ª edición. Nueva York: Wiley, 1997.

[4] S. M. Kay, Fundamentos del procesamiento estadístico de señales: Volumen I: Teoría de la estimación ("Fundamentals of statistical signal processing: Volume I: Estimation theory"). Englewood Cliffs, N. J.: Prentice-Hall, 1993.

[5] A. V. Oppenheim, A. Willsky e I. Young, Señales y sistemas ("Signals and systems"). Englewood Cliffs, Nueva Jersey: Prentice-Hall, 1983.

[6] S. Haykin, Teoría de filtros adaptativos ("Adaptive filter theory"). Upper Saddle River, Nueva Jersey: Prentice Hall, 1996.

[7] M. H. Hayes, Modelado y procesamiento estadístico de señales digitales ("Statistical digital signal processing and modeling"). Upper Saddle River, N. J.: Prentice Hall, 1996.

[8] Mathworks, Inc., Paquete de herramientas para el procesamiento de señales de MATLAB ("MATLAB Signal processing toolbox"), Guía del usuario, 2001.

[9] Mathworks, Inc., Paquete de herramientas para la identificación de sistemas de MATLAB ("MATLAB System identification toolbox"), Guía del usuario, 2001.

[10] L. B. Jackson, Filtros digitales y procesamiento de señales ("Digital filters and signal processing"). Boston: Kluwer Academic Publ., 1989.

[11] K. Steiglitz, Manual para el procesamiento digital de señales ("A digital signal processing primer"). Menlo Park: Addison-Wesley, 1996.

[12] Y. Haneda, S. Makino e Y. Kaneda, Modelado acústico común de polo y cero de funciones de transferencia para salas ("Common acoustical pole and zero modeling of room transfer functions"), IEEE Actas sobre el procesamiento del habla y de audio, volumen 2, número 2, páginas 320-328, abril 1992.

[13] M. Karjalainen, P. Antsalo, A. Makivirta, T. Peltonen y V. Valimaki, Estimación de los parámetros de amortiguación modal a partir de medidas de una respuesta con ruido ("Estimation of modal decay parameters from noisy response measurements"), en preimpresión, 5290 AES 110ª convención, (Amsterdam, Países Bajos), mayo 2001.

[14] J. D. Bunton y R. H. Small, Espectros acumulativos, ráfagas de tonos y sus aplicaciones ("Cumulative spectra, tone bursts and applications") J. Audio Eng. Soc., volumen 30, número 6, páginas 386-395, junio 1982.

[15] J. Makhoul, Predicción lineal de espectros: propiedades y aplicaciones ("Spectral linear prediction: properties and applications"), IEEE Trans. ASSP, volumen 23, número 5, páginas 283-296, 1975.

[16] J. Laroche, Un nuevo sistema de análisis/síntesis de señales musicales utilizando el método de Prony - Aplicación a sonidos de percusión altamente amortiguados ("A new analysis/synthesis of musical signals using Prony's method - Application to heavily damped percussive sounds"), en Proc. IEEE Conferencia internacional sobre acústica, voz y procesado de señales, páginas 2.053-2.056, volumen 3, 1989.

[17] J. Valakas, M. Paraskevas y J. Mourjopoulos, Análisis de la respuesta de un altavoz de polo nulo mediante una división de bandas y un modelado Prony ("Pole-zero loudspeaker response analysis by bandsplitting and prony modeling") en preimpresión 4214, AES 100ª convenión (Copenhagen), mayo 1996.

[18] J. D. Markel y J. H. G. Gray, Predicción lineal de señales de voz ("Linear prediction of speech signals"). Berlin: Springer Verlag, 1976.

[19] L. R. Rabiner y R. W. Schafer, Procesamiento digital de señales de voz ("Digital processing of speech signals"). Englewood Cliffs, Nueva Jersey: Prentice-Hall, Inc., 1978.

[20] T. W. Parks y C. S. Burrus, Diseño de filtros digitales ("Digital filter design"). Nueva York: John Wiley & Sons, Inc., 1987.

[21] L. Ljung, Identificación de sistemas - Teoría para el usuario ("System identification - Theory for the user"). Upper Saddle River, N. J.: Prentice-Hall, 1999.

[22] A. Härmä, M. Karjalainen, L. Savioja, V. Välimäki, U. K. Laine y J. Huopaniemi, Procesamiento de señales deformadas en frecuencia para aplicaciones de audio ("Frequency-warped signal processing for audio applications"), J. Audio Eng. Soc., volumen 48, número 11, páginas 1.011-1.031, noviembre 2000.

[23] T. Paatero y M. Karjalainen, Filtros de Kautz y teoría generalizada de la resolución en frecuencia y aplicaciones de audio ("Kautz filters and generalized frequency resolution theory and audio applications") en preimpresión 5378 AES 110ª convención, (Amsterdam, Países Bajos), mayo 2001.

[24] L. W. P. Biscainho, P. S. Diniz y P. A. A. Esquef, Procesos ARMA en subbandas con aplicación a la restauración de audio ("ARMA processes in sub-bands with application to audio restoration") en Proc. IEEE Int. Symp. Circ. Syst. (ISCAS 2001), (Sidney-Australia), páginas 157-160, volumen 2, mayo 2001.

[25] J. A. Moorer, Aspectos del procesamiento de señales de música informática: una visión general ("Signal processing aspects of computer music: a survey"), Proc. IEEE, volumen 65, páginas 1.108-1.137, agosto 1977.

[26] V. Valimaki y T. Tolonen, Desarrollo y calibración de un sintetizador de guitarra ("Development and calibration of a guitar synthesizer"), J. Audio Eng. Soc., volumen 46, número 9, páginas 766-778, septiembre 1998.

[27] M. W. Macon, A. McCree, W.-M. Lai y V. Viswanathan, Análisis/síntesis eficiente de sonidos de instrumentos musicales de percusión utilizando un modelo totalmente polares ("Efficient analysis/synthesis of percussion musical instrument sounds using an all-pole model"), en Proc. IEEE Int. Conf. Acoust. Speech, and Signal Processing, páginas 3.589-3.592, volumen 6, 1998.

\newpage

[28] T. Tolonen, V. Valimaki y M. Karjalainen, Modelado de no linealidades en la modulación de tensión en cuerdas punteadas ("Modeling of tension modulation nonlinearity in plucked strings"), IEEE Actas sobre el procesamiento del habla y de audio, volumen 8, número 3, páginas 300-310, mayo 2000.

[29] M. R. Schroeder, Parámetros estadísticos de las curvas de respuestas en frecuencia de salas amplias ("Statistical parameters of the frequency response curves of large rooms"), J. Audio Eng. Soc., volumen 35, número 5, páginas 299-306, 1987.

[30] J. Mourjopoulos, Métodos de ecualización digital para sistemas de audio ("Digital equalization methods for audio systems"), en preimpresión 2598, AES 84ª convención, (París), marzo 1988.

[31] J. Kuriyama y Y. Furukawa, Sistema de altavoz adaptativo ("Adaptive loudspeaker system"), J. Audio Eng. Soc., volumen 37, número 11, noviembre 1989.

[32] S. J. Elliott y P. Nelson, Ecualización de puntos múltiples en una sala utilizando filtros digitales adaptativos ("Multiple-point equalization in a room using adaptive digital filters"), J. Audio Eng. Soc., volumen 37, número 11, noviembre 1989.

[33] J. Mourjopoulos y M. A. Paraskevas, Modelado de polos y ceros de funciones de transferencia de salas ("Pole and zero modelling of room transfer functions"), J. Sound and Vibration, volumen 146, páginas 281-302, noviembre 1994.

[34] R. G. Greenfeld, Aplicación de técnicas digitales a la ecualización de altavoces ("Application of digital techniques to loudspeaker equalization"), Tesis de doctorado, Departamento de ingeniería de sistemas electrónicos de la universidad de Essex, septiembre 1991.

[35] R. Genereux, Filtros adaptativos para altavoces y salas ("Adaptive filters for loudspeakers and rooms"), en preimpresión 3375, AES 98ª convención, (San Francisco), octubre 1992.

[36] F. X. Y. Gao y W. M. Snelgrove, Linealización adaptativa de un altavoz ("Adaptive linearization of a loudspeaker"), en preimpresión 3377, AES 98ª convención, (San Francisco), octubre 1992.

[37] J. Mourjopoulos, Ecualización digital de la acústica de salas ("Digital equalization of room acoustics"), J. Audio Eng. Soc., volumen 42, número 11, noviembre 1994.

[38] G. Karachalios, D. Tsoukalas y J. Mourjopoulos, Análisis y ecualización multibanda de respuestas de altavoces ("Multiband analysis and equalization of loudspeaker response") en preimpresión 3975, AES 98ª convención, (París), febrero 1995.

[39] S. Salamouris, K. Politopoulos, V. Tsakiris y J. Mourjopoulos, Sistema digital para ecualización de altavoces y salas ("Digital system for loudspeaker and room equalization"), en preimpresión 3976, AES 98ª convención, (París), febrero 1995.

[40] Y. Haneda, S. Makino y Y. Kaneda, Ecualización de puntos múltiples de funciones de transferencia de salas utilizando polos acústicos comunes ("Multiple-point equalization of room transfer functions by using common acoustical poles"), IEEE Actas sobre el procesamiento del habla y de audio, volumen 5, número 4, páginas 325-333, julio 1997.

[41] M. Karjalainen, E. Piirilä, A. Järvinen y J. Houpaniemi, Comparación de la ecualización de respuestas de altavoces utilizando filtros digitales distorsionados ("Comparison of loudspeaker response equalization using warped digital filters"), J. Audio Eng. Soc., volumen 47, número 1/2, páginas 15-31, 1999.

[42] F. Fontana, Ecualización de polo común de salas pequeñas utilizando un ecualizador digital de tiempo real en dos etapas ("Common pole equalization of small rooms using a two-step real-time digital equalizer"), en Proc. IEEE Taller sobre aplicaciones del procesamiento de señales a los campos de audio y acústica (WASPAA'99), páginas 195-198, 1999.

[43] M. Tyril, J. A. Pedersen y P. Rubak, Filtros digitales para ecualización de baja frecuencia ("Digital filters for low-frequency equalization"), J. Audio Eng. Soc., volumen 49, número 1/2, páginas 36-43, enero/febrero 2001.

[44] A. Makivirta, P. Antsalo, M. Karjalainen y V. Valimaki, Ecualización modal de baja frecuencia de respuestas altavoz-sala ("Low-frequency modal equalization of loudspeaker-room responses"), en preimpresión 5480, AES 111ª convención, (Nueva York), noviembre/diciembre 2001.

[45] A. Mildvirta y C. Anet, Un estudio de investigación de las condiciones de control de múltiples canales y estéreo in situ ("A survey study of in-situ stereo and multi-channel monitoring conditions"), en preimpresión 5496, AES 111ª convención, (Nueva York), noviembre/diciembre 2001.

[46] Comité técnico AES sobre tecnología de audio binaural y multicanal (TC-MBAT), Sistemas de sonido envolvente multicanal y operaciones ("Multichannel surround sound systems and operations"), Documento técnico, versión 1.5, AES, 2001.

[47] EBU Documento técnico 3276-1998 (segunda edición), Condiciones de audición para la evaluación de material de programas de sonido: monofónico y estereofónico de dos canales ("Listening condition for the assessment of sound programme material: monophonic and two-channel stereophonic"), EBU, 1998.

[48] J. O. Smith, Modelado físico utilizando guías de onda digitales ("Physical modeling using digital waveguides"), Computer music J., volumen 16, número 4, páginas 74-91, 1992.

[49] V. Valimaki, J. Huopaniemi, M. Karjalainen y Z. Jinosy, Modelado físico de instrumentos de cuerdas punteadas con aplicación a la síntesis de sonido en tiempo real ("Physical modeling of plucked string instruments with application to real-time sound synthesis"), J. Audio Eng. Soc., volumen 44, número 5, páginas 331-353, mayo 1996.

[50] J. O. Smith, Técnicas para el diseño de filtros digitales e identificación de sistemas con aplicación al violín ("Techniques for digital filter design and system identification with application to the violin"), Tesis de doctorado, CCRMA, Departamento de música, Stanford University, Stanford, CA, junio 1983, informe STAN-M-14.

[51] M. Sandler, Algoritmo para encontrar raíces con elevada precisión a partir de modelos LPC de orden elevado ("Algorithm for high precision root finding from high order LPC models"), Documento IEEE - I sobre comunicaciones, habla y visión (IEEE Proceedings I on communications, speech and vision), volumen 138, número 6, páginas 596-602, diciembre 1991.

[52] M. Sandler, Nuevas técnicas de síntesis para filtros totalmente polares de elevado orden ("New synthesis techniques for high-order all-pole filters"), Documento IEEE - I sobre comunicaciones, habla y visión (IEEE Proceedings I on communications, speech and vision), volumen 139, número 1, páginas 9-16, febrero 1992.

[53] J. Laroche y J.-L. Meillier, Excitación multicanal/modelado de filtros de sonidos de percusión con aplicación al piano ("Multichannel excitation/filter modeling of percussive sounds with application to the piano"), IEEE Actas sobre procesamiento de habla y audio, volumen 2, número 2, páginas 329-344, abril 1994.

[54] J. Mackenzie, I. Kale y G. D. Cain, Aplicación del truncamiento de un modelo equilibrado a los modelos de análisis/síntesis de sonido ("Applying balanced model truncation to sound analysis/synthesis models"), en Proc. Int. Computer Music Conf., páginas 400-403, septiembre 1995.

[55] M. Karjalainen, V. Valimaki y T. Tolonen, Modelos de cuerdas punteadas, a partir del algoritmo de Karplus-Strong a las guías de onda digitales y más allá ("Plucked string models, from the Karplus-Strong algorithm to digital waveguides and beyond"), Computer Music J., volumen 22, número 3, páginas 17-32, 1998.

Claims

1. Método para la formación de un ecualizador modal (5) para una gama audible de frecuencias bajas, en particular para frecuencias por debajo de los 200 Hz para un espacio (1) predeterminado y una ubicación (2) en el mismo, que comprende las etapas de:

-: determinar los modos que se van a ecualizar al menos mediante una frecuencia central y una tasa de amortiguación de cada modo,

-: crear una descripción en tiempo discreto de los modos determinados, y

-: determinar los coeficientes del filtro ecualizador en base a la descripción en tiempo discreto de los modos determinados, y

-: formar el ecualizador (5) mediante un filtro digital definiendo los coeficientes del filtro en base a las propiedades de los modos,

en el que dicho método está caracterizado por las etapas de

-: formar una función de detección de modo (G(\Omega)),

-: definir la frecuencia \Omegap angular del pico más alto de la función (G(\Omega)),

-: realizar un análisis autorregresivo de orden predefinido sobre la versión de fase mínima de la respuesta objetivo para resolver los polos del modo que representa la frecuencia angular del pico más elevado,

-: seleccionar el polo más cercano al punto e^{j\Omega p} del círculo unidad, para representar con su complejo conjugado el modo más importante,

-: determinar el tiempo de amortiguación de dicho modo y si es superior a un nivel predeterminado, diseñar un filtro de corrección modal para dicho modo y aplicar dicho filtro de corrección modal a la respuesta que se va a ecualizar, y

-: repetir este procedimiento hasta que ningún tiempo de amortiguación supere el nivel predeterminado y

-: formar el ecualizador combinando todos los filtros de corrección modal obtenidos de esta manera en un filtro de ecualización modal en cascada.

\vskip1.000000\baselineskip

2. Método, según la reivindicación 1, caracterizado porque la descripción en tiempo discreto es una transformada en Z.

3. Método, según la reivindicación 1 ó 2, caracterizado porque se aplica el orden 50-70 al análisis AR.

\vskip1.000000\baselineskip

4. Método, según la reivindicación 1 ó 2 ó 3, caracterizado porque se utiliza un filtro de corrección de segundo orden de la ecuación

26

para corregir cada modo único.

\vskip1.000000\baselineskip

5. Método, según cualquiera de las reivindicaciones 1 a 4, caracterizado porque se modifica el sonido de los altavoces (3) principales.

6. Método, según cualquiera de las reivindicaciones 1 a 4, caracterizado porque se modifica el sonido de los altavoces (4) secundarios.