ES2333953T3 - Metodo para el diseño de un ecualizador modal para una gama audible de frecuencias bajas, especialmente para modos posicionados muy proximos. - Google Patents
Metodo para el diseño de un ecualizador modal para una gama audible de frecuencias bajas, especialmente para modos posicionados muy proximos. Download PDFInfo
- Publication number
- ES2333953T3 ES2333953T3 ES03735728T ES03735728T ES2333953T3 ES 2333953 T3 ES2333953 T3 ES 2333953T3 ES 03735728 T ES03735728 T ES 03735728T ES 03735728 T ES03735728 T ES 03735728T ES 2333953 T3 ES2333953 T3 ES 2333953T3
- Authority
- ES
- Spain
- Prior art keywords
- modes
- modal
- response
- filter
- modeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/16—Automatic control
- H03G5/165—Equalizers; Volume or gain control in limited frequency bands
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Networks Using Active Elements (AREA)
- Piezo-Electric Or Mechanical Vibrators, Or Delay Or Filter Circuits (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
- Junction Field-Effect Transistors (AREA)
- Amplifiers (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Filters And Equalizers (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Método para la formación de un ecualizador modal (5) para una gama audible de frecuencias bajas, en particular para frecuencias por debajo de los 200 Hz para un espacio (1) predeterminado y una ubicación (2) en el mismo, que comprende las etapas de: - determinar los modos que se van a ecualizar al menos mediante una frecuencia central y una tasa de amortiguación de cada modo, - crear una descripción en tiempo discreto de los modos determinados, y - determinar los coeficientes del filtro ecualizador en base a la descripción en tiempo discreto de los modos determinados, y - formar el ecualizador (5) mediante un filtro digital definiendo los coeficientes del filtro en base a las propiedades de los modos, en el que dicho método está caracterizado por las etapas de - formar una función de detección de modo (G(omega)), - definir la frecuencia omega p angular del pico más alto de la función (G(omega)), - realizar un análisis autorregresivo de orden predefinido sobre la versión de fase mínima de la respuesta objetivo para resolver los polos del modo que representa la frecuencia angular del pico más elevado, - seleccionar el polo más cercano al punto e j omega p del círculo unidad, para representar con su complejo conjugado el modo más importante, - determinar el tiempo de amortiguación de dicho modo y si es superior a un nivel predeterminado, diseñar un filtro de corrección modal para dicho modo y aplicar dicho filtro de corrección modal a la respuesta que se va a ecualizar, y - repetir este procedimiento hasta que ningún tiempo de amortiguación supere el nivel predeterminado y - formar el ecualizador combinando todos los filtros de corrección modal obtenidos de esta manera en un filtro de ecualización modal en cascada.
Description
Método para el diseño de un ecualizador modal
para una gama audible de frecuencias bajas, especialmente para modos
posicionados muy próximos.
La presente invención se refiere a un método, de
acuerdo con el preámbulo de la reivindicación 1, para formar un
ecualizador modal para una gama audible de bajas frecuencias,
especialmente para modos posicionados muy próximas.
El análisis y modelado paramétrico es una tarea
cada vez más común en los campos de acústica y audio. En esta
solicitud de patente nos centraremos en dichos problemas
relacionados con el audio en los que se puede medir una respuesta
de sistema objetivo y la tarea es modelarlo para una
síntesis/simulación informática o para realizar un modelo inverso
para su ecualización, es decir, compensar la falta de idealidad en
la respuesta observada. Los ejemplos representativos del primer
grupo, simulación directa para la síntesis, son el modelado de una
respuesta de una sala que comprende el diseño de una reverberación
artificial, o simplemente una estimación de los modos propios en
bajas frecuencias en estudios acústicos de espacios cerrados, y el
modelado de instrumentos musicales. La segunda categoría, el
modelado inverso, es común en audio, donde la ecualización de las
propiedades no ideales de la respuesta es una tarea frecuente en la
reproducción de sonido de alta calidad, así como para evitar la
realimentación acústica en los sistemas de refuerzo de sonido.
El comportamiento de los sistemas acústicos o de
audio a bajas frecuencias se puede modelar a menudo de manera
analítica y puede ser parametrizado, al menos con modelos
concentrados, por ejemplo el comportamiento modal a bajas
frecuencias de una sala rectangular [1], el cuerpo de un instrumento
musical [2], o una envolvente de un altavoz [3]. Para estructuras
irregulares y/o frecuencias más altas es más difícil o imposible
encontrar modelos numéricos o analíticos que sean útiles en la
práctica. En estos casos aún es posible medir las respuestas del
sistema y aplicar técnicas de modelado de señales para analizar,
simular o sintetizar en tiempo real una respuesta dada.
Un interés particular de este estudio se centra
en las características de resonancia y reverberación de sistemas
acústicos complejos. El comportamiento modal, es decir, la
descomposición de los modos propios suponiendo un sistema lineal e
invariante en el tiempo (LTI), puede ser extremadamente complicado.
En resonadores unidimensionales, tales como cuerdas y tubos de
instrumentos musicales, la densidad de los modos propios no es
necesariamente alta, pero estos modos pueden presentar detalles
complicados, por ejemplo, una amortiguación en dos etapas y una
fuerte pulsación en una envolvente amortiguada. En resonadores de
dos y tres dimensiones, tales como membranas, placas y espacios
cerrados, la densidad modal aumenta hacia las frecuencias más altas,
dando como resultado unas configuraciones modales densas y un
comportamiento de tipo reverberativo cuando los modos propios
adyacentes se superponen esencialmente. Además, el comportamiento
temporal se vuelve complejo, especialmente en salas donde al sonido
directo y a las primeras reflexiones les sigue un aumento de la
densidad de las reflexiones que dan como resultado una
reverberación tardía. De esta manera, el problema de modelar las
respuestas medidas puede beneficiarse de un punto de vista de
modelado en tiempo-frecuencia en el que también se
tienen en cuenta las propiedades de la percepción del
auditorio.
Existe una amplia literatura sobre el modelado
de señales de sistemas LTI [4, 5, 6, 7] en muchas ramas de la
ingeniería, ciencias de sistemas y aplicaciones. Se encuentran
disponibles herramientas de programación para el modelado, por
ejemplo en MATLAB. En este documento se utilizan particularmente las
funciones que se encuentran en el paquete de herramientas de
procesamiento de señales [8]. Otro paquete de herramientas de
MATLAB que es de interés es el paquete de herramientas de
identificación de sistemas [9]. En este documento se supone que el
sistema objetivo y el modelo deseado son, además de lineales e
invariantes en el tiempo, también estables y causales. También se
supone que la respuesta medida no está demasiado contaminada por
ruido, de manera que la estimación de los parámetros modales del
sistema es práctica para las aplicaciones que se tratan aquí.
Posteriormente, se puede aproximar la respuesta de impulso medida
h(n) mediante una expresión racional en el dominio de la
transformada en Z mediante
que hace posible simular o
sintetizar el sistema de manera eficiente mediante diversas
implementaciones de filtros digitales [5, 10, 11] de la función de
transferencia
dada.
En esta solicitud de patente se tratarán
únicamente representaciones en tiempo discreto para el procesamiento
digital de señales. De esta manera, la manera más fácil de
"modelar" una respuesta medida h(n) o su versión
truncada/parcial es tratarla directamente como un filtro FIR
Para sistemas complejos, la longitud de una
respuesta de impulso finito requerida para una representación
adecuada puede ser demasiado larga, impidiendo implementaciones en
tiempo real. Por otra parte, la reducción de la longitud del filtro
reduce las capacidades de identificación de las propiedades de
resonancia inherentes del sistema bajo estudio. Los filtros IIR
para respuesta de impulso infinito se pueden presentar en dos
formas: (a) modelos totalmente polares en los que el numerador de
la ecuación (1) se reduce a un único coeficiente de ganancia
b_{0} o (b) modelos de polo nulo en los que tanto el numerador
como el denominador son polinomios de Z no triviales.
En la ciencia de sistemas y en ingeniería, por
ejemplo en la teoría de control de tareas de estimación e
identificación, los términos autorregresivo (A), media móvil (MA) y
media móvil autorregresiva (ARMA) han sido utilizados para procesos
de modelado similares al modelado de filtros totalmente polares,
FIR, y de polo nulo, respectivamente. Por motivos de una
utilización adecuada de las abreviaturas AR y ARMA, así como para
llamar la atención a los amplios conocimientos de otros diversos
campos además del de procesamiento de señales de audio digitales,
en este documento se aplican los términos MA, AR y ARMA cuando se
refieren a tipos de modelos específicos.
Nuestra intención no es limitarse a obtener una
aproximación útil de un sistema objetivo medido mediante una
función de transferencia de la ecuación [1]. Estamos interesados en
descomponerla en una descripción paramétrica de sus componentes
constitutivos, particularmente los pares de polos complejos
conjugados, es decir, las raíces de valores complejos del polinomio
del denominador, que representan los modos propios del sistema y dan
como resultado el comportamiento resonante y reverberante. En
teoría son comunes en sistemas distribuidos espacialmente tales
como una sala [12] o el cuerpo de un instrumento, mientras que los
ceros (raíces del numerador 3 dependen
esencialmente de la posición. Estamos interesados en una estimación
precisa de los parámetros modales, tales como el ángulo polar y el
radio o, de manera equivalente, la frecuencia del modo y el
coeficiente de amortiguación.
En la ecuación [13] estudiamos este problema de
la estimación de los parámetros modales utilizando las técnicas de
análisis en tiempo-frecuencia tradicionales,
intentando aislar, en primer lugar, las frecuencias de los modos
potenciales y, posteriormente, estimando la tasa de amortiguación
modal a partir de un espectrograma, tal como un análisis de Fourier
de periodo corto o un espectro de amortiguación acumulativo [14]. La
estimación de la tasa de amortiguación también fue aplicada a
señales de banda ancha, por ejemplo para una estimación sólida del
tiempo de reverberación T_{60}. El problema con dichos métodos es
modelar modos superpuestos que dan como resultado una amortiguación
no exponencial en cualquier intervalo de frecuencia razonable. Los
enfoques AR y ARMA intentan modelar la respuesta objetivo en
conjunto, minimizando un criterio de error de modelado dado,
típicamente el error de mínimos cuadrados (LS). De esta manera, las
interacciones de los modos superpuestos se tienen en cuenta
simultánea y sistemáticamente.
Un problema de optimización directa es la poca
flexibilidad de los criterios de optimización global, por ejemplo
para tener en cuenta las propiedades de los diferentes modos.
Además, la selección de los valores adecuados para los parámetros
de orden N y P de la ecuación [1] no es fácil. Un problema práctico
es que resolver las raíces (de valores complejos) de un polinomio
de orden elevado es una tarea numérica difícil. Para evitar
problemas con modelos de orden elevado utilizamos métodos en los que
cada vez se modela una parte de la gama de frecuencias de audio
dada para obtener una descripción precisa de los modos dentro de
este intervalo de frecuencias. El modelado ARMA de ampliación de
frecuencias (FZ-ARMA) se demuestra que es una manera
potente de descomponer respuestas resonantes altamente complejas en
representaciones modales, y se pueden utilizar las implementaciones
de filtro IIR relacionadas para simular y sintetizar dichos
sistemas. Nuestra investigación está particularmente influida por
estudios anteriores sobre predicciones lineales selectivas [15], el
modelado de múltiples bandas de señales musicales [16] o las
respuestas de altavoces [17] y otras técnicas de modelado de
sistemas de alta resolución.
Esta solicitud de patente está estructurada como
se detalla a continuación. Las secciones 2 y 3 presentan una visión
global de los métodos y técnicas de modelado AR y ARMA. Se dan
ejemplos para ilustrar la capacidad de modelado y las limitaciones
de estos enfoques básicos. La sección 4 presenta el método ARMA de
ampliación de frecuencias (FZ-ARMA) que es capaz de
analizar sistemas de orden elevado con modos superpuestos y
distribuciones modales densas. Se describen los efectos de la
ausencia de idealidad, incluyendo ruido y comportamiento no LTI. En
la sección 5 se describen tres casos de aplicaciones de audio que
utilizan métodos AR/ARMA/FZ-ARMA, incluyendo el
modelado de respuestas medidas en salas, el modelado inverso y la
ecualización de respuestas altavoces-sala y el
modelado así como la síntesis del sonido de instrumentos
musicales.
\vskip1.000000\baselineskip
La respuesta de impulso de un sistema resonante
muestra una o más sinusoides amortiguadas exponencialmente. Cada
uno de dichos "modos" se puede modelar inherentemente mediante
un par de polos complejos conjugados, lo que sugiere un modelado AR
con los filtros de respuesta de impulso infinito (IIR)
correspondientes. Existe una larga tradición de buscar un ajuste
óptimo de mínimos cuadrados de dichos modelos para respuestas
medidas de sistemas LTI, tanto para una respuesta de impulso dada o
para pares de señales entrada-salida. En este
documento nos referiremos brevemente a la teoría de la predicción
lineal (LP) que ha encontrado aplicación especialmente como una
potente técnica de modelado espectral en el procesamiento de voz
[18, 19].
En la predicción lineal se supone que una
muestra de señal x(n) es predecible como una combinación
lineal de muestras anteriores
Cuando se minimiza el error de predicción de los
mínimos cuadrados entre x(n) y \hat{x}(n), los
coeficientes de (auto)correlación
juegan un papel
principal.
\vskip1.000000\baselineskip
La versión utilizada más frecuentemente del
análisis LP es el método de autocorrelación, en el que los
parámetros del modelo óptimos a_{i} se resuelven a partir de una
ecuación matricial lineal (ecuaciones normales)
\vskip1.000000\baselineskip
En esta ecuación, r_{k} son los coeficientes
de autocorrelación r_{x}(k) de la ecuación (2) para una
estructura de señales bajo estudio, y P es el orden del análisis LP
(orden del filtro modelo totalmente polar). Los coeficientes
a_{i} son los coeficientes polinomiales estimados del denominador
de la ecuación (1), es decir,
siendo el numerador únicamente un
coeficiente de ganancia. El análisis predictivo lineal se calcula en
MATLAB mediante la función "lpc", que primero resuelve los
coeficientes de autocorrelación r_{k} y posteriormente invierte
la matriz de correlación de tipo Toeplitz para obtener los
coeficientes de predicción a_{i} a través de la función de
recurrencia de Levinson
[8].
Un problema con el modelado AR de sistemas del
mundo real, en la formulación descrita anteriormente, es que el
método no es capaz de realizar un ajuste en el dominio del tiempo
para una respuesta objetivo dada a menos que el proceso objetivo
sea estrictamente del tipo AR (totalmente polar). La figura 1
muestra esto claramente en un caso simple de un modo idealizado.
Para una sinusoide amortiguada en la figura 1(a) la respuesta
del modelo en la figura 1(e) es una réplica muy precisa del
objetivo ya con orden de modelo 2 (un par de polos complejos
conjugados). Si la fase inicial se cambia 90 grados a una función
coseno amortiguada, la respuesta del modelo AR de segundo orden
(línea continua) de la figura 1(f) desciende
considerablemente del objetivo dado en la figura 1(b).
Se obtiene una comprensión más profunda del
comportamiento del modelado AR observando que el modelo está basado
totalmente en los coeficientes de autocorrelación, que en el dominio
de la frecuencia corresponden al espectro de potencias. Esto
significa un modelado espectral puro, mediante el cual el espectro
del caso coseno de la figura 1(d) se desvía claramente del
espectro de la respuesta del caso seno de la figura 1(c). Los
inicios irregulares son comunes en las respuestas de sistemas
acústicos, indicando de esta manera que el modelado AR simple
tendrá dificultades y que se necesitan métodos más potentes para un
modelado temporal preciso.
Se puede conseguir una mejor correspondencia en
el extremo del coseno amortiguado mencionado anteriormente mediante
el método de covarianza del análisis AR, pero se sigue teniendo el
problema de correspondencia de fase y se requiere un modelado ARMA.
La función del método de covarianza "ar", opción "ls", se
puede encontrar en el paquete de herramientas de identificación de
sistemas de Matlab.
\vskip1.000000\baselineskip
El modelado ARMA, que genera un filtro de polo
nulo, tiene más poder de modelado que el método AR. No obstante, es
más difícil debido a que no se encuentran soluciones cerradas,
requiriendo de esta manera una optimización no lineal. Los
algoritmos de estimación ARMA son iterativos, comenzando por un buen
modelo AR y, posteriormente, iterando hacia los valores de
parámetros óptimos. Al igual que con cualquier método de
optimización no lineal, pueden producirse problemas de divergencia
o de convergencia a un óptimo local y se encuentran simples
problemas informáticos debido a la falta de precisión numérica.
A continuación se aplican dos métodos: el método
de Prony y el método Steiglitz-McBride (estos
métodos se encuentran disponibles como funciones prony y stmcb del
paquete de herramientas de procesamiento de señales de Matlab). Se
da una breve explicación del problema de la selección del orden del
modelo, seguida de la motivación de la necesidad de una resolución
en frecuencia mejorada, antes de introducir la técnica ARMA de
ampliación de frecuencias.
El método de Prony [20, páginas
226-228] es un algoritmo de incrementos sucesivos
que ajusta las N + 1 primeras muestras de una respuesta dada de
manera exacta, mientras los P polos del denominador de la ecuación
(1) se encargan del ajuste de la amortiguación del extremo. Debido
a que la estimación de la parte AR es del tipo covarianza, el
filtro resultante puede volverse inestable, incluso en los casos en
los que el sistema objetivo a modelar es estable.
El método de Steiglitz-McBride
[7, páginas 174-177] es un algoritmo con un
prefiltrado iterativo para un ajuste de mínimos cuadrados de un
modelo ARMA de la ecuación (1) de una respuesta de impulso dada o de
un par entrada-salida dado (problema de
identificación de sistemas). Se puede obtener una estimación inicial
para el denominador por ejemplo mediante el método de Prony. Como
con el método de Prony, el filtro resultante de la iteración
Steiglitz-McBride puede volverse inestable
especialmente con órdenes de filtro elevados incluso para sistemas
objetivo estables. A menudo, la respuesta modelo comienza con una
buena correspondencia con la respuesta dada en el dominio del
tiempo (dado que es un ajuste LS) pero tras un tiempo comienza a
crecer rápidamente debido al polo o polos situados en el exterior
del círculo unidad.
Tanto el modelo AR como el modelo ARMA necesitan
una selección cuidadosa de los órdenes del filtro N y P
(N = 0) para modelos AR). No hay ninguna manera general y automática para seleccionar el orden u órdenes óptimos del filtro, en su lugar se pueden buscar mediante diversas reglas para obtener una correspondencia suficientemente buena a una respuesta objetivo dada [21] o se puede aproximar el orden u órdenes utilizando una información previa sobre el sistema objetivo a modelar.
(N = 0) para modelos AR). No hay ninguna manera general y automática para seleccionar el orden u órdenes óptimos del filtro, en su lugar se pueden buscar mediante diversas reglas para obtener una correspondencia suficientemente buena a una respuesta objetivo dada [21] o se puede aproximar el orden u órdenes utilizando una información previa sobre el sistema objetivo a modelar.
En la figura 2 se muestra un ejemplo ilustrativo
de cómo el orden del modelado AR (predicción lineal) afecta las
frecuencias modales estimadas (ángulos polares). Se representa el
espectro de magnitud de una respuesta medida de una sala en
comparación con un mapa de bifurcación de la frecuencia de un polo
relacionado. Para los órdenes más bajos, únicamente los rangos de
pico espectral se aproximan de manera general y para órdenes de
modelo crecientes estos polos se dividen en nuevos pares de polos y
grupos de polos.
En este estudio nos interesa el modelado de
sistemas resonantes y reverberantes mediante métodos en los que los
polos y los parámetros relacionados, ángulos y radios, se pueden
resolver explícitamente. Esto se necesita en aplicaciones tales
como las que se explican más adelante en la sección de aplicaciones.
La selección del orden del modelo es entonces más exigente que en
los casos en los que es suficiente encontrar los coeficientes del
numerador y el denominador. Si el orden del modelo es demasiado
bajo, no todos los modos se representan adecuadamente mediante
pares de polos complejos conjugados, o los radios de los polos
encontrados se quedan demasiado bajos. Si el orden del modelo es
demasiado alto, los modos únicos se sobremodelan a menudo, es decir,
se les asignará más de un par de polos por modo.
Aún siendo potente en casos simples para órdenes
de modelo bajos, los métodos descritos anteriormente presentan
dificultades con órdenes elevados y sistemas objetivo complejos. A
menudo dichos problemas se originan como resultado de una precisión
informática limitada. En el método de Prony y en la iteración de
Steiglitz-McBride, la inestabilidad potencial es a
menudo un problema. Aunque los polos situados en el exterior del
círculo unidad se pueden reflejar en el interior del círculo
unidad, generando un espectro de magnitud equivalente, la estructura
temporal de la respuesta de impulso cambia.
La predicción lineal (método de autocorrelación)
puede generar resultados estables y precisos con órdenes de modelo
de cientos o miles, particularmente cuando los polos no se
encuentran muy cerca del círculo unidad o entre sí. No obstante, si
se deben resolver explícitamente los polos (y los ceros), lo cual es
de interés en este estudio, la resolución de las raíces del
denominador (y del numerador) es típicamente más problemática que
obtener dichos polinomios en sí. El modelado selectivo de
frecuencias AR y ARMA resuelve alguno de estos problemas.
La presente invención difiere de la técnica
anterior en que se forma una función de detección de modo, se halla
la frecuencia angular \Omega_{p} del pico más alto de la
función, se realiza el análisis AR del orden predefinido para
identificar los polos correspondientes, seleccionando el polo más
próximo al punto e^{j\Omega p} en el círculo unidad, se determina
el tiempo de amortiguación del modo, y si es superior a un nivel
predeterminado, se diseña un filtro de corrección modal para dicho
modo, se repite el procedimiento y si ninguno de los tiempos de
amortiguación supera dicho nivel predeterminado se forma un filtro
en cascada a partir de cada filtro individual.
Más específicamente, el método según la
invención se caracteriza por lo que se especifica en las parte
caracterizante de la reivindicación 1.
La invención ofrece beneficios sustanciales.
Con la ayuda de la invención también se pueden
ecualizar de manera efectiva los modos cercanos entre sí.
\vskip1.000000\baselineskip
A continuación se describirá la invención en más
detalle con referencia a las realizaciones a modo de ejemplo
mostradas en los dibujos adjuntos en los que
La figura 1 muestra un modelado AR con
amortiguación de un modo único con diferente fase inicial: (a)
espectro de la respuesta seno, (d) espectro de la magnitud de la
respuesta coseno, (e) respuesta del modelo AR para una respuesta
sinusoidal con orden 2 y (f) respuesta del modelo AR para un caso
coseno con orden de 2 (línea continua) y orden de 20 (línea
discontinua).
La figura 2 muestra un espectro de magnitud de
una respuesta medida de una sala (superior) y las frecuencias
correspondientes a los ángulos de los polos obtenidas a partir de la
predicción lineal de orden variable (inferior).
La figura 3 muestra el caso (A), la pulsación de
amplitud debida a dos modos con frecuencias cercanas: (a) la señal
sintética generada de acuerdo con la ecuación 9 con los parámetros
dados en la tabla 1; (c) las envolventes de la amplitud original
(línea discontinua) y de la amplitud modelada (línea continua)
(curvas que se superponen casi perfectamente) y (e) la señal
resintetizada basada en el modelo estimado. Los subgráficos (b), (d)
y (f) se refieren a una señal modificada generada con los
parámetros mostrados en la tabla 1 pero con fases sustituidas por
\theta_{1} = \theta_{2} = \pi/2.
La figura 4 muestra el caso (B), una
amortiguación de dos etapas debida a dos modos de igual frecuencia:
(a) la señal sintética generada de acuerdo con la ecuación (9) con
los parámetros dados en la tabla 2; (c) las envolventes de la
amplitud original (línea discontinua) y de la amplitud modelada
(línea continua) y (e) la señal resintetizada basada en el modelo
estimado. Los subgráficos (b), (d) y (f) se refieren a otra señal
generada con los parámetros mostrados en la tabla 2 pero con fases
sustituidas por \theta_{1} = \theta_{2} = \pi/2.
La figura 5 muestra el caso (C), la pulsación de
amplitud de dos modos de ruido: (a) la señal sintética generada de
acuerdo con la ecuación (9) con los parámetros dados en la tabla 1
inmersa en ruido blanco; (c) las envolventes de la amplitud
original (línea discontinua) y de la amplitud modelada (línea
continua); y (e) la señal resintetizada basada en el modelo
estimado. Los subgráficos (b), (d) y (f) se refieren a una señal
modificada generada con los parámetros mostrados en la tabla 1 pero
con fases sustituidas por \theta_{1} = \theta_{2} =
\pi/2.
La figura 6 muestra el caso (D), la pulsación de
amplitud con cambio de tono: (a) la señal sintética generada de
acuerdo con la ecuación (9) con los parámetros dados en la tabla 1
pero con un cambio de tono. Los gráficos de la columna de la
izquierda muestran las envolventes de la amplitud del original
(línea discontinua) y del modelado (línea continua) para los
modelos FZ-ENV-ARMA de órdenes: (b)
ARMA(4, 4), (d) ARMA(8, 8) y (f) ARMA(12, 12).
Los subgráficos (c), (e) y (g) de la columna de la derecha muestran
los mismos casos excepto para el modelado FZ-ARMA
con los órdenes del modelo correspondientes.
La figura 7 muestra el caso (E), la estimación
de la tasa de amortiguación de la respuesta reverberante y T_{60}
modelando la envolvente de amortiguación utilizando el modelo
FZ-ENV-ARMA de bajo orden. La
respuesta medida fue filtrada con un paso de banda
(1-2 kHz), se tomó el valor absoluto de la
envolvente de Hilbert y se diezmó por 500, se modeló mediante los
órdenes de filtro N=6, P=6 y, finalmente, se identificó el mayor
polo (real) positivo correspondiente al principal componente de
amortiguación para la estimación de la pendiente.
La figura 8 muestra el caso (F): (a) el espectro
de amortiguación acumulativo de la respuesta medida de una sala por
debajo de los 220 Hz, para un intervalo de tiempo 0,0 ... 1,0 s; (b)
el espectro de amortiguación acumulativo calculado a partir de la
respuesta de impulso de un modelo AR (P=80) para la respuesta de la
sala de la figura 8(a). La tasa de muestreo original de
44.100 Hz se diezmó a 400 Hz antes del modelado AR. El nivel se
limitó a -50 dB.
La figura 9 muestra el caso (G), la
correspondencia de la envolvente para la amortiguación del grupo
modal entre 33 y 58 Hz en la respuesta de la sala de la figura 8
con órdenes de FZ-ARMA diferentes: (a)
ARMA(4, 6), (c) ARMA(4, 20), (e) ARMA(6, 60).
Línea continua = modelado, línea de puntos = original. Los polos (x)
y los ceros (o) en el dominio z diezmado están representados en
(b), (d) y (f), respectivamente. (Algunos ceros caen fuera de la
gama de la representación).
La figura 10 muestra el caso (H), el ajuste a la
respuesta de la sala dentro de la banda crítica 920 ... 1.080 Hz
mediante los órdenes del modelo FZ-ARMA (a)
ARMA(6, 6), (b) ARMA(6, 20), (c) ARMA(6, 60),
descritos mediante las envolventes de la amplitud de la respuesta
original (línea discontinua) y la respuesta modelada (línea
continua).
La figura 11 muestra el caso (I), los espectros
de amortiguación acumulativos para la ecualización de un altavoz
más los modos sintéticos: (a) respuesta original más cinco modos en
las frecuencias 50, 55, 100, 130 y 180 Hz, (b) los modos totalmente
amortiguados, (c) el tiempo de amortiguación modal (60 dB)
ecualizado a 250 ms y (d) la función G(\Omega) de
detección del modo para la respuesta original. Los niveles de
amortiguación están limitados a -50 dB.
La figura 12 muestra el caso (J), la
ecualización de un modo único a 46 Hz de la sala analizada en la
figura 8: (a) la respuesta original, (b) tras la ecualización del
modo.
La figura 13 muestra el caso (K), la
ecualización de la respuesta de la sala analizada en la figura 8:
(a) la respuesta original, (b) tras la ecualización del modo y (c)
la amortiguación de la energía integrada en sentido contrario para
la respuesta original (línea discontinua) y la respuesta ecualizada
(línea continua).
La figura 14a muestra un diagrama de bloques del
ecualizador modal de tipo I de acuerdo con la invención utilizando
la fuente de sonido primaria.
La figura 14b muestra un diagrama de bloques del
ecualizador modal de tipo II de acuerdo con la invención utilizando
un radiador secundario.
\vskip1.000000\baselineskip
Los problemas en la resolución de modos y grupos
de modos ubicados muy próximos entre sí fue la razón en este
estudio para experimentar con métodos que tienen un mejor control de
la resolución de frecuencias. Existen diversas ideas disponibles
para la mejora, incluyendo la deformación de frecuencias [22] y el
modelado selectivo de frecuencias tal como una predicción lineal
selectiva [15], técnicas AR/ARMA multibanda [16] y muchos otros
métodos de modelado de señales de alta resolución.
La deformación de frecuencias es una técnica
conveniente cuando tanto las frecuencias más bajas como las más
altas requieren una resolución de frecuencia aumentada. Este enfoque
se puede extender a los filtros Kautz que presentan propiedades
interesantes de control generalizado de resolución de frecuencias
[23].
El modelado selectivo de frecuencias se ha
aplicado, por ejemplo, en la predicción lineal del habla. En un
caso simple, una respuesta objetivo se puede filtrar mediante un
filtro de paso bajo y diezmar con el objeto de modelar la parte de
baja frecuencia de la respuesta. Una gama de las frecuencias más
altas se puede modular reduciéndolas y diezmándolas antes de
modelar de manera similar. En realidad, cualquier subbanda de una
gama de frecuencias dada se puede modelar de esta manera y,
finalmente, los parámetros resultantes (polos y ceros) se pueden
mapear de nuevo a la gama de frecuencias originales
correspondientes. Este enfoque se denomina en este documento
modelado mediante ampliación de frecuencias. Se parece también a las
técnicas multibanda utilizadas en [16, 17, 24].
\vskip1.000000\baselineskip
El análisis FZ-ARMA (o
FZ-AR) comienza modulando (heterodinación) la gama
de frecuencias deseado reduciéndolas hasta las proximidades de la
frecuencia cero [25, 26, 27] mediante
donde \Omega_{m} =
2\pif_{m}/f_{s}, f_{m} es la frecuencia de modulación, y
f_{s} es la tasa de muestreo. En el dominio z esto significa una
rotación en la dirección de las agujas del reloj de los polos
z_{i} un ángulo \Omega_{m}, es
decir,
pero manteniendo el radio del polo.
La siguiente etapa para aumentar la resolución de las frecuencias es
limitar la gama de frecuencias diezmando, es decir, filtrando
mediante un filtro de paso bajo y muestreando con menos muestras la
respuesta rotada mediante un factor de ampliación K_{zoom} para
obtener una nueva tasa de muestreo f_{s,zoom} =
f_{s}/K_{zoom}. Esto implica mapear a un nuevo dominio de z en
el que los polos se escalan mediante la
regla
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Conjuntamente, los mapeados (5) y (6) generan
nuevos polos. Las ecuaciones (5) y (6) caracterizan cómo las
propiedades del dominio de z de una respuesta dada se cambian a
través de la modulación y la reducción, pero el patrón de polo nulo
estimado de un modelo ARMA se obtendrá únicamente en la siguiente
etapa.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
A continuación, es posible aplicar cualquier
modelado AR o ARMA a la respuesta modulada y diezmada obtenida a
partir de h(n). Se debe observar que esta nueva señal tiene
valores complejos debido a la operación de modulación unilateral.
Este enfoque se parece a las técnicas de múltiples tasas y
subbandas.
La ventaja que se obtiene con la ampliación de
frecuencias es que en la subbanda ampliada, el orden del análisis
(ARMA) se puede reducir aumentando el factor K_{zoom} de
ampliación y, en consecuencia, la solución de polos y ceros como
raíces de los polinomios del denominador y del numerador de la
función del modelo de la ecuación (1) se simplifica.
Adicionalmente, esto significa que se puede utilizar una resolución
diferente en cada subbanda, por ejemplo, basándose en el
conocimiento sobre la complejidad modal en cada subbanda.
Tras resolver los polos y ceros dentro de una
subbanda ampliada, se deben mapear de nuevo en la banda completa.
Esto significa un escalado inverso de los radios de los polos así
como una rotación de los mismos en dirección contraria a las agujas
del reloj, es decir,
Debido a la modulación de reducción unilateral
en (4), cada polo z_{i} se debe utilizar como un par complejo
conjugado a efectos de obtener filtros de valores reales.
La etapa final es combinar los polos y los ceros
obtenidos de las diferentes subbandas en un modelo completo. Esta
no es una tarea trivial pero, por otra parte, dividiendo todo el
problema y recombinándolo de nuevo proporciona un aumento de
flexibilidad. Es ventajoso escoger polos y ceros únicamente en la
parte central de cada subbanda (superpuesta) para evitar problemas
en los límites de las subbandas debido a la limitación de banda.
En las investigaciones del modelo
FZ-ARMA que se describen a continuación, el método
de ampliación de frecuencias de resolución de los coeficientes ARMA
es el método Steiglitz-McBride. Se debe observar
también que los órdenes de filtro N y P se refieren a los filtros
de valores reales con pares complejos conjugados generados a partir
de ceros y polos parciales obtenidos a partir del método anterior.
De esta manera los órdenes son el doble del número de ceros y polos
de los procedimientos anteriores, respectivamente.
En esta sección, se muestra el rendimiento del
método de análisis FZ-ARMA a través de señales
sintéticas. En particular nos interesa investigar la capacidad de
modelado cuando se trata con señales que presentan pulsación y/o
amortiguación en dos etapas en sus envolventes. Las señales simples
que caracterizan dichas características se pueden obtener
mediante
donde M es el número de frecuencias
modales presentes en s(n), \tau_{k} son las constantes de
tiempo de amortiguación, f_{k} las frecuencias modales, f_{s}
la frecuencia de muestreo y \theta_{k} las fases iniciales de
los
modos.
\vskip1.000000\baselineskip
Empecemos con el caso (A) en el que la
envolvente de la amplitud de la señal compuesta de dos modos muestra
una pulsación. Los parámetros utilizados para generar la señal así
como aquellos adoptados en el modelado FZ-ARMA
aparecen en la tabla 1. Las respuestas objetivo en la fase seno y
coseno, sus envolventes FZ-ARMA y sus versiones
resintetizadas se muestran en la figura 3. Las envolventes se
obtienen a partir de las señales complejas diezma-
das.
das.
Cada respuesta resintetizada se calcula como la
respuesta de impulso del filtro que se obtiene combinando los polos
y ceros complejos conjugados a partir del análisis
FZ-ARMA. Se debe observar que la limitación de
banda en el enfoque en frecuencia genera ceros (y polos) compensados
que muestran elementos artificiales en la respuesta de impulso
reconstruida. En un caso típico de enfoque sobre una banda de
resonancia estrecha la respuesta de impulso reconstruida tiene un
impulso de gran amplitud, dado que es su primera muestra (ver
también [27]). Esto se ha eliminado en las simulaciones de la
respuesta sintetizada de esta solicitud de patente. Esta
eliminación tiene únicamente un efecto marginal en las propiedades
espectrales de la respuesta.
En los resultados de la simulación del caso (A)
de la figura 3, un modelo ARMA(4, 4) es suficiente para
representar adecuadamente las amortiguaciones de la envolvente en
los subgráficos (c) y (d), mientras las características de la fase
inicial de la señal resintetizada en (f) se desvían de la mostrada
en (b). Se debe observar que es casi imposible distinguir entre las
líneas continuas y discontinuas en los subgráficos (c) y (d) de la
figura 3.
En el caso (B) verificamos el modelado
FZ-ARMA de una respuesta de dos modos para la cual
la envolvente de la amplitud presenta una amortiguación de dos
etapas. Los parámetros utilizados para generar esta señal, así como
los del modelado FZ-ARMA, se resumen en la tabla 2 y
los resultados del modelado se muestran en la figura 4. El modo de
amortiguación más lento se modela adecuadamente aunque su nivel
inicial es de 10 dB por debajo del más fuerte. Esta capacidad de
análisis de la amortiguación en dos etapas puede funcionar hasta los
-30 dB en un caso sintético puro.
\vskip1.000000\baselineskip
En la simulación del caso (C), a efectos de
verificar el modelado FZ-ARMA cuando se trata con
señales con ruido, contaminamos las respuestas de impulso mostradas
en los gráficos (a) y (b) de la figura 3 con ruido Gaussiano blanco
aditivo de media cero. En este ejemplo la varianza del ruido se
elige para generar una relación señal-ruido (SNR)
de -5 dB al principio de la señal. Por supuesto, la relación SNR
local disminuye hacia el final de la señal.
Los resultados se muestran en la figura 5 que
sigue la misma estructura que las figuras anteriores. Ahora,
observando los subgráficos (c) y (d) de la figura 5 se puede ver que
las envolventes de las señales modeladas (líneas continuas)
difieren sustancialmente de aquellas de las señales con ruido
(líneas discontinuas). Además, las señales resintetizadas basadas
en los modelos calculados, mostradas en los subgráficos (e) y (f)
están libres de ruido visible y siguen estrechamente sus versiones
puras correspondientes, que están representadas en los subgráficos
(a) y (b) de la
figura 3.
figura 3.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
El resultado altamente satisfactorio de la
reducción del ruido añadido en el caso de simulación (C) se puede
entender cuando se considera la ampliación de frecuencias a una
banda estrecha alrededor de las frecuencias modales de interés,
mediante lo cual se mejora la relación SNR mediante la proporción de
ampliación, es decir, mediante 10 log_{10}200 = 23 dB en este
caso. El modelado ARMA(4, 4) de bajo orden reduce además la
influencia del ruido debido a la buena correspondencia con las
señales modales únicamente.
\vskip1.000000\baselineskip
Una suposición primaria cuando se aplica el
modelado FZ-ARMA o cualquier otro modelado de
sistemas LTI es que las frecuencias de los modos no cambian dentro
de la duración del segmento analizado. Si no se puede satisfacer
este requisito, por ejemplo, en tonos de instrumentos de cuerda
punteados fuertemente que tienen un cambio de tono inicial [28],
todavía se puede modelar el comportamiento de la envolvente de la
señal objetivo. Si la trayectoria de la frecuencia del cambio de
tono es conocida, una manera sencilla es volver a muestrear la
señal, de manera que se elimina el cambio. Otra manera es aplicar un
modelado FZ-ARMA pero adoptando órdenes mayores
para el numerador y el denominador de manera que esto puede capturar
el efecto del cambio de la frecuencia.
De manera alternativa, se puede calcular un
modelo ARMA para la envolvente de una señal modulada y diezmada
(FZ-ENV-ARMA). De esta manera se
puede aproximar el comportamiento de la envolvente con un orden de
modelo menor. El caso de simulación (D), un ejemplo que compara el
modelado FZ-ARMA estándar con el
FZ-ENV-ARMA, se muestra en la
figura 6. La señal de prueba representada en el subgráfico (a) es
una versión de la representada en la figura 3, pero ahora las
frecuencias de los modos comienzan 50 Hz por encima de los valores
indicados en la tabla 1 y posteriormente convergen exponencialmente
con una constante de tiempo de 100 ms a los valores nominales. Los
gráficos de la columna de la izquierda muestran las envolventes
original y modelada para diferentes órdenes del modelo
FZ-ENV-ARMA. Los gráficos de la
columna de la derecha hacen lo mismo pero utilizando modelos
FZ-ARMA.
Para resintetizar una señal de tono cambiante
basándose en el modelo informatizado
FZ-ENV-ARMA, es necesario estimar
el comportamiento de su tono. Posteriormente, tras obtener un modelo
para la envolvente de la amplitud, se debe utilizar una modulación
de frecuencia correspondiente al cambio de frecuencia original
durante la síntesis. Para un modelado FZ-ARMA
directo esto no es necesario si la estimación es capaz de capturar
el comportamiento dado de las frecuencias modales cambiantes.
A partir de la figura 6 se puede verificar que,
al contrario de lo que ocurre en el modelado
FZ-ARMA, el aumento del orden del modelo en el
modelado FZ-ENV-ARMA no ayuda
esencialmente a mejorar el ajuste del modelo, dado que las
relaciones de fase inherentes de la señal original se han perdido en
el cálculo de la envolvente que se utiliza como objetivo. Sin
embargo, para un modelado de orden bajo el modelado
FZ-ENV-ARMA genera un mejor ajuste
de la envolvente que el modelado FZ-ARMA del mismo
orden.
Si la respuesta de un sistema objetivo es
altamente compleja en la densidad de los modos, tal como una
respuesta de la sala a frecuencias medias o altas, una descripción
modal detallada puede no ser factible o incluso deseada. En dichos
casos el comportamiento de la envolvente se puede representar
simplemente ajustando un modelo de orden menor a la envolvente
amortiguada en una gama de frecuencias deseado mediante las técnicas
FZ-ENV-ARMA. Esto puede ser útil en
la estimación del tiempo de amortiguación. No obstante existen
muchos métodos que están mejor motivados, por ejemplo, en la
estimación RT_{60} del tiempo de reverberación [13]. El caso de
simulación (E) de la figura 7 representa la envolvente de la
amortiguación de un ejemplo de respuesta de una sala para la banda
octava 1-2 kHz y el ajuste de una envolvente
relacionada mediante el modelado FZ-ARMA de bajo
orden.
\newpage
Otra forma de comportamiento no LTI es la
ausencia de linealidad. Se puede aceptar un pequeño grado de no
linealidad en un sistema e incluso se puede tolerar una desviación
bastante severa de la linealidad si aceptamos el hecho de que los
parámetros dependen de la señal, por ejemplo dependen del nivel de
una señal.
\vskip1.000000\baselineskip
La elección de los parámetros
FZ-ARMA, es decir, \Omega_{m}, K_{zoom} y los
órdenes de ARMA N y P, dependen de diversos factores. Considerando
primero el factor de ampliación, se puede decir que cuanto mayor sea
K_{zoom} mayor será la resolución en frecuencia. Esto favorece
los casos en los que los modos están densamente distribuidos en
frecuencia. Por otra parte, valores elevados de K_{zoom} implican
un procedimiento de reducción de señal más exigente y menos
muestras disponibles para el modelado en la señal diezmada.
Una posible estrategia es definir un
f_{s,zoom} mínimo de antemano y posteriormente derivar K_{zoom}.
Por ejemplo, el criterio se puede basar en el número de muestras
que quedan en la señal diezmada. Otra elección natural cuando
existen modos o grupos de modos relativamente aislados es
seleccionar la gama de frecuencias de enfoque para cubrir dicho
grupo y sus proximidades hasta que los modos o grupos vecinos
empiezan a tener influencia. Se recomienda elegir la gama de
enfoque de manera que los picos de resonancia no se sitúen en los
extremos de las subbandas. Como regla general, una elección adecuada
es fijar f_{m} = f_{r} - f_{s,zoom}/4, que lleva la
frecuencia de resonancia f_{r} al punto medio de la gama de
frecuencias reducido.
El orden de un modelo ARMA dependerá del número
de modos asociados con cada grupo de resonancia. Los experimentos
en resonancias de dos modos revelan que adoptar un modelo
ARMA(4, 4) proporciona en general resultados satisfactorios
para dichos casos. Se puede conseguir una mejor precisión en el
modelado aumentando el orden, aunque el resultado es posible que no
se pueda interpretar físicamente para un caso de dos modos. El
análisis de orden elevado aumenta asimismo la probabilidad de
acabar con un modelo inestable.
Se debe observar que en el modelado
FZ-ARMA la frecuencia de modulación f_{m} debe
corresponder al borde inferior de la gama de enfoque y el factor de
ampliación K_{zoom} en relación a la tasa de muestreo determina
el ancho de banda de la ampliación.
\vskip1.000000\baselineskip
El modelado AR/ARMA tiene muchas aplicaciones en
el procesamiento de señales de audio actual. Los modelos lineales e
invariantes en el tiempo se pueden aplicar, por ejemplo, a la
acústica de salas, a la síntesis de sonido y a la reproducción de
audio. Basándose en la visión general teórica anterior y en los
ejemplos, en esta sección se tomarán ejemplos de estos dominios
para estudiar la viabilidad de los métodos, particularmente de la
técnica FZ-ARMA, en diversas aplicaciones de
audio.
\vskip1.000000\baselineskip
Una aplicación que constituye un reto para el
modelado AR/ARMA es encontrar aproximaciones compactas pero
perceptivamente válidas para las respuestas de impulso de una sala
[12] medidas (o calculadas). Esto se necesita, por ejemplo, en
análisis modales de salas a bajas frecuencias, en diseños de
reverberaciones artificiales o en la ecualización de respuestas de
salas con altavoces.
Como caso de estudio (F), se lleva a cabo un
análisis del comportamiento modal a bajas frecuencias de una
respuesta de impulso de una sala utilizando diferentes métodos AR y
FZ-ARMA. La sala tiene unas dimensiones aproximadas
de 5,5 x 6,5 x 2,7 m^{3}. La figura 8(a) describe el
comportamiento en tiempo-frecuencia (espectro de
amortiguación acumulativo) para frecuencias por debajo de los 220 Hz
tal como se calcula a partir de una respuesta de impulso medida de
una sala. La sala muestra amortiguaciones modales particularmente
intensas y largas de alrededor de 45 Hz.
Un modelado AR sencillo de la respuesta de
impulso de la sala por debajo de los 220 Hz utilizando una
predicción lineal, genera unos resultados bastante precisos cuando
el orden P del filtro totalmente polar tiene un valor alrededor de
100 o superior para la gama de bajas frecuencias. La figura
8(b) muestra el gráfico de la amortiguación de la respuesta
del modelo cuando P = 80. La tasa de muestreo original de 44.100 Hz
se diezmó mediante un factor de 110 antes de modelar mediante AR.
Una comparación con la figura 8(a) revela que los tiempos de
amortiguación de los modos prominentes están bastante bien
modelados pero muchos modos más débiles son demasiado cortos o están
demasiado amortiguados debido al orden del modelo insuficiente.
El modelado ARMA directo mediante el método
Steiglitz-McBride genera un mejor ajuste en el
dominio del tiempo con un orden de denominador dado, que el modelo
AR correspondiente. Por ejemplo, utilizando un orden de numerador
de N = 30 y de denominador de P = 100 funcionó bastante bien para la
respuesta de la sala anterior, aunque en muchos casos el algoritmo
Steiglitz-McBride proporciona un resultado inestable
ya con dichos órdenes de filtro moderados.
El modelo FZ-ARMA es un método
potente para modelar de manera precisa el comportamiento modal en
una gama de frecuencia limitado. La figura 9 representa los
resultados del modelado de la región modal prominente 33...58 Hz en
la respuesta de la figura 8(a). La región incluye tres modos
principales en las frecuencias de 37, 46 y 55 Hz. La figura 9
muestra la envolvente de amortiguación de la región modal para la
señal original (línea discontinua), y como resultado de aplicar el
método de Steiglitz-McBride de diferentes órdenes
(línea continua). Aumentando el orden del filtro mejora el ajuste
de la envolvente pero al final puede empezar a modelar la
envolvente del ruido de fondo. Los gráficos de polo nulo de la parte
de la derecha indican que para un orden P = 6 los polos
corresponden a los tres modos, mientras que para órdenes mayores
existen polos adicionales y no es fácil asociarlos con los
modos.
A frecuencias más altas, por encima de la
frecuencia crítica (frecuencia de Schroeder) [29] de la sala, el
comportamiento modal es difuso, es decir, la densidad modal es alta
y los modos se superponen en frecuencia. El modelado AR y ARMA de
la gama de audio completo es difícil, si no imposible. No obstante,
es posible aplicar el análisis FZ-ARMA a una banda
de frecuencia estrecha de una respuesta reverberante. La figura 10
describe un ajuste a la respuesta de la sala estudiada dentro de
una banda crítica a 1 kHz (920 ... 1.080 Hz) mediante órdenes de
modelo diferentes. Con el orden de modelo más elevado P = 60, el
ajuste de la envolvente es bueno para los primeros 250 ms y para
una gama dinámica de alrededor de 40 dB.
\vskip1.000000\baselineskip
La ecualización de la respuesta de un altavoz o
de una cadena de reproducción altavoz-sala significa
corregir la respuesta del sistema más próxima al criterio técnico o
de percepción deseado. El modelado AR y ARMA se ha comentado en la
literatura de diversas formas para un altavoz y para una
ecualización de una respuesta en frecuencia in situ, ambos
en formulaciones tanto en línea como fuera de línea [30, 31, 32, 33,
34, 35, 36, 37, 38, 39, 17, 40, 41, 42, 43, 23].
La ecualización de la respuesta en magnitud de
campo libre (posiblemente incluyendo la respuesta de la fase) de un
altavoz mediante DSP se puede llevar a cabo utilizando muchas
técnicas conocidas. En el caso de altavoces de la más alta calidad
existe apenas necesidad de mejorar su respuesta de campo libre, pero
la combinación altavoz-sala puede beneficiarse en
gran manera de una ecualización adecuada.
La tarea combinada de la ecualización del
altavoz y de la sala también es exigente dado que es esencialmente
un problema de encontrar una ecualización en
tiempo-frecuencia de percepción óptima, en lugar de
aplanar simplemente el espectro de magnitud y/o linealizar la fase.
Parece que existe una confusión común en la que simplemente
aplanando la respuesta, al menos en las frecuencias bajas en las que
podría ser técnicamente posible, se lograría una solución ideal.
Una mejor estrategia es mejorar el equilibrio de todos los
parámetros acústicos, particularmente el del tiempo de
reverberación. Tal como se ha tratado en [44], esto se puede
realizar controlando los tiempos de amortiguación de modos
individuales a bajas frecuencias, típicamente por debajo de los 200
Hz, para hacer coincidir el tiempo de reverberación en las
frecuencias medias. Esto se denomina ecualización modal. Se puede
seguir con una corrección tradicional de la envolvente de la
respuesta de magnitud. La necesidad de dicha corrección activa en
la acústica de salas es particularmente importante alrededor de los
100 Hz incluso en espacios designados para propósitos de audición,
tales como salas para monitorización de audio [45].
\vskip1.000000\baselineskip
En [44] hemos propuesto un método para la
ecualización modal. En la presente solicitud de patente sugerimos
otra técnica para realizar la ecualización modal, combinada
opcionalmente con la corrección de la envolvente de la magnitud. El
marco general de la ecualización modal se ha tratado en detalle en
documentos anteriores. Una breve descripción del procedimiento
es:
- 1.
- Medir la respuesta combinada del altavoz más la de la sala en la posición de audición de interés. Se puede aplicar cualquier técnica moderna para una medida fiable de la respuesta.
- 2.
- Analizar el tiempo de reverberación medio RT_{60} en las frecuencias medias, por ejemplo, entre 500 Hz ... 2 kHz.
- 3.
- Determinar un límite superior del tiempo de amortiguación modal como una función de la frecuencia para la gama de las bajas frecuencias, típicamente por debajo de los 200 Hz. Se puede permitir que este valor aumente ligeramente hacia las frecuencias más bajas [46, 47], por ejemplo linealmente mediante 0,2 s cuando la frecuencia disminuye de 300 Hz a 50 Hz.
- 4.
- Encontrar los modos que necesitan ecualización, es decir, aquellos que tienen un mayor tiempo de amortiguación que el límite superior definido anteriormente. Si el nivel de magnitud de un modo es tan bajo que su extremo final permanece por debajo de un nivel dado, no necesita una ecualización modal ni siquiera cuando su tiempo de amortiguación es mayor que el límite superior. Estimar los valores de los parámetros modales para dichos modos, particularmente la frecuencia modal y la constante del tiempo de amortiguación, y calcular los ángulos y radios de los polos correspondientes.
\newpage
- 5.
- Diseñar un filtro de corrección para cada modo que requiera ecualización, de manera que el filtro acorta el tiempo de amortiguación para cumplir con los criterios de límite superior especificados en la etapa 3. Esto significa anular el par de polos estimados, que representan un modo con un largo tiempo de amortiguación, mediante un par de ceros, y sustituirlo con un nuevo par de polos que tenga el tiempo de amortiguación deseado. Esto se puede realizar con un filtro IIR [44]
- \quad
- donde r y r_{c} son los radios de los polos (complejos conjugados) de la amortiguación original y de la amortiguación corregida, respectivamente, y \theta y \theta_{c} son los ángulos de los polos correspondientes.
- 6.
- Calcular las etapas 4 y 5 tanto en un modo de lotes, es decir, en paralelo para cada modo que va a ser ecualizado, o de manera iterativa, de manera que los modos se ecualizan uno a uno, comenzando desde el más importante y volviendo a la etapa 4, para aplicarlos al resultado de la ecualización anterior. El proceso finaliza cuando todos los modos restantes cumplen el criterio del tiempo de amortiguación o cuando se ha alcanzado un límite superior predeterminado de los modos que se pueden corregir.
- 7.
- La ecualización de magnitud tradicional se puede aplicar al resultado de la ecualización modal, en caso necesario, mediante cualquier método o técnica adecuados.
\vskip1.000000\baselineskip
En este contexto sólo nos interesa la etapa 4
como parte de un análisis en lotes o iterativo. Las demás etapas
siguen el esquema general descrito en [44], en el que la búsqueda
del modo y la estimación del tiempo de amortiguación se basaban en
una representación en tiempo-frecuencia y en el
ajuste de una amortiguación logarítmica más el modelo del ruido de
fondo utilizando una optimización no lineal. Mientras que el método
propuesto anteriormente era sólido para modos que estaban lo
suficientemente separados, la fuerte superposición o los modos
múltiples con frecuencias estrechamente similares son una
dificultad inherente de dicho método. Dado que los modelos AR/ARMA
buscan un óptimo global y no intentan separar los modos, son
potencialmente una alternativa mejor en dichos casos.
\vskip1.000000\baselineskip
En los casos de ecualización que se muestran a
continuación, la búsqueda de modos y la estimación de parámetros se
llevan a cabo de manera iterativa de la siguiente manera:
- 1.
- Calcular una función que se puede utilizar de manera sólida para encontrar los modos más importantes y sus frecuencias. Esto se puede realizar de dos maneras, por ejemplo, directamente mediante un análisis AR o ARMA y encontrando los polos con los mayores radios. Debido a que la selección del modelo adecuado puede ser problemática, primero hemos aplicado aquí una función de detección de un modos separados
- \quad
- donde H(\Omega) es la transformada de Fourier de la respuesta medida, \Omega es la frecuencia angular normalizada (ángulo en el plano z) y D es un operador de diferenciación (en el dominio de la frecuencia). Un ejemplo de la función G(\Omega) se representa en la figura 11 (d). Los picos positivos indican modos fuertes que pueden necesitar una ecualización del tiempo de amortiguación. Se debe observar que esta función combina tanto la información del nivel de magnitud como la del tiempo de amortiguación (a través de una derivación de fase). Esta es una función de detección posible y pueden existir otras funciones para dicho propósito.
- 2.
- Encontrar la posición del pico más elevado \Omega_{p} de la función de detección G(\Omega) como el mejor candidato para la ecualización modal. Ejecutar el análisis AR de orden predefinido (aquí se han aplicado órdenes 50...70 para la gama de frecuencias por debajo de los 220 Hz) en la versión de la fase mínima de la respuesta objetivo para encontrar los polos y seleccionar el polo más cercano al punto d^{j\Omega p} en el círculo unidad. Este polo y su complejo conjugado representan ahora el modo más importante.
- 3.
- Si el tiempo de amortiguación del modo se encuentra por debajo del límite superior y el valor de G(\Omega) se encuentra por debajo de un umbral predeterminado experimentalmente, se finaliza el proceso en la etapa 4. En caso contrario, se diseña un filtro de corrección modal de segundo orden del tipo de la ecuación (10) para cambiar el tiempo de amortiguación modal a un valor deseado por debajo del límite superior. Se aplica esto a la respuesta que se va a ecualizar y se utiliza el resultado cuando se retrocede para iterar desde la etapa 1.
- 4.
- Finalmente, reunir los filtros de corrección en un filtro en cascada que es ahora el ecualizador modal para el sistema.
\vskip1.000000\baselineskip
Una ecualización modal simulada, caso (I), se
muestra en la figura 11. Se filtra una respuesta de impulso de un
altavoz para añadir cinco modos simulados en las frecuencias de 50,
55, 100, 130 y 180 Hz, con tiempos de amortiguación modal de 60 dB
de 1,4, 0,8, 1,0, 0,8 y 0,7 segundos, respectivamente. El espectro
de amortiguación acumulativo de esta respuesta sintética se muestra
en la figura 11(a). La figura 11(b) prueba que el
efecto de los modos se puede anular casi perfectamente, dejando
únicamente la respuesta del altavoz, desplazando los radios de los
polos para corresponder con un tiempo de amortiguación muy corto
(alrededor de 60 ms) utilizando el procedimiento descrito
anteriormente. En la figura 11(c) el resultado de la
ecualización modal representada es más adecuado para las
condiciones reales de una sala. El tiempo de amortiguación de cada
modo se ecualiza a 250 ms. Los dos modos cercanos parcialmente
superpuestos, en las frecuencias 50 y 55 Hz, no provocan ninguna
dificultad, y la ecualización modal funciona casi perfectamente. En
el caso (J) de la figura 12 el modo único más importante en los 46
Hz se ecualiza acortando el tiempo de amortiguación desde un valor
superior a 1 segundo hasta alrededor de los 300 ms utilizando el
algoritmo descrito anteriormente y limitando la búsqueda de modos a
sólo uno. En la figura 12(b) el modo problemático original se
amortigua ahora claramente de manera más rápida. Además, la
respuesta ecualizada hasta los 80 Hz tiene una forma mucho más suave
dado que la ecualización modal también afecta al espectro de
magnitud. No obstante, los tiempos de amortiguación de algunos modos
todavía son largos.
La ecualización de múltiples modos de la misma
sala, el caso (K), se muestra en la figura 13. La sala es la misma
que la analizada en el caso (F), figura 8. El procedimiento descrito
anteriormente se itera 100 veces, generando 100 secciones de filtro
de corrección de segundo orden, para acortar los tiempos de
amortiguación de modos. El espectro de amortiguación acumulativo de
la respuesta ecualizada resultante se muestra en la figura
13(b). El valor objetivo para el tiempo de amortiguación
modal ecualizado (60 dB) ha sido de 150 ms.
En este caso el resultado no es tan perfecto
como en el caso del modo único o sintético. Hay alrededor de 10 dB
de amortiguación rápida al principio, tal como se muestra mediante
los gráficos de integración inversa en la figura 13(c) y, a
continuación, la tasa de amortiguación sigue a la original. Aunque
no se consigue el acortamiento ideal del tiempo de amortiguación de
manera precisa, aún así realiza una reproducción del sonido en la
sala más equilibrado en los términos de reverberación. Además, el
procedimiento de ecualización se puede mejorar mediante un ajuste
cuidadoso de los detalles.
La etapa final, es decir, la ecualización suave
de la envolvente de la respuesta en magnitud, no se trata en este
documento dado que se pueden aplicar muchas técnicas conocidas para
ecualizar la respuesta en magnitud. No obstante, una elección
interesante es integrar la fase de ecualización de la magnitud
conjuntamente con el proceso de ecualización modal AR/ARMA.
De acuerdo con la figura 14a en una
implementación típica de la invención, el sistema comprende una sala
de audición (1), que es bastante pequeña en relación con las
longitudes de onda que se van a modificar. Típicamente, la sala (1)
es una sala de control cerca de un estudio de grabación. Las
dimensiones típicas de este tipo de sala son de 6 x 6 x 3 m^{3}
(anchura x longitud x altura). En otras palabras, la presente
invención es más adecuada para salas pequeñas. No es muy efectiva
para iglesias y salas de conciertos. La intención de la invención
es diseñar un ecualizador (5) para compensar los modos de resonancia
en la proximidad de una posición (2) de audición predefinida.
La implementación de tipo I modifica la señal de
audio alimentada al altavoz (3) principal para compensar los modos
de la sala. La función de transferencia total desde el radiador
principal a la posición de audición representada en el dominio de Z
es
(12)H(z)
= G(z)
H_{m}(z)
donde G(z) es la función de
transferencia del radiador principal desde la entrada eléctrica
hasta una salida acústica y H_{m}(z) =
B(z)/A(z) es la función de transferencia de la
trayectoria desde el radiador principal a la posición de audición.
El radiador principal tiene esencialmente una respuesta en magnitud
plana y una amortiguación pequeña en nuestra banda de frecuencia de
interés, o bien el radiador principal se puede ecualizar mediante
medios convencionales y, por tanto, se puede despreciar en la
siguiente
descripción,
(13)G(Z)
=
1
Ahora se diseña un filtro de polo nulo
H_{c}(z) que tiene cero pares en las ubicaciones de los
polos identificados de las resonancias modales de
H_{m}(z). Esto anula los pares de polos de la respuesta de
la sala (1) en A(z) sustituyéndolos con nuevos pares de
polos A'(z) que generan el tiempo de amortiguación deseado en la
función de transferencia modificada H_{m}'(z)
\newpage
Esto lleva al filtro de corrección
El nuevo par de polos A'(z) se elige en la misma
frecuencia de resonancia pero más cerca del origen, logrando de
esta manera una resonancia con un valor Q reducido. De esta manera
se han desplazado los polos de resonancia modales hacia el origen y
se ha reducido el valor Q del modo. La sensibilidad de este enfoque
se tratará más adelante con diseños de ejemplo.
\vskip1.000000\baselineskip
De acuerdo con la figura 14b, el método de tipo
II utiliza un altavoz (4) secundario en una posición adecuada en la
sala (1) para radiar sonido que interactúa con el campo sonoro
generado por los altavoces (3) principales. En el siguiente
tratamiento se supone que ambos altavoces (1) y (4) son similares,
pero esto no se requiere para implementaciones prácticas. La
función de transferencia para el radiador principal (3) es
H_{m}(z) y para el radiador secundario (4)
H_{1}(z). El sumatorio acústico en la sala genera una
respuesta en frecuencia modificada H_{m}'(z) con las
características de amortiguación deseadas
\vskip1.000000\baselineskip
Esto lleva a un filtro de corrección
H_{c}(z) en el que H_{m}(z) y H_{m}'(z) difieren
en los radios de los polos modificados
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
y
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Se debe observar que si los radiadores principal
y secundario son la misma fuente, la ecuación 16 se reduce a una
formulación paralela de un filtro de corrección en cascada
equivalente al del método de tipo I presentado anteriormente
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Una condición necesaria pero no suficiente para
que exista una solución es que el radiador secundario pueda generar
un nivel de sonido en la ubicación de audición en las frecuencias en
las que puede el radiador principal, dentro de la banda de
frecuencia de interés
A bajas frecuencias en las que el tamaño de un
radiador resulta pequeño en relación a la longitud de onda, es
posible situar un radiador de manera que exista una frecuencia en la
que el radiador no se acopla bien a la sala. A dichas frecuencias
no se puede cumplir la condición de la ecuación 20 y un radiador
secundario situado en dicha ubicación no podrá afectar la
ecualización modal en dicha frecuencia. Debido a esto puede ser
ventajoso tener múltiples radiadores secundarios en la sala. En el
caso de múltiples radiadores secundarios, la ecuación 16 se
modifica de la siguiente manera
donde N es el número de radiadores
secundarios.
Una vez se han ecualizado de esta manera los
tiempos de amortiguación de los modos individuales, se puede
corregir la respuesta en magnitud del sistema resultante para
conseguir una respuesta global plana. Se puede implementar esta
corrección con cualquiera de los métodos de ecualización de la
respuesta en magnitud.
En esta solicitud de patente se tratará la
identificación y la parametrización de los modos y se estudiarán
algunos casos de ejemplos de aplicación de la ecualización modal
propuesta a diversas salas reales y sintéticas, utilizando
principalmente el primer método de ecualización modal propuesto
anteriormente. El uso de uno o más radiadores secundarios se dejará
para un estudio futuro.
\vskip1.000000\baselineskip
En esta solicitud de patente hemos estudiado el
modelado de respuestas de sistemas acústicos y de audio que
presentan propiedades resonantes y reverberantes. Particularmente,
se investigan las técnicas de modelado AR y ARMA para obtener
filtros totalmente polares o de polo nulo eficientes. Dicho
modelado, si es lo suficientemente preciso e informáticamente
económico, encuentra aplicación en la resolución de muchos problemas
de audio.
La primera parte de la solicitud de patente es
una vista global no teórica de los métodos de modelado AR y ARMA
para demostrar sus propiedades y limitaciones inherentes.
Un interés específico de este estudio ha sido
los métodos de modelado que pueden generar una buena correspondencia
temporal a una respuesta objetivo dada y una elevada resolución en
frecuencia, a menudo al mismo tiempo. En base a estudios
anteriores, principalmente en la aplicación del método de Prony a
subbandas, mostramos que el modelo ARMA (FZ-ARMA)
de ampliación de frecuencias basado en la iteración de
Steiglitz-McBride es una técnica potente para un
modelado de alta resolución en las subbandas. Los ejemplos de
simulación demuestran la capacidad de este enfoque para modelar
comportamientos reverberantes y modales complejos.
\vskip1.000000\baselineskip
[1] A. D. Pierce, Acústica, Introducción
a sus principios físicos y aplicaciones ("An introduction to its
physical principles and applications"). Woodbury, Nueva York:
Sociedad acústica de América, 1989.
[2] N. H. Fletcher y T. D.
Rossing, La física de los instrumentos musicales ("The
physics of musical instruments"). Nueva York: Springer
Verlag, 1991.
[3] M. Colloms, Altavoces de alto
rendimiento ("High performance loudspeakers"). 5ª edición.
Nueva York: Wiley, 1997.
[4] S. M. Kay, Fundamentos del
procesamiento estadístico de señales: Volumen I: Teoría de la
estimación ("Fundamentals of statistical signal processing:
Volume I: Estimation theory"). Englewood Cliffs, N. J.:
Prentice-Hall, 1993.
[5] A. V. Oppenheim, A. Willsky e
I. Young, Señales y sistemas ("Signals and systems").
Englewood Cliffs, Nueva Jersey:
Prentice-Hall, 1983.
[6] S. Haykin, Teoría de filtros
adaptativos ("Adaptive filter theory"). Upper Saddle River,
Nueva Jersey: Prentice Hall, 1996.
[7] M. H. Hayes, Modelado y procesamiento
estadístico de señales digitales ("Statistical digital signal
processing and modeling"). Upper Saddle River, N. J.:
Prentice Hall, 1996.
[8] Mathworks, Inc., Paquete de
herramientas para el procesamiento de señales de MATLAB ("MATLAB
Signal processing toolbox"), Guía del usuario, 2001.
[9] Mathworks, Inc., Paquete de
herramientas para la identificación de sistemas de MATLAB ("MATLAB
System identification toolbox"), Guía del usuario,
2001.
[10] L. B. Jackson, Filtros digitales y
procesamiento de señales ("Digital filters and signal
processing"). Boston: Kluwer Academic Publ.,
1989.
[11] K. Steiglitz, Manual para el
procesamiento digital de señales ("A digital signal processing
primer"). Menlo Park: Addison-Wesley,
1996.
[12] Y. Haneda, S. Makino e Y.
Kaneda, Modelado acústico común de polo y cero de funciones
de transferencia para salas ("Common acoustical pole and zero
modeling of room transfer functions"), IEEE Actas sobre el
procesamiento del habla y de audio, volumen 2, número 2, páginas
320-328, abril 1992.
[13] M. Karjalainen, P. Antsalo,
A. Makivirta, T. Peltonen y V. Valimaki,
Estimación de los parámetros de amortiguación modal a partir de
medidas de una respuesta con ruido ("Estimation of modal decay
parameters from noisy response measurements"), en preimpresión,
5290 AES 110ª convención, (Amsterdam, Países Bajos), mayo 2001.
[14] J. D. Bunton y R. H. Small,
Espectros acumulativos, ráfagas de tonos y sus aplicaciones
("Cumulative spectra, tone bursts and applications") J.
Audio Eng. Soc., volumen 30, número 6, páginas
386-395, junio 1982.
[15] J. Makhoul, Predicción lineal de
espectros: propiedades y aplicaciones ("Spectral linear
prediction: properties and applications"), IEEE Trans.
ASSP, volumen 23, número 5, páginas 283-296,
1975.
[16] J. Laroche, Un nuevo sistema de
análisis/síntesis de señales musicales utilizando el método de Prony
- Aplicación a sonidos de percusión altamente amortiguados ("A
new analysis/synthesis of musical signals using Prony's method -
Application to heavily damped percussive sounds"), en Proc.
IEEE Conferencia internacional sobre acústica, voz y procesado
de señales, páginas 2.053-2.056, volumen 3,
1989.
[17] J. Valakas, M. Paraskevas y
J. Mourjopoulos, Análisis de la respuesta de un altavoz de
polo nulo mediante una división de bandas y un modelado Prony
("Pole-zero loudspeaker response analysis by
bandsplitting and prony modeling") en preimpresión 4214, AES
100ª convenión (Copenhagen), mayo 1996.
[18] J. D. Markel y J. H. G. Gray,
Predicción lineal de señales de voz ("Linear prediction of speech
signals"). Berlin: Springer Verlag, 1976.
[19] L. R. Rabiner y R. W.
Schafer, Procesamiento digital de señales de voz ("Digital
processing of speech signals"). Englewood Cliffs, Nueva Jersey:
Prentice-Hall, Inc., 1978.
[20] T. W. Parks y C. S. Burrus,
Diseño de filtros digitales ("Digital filter design"). Nueva
York: John Wiley & Sons, Inc., 1987.
[21] L. Ljung, Identificación de sistemas
- Teoría para el usuario ("System identification - Theory for the
user"). Upper Saddle River, N. J.:
Prentice-Hall, 1999.
[22] A. Härmä, M. Karjalainen, L.
Savioja, V. Välimäki, U. K. Laine y J.
Huopaniemi, Procesamiento de señales deformadas en
frecuencia para aplicaciones de audio
("Frequency-warped signal processing for audio
applications"), J. Audio Eng. Soc., volumen 48, número
11, páginas 1.011-1.031, noviembre 2000.
[23] T. Paatero y M. Karjalainen,
Filtros de Kautz y teoría generalizada de la resolución en
frecuencia y aplicaciones de audio ("Kautz filters and
generalized frequency resolution theory and audio applications")
en preimpresión 5378 AES 110ª convención, (Amsterdam, Países Bajos),
mayo 2001.
[24] L. W. P. Biscainho, P. S.
Diniz y P. A. A. Esquef, Procesos ARMA en subbandas
con aplicación a la restauración de audio ("ARMA processes in
sub-bands with application to audio restoration")
en Proc. IEEE Int. Symp. Circ. Syst. (ISCAS 2001),
(Sidney-Australia), páginas 157-160,
volumen 2, mayo 2001.
[25] J. A. Moorer, Aspectos del
procesamiento de señales de música informática: una visión general
("Signal processing aspects of computer music: a survey"),
Proc. IEEE, volumen 65, páginas 1.108-1.137,
agosto 1977.
[26] V. Valimaki y T. Tolonen,
Desarrollo y calibración de un sintetizador de guitarra
("Development and calibration of a guitar synthesizer"), J.
Audio Eng. Soc., volumen 46, número 9, páginas
766-778, septiembre 1998.
[27] M. W. Macon, A. McCree, W.-M.
Lai y V. Viswanathan, Análisis/síntesis eficiente de
sonidos de instrumentos musicales de percusión utilizando un modelo
totalmente polares ("Efficient analysis/synthesis of percussion
musical instrument sounds using an all-pole
model"), en Proc. IEEE Int. Conf. Acoust. Speech, and
Signal Processing, páginas 3.589-3.592, volumen 6,
1998.
\newpage
[28] T. Tolonen, V. Valimaki y M.
Karjalainen, Modelado de no linealidades en la modulación de
tensión en cuerdas punteadas ("Modeling of tension modulation
nonlinearity in plucked strings"), IEEE Actas sobre el
procesamiento del habla y de audio, volumen 8, número 3, páginas
300-310, mayo 2000.
[29] M. R. Schroeder, Parámetros
estadísticos de las curvas de respuestas en frecuencia de salas
amplias ("Statistical parameters of the frequency response curves
of large rooms"), J. Audio Eng. Soc., volumen 35, número
5, páginas 299-306, 1987.
[30] J. Mourjopoulos, Métodos de
ecualización digital para sistemas de audio ("Digital equalization
methods for audio systems"), en preimpresión 2598, AES 84ª
convención, (París), marzo 1988.
[31] J. Kuriyama y Y. Furukawa,
Sistema de altavoz adaptativo ("Adaptive loudspeaker system"),
J. Audio Eng. Soc., volumen 37, número 11, noviembre
1989.
[32] S. J. Elliott y P. Nelson,
Ecualización de puntos múltiples en una sala utilizando filtros
digitales adaptativos ("Multiple-point
equalization in a room using adaptive digital filters"), J.
Audio Eng. Soc., volumen 37, número 11, noviembre 1989.
[33] J. Mourjopoulos y M. A.
Paraskevas, Modelado de polos y ceros de funciones de
transferencia de salas ("Pole and zero modelling of room transfer
functions"), J. Sound and Vibration, volumen 146, páginas
281-302, noviembre 1994.
[34] R. G. Greenfeld, Aplicación de
técnicas digitales a la ecualización de altavoces ("Application of
digital techniques to loudspeaker equalization"), Tesis de
doctorado, Departamento de ingeniería de sistemas electrónicos de
la universidad de Essex, septiembre 1991.
[35] R. Genereux, Filtros adaptativos
para altavoces y salas ("Adaptive filters for loudspeakers and
rooms"), en preimpresión 3375, AES 98ª convención, (San
Francisco), octubre 1992.
[36] F. X. Y. Gao y W. M.
Snelgrove, Linealización adaptativa de un altavoz
("Adaptive linearization of a loudspeaker"), en preimpresión
3377, AES 98ª convención, (San Francisco), octubre 1992.
[37] J. Mourjopoulos, Ecualización
digital de la acústica de salas ("Digital equalization of room
acoustics"), J. Audio Eng. Soc., volumen 42, número 11,
noviembre 1994.
[38] G. Karachalios, D. Tsoukalas
y J. Mourjopoulos, Análisis y ecualización multibanda de
respuestas de altavoces ("Multiband analysis and equalization of
loudspeaker response") en preimpresión 3975, AES 98ª convención,
(París), febrero 1995.
[39] S. Salamouris, K.
Politopoulos, V. Tsakiris y J. Mourjopoulos,
Sistema digital para ecualización de altavoces y salas ("Digital
system for loudspeaker and room equalization"), en preimpresión
3976, AES 98ª convención, (París), febrero 1995.
[40] Y. Haneda, S. Makino y Y.
Kaneda, Ecualización de puntos múltiples de funciones de
transferencia de salas utilizando polos acústicos comunes
("Multiple-point equalization of room transfer
functions by using common acoustical poles"), IEEE Actas
sobre el procesamiento del habla y de audio, volumen 5, número 4,
páginas 325-333, julio 1997.
[41] M. Karjalainen, E. Piirilä,
A. Järvinen y J. Houpaniemi, Comparación de la
ecualización de respuestas de altavoces utilizando filtros
digitales distorsionados ("Comparison of loudspeaker response
equalization using warped digital filters"), J. Audio Eng.
Soc., volumen 47, número 1/2, páginas 15-31,
1999.
[42] F. Fontana, Ecualización de polo
común de salas pequeñas utilizando un ecualizador digital de tiempo
real en dos etapas ("Common pole equalization of small rooms using
a two-step real-time digital
equalizer"), en Proc. IEEE Taller sobre aplicaciones del
procesamiento de señales a los campos de audio y acústica
(WASPAA'99), páginas 195-198, 1999.
[43] M. Tyril, J. A. Pedersen y P.
Rubak, Filtros digitales para ecualización de baja frecuencia
("Digital filters for low-frequency
equalization"), J. Audio Eng. Soc., volumen 49, número
1/2, páginas 36-43, enero/febrero 2001.
[44] A. Makivirta, P. Antsalo, M.
Karjalainen y V. Valimaki, Ecualización modal de baja
frecuencia de respuestas altavoz-sala
("Low-frequency modal equalization of
loudspeaker-room responses"), en preimpresión
5480, AES 111ª convención, (Nueva York), noviembre/diciembre
2001.
[45] A. Mildvirta y C. Anet, Un
estudio de investigación de las condiciones de control de múltiples
canales y estéreo in situ ("A survey study of
in-situ stereo and
multi-channel monitoring conditions"), en
preimpresión 5496, AES 111ª convención, (Nueva York),
noviembre/diciembre 2001.
[46] Comité técnico AES sobre tecnología de
audio binaural y multicanal (TC-MBAT), Sistemas de
sonido envolvente multicanal y operaciones ("Multichannel
surround sound systems and operations"), Documento técnico,
versión 1.5, AES, 2001.
[47] EBU Documento técnico
3276-1998 (segunda edición), Condiciones de audición
para la evaluación de material de programas de sonido: monofónico y
estereofónico de dos canales ("Listening condition for the
assessment of sound programme material: monophonic and
two-channel stereophonic"), EBU,
1998.
[48] J. O. Smith, Modelado físico
utilizando guías de onda digitales ("Physical modeling using
digital waveguides"), Computer music J., volumen 16,
número 4, páginas 74-91, 1992.
[49] V. Valimaki, J. Huopaniemi,
M. Karjalainen y Z. Jinosy, Modelado físico de
instrumentos de cuerdas punteadas con aplicación a la síntesis de
sonido en tiempo real ("Physical modeling of plucked string
instruments with application to real-time sound
synthesis"), J. Audio Eng. Soc., volumen 44, número 5,
páginas 331-353, mayo 1996.
[50] J. O. Smith, Técnicas para el diseño
de filtros digitales e identificación de sistemas con aplicación al
violín ("Techniques for digital filter design and system
identification with application to the violin"), Tesis de
doctorado, CCRMA, Departamento de música, Stanford University,
Stanford, CA, junio 1983, informe
STAN-M-14.
[51] M. Sandler, Algoritmo para encontrar
raíces con elevada precisión a partir de modelos LPC de orden
elevado ("Algorithm for high precision root finding from high
order LPC models"), Documento IEEE - I sobre comunicaciones,
habla y visión (IEEE Proceedings I on communications, speech and
vision), volumen 138, número 6, páginas 596-602,
diciembre 1991.
[52] M. Sandler, Nuevas técnicas de
síntesis para filtros totalmente polares de elevado orden ("New
synthesis techniques for high-order
all-pole filters"), Documento IEEE - I sobre
comunicaciones, habla y visión (IEEE Proceedings I on
communications, speech and vision), volumen 139, número 1,
páginas 9-16, febrero 1992.
[53] J. Laroche y J.-L. Meillier,
Excitación multicanal/modelado de filtros de sonidos de percusión
con aplicación al piano ("Multichannel excitation/filter modeling
of percussive sounds with application to the piano"), IEEE
Actas sobre procesamiento de habla y audio, volumen 2, número 2,
páginas 329-344, abril 1994.
[54] J. Mackenzie, I. Kale y G. D.
Cain, Aplicación del truncamiento de un modelo equilibrado a
los modelos de análisis/síntesis de sonido ("Applying balanced
model truncation to sound analysis/synthesis models"), en
Proc. Int. Computer Music Conf., páginas
400-403, septiembre 1995.
[55] M. Karjalainen, V. Valimaki y
T. Tolonen, Modelos de cuerdas punteadas, a partir del
algoritmo de Karplus-Strong a las guías de onda
digitales y más allá ("Plucked string models, from the
Karplus-Strong algorithm to digital waveguides and
beyond"), Computer Music J., volumen 22, número 3, páginas
17-32, 1998.
Claims (6)
1. Método para la formación de un ecualizador
modal (5) para una gama audible de frecuencias bajas, en particular
para frecuencias por debajo de los 200 Hz para un espacio (1)
predeterminado y una ubicación (2) en el mismo, que comprende las
etapas de:
- -
- determinar los modos que se van a ecualizar al menos mediante una frecuencia central y una tasa de amortiguación de cada modo,
- -
- crear una descripción en tiempo discreto de los modos determinados, y
- -
- determinar los coeficientes del filtro ecualizador en base a la descripción en tiempo discreto de los modos determinados, y
- -
- formar el ecualizador (5) mediante un filtro digital definiendo los coeficientes del filtro en base a las propiedades de los modos,
en el que dicho método está caracterizado
por las etapas de
- -
- formar una función de detección de modo (G(\Omega)),
- -
- definir la frecuencia \Omegap angular del pico más alto de la función (G(\Omega)),
- -
- realizar un análisis autorregresivo de orden predefinido sobre la versión de fase mínima de la respuesta objetivo para resolver los polos del modo que representa la frecuencia angular del pico más elevado,
- -
- seleccionar el polo más cercano al punto e^{j\Omega p} del círculo unidad, para representar con su complejo conjugado el modo más importante,
- -
- determinar el tiempo de amortiguación de dicho modo y si es superior a un nivel predeterminado, diseñar un filtro de corrección modal para dicho modo y aplicar dicho filtro de corrección modal a la respuesta que se va a ecualizar, y
- -
- repetir este procedimiento hasta que ningún tiempo de amortiguación supere el nivel predeterminado y
- -
- formar el ecualizador combinando todos los filtros de corrección modal obtenidos de esta manera en un filtro de ecualización modal en cascada.
\vskip1.000000\baselineskip
2. Método, según la reivindicación 1,
caracterizado porque la descripción en tiempo discreto es una
transformada en Z.
3. Método, según la reivindicación 1 ó 2,
caracterizado porque se aplica el orden 50-70
al análisis AR.
\vskip1.000000\baselineskip
4. Método, según la reivindicación 1 ó 2 ó 3,
caracterizado porque se utiliza un filtro de corrección de
segundo orden de la ecuación
para corregir cada modo
único.
\vskip1.000000\baselineskip
5. Método, según cualquiera de las
reivindicaciones 1 a 4, caracterizado porque se modifica el
sonido de los altavoces (3) principales.
6. Método, según cualquiera de las
reivindicaciones 1 a 4, caracterizado porque se modifica el
sonido de los altavoces (4) secundarios.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20020865 | 2002-05-07 | ||
FI20020865A FI20020865A (fi) | 2002-05-07 | 2002-05-07 | Menetelmä matalataajuisen modaalisen ekvalisaattorin suunnittelemiseksi erityisesti lähekkäin sijaitsevia moodeja varten |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2333953T3 true ES2333953T3 (es) | 2010-03-03 |
Family
ID=8563898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES03735728T Expired - Lifetime ES2333953T3 (es) | 2002-05-07 | 2003-04-22 | Metodo para el diseño de un ecualizador modal para una gama audible de frecuencias bajas, especialmente para modos posicionados muy proximos. |
Country Status (8)
Country | Link |
---|---|
US (1) | US7286674B2 (es) |
EP (1) | EP1516511B1 (es) |
AT (1) | ATE443976T1 (es) |
AU (1) | AU2003238101A1 (es) |
DE (1) | DE60329389D1 (es) |
ES (1) | ES2333953T3 (es) |
FI (1) | FI20020865A (es) |
WO (1) | WO2003096743A2 (es) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7019764B2 (en) * | 2001-09-20 | 2006-03-28 | Genesis Microchip Corporation | Method and apparatus for auto-generation of horizontal synchronization of an analog signal to digital display |
US7880748B1 (en) * | 2005-08-17 | 2011-02-01 | Apple Inc. | Audio view using 3-dimensional plot |
US8121312B2 (en) * | 2006-03-14 | 2012-02-21 | Harman International Industries, Incorporated | Wide-band equalization system |
US20110311065A1 (en) | 2006-03-14 | 2011-12-22 | Harman International Industries, Incorporated | Extraction of channels from multichannel signals utilizing stimulus |
US8363853B2 (en) * | 2007-02-23 | 2013-01-29 | Audyssey Laboratories, Inc. | Room acoustic response modeling and equalization with linear predictive coding and parametric filters |
KR101309671B1 (ko) | 2009-10-21 | 2013-09-23 | 돌비 인터네셔널 에이비 | 결합된 트랜스포저 필터 뱅크에서의 오버샘플링 |
US9754604B2 (en) * | 2013-04-15 | 2017-09-05 | Nuance Communications, Inc. | System and method for addressing acoustic signal reverberation |
US9848260B2 (en) * | 2013-09-24 | 2017-12-19 | Nuance Communications, Inc. | Wearable communication enhancement device |
US9426300B2 (en) | 2013-09-27 | 2016-08-23 | Dolby Laboratories Licensing Corporation | Matching reverberation in teleconferencing environments |
GB201318802D0 (en) * | 2013-10-24 | 2013-12-11 | Linn Prod Ltd | Linn Exakt |
EP3108671B1 (en) * | 2014-03-21 | 2018-08-22 | Huawei Technologies Co., Ltd. | Apparatus and method for estimating an overall mixing time based on at least a first pair of room impulse responses, as well as corresponding computer program |
EP2930958A1 (en) * | 2014-04-07 | 2015-10-14 | Harman Becker Automotive Systems GmbH | Sound wave field generation |
DE102014005381B3 (de) * | 2014-04-11 | 2014-12-11 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler |
FI129335B (en) | 2015-09-02 | 2021-12-15 | Genelec Oy | Acoustic room mode control |
US11125043B2 (en) * | 2016-03-23 | 2021-09-21 | University Of Houston System | Model-based monitoring and useful life estimation for blowout preventer annulars |
US11361742B2 (en) * | 2019-09-27 | 2022-06-14 | Eventide Inc. | Modal reverb effects for an acoustic space |
EP3985999A1 (en) * | 2020-10-19 | 2022-04-20 | Alps Alpine Co., Ltd. | Method for configuring a digital audio filter, digital audio filter, and sound system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3240947B2 (ja) * | 1997-01-28 | 2001-12-25 | ヤマハ株式会社 | ハウリング検出器及びハウリングキャンセル装置 |
US6779404B1 (en) * | 1999-11-03 | 2004-08-24 | Rune Brincker | Method for vibration analysis |
US20040091120A1 (en) * | 2002-11-12 | 2004-05-13 | Kantor Kenneth L. | Method and apparatus for improving corrective audio equalization |
-
2002
- 2002-05-07 FI FI20020865A patent/FI20020865A/fi not_active IP Right Cessation
-
2003
- 2003-04-22 AT AT03735728T patent/ATE443976T1/de active
- 2003-04-22 EP EP03735728A patent/EP1516511B1/en not_active Expired - Lifetime
- 2003-04-22 US US10/481,114 patent/US7286674B2/en active Active
- 2003-04-22 AU AU2003238101A patent/AU2003238101A1/en not_active Abandoned
- 2003-04-22 WO PCT/FI2003/000321 patent/WO2003096743A2/en not_active Application Discontinuation
- 2003-04-22 ES ES03735728T patent/ES2333953T3/es not_active Expired - Lifetime
- 2003-04-22 DE DE60329389T patent/DE60329389D1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE60329389D1 (de) | 2009-11-05 |
FI20020865A (fi) | 2003-11-08 |
FI20020865A0 (fi) | 2002-05-07 |
EP1516511B1 (en) | 2009-09-23 |
EP1516511A1 (en) | 2005-03-23 |
WO2003096743A2 (en) | 2003-11-20 |
US20050175193A1 (en) | 2005-08-11 |
AU2003238101A1 (en) | 2003-11-11 |
US7286674B2 (en) | 2007-10-23 |
ATE443976T1 (de) | 2009-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2333953T3 (es) | Metodo para el diseño de un ecualizador modal para una gama audible de frecuencias bajas, especialmente para modos posicionados muy proximos. | |
Karjalainen et al. | Frequency-zooming ARMA modeling of resonant and reverberant systems | |
Zotter et al. | Energy-preserving ambisonic decoding | |
Søndergaard et al. | The auditory modeling toolbox | |
Smith et al. | Bark and ERB bilinear transforms | |
ES2712457T3 (es) | Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y procedimiento para el funcionamiento del sistema de filtro | |
ES2683821T3 (es) | Diseño de controlador de precompensación de audio usando un conjunto variable de altavoces de soporte | |
KR101014404B1 (ko) | 오디오신호의 처리방법 및 처리장치 | |
US11049482B1 (en) | Method and system for artificial reverberation using modal decomposition | |
Bilbao et al. | Incorporating source directivity in wave-based virtual acoustics: Time-domain models and fitting to measured data | |
Välimäki et al. | Parametric spring reverberation effect | |
Ziemer et al. | Psychoacoustic sound field synthesis for musical instrument radiation characteristics | |
Shi et al. | Generation of personal sound zones with physical meaningful constraints and conjugate gradient method | |
Välimäki et al. | Spectral delay filters | |
US6453253B1 (en) | Impulse response measuring method | |
Hahn et al. | Higher-order anti-derivatives of band limited step functions for the design of radial filters in spherical harmonics expansions | |
US10019980B1 (en) | Distortion and pitch processing using a modal reverberator architecture | |
Hahn et al. | Time domain radial filter design for spherical waves | |
Panton et al. | Stage acoustics in eight Australian concert halls: Acoustic conditions in relation to subjective assessments by a touring chamber orchestra | |
Karjalainen et al. | AR/ARMA analysis and modeling of modes in resonant and reverberant systems | |
Böhlke et al. | Perceptual evaluation of violin radiation characteristics in a wave field synthesis system | |
Stephenson | Assessing the quality of low frequency audio reproduction in critical listening spaces | |
Gunnarsson et al. | Binaural auralization of microphone array room impulse responses using causal Wiener filtering | |
Paatero et al. | New digital filter techniques for room response modeling | |
Bank | Warped, kautz, and fixed-pole parallel filters: A review |