ES2249823T3 - Descodificacion de audio multifuncional. - Google Patents
Descodificacion de audio multifuncional.Info
- Publication number
- ES2249823T3 ES2249823T3 ES98908769T ES98908769T ES2249823T3 ES 2249823 T3 ES2249823 T3 ES 2249823T3 ES 98908769 T ES98908769 T ES 98908769T ES 98908769 T ES98908769 T ES 98908769T ES 2249823 T3 ES2249823 T3 ES 2249823T3
- Authority
- ES
- Spain
- Prior art keywords
- network
- attenuation
- signal
- matrix
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
UN CANCELADOR DE INTERCOMUNICACION ACUSTICA, PENSADO PARA INCORPORARLO EN UN SOFTWARE, DE MODO QUE CUANDO SE EJECUTA EN TIEMPO REAL EN UN ORDENADOR PERSONAL, EL CANCELADOR TENGA MUY BAJOS REQUISITOS DE MILLONES DE INSTRUCCIONES POR SEGUNDO Y UTILICE UNA FRACCION PEQUEÑA DE LOS CICLOS DE LA CPU DISPONIBLES. ASI, POR EJEMPLO, EL PROGRAMA SE PODRIA INCLUIR EN VIDEOJUEGOS, CD-ROMS, AUDIO PARA INTERNET Y ANALOGOS, TORNANDO LAS IMAGENES DE SONIDOS CIRCUNDANTES FUERA DEL ESPACIO ENTRE LOS ALTAVOCES MULTIMEDIA IZQUIERDO Y DERECHO DEL ORDENADOR CUANDO SE REPRODUCE EL AUDIO DE TALES FUENTES.
Description
Descodificación de audio multifuncional.
La invención se refiere a decodificación de audio
multidireccional. Más en concreto, la invención se refiere a un
cancelador de la diafonía acústica implementado mediante un
programa almacenado en un ordenador que utiliza muy pocos recursos
de procesamiento de un ordenador personal para uso en un sistema de
decodificación y de presentación de audio multidireccional.
El audio multicanal para juegos de vídeo
multimedia, CD ROM, audio por Internet y similares basado en
ordenadores personales (a menudo denominado "audio
multimedia") ha emergido como una nueva aplicación de los
sistemas de codificación y de decodificación de sonido multicanal
Dolby Surround y Dolby Digital.
Dolby Surround, basado en el uso de una matriz
amplitud-fase 4:2:4, se ha convertido actualmente en
un sistema bien conocido para codificar cuatro canales de audio
(izquierdo, derecho, central y surround) en medios de audio de dos
canales (casetes y discos compactos), transmisiones de radio y las
partes de audio de grabaciones de vídeo (cintas de vídeo y discos
láser), y radiodifusiones de televisión, y para decodificarlos de
los mismos. Dolby Surround (y Dolby Surround Pro Logic, que utiliza
un decodificador de canal surround activo para aumentar la
separación entre canales) se utiliza ampliamente en sistemas de cine
en casa, que requieren, típicamente, un mínimo de tres altavoces
(altavoces izquierdo y derecho situados próximos a la pantalla de
presentación y un altavoz surround situado detrás de la audiencia)
y preferiblemente cuatro altavoces (dos altavoces surround en lugar
de uno, situados a cada lado de la audien-
cia). Idealmente, se utiliza incluso un quinto altavoz, para proporcionar una reproducción "fuerte" del canal central.
cia). Idealmente, se utiliza incluso un quinto altavoz, para proporcionar una reproducción "fuerte" del canal central.
Dolby Digital utiliza la tecnología de
codificación de audio digital Dolby AC-3 en la que
5.1 canales de audio (izquierdo, central, derecho, surround
izquierdo, surround derecho y un canal de graves de ancho de banda
limitado) se codifican en un flujo de datos de velocidad reducida.
Dolby Digital, una tecnología más nueva que Dolby Surround, se
utiliza ya ampliamente en los sistemas de cine en casa y ha sido
elegida como el estándar de audio en Estados Unidos para el DVD
(digital video disc, disco de vídeo digital) y para la HDTV (high
definition televisión, televisión de alta definición). En un
entorno de cine en casa, Dolby Digital requiere un mínimo de cuatro
altavoces porque reproduce dos canales surround en lugar de
uno.
En el entorno "multimedia" del ordenador
personal, normalmente se emplean solamente dos altavoces, los
altavoces izquierdo y derecho situados adyacentes o próximos a la
pantalla del ordenador (y, opcionalmente, un altavoz de graves, que
puede estar situado alejado, por ejemplo en el suelo -en la presente
discusión se ignora el altavoz de graves). Cuando se reproduce por
los altavoces izquierdo y derecho a través de medios
convencionales, el material estéreo produce generalmente imágenes
sonoras que están limitadas a los propios altavoces y al espacio
entre ellos. Este efecto es el resultado de la diafonía de la señal
acústica procedente de cada altavoz en la oreja lejana de un oyente
situado enfrente de la pantalla del ordenador. La cancelación
acústica y la representación del posicionamiento arbitrario de la
fuente son aspectos del mismo proceso común.
Para reproducir material codificado en Dolby
Surround en el entorno de un ordenador, ciertas disposiciones
conocidas emplean múltiples excitadores de altavoz dentro de una
única envoltura con el fin de simular el uso de múltiples
altavoces. Ver, por ejemplo, la patente de Estados Unidos número
5.553.149.
Otras disposiciones conocidas han propuesto el
uso de procesamiento de imágenes de sonido empleando cancelación de
la diafonía acústica para proporcionar la percepción de que la
información de sonido surround procede de posiciones virtuales de
altavoces situados detrás o al lado de un oyente cuando sólo se
utilizan dos altavoces situados enfrente. Ver por ejemplo, la
solicitud de patente europea publicada EP0637191A2 y la solicitud
de patente internacional publicada WO96/06515. El origen del
cancelador de la diafonía acústica se atribuye, generalmente, a B.S.
Atal y Manfred Schroeder de Bell Telephone Laboratories (ver, por
ejemplo, la patente de Estados Unidos número 3.236.949). Como fue
descrito originalmente por Schroeder y Atal, el efecto de la
diafonía acústica puede mitigarse mediante la introducción de una
señal de cancelación apropiada desde el altavoz opuesto. Puesto que
la propia señal de cancelación producirá diafonía acústica, también
debe ser cancelada por una señal apropiada procedente del altavoz
que emitía originalmente, y así sucesivamente.
La presente invención está dirigida a un
cancelador de la diafonía acústica que puede implementarse
utilizando muy pocos recursos de procesamiento de un ordenador
personal, en especial para su utilización en un sistema de
decodificación y de presentación de audio multidireccional tal como
un sistema multimedia de ordenador que tiene solamente dos
altavoces principales.
De acuerdo con la presente invención, se
proporciona un cancelador de la diafonía acústica pensado para su
implementación mediante software, de forma que cuando corre en
tiempo real en un ordenador personal, el cancelador tiene unas
exigencias muy pequeñas de mips y utiliza una pequeña fracción de
los ciclos de CPU disponibles. De este modo, por ejemplo, el
programa podría incluirse en videojuegos, CD-ROM,
audio por Internet y similares, proporcionando imágenes de sonido
surround fuera del espacio comprendido entre los altavoces
multimedia izquierdo y derecho del ordenador cuando se reproduce el
sonido procedente de dichas fuentes.
En un sistema de reproducción ideal, si una
grabación original tiene M canales, cada uno con una dirección
asociada de la fuente, el oyente debería percibir estos M canales
reproducidos desde sus respectivas M direcciones originales. En los
sistemas de reproducción prácticos, los M canales originales se
reproducen mediante N canales de presentación o altavoces, cada uno
de los cuales tiene una posición con respecto a las direcciones de
las fuentes originales y con respecto a uno o más oyentes (cada
oyente inmóvil que tiene una posición de escucha P en cada oído).
El sistema global puede expresarse como:
M \Rightarrow
[C] \Rightarrow N \Rightarrow [R] \Rightarrow
P,
donde [C] es una red de filtros C
de M x N puertos que procesa o hace corresponder los M canales
originales a los N canales de presentación (es decir, una
correspondencia lineal, invariable en el tiempo) y [R] es una red de
filtros R de N x P puertos que procesa o hace corresponder los N
canales de presentación a P posiciones de escucha (también una
correspondencia lineal, invariable en el
tiempo).
La red de filtros R puede representarse mediante
una matriz de la sala R de respuestas de filtros o de funciones de
transferencia (en la práctica de HRTF, head related transfer
function, función de transferencia del oído) determinadas mediante
la medida o la estimación de la función de transferencia desde cada
uno de los N canales de presentación a cada una de las P posiciones
de escucha, formando una matriz N x P de funciones de
transferencia, cada una de las cuales puede incluir los efectos de
las desviaciones de respuesta de los altavoces, la acústica de la
sala, los retardos, los ecos, el posible efecto "head shadow",
etc.:
donde los elementos de la matriz
r_{11} ... r_{np} son respuestas de filtros individuales que
representan la función de transferencia desde cada canal de
presentación a cada posición de escucha. Si los elementos de la
matriz r_{11} ... r_{np} están expresados como funciones de
transferencia en el dominio de la frecuencia, por ejemplo como FFT
(fast Fourier
transforms, transformadas rápidas de Fourier), con la matriz pueden realizarse operaciones normales de matrices (suma, multiplicación, etc.). De acuerdo con la presente invención, la matriz de la sala puede simplificarse ignorando todo salvo el retardo y la atenuación dependiente de la frecuencia en el camino acústico directo entre cada canal de presentación y cada posición de escucha, y aplanando la respuesta de atenuación durante al menos una parte sustancial del espectro del sonido de audio que se intenta reproducir por dichos canales de presentación.
transforms, transformadas rápidas de Fourier), con la matriz pueden realizarse operaciones normales de matrices (suma, multiplicación, etc.). De acuerdo con la presente invención, la matriz de la sala puede simplificarse ignorando todo salvo el retardo y la atenuación dependiente de la frecuencia en el camino acústico directo entre cada canal de presentación y cada posición de escucha, y aplanando la respuesta de atenuación durante al menos una parte sustancial del espectro del sonido de audio que se intenta reproducir por dichos canales de presentación.
La red de filtros C constituye un cancelador de
la diafonía acústica y puede representarse mediante una matriz de
cancelación C de respuestas de filtros o de funciones de
transferencia:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
donde los elementos de la matriz
c_{11} ... c_{mn} son respuestas de filtros individuales. Si
los elementos de la matriz
c_{11} ... c_{mn} están expresados como funciones de transferencia en el dominio de la frecuencia, por ejemplo como FFT (fast Fourier transforms, transformadas rápidas de Fourier), con la matriz pueden realizarse operaciones normales de matrices (suma, multiplicación, etc.).
c_{11} ... c_{mn} están expresados como funciones de transferencia en el dominio de la frecuencia, por ejemplo como FFT (fast Fourier transforms, transformadas rápidas de Fourier), con la matriz pueden realizarse operaciones normales de matrices (suma, multiplicación, etc.).
Puesto que reestablece los M canales originales
en sus direcciones originales, el cancelador de la diafonía
acústica tiene la capacidad de crear imágenes virtuales –los
sonidos proceden aparentemente de las direcciones M más que de las
N posiciones de los altavoces, pudiendo estar las N posiciones
situadas en lugares diferentes a las M fuentes con respecto a las P
posiciones de escucha.
Un cancelador de la diafonía acústica funciona
básicamente como si fuera un filtro "espacial inverso" en un
sistema de reproducción de sonido para cancelar las características
acústicas de una sala de escucha y reemplazarlas por las
características acústicas de la grabación original. De forma que el
oyente escucha los M canales originales en las P posiciones de
escucha como se desea, con lo que
CR =
I,
\vskip1.000000\baselineskip
donde I es la matriz identidad,
o
\vskip1.000000\baselineskip
C =
R^{-1}.
De este modo, la matriz C puede determinarse
estableciendo la matriz de la sala R y calculando su inversa.
Puesto que la matriz de la sala R está simplificada, de acuerdo con
la presente invención, la matriz del cancelador C resultante también
estará simplificada, lo que conduce a realizaciones software más
sencillas de la red C de cancelación de la diafonía acústica,
realizaciones que minimizan los requisitos de recursos de
procesamiento cuando corren en un ordenador personal.
Si los elementos de la matriz R son funciones de
transferencia en el dominio de la frecuencia, puede calcularse su
inversa con el fin de obtener la matriz de cancelación C. De la
matriz de cancelación C pueden obtenerse entonces una o más redes de
cancelación de la diafonía acústica de M x N puertos realizables
mediante software. En la red resultante de M x N puertos, cada
salida N es, dependiendo de la realización: (1) la combinación
lineal de versiones filtradas independientemente de las M entradas,
ó (2) la combinación lineal de versiones filtradas
independientemente de las M entradas y señales de realimentación
procedentes de las N salidas filtradas independientemente, ó (3)
señales de realimentación procedentes de las N salidas filtradas
independientemente sumadas a las M entradas.
Una forma de realizar la red es transformar los
elementos de la matriz C a representaciones en el dominio del
tiempo, a partir de las cuales se obtienen fácilmente, como es bien
conocido, realizaciones de filtros FIR (finite impulse response,
respuesta impulsional finita). Aunque se prefiere una realización a
base de filtros IIR (infinite impulse response, respuesta
impulsional infinita) con el fin de minimizar los recursos de
procesamiento, la obtención de un filtro IIR a partir de un filtro
FIR no es un proceso sencillo. Por consiguiente, en lugar de
transformar los elementos de la matriz C al dominio del tiempo, se
prefiere dejarlos en el dominio de la frecuencia de donde pueden
obtenerse fácilmente las respuestas en amplitud y en fase del
filtro. Después, pueden llevarse a cabo realizaciones de sencillos
filtros IIR o de filtros FIR/IIR, incluyendo sus coeficientes del
filtro, que requieren poca potencia de procesamiento, y que
implementen las respuestas de amplitud y de fase deseadas. Aunque
tales filtros IIR ó FIR/IIR pueden obtenerse mediante técnicas de
prueba y error, en la práctica un mejor modo de obtener dichos
filtros IIR ó FIR/IIR es emplear uno de los muchos programas de
ordenador comerciales de diseño de filtros digitales.
Si la matriz de la sala R no es una matriz
cuadrada, la matriz inversa del cancelador C es una "inversa de
una seudo-matriz" pero sigue siendo el camino
óptimo para hacer corresponder M canales originales con N canales de
presentación para su presentación en P posiciones de escucha. Para
el caso de número de vínculos inferior al normal (es decir, P menor
que N) la seudo-inversa minimiza el error
cuadrático medio (RMS) entre las soluciones real y deseada. Para el
caso de número de vínculos superior al normal (es decir, P mayor
que N), la seudo-inversa minimiza la energía eficaz
(RMS) de la(s) entrada(s) necesaria(s) para
conseguir la solución exacta.
Como se comprenderá por la discusión anterior,
los principios de la presente invención son aplicables, en general,
a números arbitrarios de canales originales, altavoces y posiciones
de escucha. Sin embargo, por simplicidad, las realizaciones
preferidas descritas a continuación se refieren al caso específico
en el que existen dos altavoces (tal como en una disposición
multimedia típica de ordenador, con los altavoces situados
simétricamente y poco separados enfrente del oyente, por ejemplo a
ambos lados de la pantalla del ordenador multimedia o del aparato de
televisión), dos canales originales (tales como, pero no limitados
a, surround izquierdo y surround derecho), y dos posiciones de
escucha (los oídos de un oyente) de forma que N = M = P = 2. De
este modo, la matriz de transferencia de propiedades acústicas de la
sala R es una matriz 2 x 2 y la respuesta del cancelador, C, está
representada por la matriz 2 x 2 que es la inversa de la matriz R,
de forma que el canal original izquierdo L se percibe únicamente en
el oído izquierdo (una de las dos posiciones de escucha P) mientras
que el canal original derecho R se percibe solamente en el oído
derecho (la otra de las dos posiciones de escucha P).
Las señales aplicadas a través de un cancelador
de la diafonía acústica de este tipo a un par de altavoces situados
al lado de la pantalla de un ordenador da como resultado la
percepción de que el sonido procede de los laterales del oyente y
no del lugar en el que se encuentran situados los altavoces -las
indicaciones de la dirección frontal se pierden y el sonido parece
venir solamente del lateral, donde deberían estar los altavoces
surround. De este modo, aplicando directamente a los altavoces
información de los canales izquierdo y derecho y sumando dicha
información con información surround espacializada (es decir,
información surround procesada por el cancelador de la diafonía
acústica), solamente se necesitan dos altavoces situados junto a la
pantalla del ordenador para generar la percepción de campos sonoros
izquierdo, derecho y surround.
En uno de sus aspectos, la presente invención
está dirigida a un método de obtención de una matriz de cancelación
C de dimensiones M x N en la que cada uno de los elementos de la
matriz es una función de transferencia en el dominio de la
frecuencia, representando la matriz C una red de cancelación de la
diafonía acústica de M x N puertos para hacer corresponder M
canales originales de audio, cada uno con una dirección asociada
de la fuente, a N canales de presentación de audio, cada uno con
una posición relativa con respecto a las direcciones de las fuentes,
de forma que cada salida N es: (1) la combinación lineal de
versiones filtradas independientemente de las M entradas, ó (2) la
combinación lineal de versiones filtradas independientemente de las
M entradas y señales de realimentación procedentes de las N salidas
filtradas independientemente, ó (3) señales de realimentación
procedentes de las N salidas filtradas independientemente sumadas a
las M entradas. El método comprende el establecimiento de una matriz
de la sala R de dimensiones N x P en la que cada uno de los
elementos de la matriz es una función de transferencia en el dominio
de la frecuencia, representando la matriz R una red de N x P
puertos para hacer corresponder N posiciones de los canales de
presentación a P posiciones de escucha, en la que las funciones de
transferencia en el dominio de la frecuencia representan el retardo
y una versión aplanada de la atenuación dependiente de la frecuencia
a lo largo de un camino acústico directo desde cada una de dichas
posiciones de los canales de presentación a cada una de dichas
posiciones de escucha, y haciendo que la matriz de cancelación C
sea igual a la inversa de la matriz de la sala R. La versión
aplanada de la atenuación dependiente de la frecuencia puede ser,
por ejemplo, una media aplanada de dicha atenuación del camino
acústico a lo largo de, al menos, una parte sustancial del espectro
del sonido de audio que se intenta reproducir por los canales de
presentación.
En otro de sus aspectos, la invención está
dirigida a una red de cancelación de la diafonía acústica de M x N
puertos para hacer corresponder M canales originales de audio, cada
uno con una dirección asociada de la fuente, a N canales de
presentación de audio, cada uno con una posición relativa con
respecto a las direcciones de las fuentes, de forma que cada salida
N es: (1) la combinación lineal de versiones filtradas
independientemente de las M entradas, ó (2) la combinación lineal de
versiones filtradas independientemente de las M entradas y señales
de realimentación procedentes de las N salidas filtradas
independientemente, ó (3) señales de realimentación procedentes de
las N salidas filtradas independientemente sumadas a las M entradas.
La red de cancelación de la diafonía acústica se produce mediante
los pasos de: establecimiento de una matriz de la sala R de
dimensiones N x P en la que cada uno de los elementos de la matriz
es una función de transferencia en el dominio de la frecuencia,
representando la matriz R una red de N x P puertos para hacer
corresponder N posiciones de los canales de presentación a P
posiciones de escucha, en la que las funciones de transferencia en
el dominio de la frecuencia representan el retardo y una versión
aplanada de la atenuación dependiente de la frecuencia a lo largo de
un camino acústico directo desde cada una de las posiciones de los
canales de presentación a cada una de las posiciones de escucha;
obtención de la inversa de la matriz de la sala R para obtener una
matriz de cancelación de la diafonía acústica C de dimensiones M x
N en la que cada uno de los elementos de la matriz es una función de
transferencia en el dominio de la frecuencia, representando la
matriz C la red de cancelación de la diafonía acústica de M x N
puertos; e implementación de la versión aplanada de la atenuación
dependiente de la frecuencia por uno o más filtros digitales
sencillos que requieren poca potencia de procesamiento. Los filtros
digitales son, preferiblemente, del tipo IIR o del tipo IIR/FIR y
preferiblemente son filtros de primer orden. La versión aplanada de
la atenuación dependiente de la frecuencia puede ser, por ejemplo,
una media aplanada de dicha atenuación del camino acústico a lo
largo de, al menos, una parte sustancial del espectro del sonido de
audio que se intenta reproducir por los canales de presentación. El
retardo puede realizarse mediante una memoria intermedia circular
digital.
De acuerdo con un aspecto adicional de la
presente invención, la red de cancelación de la diafonía acústica de
M x N puertos puede incluir un compresor de amplitud,
comprendiendo el compresor atenuadores de nivel de amplitud fijo en
cada una de las entradas de la red, y amplificadores de refuerzo de
nivel de amplitud variable en cada una de las salidas de la red,
incluyendo cada uno de los amplificadores de refuerzo un circuito
escalador para variar la amplificación entre un nivel que
restablece la atenuación de entrada y un nivel atenuado que evita el
truncamiento de la señal de salida. En una realización preferida,
el control del compresor se obtiene de la entrada al compresor,
teniendo el compresor una relación de compresión infinita, dando
lugar con ello a un limitador. En la realización preferida, el
compresor incluye además un retardo en cada una de las salidas de
la red y el control del compresor mira hacia el futuro con el fin
de controlar silábicamente la ganancia del compresor. Los
atenuadores de nivel de amplitud fijo y los amplificadores de
refuerzo de nivel de amplitud variable pueden tener características
independientes de la frecuencia. Alternativamente, los atenuadores
de nivel de amplitud fijo y los amplificadores de refuerzo de nivel
de amplitud variable tienen características dependientes de la
frecuencia. Cuando el procesador de la diafonía acústica es ruidoso
con niveles bajos de señal, como puede ser el caso cuando se
utiliza un procesador barato, tal como chips DSP que soportan
solamente longitudes de palabras de 16 bits, las características
dependientes de la frecuencia de dichos atenuadores de nivel de
amplitud fijo y de dichos amplificadores de refuerzo de nivel de
amplitud variable funcionan solamente desde frecuencias medias
hasta bajas, manteniendo de este modo baja la pérdida en la relación
señal/ruido y limitando las pérdidas a frecuencias que son menos
audibles.
En otro aspecto de la invención, la red de
cancelación de la diafonía acústica es una red de 2 x 2 puertos
para hacer corresponder dos canales originales de audio M a dos
canales de presentación de audio N aplicados a un par de
transductores que tienen posiciones relativas con respecto a las
direcciones de los canales originales de audio M, teniendo el
oyente dos posiciones de escucha P, el oído izquierdo y el oído
derecho del oyente, con respecto a los transductores, comprendiendo
la red además (1) dos combinadores de señales, un primer combinador
de señales y un segundo combinador de señales, teniendo cada
combinador de señales al menos dos entradas y una salida, en la que
(a) una de las N entradas está conectada a una entrada del primer
combinador de señales y otra de las N entradas está conectada a una
entrada del segundo combinador de señales, y (b) una de las N
salidas está conectada a la salida del primer combinador de señales
y otra de las salidas está conectada a la salida del segundo
combinador de señales, y (2) dos caminos de realimentación de
señales, un primer camino de realimentación de señales y un segundo
camino de realimentación de señales, teniendo cada camino de
realimentación un retardo y características dependientes de la
frecuencia, y teniendo cada camino de realimentación una entrada y
una salida, en la que (a) la entrada del primer camino de
realimentación de señales está conectada a la salida del primer
combinador de señales y la salida del primer camino de
realimentación de señales está conectada a la otra entrada del
segundo combinador de señales, (b) la entrada del segundo camino de
realimentación de señales está conectada a la salida del segundo
combinador de señales y la salida del segundo camino de
realimentación de señales está conectada a la otra entrada del
primer combinador de señales, (c) cada uno de los caminos de
realimentación tiene un retardo que representa el tiempo adicional
que necesita el sonido para propagarse a lo largo del camino
acústico entre un transductor y el oído del oyente más alejado del
transductor con respecto al tiempo que necesita el sonido para
propagarse a lo largo del camino acústico entre el mismo
transductor y el oído del oyente más cercano a dicho transductor, y
(d) cada uno de los caminos de realimentación tiene una
característica que depende de la frecuencia que representa la
diferencia en la atenuación en el camino acústico entre un
transductor y el oído del oyente más alejado del transductor y la
atenuación en el camino acústico entre el mismo transductor y el
oído del oyente más cercano a dicho transductor, y (3) teniendo los
combinadores de señales, los caminos de realimentación de señales y
las conexiones entre ellos características de polaridad de forma
que las señales procesadas por un camino de realimentación se
combinan restándose a las señales introducidas en la otra entrada
del respectivo combinador de señales. Los dos canales de
presentación pueden aplicarse a un par de transductores,
generalmente dispuestos enfrente de y en posiciones sustancialmente
simétricas a la izquierda y a la derecha con respecto a un oyente.
La característica dependiente de la frecuencia puede materializarse
como una característica de filtro en pendiente paso bajo de primer
orden, que puede implementarse por medio de un filtro IIR o una
combinación de filtros FIR/IIR. La atenuación en el camino acústico
entre un transductor y el oído del oyente más alejado del
transductor se determina obteniendo la diferencia entre la
respuesta de transferencia del oído desde un transductor y el oído
del oyente más alejado del transductor y la respuesta de
transferencia del oído desde el otro transductor al oído del oyente
más cercano al otro transductor y aplanando la diferencia.
Diversos aspectos de la invención pueden
utilizarse independientemente o en combinación unos con otros.
La figura 1 es un diagrama de bloques funcionales
de un cancelador de la diafonía acústica sencillo de 4 puertos.
La figura 2 muestra gráficos de la amplitud de
dos características de respuesta acústica en función de la
frecuencia: la respuesta A es la diferencia de las respuestas a los
impulsos de los oídos izquierdo y derecho para fuentes a \pm 15
grados y la respuesta B es una versión aplanada de la respuesta
A.
La figura 3 es un diagrama de bloques funcionales
de un filtro sencillo de primer orden que se puede usar en el
sencillo cancelador de la diafonía acústica de la figura 1 para
llevar a cabo una versión aplanada de la diferencia de las
respuestas a los impulsos de los oídos izquierdo y derecho.
La figura 4A es un diagrama de bloques
funcionales que muestra un entorno preferido en el que puede
emplearse la red de cancelación de la diafonía acústica de la
presente invención.
La figura 4B es un diagrama de bloques
funcionales que muestra un entorno preferido alternativo en el que
puede emplearse la red de cancelación de la diafonía acústica de la
presente invención, con respecto no sólo a las señales del canal
surround, sino también con respecto a las señales principales
izquierda y derecha.
La figura 5 es un diagrama de bloques funcionales
que muestra la realización preferida del sencillo cancelador de 2 x
2 puertos de las figuras 1 y 3 para uso en los entornos de las
figuras 4A ó 4B.
La figura 6 es un diagrama de bloques funcionales
que muestra una realización del mezclador-reductor
y compresor/limitador de salida de las figuras 4A y 4B.
Como se ha mencionado anteriormente, la respuesta
requerida de un cancelador acústico puede calcularse midiendo la
respuesta efectiva del proceso de diafonía (de cada altavoz con
cada oído), y calculando una respuesta inversa invirtiendo la
matriz de las funciones del sistema. Como se ha explicado
anteriormente, puede entonces obtenerse una o más realizaciones
software de la respuesta inversa. Sin embargo, debido a la sencilla
naturaleza del proceso de diafonía en el caso de 2 x 2 (2
altavoces, 2 oídos), es posible llegar a la respuesta inversa de un
modo más intuitivo.
La diferencia principal entre una señal acústica
dada que llega al oído cercano y la misma señal que llega al oído
lejano es que la señal en el oído lejano está retardada y atenuada
ligeramente en relación con la que llega al oído cercano. La
generación de una señal de cancelación implica, por consiguiente, el
restar del canal opuesto una señal con un retardo y una atenuación
similares.
Un cancelador de la diafonía acústica emplea el
concepto básico de cancelación activa del ruido -es decir, la señal
de acoplamiento procedente del altavoz izquierdo que se oye en el
oído derecho se cancela aplicando al canal derecho una versión de
la misma señal con fase invertida, retardada, con amplitud reducida
y filtrada dependiendo de la frecuencia y viceversa. Cada señal con
fase invertida debe, a su vez, cancelarse de la misma manera (al
menos durante varias iteraciones).
La figura 1 es un diagrama de bloques funcionales
que muestra los elementos básicos de un cancelador sencillo. Cada
retardo 12 y 14 es típicamente de alrededor de 140 \mus para
altavoces situados delante de un oyente a ángulos de \pm 15
grados (un retardo de alrededor de 6 muestras a una frecuencia de
muestreo de 44,1 kHz). Cada uno de los filtros 16 y 18 es
simplemente un factor de atenuación independiente de la frecuencia,
K, típicamente de alrededor de 0,9. La entrada de cada rama de
realimentación 20 y 22 se toma de la salida de un sumador aditivo
(24 y 26, respectivamente) en una disposición de realimentación
negativa de canal cruzado (cada rama se resta en el respectivo
sumador), para generar una señal de cancelación de cada señal de
cancelación previa, como se explicó anteriormente. Éste es un
cancelador de la diafonía acústica muy sencillo de realizar en forma
digital: dos sumas, dos multiplicaciones y un par de memorias
circulares de 6 muestras para los retardos. De este modo, en esta
realización, las N salidas de la red de M x N puertos son las
señales de realimentación filtradas independientemente procedentes
de las N salidas sumadas a las M entradas.
Sin embargo, el sencillo cancelador que acabamos
de describir no tiene en cuenta el hecho de que la atenuación
introducida en el camino acústico lejano depende de la
frecuencia. Es de sobra conocido el que la característica de
frecuencia de dichos caminos acústicos puede obtenerse midiendo las
respuestas a impulsos binaurales utilizando una cabeza humana o una
cabeza de maniquí, normalmente medidas en un ambiente anecoico. Es
fácil acceder a datos publicados que reflejan dichas medidas. Por
ejemplo, respuestas a impulsos binaurales que se pueden utilizar
pueden ser las obtenidas con una cabeza de maniquí de la marca Kemar
en un ambiente anecoico por el MIT Media Lab, y publicadas en su
página web de Internet. Utilizando dichos datos, se restan los
valores de la magnitud, en dB, de las transformadas de Fourier de
las respuestas a los impulsos de los oídos izquierdo y derecho para
fuentes situadas a 15 grados para llegar a una respuesta diferencia
en frecuencia que corresponde a altavoces situados a \pm 15
grados. Este espectro diferencia en bruto se muestra en la figura 2
como respuesta A, una característica bastante compleja que
requeriría una realización mediante un filtro multipolo.
Un aspecto de la presente invención es aplanar
una respuesta tal como la respuesta A de la figura 2, con el fin de
simplificar la realización del filtro resultante, minimizando con
ello los recursos de procesamiento del ordenador necesarios. Otro
aspecto de la presente invención es la implementación de la
respuesta aplanada mediante una sección de filtros de primer orden,
que, cuando se lleva a cabo, requiere una potencia de procesamiento
muy baja. La respuesta de una sección de filtros de primer orden
que proporciona un aplanamiento conveniente es, por ejemplo, la
respuesta B de la figura 2. La respuesta deseada es una media
aplanada de la atenuación del camino acústico a lo largo de, al
menos, una parte sustancial del espectro de sonido de audio que se
intenta reproducir por dichos canales de presentación. El intentar
aproximar la respuesta con mayor precisión no será de utilidad
porque existen muchas fuentes de error: altavoces no adaptados,
altavoces a distinta distancia del oyente, la cabeza del oyente no
es simétrica, anchura anormal de la cabeza, etc. En la práctica, la
respuesta de un filtro de primer orden se aproxima a la
característica ideal lo suficiente como para que el cancelador de la
diafonía resultante sea eficaz para la mayoría de los
oyen-
tes.
tes.
Una respuesta aplanada, tal como la respuesta B
de la figura 2, puede conseguirse empleando el filtro FIR/IIR de la
figura 3 en lugar de cada uno de los filtros atenuadores de banda
ancha (independientes de la frecuencia) 16 y 18 de la figura 1 (es
decir, reemplazando la constante de atenuación K con un filtro de
primer orden). Funcionalmente, como se muestra en la realización del
filtro de la figura 3, la entrada del filtro se aplica a un primer
circuito escalador (ff0) 30 y a un primer retardo 32. La salida del
retardo 32 se aplica a un segundo circuito escalador (ff1) 34. Un
sumador 36, que tiene varias entradas y una salida, recibe las
salidas de los circuitos escaladores 30 y 34. La salida del sumador
36 proporciona la salida del filtro que también se realimenta a
través de un segundo retardo 38 y un tercer circuito escalador (fb1)
39 a otra entrada del sumador 36. Para altavoces a \pm 15 grados
y una frecuencia de muestreo (fmuestreo) de 44,1 kHz, los
coeficientes del filtro para la realización mostrada son ff0 = -
0,4608, ff1 = 0,2596, y fb1 = 0,7702. Los retardos 32 y 38 pueden
implementarse mediante memorias circulares. La elección de ff0, ff1
y fb1, y el número de muestras en los dos retardos de memorias
circulares dependen de la frecuencia de muestreo y de la separación
de los altavoces. El número de muestras de los retardos está,
típicamente, en el margen de 1 a 7 para ángulos de altavoces y
frecuencias de muestreo prácticas (alrededor de 6 muestras para
ángulos de altavoces de \pm 15 grados y fmuestreo = 44,1
kHz).
De acuerdo con otro aspecto de la presente
invención, la realización del filtro de la respuesta diferencia
aplanada se implementa mediante un filtro IIR o un filtro FIR/IIR
de primer orden. Si se implementa utilizando un filtro FIR, con el
fin de proporcionar múltiples iteraciones de la cancelación cruzada
necesaria, se requiere alimentación hacia adelante
(feed-forward) con retardos múltiples. Una
implementación de este tipo requiere un nivel alto de
procesamiento. Por otra parte, una realización mediante filtro IIR
ó filtro FIR/IIR proporciona inherentemente retardos múltiples con
mucha mayor simplicidad y menores demandas de procesamiento.
La realización del filtro mostrada en la figura 3
constituye un filtro híbrido FIR/IIR -la parte de alimentación
hacia delante (escalamiento de la entrada por ff0 y su aplicación a
un sumador 34; y retardo de la entrada, escalamiento por ff1 y su
aplicación al sumador 34) constituye un filtro FIR y la parte de
retroalimentación (retardo de la salida, escalamiento de la misma
por fb1 y su aplicación al sumador 34) constituye un filtro
IIR.
La característica dependiente de la frecuencia de
un filtro de este tipo FIR/IIR se denomina a menudo característica
de tipo pendiente (shelving) paso bajo. Cuando las salidas del
aparato de procesamiento de las señales de audio se van a aplicar a
un par de transductores separados alrededor de \pm 15 grados, la
característica de tipo pendiente paso bajo tiene un primer punto de
inflexión a alrededor de 2.000 Hz y un segundo punto de inflexión a
alrededor de 4.370 kHz. Cuando las salidas del aparato de
procesamiento de las señales de audio se van a aplicar a un par de
transductores separados alrededor de \pm 20 grados, la
característica de tipo pendiente paso bajo tiene un primer punto de
inflexión a alrededor de 1.600 Hz y un segundo punto de inflexión a
alrededor de 4.150 kHz.
La frecuencia de muestreo no es crítica. Una
frecuencia de 44,1 kHz es adecuada para compatibilizar con otras
fuentes de audio digital y para proporcionar una respuesta de
frecuencia suficiente para una reproducción de alta fidelidad.
Pueden utilizarse otras frecuencias de muestreo (tales como, pero
no limitadas a 48 kHz, 32 kHz, 22,05 kHz y 11 kHz). Cuando los
filtros 16 y 18 de la figura 1 se materializan mediante un filtro
como el mostrado en la figura 3 en los que la inversión se maneja
mediante elección de signo de los términos ff0 y ff1, los signos de
resta (-) en los sumadores 24 y 26 (figura 1) se sustituyen por
signos de suma (+).
La figura 4A es un diagrama de bloques
funcionales que muestra un entorno preferido en el que puede
emplearse la red de cancelación de la diafonía acústica de la
presente invención. Se reciben 5 señales de entrada de audio
digital: izquierda, central, derecha, surround izquierda y surround
derecha, tales como las procedentes de un decodificador Dolby
Surround AC-3 (no mostrado). Las entradas se
aplican, respectivamente, a filtros opcionales de bloqueo de CC 40,
42, 44, 46 y 48, cada uno de ellos con una respuesta de paso alto
(-3 dB a 20 Hz) (los filtros de bloqueo de CC pueden no ser
necesarios, dependiendo de la fuente de señal que los alimenta).
Los retardos opcionales 50, 52 y 54 en las líneas de entrada
izquierda, central y derecha tienen retardos equivalentes a los
retardos, si existen, de la red de cancelación de la diafonía 56.
Normalmente, no habrá retardo en la red 56 y los retardos 50, 52 y
54 se omiten a menos que la red 56 incluya un limitador/compresor de
amplitud de un cierto tipo, como se describe a continuación. En
este entorno, las entradas a la red de cancelación 56 son las
entradas surround izquierda y surround derecha (en general, las
entradas a la red 56 no están limitadas a que sean entradas
surround). Una realización preferida de la red de cancelación 56
para uso en este entorno se describe en conexión con la realización
de la figura 5. Un mezclador-reductor y
limitador/compresor de salida 58 recibe las señales izquierda,
central y derecha retardadas y las señales surround procesadas para
proporcionar dos señales de salida, izquierda y derecha, adecuadas
para su reproducción por dos altavoces multimedia de ordenador.
Detalles adicionales del mezclador-reductor y
limitador/compresor de salida 58 se describen en conexión con la
figura 6. La función de limitador del bloque 58 asegura que ninguna
señal digital de salida exceda de una amplitud de 1.
Un flujo digital de datos AC-3
decodificado contiene cinco canales discretos de anchura de banda
completa y un canal de graves. Es deseable el preservar la
separación de los canales en la presentación en dos altavoces en la
medida de lo posible. Por consiguiente, solamente los canales
surround izquierdo y derecho se procesan por una red de cancelación
(sin embargo, en la figura 4B alternativa, descrita después, el
canal central también puede aplicarse a las entradas de la red). Los
canales frontales izquierdo y derecho se suman, respectivamente, a
los canales surround izquierdo y derecho procesados en la red de
cancelación. El canal central y el canal de graves (no mostrado,
cuando se utiliza) se mezclan en fase en las salidas izquierda y
derecha sin ningún procesamiento adicional.
La disposición de la figura 4A puede emplearse
también cuando existen cuatro señales de entrada (canales
izquierdo, central y derecho, un único canal surround y no existe
canal de graves separado) tal como lo proporcionado por el
decodificador de Dolby Surround o Dolby Surround Pro Logic. En este
caso, el canal surround único debería decorrelarse en dos señales
seudo-estereofónicas, que se aplican después a las
entradas del cancelador. Puede utilizarse una conversión
seudo-estereofónica sencilla empleando
desplazamiento de fase de forma que una señal esté desfasada con
respecto a la otra. En el estado de la técnica se conocen muchas
técnicas de conversión
seudo-estereofó-
nicas.
nicas.
La disposición de la figura 4A puede emplearse
también cuando sólo existen dos señales estereofónicas de entrada.
En este caso, pueden crearse señales surround
seudo-estereofónicas retardando cada una de las dos
señales estereofónicas de entrada alrededor de 30 ms. De forma
similar, incluso una única señal de entrada monofónica puede
utilizarse para obtener un par de señales
seudo-estereofónicas para proporcionar las entradas
izquierda y derecha y para crear un par de señales
seudo-surround retardando cada una de ellas.
La figura 4B muestra alternativas adicionales a
la realización de la figura 4A. En la figura 4B, los canales
frontales izquierdo y derecho se ensanchan ligeramente mediante una
mezcla parcial en oposición de fase en el bloque 49. Aunque la
mezcla en oposición de fase para ensanchar la "etapa" aparente
de estéreo es una técnica bien conocida, es un aspecto de la
presente invención el realizar dicha mezcla mediante un cálculo
matricial de la misma manera que se lleva a cabo en el cancelador de
la diafonía (como se indicó anteriormente, la cancelación acústica
y el posicionamiento arbitrario de la fuente son aspectos de un
mismo proceso). De este modo, la realización del cálculo de la
mezcla en oposición de fase del bloque 49 constituye otra red de M
x N puertos representada por una matriz C, en la que M = N = 2 y
puede emplearse la implementación de la red de cancelación de la
diafonía de las figuras 1 y 3. En este caso, puesto que el cambio
con respecto a la posición deseada es ligero (es decir, la
separación de las fuentes izquierda y derecha M con respecto a las
separaciones típicas de los altavoces de la pantalla del ordenador
es mucho más aproximada que cuando las fuentes M son fuentes
surround), las operaciones de la matriz son más sencillas que para
el caso del cancelador de la diafonía surround, requiriendo menores
recursos de procesamiento.
Como otra opción, el canal central puede
cancelarse con el fin de minimizar la "coloración" que resulta
de escuchar la señal central dos veces en cada oído -una procedente
del altavoz cercano y otra de nuevo procedente del altavoz lejano.
En lugar de requerir una realización de un cancelador separado, las
señales de diafonía acústica del canal central pueden cancelarse
aplicándolas a la red de cancelación de la diafonía del canal
surround. Para ello, la señal del canal central se mezcla con las
entradas surround izquierda y surround derecha de la red de
cancelación de la diafonía 56 a través de sumadores 51 y 53,
respectivamente.
La figura 5 es un diagrama de bloques funcionales
que muestra la realización preferida del sencillo cancelador de 2 x
2 puertos de las figuras 1 y 3 para uso en el entorno de la figura
4. Los elementos comunes con la figura 1 mantienen las mismas
referencias numéricas. La figura 5 difiere de la realización de las
figuras 1 y 3 en que incluye un compresor para evitar el
truncamiento de las señales de niveles altos. El cancelador no
debería generar valores mayores que 1,0, pero es probable que lo
haga desde medias hasta bajas frecuencias (por debajo de alrededor
de 200 Hz) bajo ciertas condiciones de señal incluso cuando las
señales de entrada no excedan de 1,0 (esto puede ocurrir cuando una
señal se aplica solamente a una entrada o las señales aplicadas a
ambas entradas están desfasadas una con respecto a la otra). No
pueden utilizarse filtros paso alto a la entrada para eliminar las
frecuencias bajas que causan el problema porque dichos filtros, para
que sean eficaces, producen alteraciones en el desplazamiento de
fase que reducen la eficacia del cancelador e introducen
coloración. De este modo, de acuerdo con otro aspecto de la
invención, se proporciona un cancelador de la diafonía de baja
potencia de procesamiento que incluye un compresor, requiriendo
también el compresor baja potencia de cálculo.
Cuando los cálculos se llevan a cabo en un
procesador de punto fijo, el compresor funciona proporcionando una
atenuación fija a la entrada del cancelador de la diafonía acústica
y una amplificación variable a la salida del cancelador. El valor
de la atenuación fija es suficiente para asegurar que la salida del
cancelador no excede de 1,0 bajo cualquier condición de señal (por
ejemplo, si cuando se aplica una señal a únicamente una entrada el
cancelador produce una amplificación de 20 dB en dicha señal, la
atenuación fija es de 20 dB). La amplificación variable varía entre
un nivel que restablece la atenuación a la entrada y un nivel
atenuado que impide el truncamiento de la señal de salida.
El compresor puede estar controlado a la entrada
(a la entrada del compresor), porque, normalmente, un compresor
controlado a la salida debe actuar instantáneamente, produciendo con
ello distorsiones audibles. En una realización alternativa, descrita
después, un compresor controlado a la salida evita la producción de
tales distorsiones audibles. El compresor puede realizarse con una
relación de compresión finita, o con una relación de compresión
infinita, en cuyo caso es un limitador.
La disposición de la atenuación fija antes del
cancelador seguida de la amplificación variable constituye un
aspecto de la presente invención. Aunque una ganancia variable a la
entrada del cancelador serviría de seguro contra el truncamiento a
la salida del cancelador, los sensores de control de la ganancia
variable deberían estar necesariamente situados a la salida del
cancelador. Sin embargo, una configuración de este tipo no es
factible porque para el instante en que se detectara el
truncamiento en la salida sería demasiado tarde para reducir la
ganancia de entrada, especialmente teniendo en cuenta el retardo
del cancelador. En su lugar, la presente invención sitúa tanto la
detección como la ganancia variable a la salida del cancelador en
combinación con una atenuación fija antes de la entrada al
cancelador. Como se describe posteriormente, los retardos en los
caminos de la señal de salida del cancelador permiten una "mirada
hacia el futuro", de forma que los sensores puedan controlar
silábicamente la ganancia del compresor.
Para entradas surround aplicadas a un cancelador
de la diafonía, como las de la izquierda de la figura 5, la
probabilidad de sobrecarga, ya sea dentro del cancelador o en los
circuitos posteriores (ya sea en los convertidores
digitales-analógicos o quizás en los amplificadores
de potencia o altavoces), varía con la frecuencia. Una forma de
prevenir dicha sobrecarga es preceder el cancelador con
"pre-énfasis" utilizando una respuesta que siga más o menos el
nivel de sobrecarga de la entrada como una función de la
frecuencia. Por lo tanto, si a la frecuencia f el sistema se
sobrecargase x dB con respecto al valor máximo de entrada,
introducimos x dB de atenuación a la frecuencia f. Este pre-énfasis
(fijo) se elige para asegurar que dentro del cancelador no puede
producirse sobrecarga.
En una materialización práctica de la realización
de la figura 5, en la que el cancelador de la diafonía acústica
corre en un equipo de procesamiento barato (tal como pastillas DSP
en punto fijo que soportan sólo longitudes de palabras de 16 bits),
tanto la atenuación fija como la amplificación variable tienen
características dependientes de la frecuencia, de forma que la
atenuación y la amplificación sólo funcionan desde medias hasta
bajas frecuencias (por debajo de alrededor de 200 Hz, por ejemplo),
manteniendo de este modo baja la pérdida de la relación señal/ruido
y limitando la pérdida a frecuencias en las que es menos
audible.
En la realización de la figura 5, el compresor
funciona proporcionando un pre-énfasis fijo a su entrada, lo que
atenúa las bajas frecuencias suficientemente como para evitar
cualquier truncamiento en el cancelador, y un de-énfasis variable a
su salida, que restablece mediante ajuste las bajas frecuencias. El
de-énfasis variable varía entre un nivel que es complementario del
pre-énfasis a la entrada y un nivel atenuado que evita el
truncamiento de la señal de salida. Debido al uso de pre-énfasis y
de de-énfasis variable, el efecto sobre la relación señal/ruido es
inaudible incluso si el procesador de la diafonía es ruidoso a
niveles de señal bajos (como puede suceder cuando se emplea un
procesador barato, tal como pastillas DSP que soportan sólo
longitudes de palabras de 16 bits).
Aunque uno puede restablecer la respuesta en
frecuencia y el nivel de señal globales mediante la introducción,
después del cancelador, del de-énfasis complementario exacto, por
ejemplo una amplificación de 20 dB en CC cayendo en pendiente hasta
6,7 dB a \pi/2, esto desde luego no tendría efecto sobre la
sobrecarga dentro del propio cancelador, pero podría conducir a
sobrecargas más adelante a lo largo del sistema. Una solución
preferida para protegerse contra dicha sobrecarga, mostrada en la
realización de la figura 5, modela la respuesta restablecida
(compensa hacia abajo el nivel para evitar sobrecargas) en las dos
salidas del cancelador de la diafonía acústica, mide la mayor de
las salidas modeladas, estima si indica que una, la otra o las dos
salidas principales estarán sobrecargadas, y si se predice
truncamiento, aplica reducción de ganancia inmediatamente antes del
de-énfasis. Esto constituye un limitador/compresor de "banda
ancha", porque el cambio de ganancia aplicada es el mismo en
todas las frecuencias; no permite que ninguna salida exceda el valor
máximo (o cualquier otro valor umbral deseado), con independencia
de las frecuencias que contenga la señal.
En la realización de la figura 5, el pre-énfasis
es proporcionado por los filtros idénticos 60 y 62. Aunque las
características del filtro no son críticas, cada filtro puede
realizarse como un filtro de primer orden que tenga una respuesta de
filtro tipo pendiente, de forma que su respuesta es de - 20 dB en CC
y de - 6,7 dB a \pi/2 (la frecuencia de Nyquist). El de-énfasis
variable puede realizarse mediante filtros de escala idénticos 64 y
66, cada uno de los cuales, en cuanto a la forma, tiene una
respuesta que es la inversa de la de los filtros 60 y 62. Cada uno
de los filtros 64 y 66 recibe el mismo escalado con el fin de
escalar la respuesta respectiva en una cantidad de 20 dB (la forma
de la respuesta permanece sin alteración). Los factores de escalado
son generados por los filtros 68 y 70 y un bloque de cálculo del
escalado 72. Los retardos 74 y 76 retardan las salidas del
cancelador con el fin de permitir a los sensores de salida del
cancelador el mirar hacia el futuro y controlar silábicamente los
filtros 64 y 66. La duración de los retardos 74 y 76 es equivalente
a la de los retardos entre las respectivas entradas a los retardos
74 y 76 y las salidas de los factores de escalado del bloque de
cálculo del escalado 72. Los retardos 74 y 76 pueden realizarse
mediante memorias circulares.
Los filtros 64 y 66 son filtros de primer orden,
teniendo cada uno de ellos una respuesta del tipo pendiente (un
filtro tipo pendiente paso bajo que varía con la frecuencia,
comenzando la pendiente en la unidad, aumentando hasta un máximo de
- 6 dB/octava, y después disminuyendo de nuevo hasta la unidad)
variando entre + 20 dB y 0 dB en CC y entre + 6,7 dB y - 13,3 dB a
\pi/2, dependiendo del escalado. Los filtros 68 y 70 son también
filtros tipo pendiente paso bajo, pero, sin embargo, son fijos y
tienen una respuesta de - 13,3 dB a \pi/2 y 0 dB a CC. El bloque
de cálculo del escalado opera primero sobre bloques de muestras
(bloques de 8 muestras en la realización práctica) para calcular el
valor absoluto máximo en los respectivos bloques de muestras en las
salidas izquierda y derecha del cancelador (es decir, se selecciona
el bloque con el valor máximo mayor de las salidas de los filtros 68
y 70 y el valor máximo en dicho bloque determina el valor del
escalado). Se calcula entonces un factor de escalado que fija el
nivel de los filtros 64 y 66 de forma que la salida no exceda de
1,0. Los factores de escalado se interpolan entre los bloques previo
y actual de forma que el compresor actúa silábicamente y no genera
distorsiones indesea-
bles.
bles.
Si el procesador de punto fijo sobre el que corre
el cancelador de la diafonía acústica tiene suficientes bits
(digamos, 20 bits) para que no añada ruido audible a niveles bajos
de señal, puede utilizarse un esquema de compresión de banda ancha
(independiente de la frecuencia) en lugar de uno dependiente de la
frecuencia. En este caso, cada una de las entradas puede estar
sujeta a una atenuación de banda ancha (independiente de la
frecuencia) (por ejemplo de 10 dB) y la salida del cancelador puede
aplicarse a un amplificador controlable de banda ancha
(independiente de la frecuencia) con una ganancia de hasta 10 dB,
reduciéndose la ganancia en la medida necesaria para evitar el
truncamiento de la salida digital. De este modo, los filtros 60,
62, 68 y 70 se convierten en una atenuación fija a todas las
frecuencias de interés, mientras que los filtros 64 y 66 perderían
su dependencia de la frecuencia y se convertirían en amplificadores
de banda ancha (independientes de la frecuencia) a dichas
frecuencias.
Si el procesador en el que corre el cancelador de
la diafonía acústica es un procesador de punto flotante, el cálculo
puede hacerse en punto flotante sin atenuación de entrada,
permitiendo niveles de señales intermedias mayores de 1,0 y
excluyendo la necesidad de ninguna acción del compresor hasta la
salida del cancelador de la diafonía acústica, eliminando de este
modo los filtros o atenuadores de entrada y ahorrando recursos del
procesador.
Son posibles diversas alternativas a la
realización dependiente de la frecuencia descrita. En una primera
alternativa, la predicción de truncamiento puede utilizarse para
modificar la forma del de-énfasis aplicado en lugar de producir una
variación en la ganancia global. Una forma de implementar una
solución de modificación de la forma del de-énfasis de este tipo es
proporcionar inicialmente una reducción de la ganancia de banda
ancha a medida que la señal de control (que indica la probabilidad
de sobrecarga) aumenta hasta que exista ganancia unidad a
frecuencias altas, seguida de (mientras la señal de control
continúa creciendo) un incremento progresivo de la pérdida a
frecuencias bajas mientras se deja en la unidad la ganancia a
frecuencias altas. Dicha solución no debería conducir a mucha
inestabilidad de los componentes de sonido de frecuencias medias y
altas en presencia de señales dominantes de baja frecuencia. Debe
indicarse que una señal de control, indicando, por ejemplo, en
cuanto se sobrecargaría la salida si no se hiciera nada, no
proporciona información sobre dónde caen en el espectro la señal o
señales que producen la sobrecarga. Sin embargo, para frecuencias
dominantes altas (por ejemplo, cerca de \pi/2, una condición
altamente improbable) una reducción de ganancia de más de una cierta
cantidad, digamos 6,7 dB, nunca sería necesaria (es decir, la
retirada de la amplificación de 6,7 dB del de-énfasis inactivo,
dando por consiguiente ganancia unidad). Para frecuencias dominantes
bajas, una reducción tan grande como una cierta cantidad, digamos
20 dB, nunca sería necesaria (de nuevo para ganancia unidad a baja
frecuencia), pero en esos instantes no existiría necesidad de
reducir la ganancia a frecuencias elevadas en una cantidad
aproximadamente tan grande como 20 dB.
Son posibles otras formas de adaptación de la
forma del de-énfasis. Los beneficios de dicha adaptación son
análogos a los beneficios ofrecidos por la separación en bandas en
los compresores de audio digital, a saber, una reducción en la
modulación cruzada de señales (diafonía) en una parte del espectro
por señales en otras partes.
En una alternativa adicional, el modelado puede
mejorarse para simular el efecto de de-énfasis variable haciendo
también variables los bloques 68/70. En este caso, el
limitador/compresor se convierte en un limitador/compresor
controlado a la salida cuya señal de control se utiliza para operar
sobre las señales principales tras los retardos 74/76. El hecho de
que dicho control de salida rápida produzca distorsiones
transitorias no tiene consecuencias porque las salidas de los
filtros 68/70 no se oyen. El resultado es proporcionar una señal de
control aplanada para la señal que afecta al de-énfasis
proporcionado por los bloques 64/66.
La figura 6 es un diagrama de bloques funcionales
que muestra una realización del mezclador-reductor
y compresor/limitador de salida 58. Debe hacerse notar que el
compresor/limitador de salida que forma parte del bloque 58
proporciona limitación adicional a la proporcionada en la
realización de la figura 5 del cancelador de la diafonía acústica.
Cuando a las señales surround se les suma las señales frontales,
como en la figura 6, el nivel de pico es probable que aumente,
dando lugar a la necesidad de un compresor/limitador de salida.
Con referencia a los detalles de la figura 6, las
entradas (izquierda, central, derecha, surround izquierda y
surround derecha) son las salidas de los bloques 50, 52, 54 y 56 de
la realización de la figura 4A (o, alternativamente, las salidas de
los bloques 50, 54 y 56 de la realización de la figura 4B). Los
retardos 80, 82, 84, 86 y 88 son opcionales. El uso de retardos
permitiría la suavización de las muestras que pueden provocar el
truncamiento mediante un cálculo del escalado, descrito a
continuación. El mezclador-reductor de la señal 90
del mezclador-reductor y compresor/limitador de
salida 58 suma las entradas izquierda, central y surround izquierda
para generar la SALIDA IZQUIERDA; y suma las entradas derecha,
central y surround derecha para generar la SALIDA DERECHA. El nivel
de amplitud de las señales SALIDA IZQUIERDA y SALIDA DERECHA se
varía de acuerdo con un coeficiente de escalado generado por una
función de cálculo del escalado 92. Las entradas a la función de
cálculo del escalado son las salidas izquierda y derecha de un
mezclador-reductor (modelado) del camino de control
94.
El mezclador-reductor del camino
de control proporciona las mismas funciones de
mezclado-reducción que el
mezclador-reductor de la señal, mezclando las 5.1
entradas (sólo se muestran 5) para dar 2 salidas. Sin embargo, el
mezclador-reductor del camino de control incluye
atenuación para asegurar que no existe truncamiento de señal bajo
ninguna condición de las señales de entrada. El valor exacto de la
atenuación no es crítico. Si SALIDA IZQUIERDA = Izquierda + Surround
Izquierda (procedente del cancelador de la diafonía acústica) +
0,707 Central + 0,707 Graves, la máxima salida podría ser 3,414 (lo
mismo vale para SALIDA DERECHA), de forma que una atenuación de al
menos la inversa de 3,414 es adecuada. Puesto que el
compresor/limitador solamente trabaja con niveles de señal elevados
y el controlador no está en el camino de la señal, no se requiere
una relación señal/ruido elevada, de forma que sería adecuada una
atenuación de 4 ó 5. Una vez mezclada-reducida a L
(izquierda) y R (derecha), el bloque de cálculo del escalado utiliza
la mayor de las entradas L y R para generar un coeficiente de
escalado de 1,0 o menor para limitar la ganancia de forma uniforme
en el mezclador-reductor del camino de la señal
90.
Claims (29)
1. Un método de obtención de una matriz de
cancelación C de dimensiones M x N en la que cada uno de los
elementos de la matriz es una función de transferencia en el
dominio de la frecuencia, representando la matriz C una red de
cancelación de la diafonía acústica de M x N puertos para hacer
corresponder M canales originales de audio, cada uno con una
dirección asociada de la fuente, a N canales de presentación de
audio, cada uno con una posición relativa con respecto a las
direcciones de las fuentes, de forma que cada salida N es la
combinación lineal de versiones filtradas independientemente de las
M entradas, o la combinación lineal de versiones filtradas
independientemente de las M entradas y señales de realimentación
procedentes de las N salidas filtradas independientemente, o
señales de realimentación procedentes de las N salidas filtradas
independientemente sumadas a las M entradas, comprendiendo
el establecimiento de una matriz de la sala R de
dimensiones N x P en la que cada uno de los elementos de la matriz
es una función de transferencia en el dominio de la frecuencia,
representando la matriz R una red de N x P puertos para hacer
corresponder N posiciones de los canales de presentación a P
posiciones de escucha, en la que dichas funciones de transferencia
en el dominio de la frecuencia representan el retardo y una versión
aplanada de la atenuación dependiente de la frecuencia a lo largo
de un camino acústico directo desde cada una de dichas posiciones de
los canales de presentación a cada una de dichas posiciones de
escucha, y
haciendo que la matriz de cancelación de la
diafonía acústica C sea igual a la inversa de la matriz de la sala
R.
2. Un método de acuerdo con la reivindicación 1,
en el que dicha versión aplanada de la atenuación dependiente de la
frecuencia es una media aplanada de dicha atenuación del camino
acústico a lo largo de, al menos, una parte sustancial del espectro
del sonido de audio que se intenta reproducir por dichos canales de
presentación.
3. Una red de cancelación de la diafonía acústica
de M x N puertos para hacer corresponder M canales originales de
audio, cada uno con una dirección asociada de la fuente, a N
canales de presentación de audio, cada uno con una posición
relativa con respecto a las direcciones de las fuentes, de forma que
cada salida N es la combinación lineal de versiones filtradas
independientemente de las M entradas, o la combinación lineal de
versiones filtradas independientemente de las M entradas y señales
de realimentación procedentes de las N salidas filtradas
independientemente, o señales de realimentación procedentes de las N
salidas filtradas independientemente sumadas a las M entradas,
generándose la red de cancelación de la diafonía acústica mediante
los pasos de:
establecimiento de una matriz de la sala R de
dimensiones N x P en la que cada uno de los elementos de la matriz
es una función de transferencia en el dominio de la frecuencia,
representando la matriz R una red de N x P puertos para hacer
corresponder N posiciones de los canales de presentación a P
posiciones de escucha, en la que dichas funciones de transferencia
en el dominio de la frecuencia representan el retardo y una versión
aplanada de la atenuación dependiente de la frecuencia a lo largo
de un camino acústico directo desde cada una de dichas posiciones de
los canales de presentación a cada una de dichas posiciones de
escucha;
obtención de la inversa de la matriz de la sala R
para obtener una matriz de cancelación de la diafonía acústica C de
dimensiones M x N en la que cada uno de los elementos de la matriz
es una función de transferencia en el dominio de la frecuencia,
representando la matriz C dicha red de cancelación de la diafonía
acústica de M x N puertos; e
implementación de la versión aplanada de la
atenuación dependiente de la frecuencia mediante uno o más filtros
digitales sencillos que requieren poca potencia de
procesamiento.
4. Una red de acuerdo con la reivindicación 3, en
la que dichos filtros digitales son del tipo IIR o del tipo
IIR/FIR.
5. Una red de acuerdo con la reivindicación 3, en
la que dichos filtros digitales sencillos son filtros de primer
orden.
6. Una red de acuerdo con la reivindicación 4, en
la que dichos filtros digitales sencillos son filtros de primer
orden.
7. Una red de acuerdo con la reivindicación 3, en
la que dicha versión aplanada de la atenuación dependiente de la
frecuencia es una media aplanada de dicha atenuación del camino
acústico a lo largo de, al menos, una parte sustancial del espectro
del sonido de audio que se intenta reproducir por dichos canales de
presentación.
8. Una red de acuerdo con la reivindicación 4, en
la que dicha versión aplanada de la atenuación dependiente de la
frecuencia es una media aplanada de dicha atenuación del camino
acústico a lo largo de, al menos, una parte sustancial del espectro
del sonido de audio que se intenta reproducir por dichos canales de
presentación.
9. Una red de acuerdo con la reivindicación 5, en
la que dicha versión aplanada de la atenuación dependiente de la
frecuencia es una media aplanada de dicha atenuación del camino
acústico a lo largo de, al menos, una parte sustancial del espectro
del sonido de audio que se intenta reproducir por dichos canales de
presentación.
10. Una red de acuerdo con la reivindicación 3,
que comprende además la implementación de dicho retardo mediante una
memoria circular digital.
11. Una red de acuerdo con la reivindicación 4,
que comprende además la implementación de dicho retardo mediante una
memoria circular digital.
12. Una red de acuerdo con la reivindicación 5,
que comprende además la implementación de dicho retardo mediante una
memoria circular digital.
13. Una red de acuerdo con la reivindicación 3,
que comprende además un compresor de amplitud, comprendiendo dicho
compresor de amplitud
atenuadores de nivel de amplitud fijo en cada una
de las entradas de la red, y
amplificadores de refuerzo de nivel de amplitud
variable en cada una de las salidas de la red, incluyendo cada uno
de los amplificadores de refuerzo un circuito escalador para variar
la amplificación entre un nivel que restablece la atenuación de
entrada y un nivel atenuado que evita el truncamiento de la señal
de salida.
14. Una red de acuerdo con la reivindicación 4,
que comprende además un compresor de amplitud, comprendiendo dicho
compresor de amplitud
atenuadores de nivel de amplitud fijo en cada una
de las entradas de la red, y
amplificadores de refuerzo de nivel de amplitud
variable en cada una de las salidas de la red, incluyendo cada uno
de los amplificadores de refuerzo un circuito escalador para variar
la amplificación entre un nivel que restablece la atenuación de
entrada y un nivel atenuado que evita el truncamiento de la señal
de salida.
15. Una red de acuerdo con la reivindicación 5,
que comprende además un compresor de amplitud, comprendiendo dicho
compresor de amplitud
atenuadores de nivel de amplitud fijo en cada una
de las entradas de la red, y
amplificadores de refuerzo de nivel de amplitud
variable en cada una de las salidas de la red, incluyendo cada uno
de los amplificadores de refuerzo un circuito escalador para variar
la amplificación entre un nivel que restablece la atenuación de
entrada y un nivel atenuado que evita el truncamiento de la señal de
salida.
16. Una red de acuerdo con una cualquiera de las
reivindicaciones 13, 14 ó 15, en la que el control para el compresor
se obtiene de la entrada al compresor.
17. Una red de acuerdo con una cualquiera de las
reivindicaciones 13, 14 ó 15, en la que dicho compresor tiene una
relación de compresión infinita, con lo que el compresor constituye
un limitador.
18. Una red de acuerdo con la reivindicación 16,
en la que dicho compresor incluye además un retardo en cada una de
las salidas de la red y en la que el control para el compresor mira
hacia el futuro con el fin de controlar silábicamente la ganancia
del compresor.
19. Una red de acuerdo con la reivindicación 16,
en la que dichos atenuadores de nivel de amplitud fijo y dichos
amplificadores de refuerzo de nivel de amplitud variable tienen
características que dependen de la frecuencia.
20. Una red de acuerdo con la reivindicación 19,
en la que las características que dependen de la frecuencia de
dichos atenuadores de nivel de amplitud fijo y dichos
amplificadores de refuerzo de nivel de amplitud variable funcionan
solamente desde frecuencias medias hasta bajas.
21. Una red de acuerdo con la reivindicación 16,
en la que dichos atenuadores de nivel de amplitud fijo y dichos
amplificadores de refuerzo de nivel de amplitud variable tienen
características independientes de la frecuencia.
22. Una red de acuerdo con una cualquiera de las
reivindicaciones 3, 4, 5, 7 ó 13 en la que dicha red de cancelación
de la diafonía acústica es una red de 2 x 2 puertos para hacer
corresponder dos canales originales de audio M a dos canales de
presentación de audio N aplicados a un par de transductores que
tienen posiciones relativas con respecto a las direcciones de los
canales originales de audio M, teniendo el oyente dos posiciones de
escucha P, el oído izquierdo y el oído derecho del oyente, con
respecto a los transductores, en la que la red comprende además
dos combinadores de señales, un primer combinador
de señales y un segundo combinador de señales, teniendo cada
combinador de señales al menos dos entradas y una salida, en la
que
- una de dichas N entradas está conectada a una entrada de dicho primer combinador de señales y otra de dichas N entradas está conectada a una entrada de dicho segundo combinador de señales, y
- una de dichas N salidas está conectada a la salida de dicho primer combinador de señales y otra de dichas salidas está conectada a la salida de dicho segundo combinador de señales, y
dos caminos de realimentación de señales, un
primer camino de realimentación de señales y un segundo camino de
realimentación de señales, teniendo cada camino de realimentación
un retardo y características dependientes de la frecuencia, y
teniendo cada camino de realimentación una entrada y una salida, en
la que
- la entrada de dicho primer camino de realimentación de señales está conectada a la salida de dicho primer combinador de señales y la salida de dicho primer camino de realimentación de señales está conectada a la otra entrada de dicho segundo combinador de señales,
- la entrada de dicho segundo camino de realimentación de señales está conectada a la salida de dicho segundo combinador de señales y la salida de dicho segundo camino de realimentación de señales está conectada a la otra entrada de dicho primer combinador de señales,
- cada uno de dichos caminos de realimentación tiene un retardo que representa el tiempo adicional que necesita el sonido para propagarse a lo largo del camino acústico entre un transductor y el oído del oyente más alejado de dicho transductor con respecto al tiempo que necesita el sonido para propagarse a lo largo del camino acústico entre el mismo transductor y el oído del oyente más cercano a dicho mismo transductor, y
- cada uno de dichos caminos de realimentación tiene una característica que depende de la frecuencia que representa la diferencia en la atenuación en el camino acústico entre un transductor y el oído del oyente más alejado de dicho transductor y la atenuación en el camino acústico entre el mismo transductor y el oído del oyente más cercano a dicho mismo transductor, y
teniendo dichos combinadores de señales, dichos
caminos de realimentación de señales y dichas conexiones entre ellos
características de polaridad de forma que las señales procesadas
por un camino de realimentación se combinan restándose a las señales
introducidas en la otra entrada del respectivo combinador de
señales.
23. Una red de acuerdo con la reivindicación 22,
en la que dichos canales de presentación se aplican a un par de
transductores, generalmente dispuestos enfrente de y en posiciones
sustancialmente simétricas a la izquierda y a la derecha con
respecto a un oyente.
24. La red de la reivindicación 23, en la que la
característica dependiente de la frecuencia es una característica de
filtro tipo pendiente paso bajo.
25. La red de la reivindicación 24, en la que la
característica de filtro en pendiente paso bajo es una
característica de filtro tipo pendiente paso bajo de primer
orden.
26. La red de la reivindicación 25, en la que la
característica de filtro tipo pendiente paso bajo de primer orden se
implementa por medio de un filtro IIR o una combinación de filtros
FIR/IIR.
27. La red de la reivindicación 25, en la que la
característica de filtro en pendiente paso bajo tiene un primer
punto de inflexión a aproximadamente 2.000 Hz y un segundo punto de
inflexión a aproximadamente 4.370 kHz cuando las salidas del
aparato de procesamiento de la señal de audio son para aplicación a
un par de transductores dispuestos aproximadamente a 15 grados.
28. La red de la reivindicación 25, en la que la
característica de filtro en pendiente paso bajo tiene un primer
punto de inflexión a aproximadamente 1.600 Hz y un segundo punto de
inflexión a aproximadamente 4.150 kHz cuando las salidas de la red
son para aplicación a un par de transductores dispuestos
aproximadamente a 20 grados.
29. La red de la reivindicación 23, en la que la
atenuación en el camino acústico entre un transductor y el oído del
oyente más alejado del transductor se determina obteniendo la
diferencia entre la respuesta de transferencia del oído desde un
transductor al oído del oyente más alejado del transductor y la
respuesta de transferencia del oído desde el otro transductor al
oído del oyente más cercano al otro transductor y aplanando la
diferencia.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/819,582 US6449368B1 (en) | 1997-03-14 | 1997-03-14 | Multidirectional audio decoding |
US819582 | 1997-03-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2249823T3 true ES2249823T3 (es) | 2006-04-01 |
Family
ID=25228541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES98908769T Expired - Lifetime ES2249823T3 (es) | 1997-03-14 | 1998-02-26 | Descodificacion de audio multifuncional. |
Country Status (11)
Country | Link |
---|---|
US (1) | US6449368B1 (es) |
EP (1) | EP0966865B1 (es) |
JP (1) | JP2001516537A (es) |
KR (1) | KR100591008B1 (es) |
AT (1) | ATE311733T1 (es) |
AU (1) | AU747377B2 (es) |
CA (1) | CA2283838C (es) |
DE (1) | DE69832595T2 (es) |
DK (1) | DK0966865T3 (es) |
ES (1) | ES2249823T3 (es) |
WO (1) | WO1998042162A2 (es) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK1025743T3 (da) * | 1997-09-16 | 2013-08-05 | Dolby Lab Licensing Corp | Anvendelse af filtereffekter i stereohovedtelefoner for at forbedre den rumlige opfattelse af en kilde rundt om en lytter |
DE19847689B4 (de) * | 1998-10-15 | 2013-07-11 | Samsung Electronics Co., Ltd. | Vorrichtung und Verfahren zur dreidimensionalen Tonwiedergabe |
EP1091615B1 (en) * | 1999-10-07 | 2003-01-08 | Zlatan Ribic | Method and apparatus for picking up sound |
US7369665B1 (en) | 2000-08-23 | 2008-05-06 | Nintendo Co., Ltd. | Method and apparatus for mixing sound signals |
AUPR061800A0 (en) * | 2000-10-09 | 2000-11-02 | Lake Technology Limited | Authoring system |
EP1251717A1 (fr) * | 2001-04-17 | 2002-10-23 | Yellowknife A.V.V. | Procédé et circuit pour l'écoute au casque d'un enrégistrement audio |
US6804565B2 (en) | 2001-05-07 | 2004-10-12 | Harman International Industries, Incorporated | Data-driven software architecture for digital sound processing and equalization |
KR100392449B1 (ko) * | 2001-07-16 | 2003-07-23 | 삼성전자주식회사 | 디지털tv신호의 재생시스템 및 그 재생방법 |
JP4097426B2 (ja) * | 2001-12-07 | 2008-06-11 | 日本ビクター株式会社 | 位相変換サラウンド回路 |
TWI230024B (en) * | 2001-12-18 | 2005-03-21 | Dolby Lab Licensing Corp | Method and audio apparatus for improving spatial perception of multiple sound channels when reproduced by two loudspeakers |
US20030202665A1 (en) * | 2002-04-24 | 2003-10-30 | Bo-Ting Lin | Implementation method of 3D audio |
US7567845B1 (en) * | 2002-06-04 | 2009-07-28 | Creative Technology Ltd | Ambience generation for stereo signals |
US7072726B2 (en) * | 2002-06-19 | 2006-07-04 | Microsoft Corporation | Converting M channels of digital audio data into N channels of digital audio data |
US7290057B2 (en) | 2002-08-20 | 2007-10-30 | Microsoft Corporation | Media streaming of web content data |
KR100541478B1 (ko) * | 2002-09-06 | 2006-01-10 | 엘지전자 주식회사 | 휴대폰 음장 제어장치 및 방법 |
JP4627973B2 (ja) * | 2003-07-29 | 2011-02-09 | 富士通テン株式会社 | スピーカ装置 |
US8054980B2 (en) * | 2003-09-05 | 2011-11-08 | Stmicroelectronics Asia Pacific Pte, Ltd. | Apparatus and method for rendering audio information to virtualize speakers in an audio system |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7970144B1 (en) | 2003-12-17 | 2011-06-28 | Creative Technology Ltd | Extracting and modifying a panned source for enhancement and upmix of audio signals |
KR20050060789A (ko) * | 2003-12-17 | 2005-06-22 | 삼성전자주식회사 | 가상 음향 재생 방법 및 그 장치 |
KR101086398B1 (ko) * | 2003-12-24 | 2011-11-25 | 삼성전자주식회사 | 다수의 마이크로폰을 이용한 지향성 제어 가능 스피커시스템 및 그 방법 |
JP2006319801A (ja) * | 2005-05-13 | 2006-11-24 | Pioneer Electronic Corp | バーチャルサラウンドデコーダ装置 |
JP2006319802A (ja) * | 2005-05-13 | 2006-11-24 | Pioneer Electronic Corp | バーチャルサラウンドデコーダ装置 |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
EP1915818A1 (en) * | 2005-07-29 | 2008-04-30 | Harman International Industries, Incorporated | Audio tuning system |
KR100739776B1 (ko) | 2005-09-22 | 2007-07-13 | 삼성전자주식회사 | 입체 음향 생성 방법 및 장치 |
KR100636248B1 (ko) * | 2005-09-26 | 2006-10-19 | 삼성전자주식회사 | 보컬 제거 장치 및 방법 |
KR100739762B1 (ko) | 2005-09-26 | 2007-07-13 | 삼성전자주식회사 | 크로스토크 제거 장치 및 그를 적용한 입체 음향 생성 시스템 |
US8411869B2 (en) * | 2006-01-19 | 2013-04-02 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
KR100878816B1 (ko) | 2006-02-07 | 2009-01-14 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
KR20090054412A (ko) * | 2006-09-28 | 2009-05-29 | 파나소닉 주식회사 | 파형등화장치 |
US8805743B2 (en) * | 2006-12-27 | 2014-08-12 | International Business Machines Corporation | Tracking, distribution and management of apportionable licenses granted for distributed software products |
US7953233B2 (en) * | 2007-03-20 | 2011-05-31 | National Semiconductor Corporation | Synchronous detection and calibration system and method for differential acoustic sensors |
US8229143B2 (en) * | 2007-05-07 | 2012-07-24 | Sunil Bharitkar | Stereo expansion with binaural modeling |
US7948862B2 (en) * | 2007-09-26 | 2011-05-24 | Solarflare Communications, Inc. | Crosstalk cancellation using sliding filters |
US20090086982A1 (en) * | 2007-09-28 | 2009-04-02 | Qualcomm Incorporated | Crosstalk cancellation for closely spaced speakers |
UA101542C2 (ru) * | 2008-12-15 | 2013-04-10 | Долби Лабораторис Лайсензин Корпорейшн | Виртуализатор окружающего звука с динамическим сжатием диапазона и способ |
CN102197662B (zh) * | 2009-05-18 | 2014-04-23 | 哈曼国际工业有限公司 | 效率优化的音频系统 |
US8259960B2 (en) * | 2009-09-11 | 2012-09-04 | BSG Laboratory, LLC | Phase layering apparatus and method for a complete audio signal |
US8194869B2 (en) | 2010-03-17 | 2012-06-05 | Harman International Industries, Incorporated | Audio power management system |
US9107021B2 (en) * | 2010-04-30 | 2015-08-11 | Microsoft Technology Licensing, Llc | Audio spatialization using reflective room model |
US9351073B1 (en) * | 2012-06-20 | 2016-05-24 | Amazon Technologies, Inc. | Enhanced stereo playback |
US9277343B1 (en) | 2012-06-20 | 2016-03-01 | Amazon Technologies, Inc. | Enhanced stereo playback with listener position tracking |
US9271102B2 (en) * | 2012-08-16 | 2016-02-23 | Turtle Beach Corporation | Multi-dimensional parametric audio system and method |
US9560464B2 (en) | 2014-11-25 | 2017-01-31 | The Trustees Of Princeton University | System and method for producing head-externalized 3D audio through headphones |
US9830927B2 (en) * | 2014-12-16 | 2017-11-28 | Psyx Research, Inc. | System and method for decorrelating audio data |
MX367429B (es) * | 2015-02-18 | 2019-08-21 | Huawei Tech Co Ltd | Un aparato de procesamiento de señal de audio y metodo para filtrar una señal de audio. |
US9773491B2 (en) * | 2015-09-16 | 2017-09-26 | Bose Corporation | Estimating secondary path magnitude in active noise control |
US9923550B2 (en) | 2015-09-16 | 2018-03-20 | Bose Corporation | Estimating secondary path phase in active noise control |
US9756423B2 (en) * | 2015-09-16 | 2017-09-05 | Océ-Technologies B.V. | Method for removing electric crosstalk |
JP6454916B2 (ja) * | 2017-03-28 | 2019-01-23 | 本田技研工業株式会社 | 音声処理装置、音声処理方法及びプログラム |
US10771896B2 (en) | 2017-04-14 | 2020-09-08 | Hewlett-Packard Development Company, L.P. | Crosstalk cancellation for speaker-based spatial rendering |
JP2022504233A (ja) | 2018-10-05 | 2022-01-13 | マジック リープ, インコーポレイテッド | 両耳オーディオレンダリングのための両耳間時間差クロスフェーダ |
US11246001B2 (en) * | 2020-04-23 | 2022-02-08 | Thx Ltd. | Acoustic crosstalk cancellation and virtual speakers techniques |
Family Cites Families (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE25652E (en) * | 1964-10-06 | Sound reproducing apparatus | ||
GB394325A (en) | 1931-12-14 | 1933-06-14 | Alan Dower Blumlein | Improvements in and relating to sound-transmission, sound-recording and sound-reproducing systems |
GB781186A (en) | 1954-08-18 | 1957-08-14 | Emi Ltd | Improvements in or relating to electrical sound transmission systems |
GB871992A (en) | 1956-10-13 | 1961-07-05 | Emi Ltd | Improvements relating to stereophonic sound transmission systems |
US3249696A (en) | 1961-10-16 | 1966-05-03 | Zenith Radio Corp | Simplified extended stereo |
US3219757A (en) | 1962-08-06 | 1965-11-23 | Gen Electric | Sound reproduction from monaural information |
US3238304A (en) | 1962-09-24 | 1966-03-01 | Victor Company Of Japan | Stereophonic effect emphasizing system |
US3236949A (en) | 1962-11-19 | 1966-02-22 | Bell Telephone Labor Inc | Apparent sound source translator |
US3170991A (en) | 1963-11-27 | 1965-02-23 | Glasgal Ralph | System for stereo separation ratio control, elimination of cross-talk and the like |
US3892624A (en) | 1970-02-03 | 1975-07-01 | Sony Corp | Stereophonic sound reproducing system |
US4060696A (en) * | 1975-06-20 | 1977-11-29 | Victor Company Of Japan, Limited | Binaural four-channel stereophony |
AT338011B (de) | 1975-09-30 | 1977-07-25 | Akg Akustische Kino Geraete | Anordnung zur drahtlosen ubertragung von niederfrequenzsignalen |
US4118599A (en) | 1976-02-27 | 1978-10-03 | Victor Company Of Japan, Limited | Stereophonic sound reproduction system |
JPS52125301A (en) | 1976-04-13 | 1977-10-21 | Victor Co Of Japan Ltd | Signal processing circuit |
DE2736558A1 (de) | 1976-08-17 | 1978-02-23 | Novanex Automation Nv | Phasenstereosystem |
US4159397A (en) | 1977-05-08 | 1979-06-26 | Victor Company Of Japan, Limited | Acoustic translation of quadraphonic signals for two- and four-speaker sound reproduction |
US4209665A (en) | 1977-08-29 | 1980-06-24 | Victor Company Of Japan, Limited | Audio signal translation for loudspeaker and headphone sound reproduction |
JPS5832840B2 (ja) | 1977-09-10 | 1983-07-15 | 日本ビクター株式会社 | 立体音場拡大装置 |
JPS5442102A (en) | 1977-09-10 | 1979-04-03 | Victor Co Of Japan Ltd | Stereo reproduction system |
US4218585A (en) | 1979-04-05 | 1980-08-19 | Carver R W | Dimensional sound producing apparatus and method |
US4309570A (en) | 1979-04-05 | 1982-01-05 | Carver R W | Dimensional sound recording and apparatus and method for producing the same |
US4603429A (en) | 1979-04-05 | 1986-07-29 | Carver R W | Dimensional sound recording and apparatus and method for producing the same |
US4388494A (en) | 1980-01-12 | 1983-06-14 | Schoene Peter | Process and apparatus for improved dummy head stereophonic reproduction |
US4356349A (en) | 1980-03-12 | 1982-10-26 | Trod Nossel Recording Studios, Inc. | Acoustic image enhancing method and apparatus |
JPS575500A (en) | 1980-06-12 | 1982-01-12 | Mitsubishi Electric Corp | Acoustic reproducing device |
JPS57104400A (en) | 1980-12-19 | 1982-06-29 | Matsushita Electric Ind Co Ltd | 4 channel stereo device |
US4567607A (en) | 1983-05-03 | 1986-01-28 | Stereo Concepts, Inc. | Stereo image recovery |
NL8303945A (nl) | 1983-11-17 | 1985-06-17 | Philips Nv | Inrichting voor het realiseren van een pseudo-stereo signaal. |
US4661851A (en) * | 1984-03-27 | 1987-04-28 | Rca Corporation | Apparatus for reducing the effect of noise interference in audio companding system |
US4706287A (en) | 1984-10-17 | 1987-11-10 | Kintek, Inc. | Stereo generator |
US4700389A (en) | 1985-02-15 | 1987-10-13 | Pioneer Electronic Corporation | Stereo sound field enlarging circuit |
IT1185876B (it) | 1985-08-09 | 1987-11-18 | Sgs Microelettronica Spa | Sistema di espansione della base stereo per apparati di diffusione acustica stereofonica |
IT1185706B (it) | 1985-09-12 | 1987-11-12 | Sgs Microelettronica Spa | Sistema non recursivo di espansione della base stereo per apparati di diffusione acustica stereofonica |
US5056149A (en) | 1987-03-10 | 1991-10-08 | Broadie Richard G | Monaural to stereophonic sound translation process and apparatus |
JPS63224599A (ja) | 1987-03-13 | 1988-09-19 | Asa Plan:Kk | ステレオ処理装置 |
US5034983A (en) | 1987-10-15 | 1991-07-23 | Cooper Duane H | Head diffraction compensated stereo system |
US4893342A (en) | 1987-10-15 | 1990-01-09 | Cooper Duane H | Head diffraction compensated stereo system |
US4975954A (en) | 1987-10-15 | 1990-12-04 | Cooper Duane H | Head diffraction compensated stereo system with optimal equalization |
US4910779A (en) | 1987-10-15 | 1990-03-20 | Cooper Duane H | Head diffraction compensated stereo system with optimal equalization |
US5136651A (en) | 1987-10-15 | 1992-08-04 | Cooper Duane H | Head diffraction compensated stereo system |
US4910778A (en) | 1987-10-16 | 1990-03-20 | Barton Geoffrey J | Signal enhancement processor for stereo system |
EP0434691B1 (en) | 1988-07-08 | 1995-03-22 | Adaptive Audio Limited | Improvements in or relating to sound reproduction systems |
FI111789B (fi) | 1989-01-10 | 2003-09-15 | Nintendo Co Ltd | Elektroninen pelilaite, jossa on mahdollisuus pseudostereofoniseen äänen kehittämiseen |
US5095507A (en) | 1990-07-24 | 1992-03-10 | Lowe Danny D | Method and apparatus for generating incoherent multiples of a monaural input signal for sound image placement |
JPH07105999B2 (ja) | 1990-10-11 | 1995-11-13 | ヤマハ株式会社 | 音像定位装置 |
US5208493A (en) | 1991-04-30 | 1993-05-04 | Thomson Consumer Electronics, Inc. | Stereo expansion selection switch |
JPH05191896A (ja) | 1992-01-13 | 1993-07-30 | Pioneer Electron Corp | 擬似ステレオ装置 |
JPH05191899A (ja) | 1992-01-16 | 1993-07-30 | Pioneer Electron Corp | ステレオサラウンド装置 |
US5173944A (en) | 1992-01-29 | 1992-12-22 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Head related transfer function pseudo-stereophony |
EP0553832B1 (en) | 1992-01-30 | 1998-07-08 | Matsushita Electric Industrial Co., Ltd. | Sound field controller |
DE69322805T2 (de) * | 1992-04-03 | 1999-08-26 | Yamaha Corp. | Verfahren zur Steuerung von Tonquellenposition |
US5420929A (en) | 1992-05-26 | 1995-05-30 | Ford Motor Company | Signal processor for sound image enhancement |
JP3565846B2 (ja) | 1992-07-06 | 2004-09-15 | アダプティブ オーディオ リミテッド | 適応音響システム及び音再生システム |
US5440639A (en) | 1992-10-14 | 1995-08-08 | Yamaha Corporation | Sound localization control apparatus |
US5319713A (en) | 1992-11-12 | 1994-06-07 | Rocktron Corporation | Multi dimensional sound circuit |
JPH06165296A (ja) | 1992-11-18 | 1994-06-10 | Matsushita Electric Ind Co Ltd | 音場信号再生装置 |
US5598478A (en) * | 1992-12-18 | 1997-01-28 | Victor Company Of Japan, Ltd. | Sound image localization control apparatus |
JP2886402B2 (ja) | 1992-12-22 | 1999-04-26 | 株式会社河合楽器製作所 | ステレオ信号発生装置 |
JP2897586B2 (ja) | 1993-03-05 | 1999-05-31 | ヤマハ株式会社 | 音場制御装置 |
EP0637191B1 (en) * | 1993-07-30 | 2003-10-22 | Victor Company Of Japan, Ltd. | Surround signal processing apparatus |
DE4326811A1 (de) | 1993-08-10 | 1995-02-16 | Philips Patentverwaltung | Schaltungsanordnung zum Umwandeln eines Stereosignals |
US5438623A (en) * | 1993-10-04 | 1995-08-01 | The United States Of America As Represented By The Administrator Of National Aeronautics And Space Administration | Multi-channel spatialization system for audio signals |
KR0135850B1 (ko) | 1993-11-18 | 1998-05-15 | 김광호 | 음성재생장치 |
US5517570A (en) | 1993-12-14 | 1996-05-14 | Taylor Group Of Companies, Inc. | Sound reproducing array processor system |
BE1008027A3 (nl) | 1994-01-17 | 1995-12-12 | Philips Electronics Nv | Signaalcombinatieschakeling, signaalbewerkingsschakeling voorzien van de signaalcombinatieschakeling, stereofonische audioweergave-inrichting voorzien de signaalbewerkingsschakeling, alsmede een audio-visuele weergave-inrichting voorzien van de stereofonische audioweergave-inrichting. |
US5436975A (en) | 1994-02-02 | 1995-07-25 | Qsound Ltd. | Apparatus for cross fading out of the head sound locations |
US5659619A (en) | 1994-05-11 | 1997-08-19 | Aureal Semiconductor, Inc. | Three-dimensional virtual audio display employing reduced complexity imaging filters |
JP2944424B2 (ja) | 1994-06-16 | 1999-09-06 | 三洋電機株式会社 | 音響再生回路 |
JPH0819100A (ja) | 1994-07-01 | 1996-01-19 | Matsushita Electric Ind Co Ltd | サラウンドステレオ |
US5533129A (en) | 1994-08-24 | 1996-07-02 | Gefvert; Herbert I. | Multi-dimensional sound reproduction system |
GB9417185D0 (en) * | 1994-08-25 | 1994-10-12 | Adaptive Audio Ltd | Sounds recording and reproduction systems |
JP3500746B2 (ja) | 1994-12-21 | 2004-02-23 | 松下電器産業株式会社 | 音像定位装置及びフィルタ設定方法 |
US5844993A (en) | 1995-01-25 | 1998-12-01 | Victor Company Of Japan, Ltd. | Surround signal processing apparatus |
US5889867A (en) * | 1996-09-18 | 1999-03-30 | Bauck; Jerald L. | Stereophonic Reformatter |
-
1997
- 1997-03-14 US US08/819,582 patent/US6449368B1/en not_active Expired - Lifetime
-
1998
- 1998-02-26 CA CA002283838A patent/CA2283838C/en not_active Expired - Lifetime
- 1998-02-26 EP EP98908769A patent/EP0966865B1/en not_active Expired - Lifetime
- 1998-02-26 WO PCT/US1998/003882 patent/WO1998042162A2/en active IP Right Grant
- 1998-02-26 KR KR1019997007959A patent/KR100591008B1/ko not_active IP Right Cessation
- 1998-02-26 AU AU66717/98A patent/AU747377B2/en not_active Expired
- 1998-02-26 DK DK98908769T patent/DK0966865T3/da active
- 1998-02-26 DE DE69832595T patent/DE69832595T2/de not_active Expired - Lifetime
- 1998-02-26 AT AT98908769T patent/ATE311733T1/de active
- 1998-02-26 JP JP54053798A patent/JP2001516537A/ja active Pending
- 1998-02-26 ES ES98908769T patent/ES2249823T3/es not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CA2283838C (en) | 2006-01-24 |
ATE311733T1 (de) | 2005-12-15 |
WO1998042162A2 (en) | 1998-09-24 |
CA2283838A1 (en) | 1998-09-24 |
EP0966865B1 (en) | 2005-11-30 |
JP2001516537A (ja) | 2001-09-25 |
DE69832595T2 (de) | 2006-08-10 |
DE69832595D1 (de) | 2006-01-05 |
EP0966865A2 (en) | 1999-12-29 |
DK0966865T3 (da) | 2006-03-27 |
KR100591008B1 (ko) | 2006-06-22 |
AU6671798A (en) | 1998-10-12 |
WO1998042162A3 (en) | 1998-12-03 |
AU747377B2 (en) | 2002-05-16 |
KR20000075880A (ko) | 2000-12-26 |
US6449368B1 (en) | 2002-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2249823T3 (es) | Descodificacion de audio multifuncional. | |
JP4732807B2 (ja) | オーディオ信号処理 | |
TWI489887B (zh) | 用於喇叭或耳機播放之虛擬音訊處理技術 | |
CA2744459C (en) | Surround sound virtualizer and method with dynamic range compression | |
US6937737B2 (en) | Multi-channel audio surround sound from front located loudspeakers | |
US8442237B2 (en) | Apparatus and method of reproducing virtual sound of two channels | |
US8477951B2 (en) | Front surround system and method of reproducing sound using psychoacoustic models | |
KR100626233B1 (ko) | 스테레오 확장 네트워크에서의 출력의 등화 | |
KR100608025B1 (ko) | 2채널 헤드폰용 입체 음향 생성 방법 및 장치 | |
KR20050119605A (ko) | 7.1 채널 오디오 재생 방법 및 장치 | |
US5844993A (en) | Surround signal processing apparatus | |
EP2229012B1 (en) | Device, method, program, and system for canceling crosstalk when reproducing sound through plurality of speakers arranged around listener | |
US8817997B2 (en) | Stereophonic sound output apparatus and early reflection generation method thereof | |
JP2956545B2 (ja) | 音場制御装置 | |
NL1032538C2 (nl) | Apparaat en werkwijze voor het reproduceren van virtueel geluid van twee kanalen. | |
JP2002291100A (ja) | オーディオ信号再生方法、及びパッケージメディア | |
KR100641454B1 (ko) | 오디오 시스템의 크로스토크 제거 장치 | |
EP1212923B1 (en) | Method and apparatus for generating a second audio signal from a first audio signal | |
CN114363793B (zh) | 双声道音频转换为虚拟环绕5.1声道音频的系统及方法 | |
JP2007202020A (ja) | 音声信号処理装置、音声信号処理方法、プログラム | |
KR20050060552A (ko) | 입체 음향 시스템 및 입체 음향 구현 방법 | |
WO2024081957A1 (en) | Binaural externalization processing | |
JP2006042316A (ja) | 音像上方拡大回路 | |
JP2003125500A (ja) | マルチチャンネル再生装置 |