ES2249823T3 - Descodificacion de audio multifuncional. - Google Patents

Descodificacion de audio multifuncional.

Info

Publication number
ES2249823T3
ES2249823T3 ES98908769T ES98908769T ES2249823T3 ES 2249823 T3 ES2249823 T3 ES 2249823T3 ES 98908769 T ES98908769 T ES 98908769T ES 98908769 T ES98908769 T ES 98908769T ES 2249823 T3 ES2249823 T3 ES 2249823T3
Authority
ES
Spain
Prior art keywords
network
attenuation
signal
matrix
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES98908769T
Other languages
English (en)
Inventor
Mark F. Davis
Louis D. Fielder
Matthew C. Fellers
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of ES2249823T3 publication Critical patent/ES2249823T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

UN CANCELADOR DE INTERCOMUNICACION ACUSTICA, PENSADO PARA INCORPORARLO EN UN SOFTWARE, DE MODO QUE CUANDO SE EJECUTA EN TIEMPO REAL EN UN ORDENADOR PERSONAL, EL CANCELADOR TENGA MUY BAJOS REQUISITOS DE MILLONES DE INSTRUCCIONES POR SEGUNDO Y UTILICE UNA FRACCION PEQUEÑA DE LOS CICLOS DE LA CPU DISPONIBLES. ASI, POR EJEMPLO, EL PROGRAMA SE PODRIA INCLUIR EN VIDEOJUEGOS, CD-ROMS, AUDIO PARA INTERNET Y ANALOGOS, TORNANDO LAS IMAGENES DE SONIDOS CIRCUNDANTES FUERA DEL ESPACIO ENTRE LOS ALTAVOCES MULTIMEDIA IZQUIERDO Y DERECHO DEL ORDENADOR CUANDO SE REPRODUCE EL AUDIO DE TALES FUENTES.

Description

Descodificación de audio multifuncional.
Campo de la invención
La invención se refiere a decodificación de audio multidireccional. Más en concreto, la invención se refiere a un cancelador de la diafonía acústica implementado mediante un programa almacenado en un ordenador que utiliza muy pocos recursos de procesamiento de un ordenador personal para uso en un sistema de decodificación y de presentación de audio multidireccional.
Estado de la técnica
El audio multicanal para juegos de vídeo multimedia, CD ROM, audio por Internet y similares basado en ordenadores personales (a menudo denominado "audio multimedia") ha emergido como una nueva aplicación de los sistemas de codificación y de decodificación de sonido multicanal Dolby Surround y Dolby Digital.
Dolby Surround, basado en el uso de una matriz amplitud-fase 4:2:4, se ha convertido actualmente en un sistema bien conocido para codificar cuatro canales de audio (izquierdo, derecho, central y surround) en medios de audio de dos canales (casetes y discos compactos), transmisiones de radio y las partes de audio de grabaciones de vídeo (cintas de vídeo y discos láser), y radiodifusiones de televisión, y para decodificarlos de los mismos. Dolby Surround (y Dolby Surround Pro Logic, que utiliza un decodificador de canal surround activo para aumentar la separación entre canales) se utiliza ampliamente en sistemas de cine en casa, que requieren, típicamente, un mínimo de tres altavoces (altavoces izquierdo y derecho situados próximos a la pantalla de presentación y un altavoz surround situado detrás de la audiencia) y preferiblemente cuatro altavoces (dos altavoces surround en lugar de uno, situados a cada lado de la audien-
cia). Idealmente, se utiliza incluso un quinto altavoz, para proporcionar una reproducción "fuerte" del canal central.
Dolby Digital utiliza la tecnología de codificación de audio digital Dolby AC-3 en la que 5.1 canales de audio (izquierdo, central, derecho, surround izquierdo, surround derecho y un canal de graves de ancho de banda limitado) se codifican en un flujo de datos de velocidad reducida. Dolby Digital, una tecnología más nueva que Dolby Surround, se utiliza ya ampliamente en los sistemas de cine en casa y ha sido elegida como el estándar de audio en Estados Unidos para el DVD (digital video disc, disco de vídeo digital) y para la HDTV (high definition televisión, televisión de alta definición). En un entorno de cine en casa, Dolby Digital requiere un mínimo de cuatro altavoces porque reproduce dos canales surround en lugar de uno.
En el entorno "multimedia" del ordenador personal, normalmente se emplean solamente dos altavoces, los altavoces izquierdo y derecho situados adyacentes o próximos a la pantalla del ordenador (y, opcionalmente, un altavoz de graves, que puede estar situado alejado, por ejemplo en el suelo -en la presente discusión se ignora el altavoz de graves). Cuando se reproduce por los altavoces izquierdo y derecho a través de medios convencionales, el material estéreo produce generalmente imágenes sonoras que están limitadas a los propios altavoces y al espacio entre ellos. Este efecto es el resultado de la diafonía de la señal acústica procedente de cada altavoz en la oreja lejana de un oyente situado enfrente de la pantalla del ordenador. La cancelación acústica y la representación del posicionamiento arbitrario de la fuente son aspectos del mismo proceso común.
Para reproducir material codificado en Dolby Surround en el entorno de un ordenador, ciertas disposiciones conocidas emplean múltiples excitadores de altavoz dentro de una única envoltura con el fin de simular el uso de múltiples altavoces. Ver, por ejemplo, la patente de Estados Unidos número 5.553.149.
Otras disposiciones conocidas han propuesto el uso de procesamiento de imágenes de sonido empleando cancelación de la diafonía acústica para proporcionar la percepción de que la información de sonido surround procede de posiciones virtuales de altavoces situados detrás o al lado de un oyente cuando sólo se utilizan dos altavoces situados enfrente. Ver por ejemplo, la solicitud de patente europea publicada EP0637191A2 y la solicitud de patente internacional publicada WO96/06515. El origen del cancelador de la diafonía acústica se atribuye, generalmente, a B.S. Atal y Manfred Schroeder de Bell Telephone Laboratories (ver, por ejemplo, la patente de Estados Unidos número 3.236.949). Como fue descrito originalmente por Schroeder y Atal, el efecto de la diafonía acústica puede mitigarse mediante la introducción de una señal de cancelación apropiada desde el altavoz opuesto. Puesto que la propia señal de cancelación producirá diafonía acústica, también debe ser cancelada por una señal apropiada procedente del altavoz que emitía originalmente, y así sucesivamente.
La presente invención está dirigida a un cancelador de la diafonía acústica que puede implementarse utilizando muy pocos recursos de procesamiento de un ordenador personal, en especial para su utilización en un sistema de decodificación y de presentación de audio multidireccional tal como un sistema multimedia de ordenador que tiene solamente dos altavoces principales.
Descripción de la invención
De acuerdo con la presente invención, se proporciona un cancelador de la diafonía acústica pensado para su implementación mediante software, de forma que cuando corre en tiempo real en un ordenador personal, el cancelador tiene unas exigencias muy pequeñas de mips y utiliza una pequeña fracción de los ciclos de CPU disponibles. De este modo, por ejemplo, el programa podría incluirse en videojuegos, CD-ROM, audio por Internet y similares, proporcionando imágenes de sonido surround fuera del espacio comprendido entre los altavoces multimedia izquierdo y derecho del ordenador cuando se reproduce el sonido procedente de dichas fuentes.
En un sistema de reproducción ideal, si una grabación original tiene M canales, cada uno con una dirección asociada de la fuente, el oyente debería percibir estos M canales reproducidos desde sus respectivas M direcciones originales. En los sistemas de reproducción prácticos, los M canales originales se reproducen mediante N canales de presentación o altavoces, cada uno de los cuales tiene una posición con respecto a las direcciones de las fuentes originales y con respecto a uno o más oyentes (cada oyente inmóvil que tiene una posición de escucha P en cada oído). El sistema global puede expresarse como:
M \Rightarrow [C] \Rightarrow N \Rightarrow [R] \Rightarrow P,
donde [C] es una red de filtros C de M x N puertos que procesa o hace corresponder los M canales originales a los N canales de presentación (es decir, una correspondencia lineal, invariable en el tiempo) y [R] es una red de filtros R de N x P puertos que procesa o hace corresponder los N canales de presentación a P posiciones de escucha (también una correspondencia lineal, invariable en el tiempo).
La red de filtros R puede representarse mediante una matriz de la sala R de respuestas de filtros o de funciones de transferencia (en la práctica de HRTF, head related transfer function, función de transferencia del oído) determinadas mediante la medida o la estimación de la función de transferencia desde cada uno de los N canales de presentación a cada una de las P posiciones de escucha, formando una matriz N x P de funciones de transferencia, cada una de las cuales puede incluir los efectos de las desviaciones de respuesta de los altavoces, la acústica de la sala, los retardos, los ecos, el posible efecto "head shadow", etc.:
1
donde los elementos de la matriz r_{11} ... r_{np} son respuestas de filtros individuales que representan la función de transferencia desde cada canal de presentación a cada posición de escucha. Si los elementos de la matriz r_{11} ... r_{np} están expresados como funciones de transferencia en el dominio de la frecuencia, por ejemplo como FFT (fast Fourier
transforms, transformadas rápidas de Fourier), con la matriz pueden realizarse operaciones normales de matrices (suma, multiplicación, etc.). De acuerdo con la presente invención, la matriz de la sala puede simplificarse ignorando todo salvo el retardo y la atenuación dependiente de la frecuencia en el camino acústico directo entre cada canal de presentación y cada posición de escucha, y aplanando la respuesta de atenuación durante al menos una parte sustancial del espectro del sonido de audio que se intenta reproducir por dichos canales de presentación.
La red de filtros C constituye un cancelador de la diafonía acústica y puede representarse mediante una matriz de cancelación C de respuestas de filtros o de funciones de transferencia:
\vskip1.000000\baselineskip
2
\vskip1.000000\baselineskip
donde los elementos de la matriz c_{11} ... c_{mn} son respuestas de filtros individuales. Si los elementos de la matriz
c_{11} ... c_{mn} están expresados como funciones de transferencia en el dominio de la frecuencia, por ejemplo como FFT (fast Fourier transforms, transformadas rápidas de Fourier), con la matriz pueden realizarse operaciones normales de matrices (suma, multiplicación, etc.).
Puesto que reestablece los M canales originales en sus direcciones originales, el cancelador de la diafonía acústica tiene la capacidad de crear imágenes virtuales –los sonidos proceden aparentemente de las direcciones M más que de las N posiciones de los altavoces, pudiendo estar las N posiciones situadas en lugares diferentes a las M fuentes con respecto a las P posiciones de escucha.
Un cancelador de la diafonía acústica funciona básicamente como si fuera un filtro "espacial inverso" en un sistema de reproducción de sonido para cancelar las características acústicas de una sala de escucha y reemplazarlas por las características acústicas de la grabación original. De forma que el oyente escucha los M canales originales en las P posiciones de escucha como se desea, con lo que
CR = I,
\vskip1.000000\baselineskip
donde I es la matriz identidad, o
\vskip1.000000\baselineskip
C = R^{-1}.
De este modo, la matriz C puede determinarse estableciendo la matriz de la sala R y calculando su inversa. Puesto que la matriz de la sala R está simplificada, de acuerdo con la presente invención, la matriz del cancelador C resultante también estará simplificada, lo que conduce a realizaciones software más sencillas de la red C de cancelación de la diafonía acústica, realizaciones que minimizan los requisitos de recursos de procesamiento cuando corren en un ordenador personal.
Si los elementos de la matriz R son funciones de transferencia en el dominio de la frecuencia, puede calcularse su inversa con el fin de obtener la matriz de cancelación C. De la matriz de cancelación C pueden obtenerse entonces una o más redes de cancelación de la diafonía acústica de M x N puertos realizables mediante software. En la red resultante de M x N puertos, cada salida N es, dependiendo de la realización: (1) la combinación lineal de versiones filtradas independientemente de las M entradas, ó (2) la combinación lineal de versiones filtradas independientemente de las M entradas y señales de realimentación procedentes de las N salidas filtradas independientemente, ó (3) señales de realimentación procedentes de las N salidas filtradas independientemente sumadas a las M entradas.
Una forma de realizar la red es transformar los elementos de la matriz C a representaciones en el dominio del tiempo, a partir de las cuales se obtienen fácilmente, como es bien conocido, realizaciones de filtros FIR (finite impulse response, respuesta impulsional finita). Aunque se prefiere una realización a base de filtros IIR (infinite impulse response, respuesta impulsional infinita) con el fin de minimizar los recursos de procesamiento, la obtención de un filtro IIR a partir de un filtro FIR no es un proceso sencillo. Por consiguiente, en lugar de transformar los elementos de la matriz C al dominio del tiempo, se prefiere dejarlos en el dominio de la frecuencia de donde pueden obtenerse fácilmente las respuestas en amplitud y en fase del filtro. Después, pueden llevarse a cabo realizaciones de sencillos filtros IIR o de filtros FIR/IIR, incluyendo sus coeficientes del filtro, que requieren poca potencia de procesamiento, y que implementen las respuestas de amplitud y de fase deseadas. Aunque tales filtros IIR ó FIR/IIR pueden obtenerse mediante técnicas de prueba y error, en la práctica un mejor modo de obtener dichos filtros IIR ó FIR/IIR es emplear uno de los muchos programas de ordenador comerciales de diseño de filtros digitales.
Si la matriz de la sala R no es una matriz cuadrada, la matriz inversa del cancelador C es una "inversa de una seudo-matriz" pero sigue siendo el camino óptimo para hacer corresponder M canales originales con N canales de presentación para su presentación en P posiciones de escucha. Para el caso de número de vínculos inferior al normal (es decir, P menor que N) la seudo-inversa minimiza el error cuadrático medio (RMS) entre las soluciones real y deseada. Para el caso de número de vínculos superior al normal (es decir, P mayor que N), la seudo-inversa minimiza la energía eficaz (RMS) de la(s) entrada(s) necesaria(s) para conseguir la solución exacta.
Como se comprenderá por la discusión anterior, los principios de la presente invención son aplicables, en general, a números arbitrarios de canales originales, altavoces y posiciones de escucha. Sin embargo, por simplicidad, las realizaciones preferidas descritas a continuación se refieren al caso específico en el que existen dos altavoces (tal como en una disposición multimedia típica de ordenador, con los altavoces situados simétricamente y poco separados enfrente del oyente, por ejemplo a ambos lados de la pantalla del ordenador multimedia o del aparato de televisión), dos canales originales (tales como, pero no limitados a, surround izquierdo y surround derecho), y dos posiciones de escucha (los oídos de un oyente) de forma que N = M = P = 2. De este modo, la matriz de transferencia de propiedades acústicas de la sala R es una matriz 2 x 2 y la respuesta del cancelador, C, está representada por la matriz 2 x 2 que es la inversa de la matriz R, de forma que el canal original izquierdo L se percibe únicamente en el oído izquierdo (una de las dos posiciones de escucha P) mientras que el canal original derecho R se percibe solamente en el oído derecho (la otra de las dos posiciones de escucha P).
Las señales aplicadas a través de un cancelador de la diafonía acústica de este tipo a un par de altavoces situados al lado de la pantalla de un ordenador da como resultado la percepción de que el sonido procede de los laterales del oyente y no del lugar en el que se encuentran situados los altavoces -las indicaciones de la dirección frontal se pierden y el sonido parece venir solamente del lateral, donde deberían estar los altavoces surround. De este modo, aplicando directamente a los altavoces información de los canales izquierdo y derecho y sumando dicha información con información surround espacializada (es decir, información surround procesada por el cancelador de la diafonía acústica), solamente se necesitan dos altavoces situados junto a la pantalla del ordenador para generar la percepción de campos sonoros izquierdo, derecho y surround.
En uno de sus aspectos, la presente invención está dirigida a un método de obtención de una matriz de cancelación C de dimensiones M x N en la que cada uno de los elementos de la matriz es una función de transferencia en el dominio de la frecuencia, representando la matriz C una red de cancelación de la diafonía acústica de M x N puertos para hacer corresponder M canales originales de audio, cada uno con una dirección asociada de la fuente, a N canales de presentación de audio, cada uno con una posición relativa con respecto a las direcciones de las fuentes, de forma que cada salida N es: (1) la combinación lineal de versiones filtradas independientemente de las M entradas, ó (2) la combinación lineal de versiones filtradas independientemente de las M entradas y señales de realimentación procedentes de las N salidas filtradas independientemente, ó (3) señales de realimentación procedentes de las N salidas filtradas independientemente sumadas a las M entradas. El método comprende el establecimiento de una matriz de la sala R de dimensiones N x P en la que cada uno de los elementos de la matriz es una función de transferencia en el dominio de la frecuencia, representando la matriz R una red de N x P puertos para hacer corresponder N posiciones de los canales de presentación a P posiciones de escucha, en la que las funciones de transferencia en el dominio de la frecuencia representan el retardo y una versión aplanada de la atenuación dependiente de la frecuencia a lo largo de un camino acústico directo desde cada una de dichas posiciones de los canales de presentación a cada una de dichas posiciones de escucha, y haciendo que la matriz de cancelación C sea igual a la inversa de la matriz de la sala R. La versión aplanada de la atenuación dependiente de la frecuencia puede ser, por ejemplo, una media aplanada de dicha atenuación del camino acústico a lo largo de, al menos, una parte sustancial del espectro del sonido de audio que se intenta reproducir por los canales de presentación.
En otro de sus aspectos, la invención está dirigida a una red de cancelación de la diafonía acústica de M x N puertos para hacer corresponder M canales originales de audio, cada uno con una dirección asociada de la fuente, a N canales de presentación de audio, cada uno con una posición relativa con respecto a las direcciones de las fuentes, de forma que cada salida N es: (1) la combinación lineal de versiones filtradas independientemente de las M entradas, ó (2) la combinación lineal de versiones filtradas independientemente de las M entradas y señales de realimentación procedentes de las N salidas filtradas independientemente, ó (3) señales de realimentación procedentes de las N salidas filtradas independientemente sumadas a las M entradas. La red de cancelación de la diafonía acústica se produce mediante los pasos de: establecimiento de una matriz de la sala R de dimensiones N x P en la que cada uno de los elementos de la matriz es una función de transferencia en el dominio de la frecuencia, representando la matriz R una red de N x P puertos para hacer corresponder N posiciones de los canales de presentación a P posiciones de escucha, en la que las funciones de transferencia en el dominio de la frecuencia representan el retardo y una versión aplanada de la atenuación dependiente de la frecuencia a lo largo de un camino acústico directo desde cada una de las posiciones de los canales de presentación a cada una de las posiciones de escucha; obtención de la inversa de la matriz de la sala R para obtener una matriz de cancelación de la diafonía acústica C de dimensiones M x N en la que cada uno de los elementos de la matriz es una función de transferencia en el dominio de la frecuencia, representando la matriz C la red de cancelación de la diafonía acústica de M x N puertos; e implementación de la versión aplanada de la atenuación dependiente de la frecuencia por uno o más filtros digitales sencillos que requieren poca potencia de procesamiento. Los filtros digitales son, preferiblemente, del tipo IIR o del tipo IIR/FIR y preferiblemente son filtros de primer orden. La versión aplanada de la atenuación dependiente de la frecuencia puede ser, por ejemplo, una media aplanada de dicha atenuación del camino acústico a lo largo de, al menos, una parte sustancial del espectro del sonido de audio que se intenta reproducir por los canales de presentación. El retardo puede realizarse mediante una memoria intermedia circular digital.
De acuerdo con un aspecto adicional de la presente invención, la red de cancelación de la diafonía acústica de M x N puertos puede incluir un compresor de amplitud, comprendiendo el compresor atenuadores de nivel de amplitud fijo en cada una de las entradas de la red, y amplificadores de refuerzo de nivel de amplitud variable en cada una de las salidas de la red, incluyendo cada uno de los amplificadores de refuerzo un circuito escalador para variar la amplificación entre un nivel que restablece la atenuación de entrada y un nivel atenuado que evita el truncamiento de la señal de salida. En una realización preferida, el control del compresor se obtiene de la entrada al compresor, teniendo el compresor una relación de compresión infinita, dando lugar con ello a un limitador. En la realización preferida, el compresor incluye además un retardo en cada una de las salidas de la red y el control del compresor mira hacia el futuro con el fin de controlar silábicamente la ganancia del compresor. Los atenuadores de nivel de amplitud fijo y los amplificadores de refuerzo de nivel de amplitud variable pueden tener características independientes de la frecuencia. Alternativamente, los atenuadores de nivel de amplitud fijo y los amplificadores de refuerzo de nivel de amplitud variable tienen características dependientes de la frecuencia. Cuando el procesador de la diafonía acústica es ruidoso con niveles bajos de señal, como puede ser el caso cuando se utiliza un procesador barato, tal como chips DSP que soportan solamente longitudes de palabras de 16 bits, las características dependientes de la frecuencia de dichos atenuadores de nivel de amplitud fijo y de dichos amplificadores de refuerzo de nivel de amplitud variable funcionan solamente desde frecuencias medias hasta bajas, manteniendo de este modo baja la pérdida en la relación señal/ruido y limitando las pérdidas a frecuencias que son menos audibles.
En otro aspecto de la invención, la red de cancelación de la diafonía acústica es una red de 2 x 2 puertos para hacer corresponder dos canales originales de audio M a dos canales de presentación de audio N aplicados a un par de transductores que tienen posiciones relativas con respecto a las direcciones de los canales originales de audio M, teniendo el oyente dos posiciones de escucha P, el oído izquierdo y el oído derecho del oyente, con respecto a los transductores, comprendiendo la red además (1) dos combinadores de señales, un primer combinador de señales y un segundo combinador de señales, teniendo cada combinador de señales al menos dos entradas y una salida, en la que (a) una de las N entradas está conectada a una entrada del primer combinador de señales y otra de las N entradas está conectada a una entrada del segundo combinador de señales, y (b) una de las N salidas está conectada a la salida del primer combinador de señales y otra de las salidas está conectada a la salida del segundo combinador de señales, y (2) dos caminos de realimentación de señales, un primer camino de realimentación de señales y un segundo camino de realimentación de señales, teniendo cada camino de realimentación un retardo y características dependientes de la frecuencia, y teniendo cada camino de realimentación una entrada y una salida, en la que (a) la entrada del primer camino de realimentación de señales está conectada a la salida del primer combinador de señales y la salida del primer camino de realimentación de señales está conectada a la otra entrada del segundo combinador de señales, (b) la entrada del segundo camino de realimentación de señales está conectada a la salida del segundo combinador de señales y la salida del segundo camino de realimentación de señales está conectada a la otra entrada del primer combinador de señales, (c) cada uno de los caminos de realimentación tiene un retardo que representa el tiempo adicional que necesita el sonido para propagarse a lo largo del camino acústico entre un transductor y el oído del oyente más alejado del transductor con respecto al tiempo que necesita el sonido para propagarse a lo largo del camino acústico entre el mismo transductor y el oído del oyente más cercano a dicho transductor, y (d) cada uno de los caminos de realimentación tiene una característica que depende de la frecuencia que representa la diferencia en la atenuación en el camino acústico entre un transductor y el oído del oyente más alejado del transductor y la atenuación en el camino acústico entre el mismo transductor y el oído del oyente más cercano a dicho transductor, y (3) teniendo los combinadores de señales, los caminos de realimentación de señales y las conexiones entre ellos características de polaridad de forma que las señales procesadas por un camino de realimentación se combinan restándose a las señales introducidas en la otra entrada del respectivo combinador de señales. Los dos canales de presentación pueden aplicarse a un par de transductores, generalmente dispuestos enfrente de y en posiciones sustancialmente simétricas a la izquierda y a la derecha con respecto a un oyente. La característica dependiente de la frecuencia puede materializarse como una característica de filtro en pendiente paso bajo de primer orden, que puede implementarse por medio de un filtro IIR o una combinación de filtros FIR/IIR. La atenuación en el camino acústico entre un transductor y el oído del oyente más alejado del transductor se determina obteniendo la diferencia entre la respuesta de transferencia del oído desde un transductor y el oído del oyente más alejado del transductor y la respuesta de transferencia del oído desde el otro transductor al oído del oyente más cercano al otro transductor y aplanando la diferencia.
Diversos aspectos de la invención pueden utilizarse independientemente o en combinación unos con otros.
Breve descripción de los dibujos
La figura 1 es un diagrama de bloques funcionales de un cancelador de la diafonía acústica sencillo de 4 puertos.
La figura 2 muestra gráficos de la amplitud de dos características de respuesta acústica en función de la frecuencia: la respuesta A es la diferencia de las respuestas a los impulsos de los oídos izquierdo y derecho para fuentes a \pm 15 grados y la respuesta B es una versión aplanada de la respuesta A.
La figura 3 es un diagrama de bloques funcionales de un filtro sencillo de primer orden que se puede usar en el sencillo cancelador de la diafonía acústica de la figura 1 para llevar a cabo una versión aplanada de la diferencia de las respuestas a los impulsos de los oídos izquierdo y derecho.
La figura 4A es un diagrama de bloques funcionales que muestra un entorno preferido en el que puede emplearse la red de cancelación de la diafonía acústica de la presente invención.
La figura 4B es un diagrama de bloques funcionales que muestra un entorno preferido alternativo en el que puede emplearse la red de cancelación de la diafonía acústica de la presente invención, con respecto no sólo a las señales del canal surround, sino también con respecto a las señales principales izquierda y derecha.
La figura 5 es un diagrama de bloques funcionales que muestra la realización preferida del sencillo cancelador de 2 x 2 puertos de las figuras 1 y 3 para uso en los entornos de las figuras 4A ó 4B.
La figura 6 es un diagrama de bloques funcionales que muestra una realización del mezclador-reductor y compresor/limitador de salida de las figuras 4A y 4B.
Mejores modos para llevar a cabo la invención
Como se ha mencionado anteriormente, la respuesta requerida de un cancelador acústico puede calcularse midiendo la respuesta efectiva del proceso de diafonía (de cada altavoz con cada oído), y calculando una respuesta inversa invirtiendo la matriz de las funciones del sistema. Como se ha explicado anteriormente, puede entonces obtenerse una o más realizaciones software de la respuesta inversa. Sin embargo, debido a la sencilla naturaleza del proceso de diafonía en el caso de 2 x 2 (2 altavoces, 2 oídos), es posible llegar a la respuesta inversa de un modo más intuitivo.
La diferencia principal entre una señal acústica dada que llega al oído cercano y la misma señal que llega al oído lejano es que la señal en el oído lejano está retardada y atenuada ligeramente en relación con la que llega al oído cercano. La generación de una señal de cancelación implica, por consiguiente, el restar del canal opuesto una señal con un retardo y una atenuación similares.
Un cancelador de la diafonía acústica emplea el concepto básico de cancelación activa del ruido -es decir, la señal de acoplamiento procedente del altavoz izquierdo que se oye en el oído derecho se cancela aplicando al canal derecho una versión de la misma señal con fase invertida, retardada, con amplitud reducida y filtrada dependiendo de la frecuencia y viceversa. Cada señal con fase invertida debe, a su vez, cancelarse de la misma manera (al menos durante varias iteraciones).
La figura 1 es un diagrama de bloques funcionales que muestra los elementos básicos de un cancelador sencillo. Cada retardo 12 y 14 es típicamente de alrededor de 140 \mus para altavoces situados delante de un oyente a ángulos de \pm 15 grados (un retardo de alrededor de 6 muestras a una frecuencia de muestreo de 44,1 kHz). Cada uno de los filtros 16 y 18 es simplemente un factor de atenuación independiente de la frecuencia, K, típicamente de alrededor de 0,9. La entrada de cada rama de realimentación 20 y 22 se toma de la salida de un sumador aditivo (24 y 26, respectivamente) en una disposición de realimentación negativa de canal cruzado (cada rama se resta en el respectivo sumador), para generar una señal de cancelación de cada señal de cancelación previa, como se explicó anteriormente. Éste es un cancelador de la diafonía acústica muy sencillo de realizar en forma digital: dos sumas, dos multiplicaciones y un par de memorias circulares de 6 muestras para los retardos. De este modo, en esta realización, las N salidas de la red de M x N puertos son las señales de realimentación filtradas independientemente procedentes de las N salidas sumadas a las M entradas.
Sin embargo, el sencillo cancelador que acabamos de describir no tiene en cuenta el hecho de que la atenuación introducida en el camino acústico lejano depende de la frecuencia. Es de sobra conocido el que la característica de frecuencia de dichos caminos acústicos puede obtenerse midiendo las respuestas a impulsos binaurales utilizando una cabeza humana o una cabeza de maniquí, normalmente medidas en un ambiente anecoico. Es fácil acceder a datos publicados que reflejan dichas medidas. Por ejemplo, respuestas a impulsos binaurales que se pueden utilizar pueden ser las obtenidas con una cabeza de maniquí de la marca Kemar en un ambiente anecoico por el MIT Media Lab, y publicadas en su página web de Internet. Utilizando dichos datos, se restan los valores de la magnitud, en dB, de las transformadas de Fourier de las respuestas a los impulsos de los oídos izquierdo y derecho para fuentes situadas a 15 grados para llegar a una respuesta diferencia en frecuencia que corresponde a altavoces situados a \pm 15 grados. Este espectro diferencia en bruto se muestra en la figura 2 como respuesta A, una característica bastante compleja que requeriría una realización mediante un filtro multipolo.
Un aspecto de la presente invención es aplanar una respuesta tal como la respuesta A de la figura 2, con el fin de simplificar la realización del filtro resultante, minimizando con ello los recursos de procesamiento del ordenador necesarios. Otro aspecto de la presente invención es la implementación de la respuesta aplanada mediante una sección de filtros de primer orden, que, cuando se lleva a cabo, requiere una potencia de procesamiento muy baja. La respuesta de una sección de filtros de primer orden que proporciona un aplanamiento conveniente es, por ejemplo, la respuesta B de la figura 2. La respuesta deseada es una media aplanada de la atenuación del camino acústico a lo largo de, al menos, una parte sustancial del espectro de sonido de audio que se intenta reproducir por dichos canales de presentación. El intentar aproximar la respuesta con mayor precisión no será de utilidad porque existen muchas fuentes de error: altavoces no adaptados, altavoces a distinta distancia del oyente, la cabeza del oyente no es simétrica, anchura anormal de la cabeza, etc. En la práctica, la respuesta de un filtro de primer orden se aproxima a la característica ideal lo suficiente como para que el cancelador de la diafonía resultante sea eficaz para la mayoría de los oyen-
tes.
Una respuesta aplanada, tal como la respuesta B de la figura 2, puede conseguirse empleando el filtro FIR/IIR de la figura 3 en lugar de cada uno de los filtros atenuadores de banda ancha (independientes de la frecuencia) 16 y 18 de la figura 1 (es decir, reemplazando la constante de atenuación K con un filtro de primer orden). Funcionalmente, como se muestra en la realización del filtro de la figura 3, la entrada del filtro se aplica a un primer circuito escalador (ff0) 30 y a un primer retardo 32. La salida del retardo 32 se aplica a un segundo circuito escalador (ff1) 34. Un sumador 36, que tiene varias entradas y una salida, recibe las salidas de los circuitos escaladores 30 y 34. La salida del sumador 36 proporciona la salida del filtro que también se realimenta a través de un segundo retardo 38 y un tercer circuito escalador (fb1) 39 a otra entrada del sumador 36. Para altavoces a \pm 15 grados y una frecuencia de muestreo (fmuestreo) de 44,1 kHz, los coeficientes del filtro para la realización mostrada son ff0 = - 0,4608, ff1 = 0,2596, y fb1 = 0,7702. Los retardos 32 y 38 pueden implementarse mediante memorias circulares. La elección de ff0, ff1 y fb1, y el número de muestras en los dos retardos de memorias circulares dependen de la frecuencia de muestreo y de la separación de los altavoces. El número de muestras de los retardos está, típicamente, en el margen de 1 a 7 para ángulos de altavoces y frecuencias de muestreo prácticas (alrededor de 6 muestras para ángulos de altavoces de \pm 15 grados y fmuestreo = 44,1 kHz).
De acuerdo con otro aspecto de la presente invención, la realización del filtro de la respuesta diferencia aplanada se implementa mediante un filtro IIR o un filtro FIR/IIR de primer orden. Si se implementa utilizando un filtro FIR, con el fin de proporcionar múltiples iteraciones de la cancelación cruzada necesaria, se requiere alimentación hacia adelante (feed-forward) con retardos múltiples. Una implementación de este tipo requiere un nivel alto de procesamiento. Por otra parte, una realización mediante filtro IIR ó filtro FIR/IIR proporciona inherentemente retardos múltiples con mucha mayor simplicidad y menores demandas de procesamiento.
La realización del filtro mostrada en la figura 3 constituye un filtro híbrido FIR/IIR -la parte de alimentación hacia delante (escalamiento de la entrada por ff0 y su aplicación a un sumador 34; y retardo de la entrada, escalamiento por ff1 y su aplicación al sumador 34) constituye un filtro FIR y la parte de retroalimentación (retardo de la salida, escalamiento de la misma por fb1 y su aplicación al sumador 34) constituye un filtro IIR.
La característica dependiente de la frecuencia de un filtro de este tipo FIR/IIR se denomina a menudo característica de tipo pendiente (shelving) paso bajo. Cuando las salidas del aparato de procesamiento de las señales de audio se van a aplicar a un par de transductores separados alrededor de \pm 15 grados, la característica de tipo pendiente paso bajo tiene un primer punto de inflexión a alrededor de 2.000 Hz y un segundo punto de inflexión a alrededor de 4.370 kHz. Cuando las salidas del aparato de procesamiento de las señales de audio se van a aplicar a un par de transductores separados alrededor de \pm 20 grados, la característica de tipo pendiente paso bajo tiene un primer punto de inflexión a alrededor de 1.600 Hz y un segundo punto de inflexión a alrededor de 4.150 kHz.
La frecuencia de muestreo no es crítica. Una frecuencia de 44,1 kHz es adecuada para compatibilizar con otras fuentes de audio digital y para proporcionar una respuesta de frecuencia suficiente para una reproducción de alta fidelidad. Pueden utilizarse otras frecuencias de muestreo (tales como, pero no limitadas a 48 kHz, 32 kHz, 22,05 kHz y 11 kHz). Cuando los filtros 16 y 18 de la figura 1 se materializan mediante un filtro como el mostrado en la figura 3 en los que la inversión se maneja mediante elección de signo de los términos ff0 y ff1, los signos de resta (-) en los sumadores 24 y 26 (figura 1) se sustituyen por signos de suma (+).
La figura 4A es un diagrama de bloques funcionales que muestra un entorno preferido en el que puede emplearse la red de cancelación de la diafonía acústica de la presente invención. Se reciben 5 señales de entrada de audio digital: izquierda, central, derecha, surround izquierda y surround derecha, tales como las procedentes de un decodificador Dolby Surround AC-3 (no mostrado). Las entradas se aplican, respectivamente, a filtros opcionales de bloqueo de CC 40, 42, 44, 46 y 48, cada uno de ellos con una respuesta de paso alto (-3 dB a 20 Hz) (los filtros de bloqueo de CC pueden no ser necesarios, dependiendo de la fuente de señal que los alimenta). Los retardos opcionales 50, 52 y 54 en las líneas de entrada izquierda, central y derecha tienen retardos equivalentes a los retardos, si existen, de la red de cancelación de la diafonía 56. Normalmente, no habrá retardo en la red 56 y los retardos 50, 52 y 54 se omiten a menos que la red 56 incluya un limitador/compresor de amplitud de un cierto tipo, como se describe a continuación. En este entorno, las entradas a la red de cancelación 56 son las entradas surround izquierda y surround derecha (en general, las entradas a la red 56 no están limitadas a que sean entradas surround). Una realización preferida de la red de cancelación 56 para uso en este entorno se describe en conexión con la realización de la figura 5. Un mezclador-reductor y limitador/compresor de salida 58 recibe las señales izquierda, central y derecha retardadas y las señales surround procesadas para proporcionar dos señales de salida, izquierda y derecha, adecuadas para su reproducción por dos altavoces multimedia de ordenador. Detalles adicionales del mezclador-reductor y limitador/compresor de salida 58 se describen en conexión con la figura 6. La función de limitador del bloque 58 asegura que ninguna señal digital de salida exceda de una amplitud de 1.
Un flujo digital de datos AC-3 decodificado contiene cinco canales discretos de anchura de banda completa y un canal de graves. Es deseable el preservar la separación de los canales en la presentación en dos altavoces en la medida de lo posible. Por consiguiente, solamente los canales surround izquierdo y derecho se procesan por una red de cancelación (sin embargo, en la figura 4B alternativa, descrita después, el canal central también puede aplicarse a las entradas de la red). Los canales frontales izquierdo y derecho se suman, respectivamente, a los canales surround izquierdo y derecho procesados en la red de cancelación. El canal central y el canal de graves (no mostrado, cuando se utiliza) se mezclan en fase en las salidas izquierda y derecha sin ningún procesamiento adicional.
La disposición de la figura 4A puede emplearse también cuando existen cuatro señales de entrada (canales izquierdo, central y derecho, un único canal surround y no existe canal de graves separado) tal como lo proporcionado por el decodificador de Dolby Surround o Dolby Surround Pro Logic. En este caso, el canal surround único debería decorrelarse en dos señales seudo-estereofónicas, que se aplican después a las entradas del cancelador. Puede utilizarse una conversión seudo-estereofónica sencilla empleando desplazamiento de fase de forma que una señal esté desfasada con respecto a la otra. En el estado de la técnica se conocen muchas técnicas de conversión seudo-estereofó-
nicas.
La disposición de la figura 4A puede emplearse también cuando sólo existen dos señales estereofónicas de entrada. En este caso, pueden crearse señales surround seudo-estereofónicas retardando cada una de las dos señales estereofónicas de entrada alrededor de 30 ms. De forma similar, incluso una única señal de entrada monofónica puede utilizarse para obtener un par de señales seudo-estereofónicas para proporcionar las entradas izquierda y derecha y para crear un par de señales seudo-surround retardando cada una de ellas.
La figura 4B muestra alternativas adicionales a la realización de la figura 4A. En la figura 4B, los canales frontales izquierdo y derecho se ensanchan ligeramente mediante una mezcla parcial en oposición de fase en el bloque 49. Aunque la mezcla en oposición de fase para ensanchar la "etapa" aparente de estéreo es una técnica bien conocida, es un aspecto de la presente invención el realizar dicha mezcla mediante un cálculo matricial de la misma manera que se lleva a cabo en el cancelador de la diafonía (como se indicó anteriormente, la cancelación acústica y el posicionamiento arbitrario de la fuente son aspectos de un mismo proceso). De este modo, la realización del cálculo de la mezcla en oposición de fase del bloque 49 constituye otra red de M x N puertos representada por una matriz C, en la que M = N = 2 y puede emplearse la implementación de la red de cancelación de la diafonía de las figuras 1 y 3. En este caso, puesto que el cambio con respecto a la posición deseada es ligero (es decir, la separación de las fuentes izquierda y derecha M con respecto a las separaciones típicas de los altavoces de la pantalla del ordenador es mucho más aproximada que cuando las fuentes M son fuentes surround), las operaciones de la matriz son más sencillas que para el caso del cancelador de la diafonía surround, requiriendo menores recursos de procesamiento.
Como otra opción, el canal central puede cancelarse con el fin de minimizar la "coloración" que resulta de escuchar la señal central dos veces en cada oído -una procedente del altavoz cercano y otra de nuevo procedente del altavoz lejano. En lugar de requerir una realización de un cancelador separado, las señales de diafonía acústica del canal central pueden cancelarse aplicándolas a la red de cancelación de la diafonía del canal surround. Para ello, la señal del canal central se mezcla con las entradas surround izquierda y surround derecha de la red de cancelación de la diafonía 56 a través de sumadores 51 y 53, respectivamente.
La figura 5 es un diagrama de bloques funcionales que muestra la realización preferida del sencillo cancelador de 2 x 2 puertos de las figuras 1 y 3 para uso en el entorno de la figura 4. Los elementos comunes con la figura 1 mantienen las mismas referencias numéricas. La figura 5 difiere de la realización de las figuras 1 y 3 en que incluye un compresor para evitar el truncamiento de las señales de niveles altos. El cancelador no debería generar valores mayores que 1,0, pero es probable que lo haga desde medias hasta bajas frecuencias (por debajo de alrededor de 200 Hz) bajo ciertas condiciones de señal incluso cuando las señales de entrada no excedan de 1,0 (esto puede ocurrir cuando una señal se aplica solamente a una entrada o las señales aplicadas a ambas entradas están desfasadas una con respecto a la otra). No pueden utilizarse filtros paso alto a la entrada para eliminar las frecuencias bajas que causan el problema porque dichos filtros, para que sean eficaces, producen alteraciones en el desplazamiento de fase que reducen la eficacia del cancelador e introducen coloración. De este modo, de acuerdo con otro aspecto de la invención, se proporciona un cancelador de la diafonía de baja potencia de procesamiento que incluye un compresor, requiriendo también el compresor baja potencia de cálculo.
Cuando los cálculos se llevan a cabo en un procesador de punto fijo, el compresor funciona proporcionando una atenuación fija a la entrada del cancelador de la diafonía acústica y una amplificación variable a la salida del cancelador. El valor de la atenuación fija es suficiente para asegurar que la salida del cancelador no excede de 1,0 bajo cualquier condición de señal (por ejemplo, si cuando se aplica una señal a únicamente una entrada el cancelador produce una amplificación de 20 dB en dicha señal, la atenuación fija es de 20 dB). La amplificación variable varía entre un nivel que restablece la atenuación a la entrada y un nivel atenuado que impide el truncamiento de la señal de salida.
El compresor puede estar controlado a la entrada (a la entrada del compresor), porque, normalmente, un compresor controlado a la salida debe actuar instantáneamente, produciendo con ello distorsiones audibles. En una realización alternativa, descrita después, un compresor controlado a la salida evita la producción de tales distorsiones audibles. El compresor puede realizarse con una relación de compresión finita, o con una relación de compresión infinita, en cuyo caso es un limitador.
La disposición de la atenuación fija antes del cancelador seguida de la amplificación variable constituye un aspecto de la presente invención. Aunque una ganancia variable a la entrada del cancelador serviría de seguro contra el truncamiento a la salida del cancelador, los sensores de control de la ganancia variable deberían estar necesariamente situados a la salida del cancelador. Sin embargo, una configuración de este tipo no es factible porque para el instante en que se detectara el truncamiento en la salida sería demasiado tarde para reducir la ganancia de entrada, especialmente teniendo en cuenta el retardo del cancelador. En su lugar, la presente invención sitúa tanto la detección como la ganancia variable a la salida del cancelador en combinación con una atenuación fija antes de la entrada al cancelador. Como se describe posteriormente, los retardos en los caminos de la señal de salida del cancelador permiten una "mirada hacia el futuro", de forma que los sensores puedan controlar silábicamente la ganancia del compresor.
Para entradas surround aplicadas a un cancelador de la diafonía, como las de la izquierda de la figura 5, la probabilidad de sobrecarga, ya sea dentro del cancelador o en los circuitos posteriores (ya sea en los convertidores digitales-analógicos o quizás en los amplificadores de potencia o altavoces), varía con la frecuencia. Una forma de prevenir dicha sobrecarga es preceder el cancelador con "pre-énfasis" utilizando una respuesta que siga más o menos el nivel de sobrecarga de la entrada como una función de la frecuencia. Por lo tanto, si a la frecuencia f el sistema se sobrecargase x dB con respecto al valor máximo de entrada, introducimos x dB de atenuación a la frecuencia f. Este pre-énfasis (fijo) se elige para asegurar que dentro del cancelador no puede producirse sobrecarga.
En una materialización práctica de la realización de la figura 5, en la que el cancelador de la diafonía acústica corre en un equipo de procesamiento barato (tal como pastillas DSP en punto fijo que soportan sólo longitudes de palabras de 16 bits), tanto la atenuación fija como la amplificación variable tienen características dependientes de la frecuencia, de forma que la atenuación y la amplificación sólo funcionan desde medias hasta bajas frecuencias (por debajo de alrededor de 200 Hz, por ejemplo), manteniendo de este modo baja la pérdida de la relación señal/ruido y limitando la pérdida a frecuencias en las que es menos audible.
En la realización de la figura 5, el compresor funciona proporcionando un pre-énfasis fijo a su entrada, lo que atenúa las bajas frecuencias suficientemente como para evitar cualquier truncamiento en el cancelador, y un de-énfasis variable a su salida, que restablece mediante ajuste las bajas frecuencias. El de-énfasis variable varía entre un nivel que es complementario del pre-énfasis a la entrada y un nivel atenuado que evita el truncamiento de la señal de salida. Debido al uso de pre-énfasis y de de-énfasis variable, el efecto sobre la relación señal/ruido es inaudible incluso si el procesador de la diafonía es ruidoso a niveles de señal bajos (como puede suceder cuando se emplea un procesador barato, tal como pastillas DSP que soportan sólo longitudes de palabras de 16 bits).
Aunque uno puede restablecer la respuesta en frecuencia y el nivel de señal globales mediante la introducción, después del cancelador, del de-énfasis complementario exacto, por ejemplo una amplificación de 20 dB en CC cayendo en pendiente hasta 6,7 dB a \pi/2, esto desde luego no tendría efecto sobre la sobrecarga dentro del propio cancelador, pero podría conducir a sobrecargas más adelante a lo largo del sistema. Una solución preferida para protegerse contra dicha sobrecarga, mostrada en la realización de la figura 5, modela la respuesta restablecida (compensa hacia abajo el nivel para evitar sobrecargas) en las dos salidas del cancelador de la diafonía acústica, mide la mayor de las salidas modeladas, estima si indica que una, la otra o las dos salidas principales estarán sobrecargadas, y si se predice truncamiento, aplica reducción de ganancia inmediatamente antes del de-énfasis. Esto constituye un limitador/compresor de "banda ancha", porque el cambio de ganancia aplicada es el mismo en todas las frecuencias; no permite que ninguna salida exceda el valor máximo (o cualquier otro valor umbral deseado), con independencia de las frecuencias que contenga la señal.
En la realización de la figura 5, el pre-énfasis es proporcionado por los filtros idénticos 60 y 62. Aunque las características del filtro no son críticas, cada filtro puede realizarse como un filtro de primer orden que tenga una respuesta de filtro tipo pendiente, de forma que su respuesta es de - 20 dB en CC y de - 6,7 dB a \pi/2 (la frecuencia de Nyquist). El de-énfasis variable puede realizarse mediante filtros de escala idénticos 64 y 66, cada uno de los cuales, en cuanto a la forma, tiene una respuesta que es la inversa de la de los filtros 60 y 62. Cada uno de los filtros 64 y 66 recibe el mismo escalado con el fin de escalar la respuesta respectiva en una cantidad de 20 dB (la forma de la respuesta permanece sin alteración). Los factores de escalado son generados por los filtros 68 y 70 y un bloque de cálculo del escalado 72. Los retardos 74 y 76 retardan las salidas del cancelador con el fin de permitir a los sensores de salida del cancelador el mirar hacia el futuro y controlar silábicamente los filtros 64 y 66. La duración de los retardos 74 y 76 es equivalente a la de los retardos entre las respectivas entradas a los retardos 74 y 76 y las salidas de los factores de escalado del bloque de cálculo del escalado 72. Los retardos 74 y 76 pueden realizarse mediante memorias circulares.
Los filtros 64 y 66 son filtros de primer orden, teniendo cada uno de ellos una respuesta del tipo pendiente (un filtro tipo pendiente paso bajo que varía con la frecuencia, comenzando la pendiente en la unidad, aumentando hasta un máximo de - 6 dB/octava, y después disminuyendo de nuevo hasta la unidad) variando entre + 20 dB y 0 dB en CC y entre + 6,7 dB y - 13,3 dB a \pi/2, dependiendo del escalado. Los filtros 68 y 70 son también filtros tipo pendiente paso bajo, pero, sin embargo, son fijos y tienen una respuesta de - 13,3 dB a \pi/2 y 0 dB a CC. El bloque de cálculo del escalado opera primero sobre bloques de muestras (bloques de 8 muestras en la realización práctica) para calcular el valor absoluto máximo en los respectivos bloques de muestras en las salidas izquierda y derecha del cancelador (es decir, se selecciona el bloque con el valor máximo mayor de las salidas de los filtros 68 y 70 y el valor máximo en dicho bloque determina el valor del escalado). Se calcula entonces un factor de escalado que fija el nivel de los filtros 64 y 66 de forma que la salida no exceda de 1,0. Los factores de escalado se interpolan entre los bloques previo y actual de forma que el compresor actúa silábicamente y no genera distorsiones indesea-
bles.
Si el procesador de punto fijo sobre el que corre el cancelador de la diafonía acústica tiene suficientes bits (digamos, 20 bits) para que no añada ruido audible a niveles bajos de señal, puede utilizarse un esquema de compresión de banda ancha (independiente de la frecuencia) en lugar de uno dependiente de la frecuencia. En este caso, cada una de las entradas puede estar sujeta a una atenuación de banda ancha (independiente de la frecuencia) (por ejemplo de 10 dB) y la salida del cancelador puede aplicarse a un amplificador controlable de banda ancha (independiente de la frecuencia) con una ganancia de hasta 10 dB, reduciéndose la ganancia en la medida necesaria para evitar el truncamiento de la salida digital. De este modo, los filtros 60, 62, 68 y 70 se convierten en una atenuación fija a todas las frecuencias de interés, mientras que los filtros 64 y 66 perderían su dependencia de la frecuencia y se convertirían en amplificadores de banda ancha (independientes de la frecuencia) a dichas frecuencias.
Si el procesador en el que corre el cancelador de la diafonía acústica es un procesador de punto flotante, el cálculo puede hacerse en punto flotante sin atenuación de entrada, permitiendo niveles de señales intermedias mayores de 1,0 y excluyendo la necesidad de ninguna acción del compresor hasta la salida del cancelador de la diafonía acústica, eliminando de este modo los filtros o atenuadores de entrada y ahorrando recursos del procesador.
Son posibles diversas alternativas a la realización dependiente de la frecuencia descrita. En una primera alternativa, la predicción de truncamiento puede utilizarse para modificar la forma del de-énfasis aplicado en lugar de producir una variación en la ganancia global. Una forma de implementar una solución de modificación de la forma del de-énfasis de este tipo es proporcionar inicialmente una reducción de la ganancia de banda ancha a medida que la señal de control (que indica la probabilidad de sobrecarga) aumenta hasta que exista ganancia unidad a frecuencias altas, seguida de (mientras la señal de control continúa creciendo) un incremento progresivo de la pérdida a frecuencias bajas mientras se deja en la unidad la ganancia a frecuencias altas. Dicha solución no debería conducir a mucha inestabilidad de los componentes de sonido de frecuencias medias y altas en presencia de señales dominantes de baja frecuencia. Debe indicarse que una señal de control, indicando, por ejemplo, en cuanto se sobrecargaría la salida si no se hiciera nada, no proporciona información sobre dónde caen en el espectro la señal o señales que producen la sobrecarga. Sin embargo, para frecuencias dominantes altas (por ejemplo, cerca de \pi/2, una condición altamente improbable) una reducción de ganancia de más de una cierta cantidad, digamos 6,7 dB, nunca sería necesaria (es decir, la retirada de la amplificación de 6,7 dB del de-énfasis inactivo, dando por consiguiente ganancia unidad). Para frecuencias dominantes bajas, una reducción tan grande como una cierta cantidad, digamos 20 dB, nunca sería necesaria (de nuevo para ganancia unidad a baja frecuencia), pero en esos instantes no existiría necesidad de reducir la ganancia a frecuencias elevadas en una cantidad aproximadamente tan grande como 20 dB.
Son posibles otras formas de adaptación de la forma del de-énfasis. Los beneficios de dicha adaptación son análogos a los beneficios ofrecidos por la separación en bandas en los compresores de audio digital, a saber, una reducción en la modulación cruzada de señales (diafonía) en una parte del espectro por señales en otras partes.
En una alternativa adicional, el modelado puede mejorarse para simular el efecto de de-énfasis variable haciendo también variables los bloques 68/70. En este caso, el limitador/compresor se convierte en un limitador/compresor controlado a la salida cuya señal de control se utiliza para operar sobre las señales principales tras los retardos 74/76. El hecho de que dicho control de salida rápida produzca distorsiones transitorias no tiene consecuencias porque las salidas de los filtros 68/70 no se oyen. El resultado es proporcionar una señal de control aplanada para la señal que afecta al de-énfasis proporcionado por los bloques 64/66.
La figura 6 es un diagrama de bloques funcionales que muestra una realización del mezclador-reductor y compresor/limitador de salida 58. Debe hacerse notar que el compresor/limitador de salida que forma parte del bloque 58 proporciona limitación adicional a la proporcionada en la realización de la figura 5 del cancelador de la diafonía acústica. Cuando a las señales surround se les suma las señales frontales, como en la figura 6, el nivel de pico es probable que aumente, dando lugar a la necesidad de un compresor/limitador de salida.
Con referencia a los detalles de la figura 6, las entradas (izquierda, central, derecha, surround izquierda y surround derecha) son las salidas de los bloques 50, 52, 54 y 56 de la realización de la figura 4A (o, alternativamente, las salidas de los bloques 50, 54 y 56 de la realización de la figura 4B). Los retardos 80, 82, 84, 86 y 88 son opcionales. El uso de retardos permitiría la suavización de las muestras que pueden provocar el truncamiento mediante un cálculo del escalado, descrito a continuación. El mezclador-reductor de la señal 90 del mezclador-reductor y compresor/limitador de salida 58 suma las entradas izquierda, central y surround izquierda para generar la SALIDA IZQUIERDA; y suma las entradas derecha, central y surround derecha para generar la SALIDA DERECHA. El nivel de amplitud de las señales SALIDA IZQUIERDA y SALIDA DERECHA se varía de acuerdo con un coeficiente de escalado generado por una función de cálculo del escalado 92. Las entradas a la función de cálculo del escalado son las salidas izquierda y derecha de un mezclador-reductor (modelado) del camino de control 94.
El mezclador-reductor del camino de control proporciona las mismas funciones de mezclado-reducción que el mezclador-reductor de la señal, mezclando las 5.1 entradas (sólo se muestran 5) para dar 2 salidas. Sin embargo, el mezclador-reductor del camino de control incluye atenuación para asegurar que no existe truncamiento de señal bajo ninguna condición de las señales de entrada. El valor exacto de la atenuación no es crítico. Si SALIDA IZQUIERDA = Izquierda + Surround Izquierda (procedente del cancelador de la diafonía acústica) + 0,707 Central + 0,707 Graves, la máxima salida podría ser 3,414 (lo mismo vale para SALIDA DERECHA), de forma que una atenuación de al menos la inversa de 3,414 es adecuada. Puesto que el compresor/limitador solamente trabaja con niveles de señal elevados y el controlador no está en el camino de la señal, no se requiere una relación señal/ruido elevada, de forma que sería adecuada una atenuación de 4 ó 5. Una vez mezclada-reducida a L (izquierda) y R (derecha), el bloque de cálculo del escalado utiliza la mayor de las entradas L y R para generar un coeficiente de escalado de 1,0 o menor para limitar la ganancia de forma uniforme en el mezclador-reductor del camino de la señal 90.

Claims (29)

1. Un método de obtención de una matriz de cancelación C de dimensiones M x N en la que cada uno de los elementos de la matriz es una función de transferencia en el dominio de la frecuencia, representando la matriz C una red de cancelación de la diafonía acústica de M x N puertos para hacer corresponder M canales originales de audio, cada uno con una dirección asociada de la fuente, a N canales de presentación de audio, cada uno con una posición relativa con respecto a las direcciones de las fuentes, de forma que cada salida N es la combinación lineal de versiones filtradas independientemente de las M entradas, o la combinación lineal de versiones filtradas independientemente de las M entradas y señales de realimentación procedentes de las N salidas filtradas independientemente, o señales de realimentación procedentes de las N salidas filtradas independientemente sumadas a las M entradas, comprendiendo
el establecimiento de una matriz de la sala R de dimensiones N x P en la que cada uno de los elementos de la matriz es una función de transferencia en el dominio de la frecuencia, representando la matriz R una red de N x P puertos para hacer corresponder N posiciones de los canales de presentación a P posiciones de escucha, en la que dichas funciones de transferencia en el dominio de la frecuencia representan el retardo y una versión aplanada de la atenuación dependiente de la frecuencia a lo largo de un camino acústico directo desde cada una de dichas posiciones de los canales de presentación a cada una de dichas posiciones de escucha, y
haciendo que la matriz de cancelación de la diafonía acústica C sea igual a la inversa de la matriz de la sala R.
2. Un método de acuerdo con la reivindicación 1, en el que dicha versión aplanada de la atenuación dependiente de la frecuencia es una media aplanada de dicha atenuación del camino acústico a lo largo de, al menos, una parte sustancial del espectro del sonido de audio que se intenta reproducir por dichos canales de presentación.
3. Una red de cancelación de la diafonía acústica de M x N puertos para hacer corresponder M canales originales de audio, cada uno con una dirección asociada de la fuente, a N canales de presentación de audio, cada uno con una posición relativa con respecto a las direcciones de las fuentes, de forma que cada salida N es la combinación lineal de versiones filtradas independientemente de las M entradas, o la combinación lineal de versiones filtradas independientemente de las M entradas y señales de realimentación procedentes de las N salidas filtradas independientemente, o señales de realimentación procedentes de las N salidas filtradas independientemente sumadas a las M entradas, generándose la red de cancelación de la diafonía acústica mediante los pasos de:
establecimiento de una matriz de la sala R de dimensiones N x P en la que cada uno de los elementos de la matriz es una función de transferencia en el dominio de la frecuencia, representando la matriz R una red de N x P puertos para hacer corresponder N posiciones de los canales de presentación a P posiciones de escucha, en la que dichas funciones de transferencia en el dominio de la frecuencia representan el retardo y una versión aplanada de la atenuación dependiente de la frecuencia a lo largo de un camino acústico directo desde cada una de dichas posiciones de los canales de presentación a cada una de dichas posiciones de escucha;
obtención de la inversa de la matriz de la sala R para obtener una matriz de cancelación de la diafonía acústica C de dimensiones M x N en la que cada uno de los elementos de la matriz es una función de transferencia en el dominio de la frecuencia, representando la matriz C dicha red de cancelación de la diafonía acústica de M x N puertos; e
implementación de la versión aplanada de la atenuación dependiente de la frecuencia mediante uno o más filtros digitales sencillos que requieren poca potencia de procesamiento.
4. Una red de acuerdo con la reivindicación 3, en la que dichos filtros digitales son del tipo IIR o del tipo IIR/FIR.
5. Una red de acuerdo con la reivindicación 3, en la que dichos filtros digitales sencillos son filtros de primer orden.
6. Una red de acuerdo con la reivindicación 4, en la que dichos filtros digitales sencillos son filtros de primer orden.
7. Una red de acuerdo con la reivindicación 3, en la que dicha versión aplanada de la atenuación dependiente de la frecuencia es una media aplanada de dicha atenuación del camino acústico a lo largo de, al menos, una parte sustancial del espectro del sonido de audio que se intenta reproducir por dichos canales de presentación.
8. Una red de acuerdo con la reivindicación 4, en la que dicha versión aplanada de la atenuación dependiente de la frecuencia es una media aplanada de dicha atenuación del camino acústico a lo largo de, al menos, una parte sustancial del espectro del sonido de audio que se intenta reproducir por dichos canales de presentación.
9. Una red de acuerdo con la reivindicación 5, en la que dicha versión aplanada de la atenuación dependiente de la frecuencia es una media aplanada de dicha atenuación del camino acústico a lo largo de, al menos, una parte sustancial del espectro del sonido de audio que se intenta reproducir por dichos canales de presentación.
10. Una red de acuerdo con la reivindicación 3, que comprende además la implementación de dicho retardo mediante una memoria circular digital.
11. Una red de acuerdo con la reivindicación 4, que comprende además la implementación de dicho retardo mediante una memoria circular digital.
12. Una red de acuerdo con la reivindicación 5, que comprende además la implementación de dicho retardo mediante una memoria circular digital.
13. Una red de acuerdo con la reivindicación 3, que comprende además un compresor de amplitud, comprendiendo dicho compresor de amplitud
atenuadores de nivel de amplitud fijo en cada una de las entradas de la red, y
amplificadores de refuerzo de nivel de amplitud variable en cada una de las salidas de la red, incluyendo cada uno de los amplificadores de refuerzo un circuito escalador para variar la amplificación entre un nivel que restablece la atenuación de entrada y un nivel atenuado que evita el truncamiento de la señal de salida.
14. Una red de acuerdo con la reivindicación 4, que comprende además un compresor de amplitud, comprendiendo dicho compresor de amplitud
atenuadores de nivel de amplitud fijo en cada una de las entradas de la red, y
amplificadores de refuerzo de nivel de amplitud variable en cada una de las salidas de la red, incluyendo cada uno de los amplificadores de refuerzo un circuito escalador para variar la amplificación entre un nivel que restablece la atenuación de entrada y un nivel atenuado que evita el truncamiento de la señal de salida.
15. Una red de acuerdo con la reivindicación 5, que comprende además un compresor de amplitud, comprendiendo dicho compresor de amplitud
atenuadores de nivel de amplitud fijo en cada una de las entradas de la red, y
amplificadores de refuerzo de nivel de amplitud variable en cada una de las salidas de la red, incluyendo cada uno de los amplificadores de refuerzo un circuito escalador para variar la amplificación entre un nivel que restablece la atenuación de entrada y un nivel atenuado que evita el truncamiento de la señal de salida.
16. Una red de acuerdo con una cualquiera de las reivindicaciones 13, 14 ó 15, en la que el control para el compresor se obtiene de la entrada al compresor.
17. Una red de acuerdo con una cualquiera de las reivindicaciones 13, 14 ó 15, en la que dicho compresor tiene una relación de compresión infinita, con lo que el compresor constituye un limitador.
18. Una red de acuerdo con la reivindicación 16, en la que dicho compresor incluye además un retardo en cada una de las salidas de la red y en la que el control para el compresor mira hacia el futuro con el fin de controlar silábicamente la ganancia del compresor.
19. Una red de acuerdo con la reivindicación 16, en la que dichos atenuadores de nivel de amplitud fijo y dichos amplificadores de refuerzo de nivel de amplitud variable tienen características que dependen de la frecuencia.
20. Una red de acuerdo con la reivindicación 19, en la que las características que dependen de la frecuencia de dichos atenuadores de nivel de amplitud fijo y dichos amplificadores de refuerzo de nivel de amplitud variable funcionan solamente desde frecuencias medias hasta bajas.
21. Una red de acuerdo con la reivindicación 16, en la que dichos atenuadores de nivel de amplitud fijo y dichos amplificadores de refuerzo de nivel de amplitud variable tienen características independientes de la frecuencia.
22. Una red de acuerdo con una cualquiera de las reivindicaciones 3, 4, 5, 7 ó 13 en la que dicha red de cancelación de la diafonía acústica es una red de 2 x 2 puertos para hacer corresponder dos canales originales de audio M a dos canales de presentación de audio N aplicados a un par de transductores que tienen posiciones relativas con respecto a las direcciones de los canales originales de audio M, teniendo el oyente dos posiciones de escucha P, el oído izquierdo y el oído derecho del oyente, con respecto a los transductores, en la que la red comprende además
dos combinadores de señales, un primer combinador de señales y un segundo combinador de señales, teniendo cada combinador de señales al menos dos entradas y una salida, en la que
una de dichas N entradas está conectada a una entrada de dicho primer combinador de señales y otra de dichas N entradas está conectada a una entrada de dicho segundo combinador de señales, y
una de dichas N salidas está conectada a la salida de dicho primer combinador de señales y otra de dichas salidas está conectada a la salida de dicho segundo combinador de señales, y
dos caminos de realimentación de señales, un primer camino de realimentación de señales y un segundo camino de realimentación de señales, teniendo cada camino de realimentación un retardo y características dependientes de la frecuencia, y teniendo cada camino de realimentación una entrada y una salida, en la que
la entrada de dicho primer camino de realimentación de señales está conectada a la salida de dicho primer combinador de señales y la salida de dicho primer camino de realimentación de señales está conectada a la otra entrada de dicho segundo combinador de señales,
la entrada de dicho segundo camino de realimentación de señales está conectada a la salida de dicho segundo combinador de señales y la salida de dicho segundo camino de realimentación de señales está conectada a la otra entrada de dicho primer combinador de señales,
cada uno de dichos caminos de realimentación tiene un retardo que representa el tiempo adicional que necesita el sonido para propagarse a lo largo del camino acústico entre un transductor y el oído del oyente más alejado de dicho transductor con respecto al tiempo que necesita el sonido para propagarse a lo largo del camino acústico entre el mismo transductor y el oído del oyente más cercano a dicho mismo transductor, y
cada uno de dichos caminos de realimentación tiene una característica que depende de la frecuencia que representa la diferencia en la atenuación en el camino acústico entre un transductor y el oído del oyente más alejado de dicho transductor y la atenuación en el camino acústico entre el mismo transductor y el oído del oyente más cercano a dicho mismo transductor, y
teniendo dichos combinadores de señales, dichos caminos de realimentación de señales y dichas conexiones entre ellos características de polaridad de forma que las señales procesadas por un camino de realimentación se combinan restándose a las señales introducidas en la otra entrada del respectivo combinador de señales.
23. Una red de acuerdo con la reivindicación 22, en la que dichos canales de presentación se aplican a un par de transductores, generalmente dispuestos enfrente de y en posiciones sustancialmente simétricas a la izquierda y a la derecha con respecto a un oyente.
24. La red de la reivindicación 23, en la que la característica dependiente de la frecuencia es una característica de filtro tipo pendiente paso bajo.
25. La red de la reivindicación 24, en la que la característica de filtro en pendiente paso bajo es una característica de filtro tipo pendiente paso bajo de primer orden.
26. La red de la reivindicación 25, en la que la característica de filtro tipo pendiente paso bajo de primer orden se implementa por medio de un filtro IIR o una combinación de filtros FIR/IIR.
27. La red de la reivindicación 25, en la que la característica de filtro en pendiente paso bajo tiene un primer punto de inflexión a aproximadamente 2.000 Hz y un segundo punto de inflexión a aproximadamente 4.370 kHz cuando las salidas del aparato de procesamiento de la señal de audio son para aplicación a un par de transductores dispuestos aproximadamente a 15 grados.
28. La red de la reivindicación 25, en la que la característica de filtro en pendiente paso bajo tiene un primer punto de inflexión a aproximadamente 1.600 Hz y un segundo punto de inflexión a aproximadamente 4.150 kHz cuando las salidas de la red son para aplicación a un par de transductores dispuestos aproximadamente a 20 grados.
29. La red de la reivindicación 23, en la que la atenuación en el camino acústico entre un transductor y el oído del oyente más alejado del transductor se determina obteniendo la diferencia entre la respuesta de transferencia del oído desde un transductor al oído del oyente más alejado del transductor y la respuesta de transferencia del oído desde el otro transductor al oído del oyente más cercano al otro transductor y aplanando la diferencia.
ES98908769T 1997-03-14 1998-02-26 Descodificacion de audio multifuncional. Expired - Lifetime ES2249823T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/819,582 US6449368B1 (en) 1997-03-14 1997-03-14 Multidirectional audio decoding
US819582 1997-03-14

Publications (1)

Publication Number Publication Date
ES2249823T3 true ES2249823T3 (es) 2006-04-01

Family

ID=25228541

Family Applications (1)

Application Number Title Priority Date Filing Date
ES98908769T Expired - Lifetime ES2249823T3 (es) 1997-03-14 1998-02-26 Descodificacion de audio multifuncional.

Country Status (11)

Country Link
US (1) US6449368B1 (es)
EP (1) EP0966865B1 (es)
JP (1) JP2001516537A (es)
KR (1) KR100591008B1 (es)
AT (1) ATE311733T1 (es)
AU (1) AU747377B2 (es)
CA (1) CA2283838C (es)
DE (1) DE69832595T2 (es)
DK (1) DK0966865T3 (es)
ES (1) ES2249823T3 (es)
WO (1) WO1998042162A2 (es)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1025743T3 (da) * 1997-09-16 2013-08-05 Dolby Lab Licensing Corp Anvendelse af filtereffekter i stereohovedtelefoner for at forbedre den rumlige opfattelse af en kilde rundt om en lytter
DE19847689B4 (de) * 1998-10-15 2013-07-11 Samsung Electronics Co., Ltd. Vorrichtung und Verfahren zur dreidimensionalen Tonwiedergabe
EP1091615B1 (en) * 1999-10-07 2003-01-08 Zlatan Ribic Method and apparatus for picking up sound
US7369665B1 (en) 2000-08-23 2008-05-06 Nintendo Co., Ltd. Method and apparatus for mixing sound signals
AUPR061800A0 (en) * 2000-10-09 2000-11-02 Lake Technology Limited Authoring system
EP1251717A1 (fr) * 2001-04-17 2002-10-23 Yellowknife A.V.V. Procédé et circuit pour l'écoute au casque d'un enrégistrement audio
US6804565B2 (en) 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
KR100392449B1 (ko) * 2001-07-16 2003-07-23 삼성전자주식회사 디지털tv신호의 재생시스템 및 그 재생방법
JP4097426B2 (ja) * 2001-12-07 2008-06-11 日本ビクター株式会社 位相変換サラウンド回路
TWI230024B (en) * 2001-12-18 2005-03-21 Dolby Lab Licensing Corp Method and audio apparatus for improving spatial perception of multiple sound channels when reproduced by two loudspeakers
US20030202665A1 (en) * 2002-04-24 2003-10-30 Bo-Ting Lin Implementation method of 3D audio
US7567845B1 (en) * 2002-06-04 2009-07-28 Creative Technology Ltd Ambience generation for stereo signals
US7072726B2 (en) * 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
US7290057B2 (en) 2002-08-20 2007-10-30 Microsoft Corporation Media streaming of web content data
KR100541478B1 (ko) * 2002-09-06 2006-01-10 엘지전자 주식회사 휴대폰 음장 제어장치 및 방법
JP4627973B2 (ja) * 2003-07-29 2011-02-09 富士通テン株式会社 スピーカ装置
US8054980B2 (en) * 2003-09-05 2011-11-08 Stmicroelectronics Asia Pacific Pte, Ltd. Apparatus and method for rendering audio information to virtualize speakers in an audio system
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7970144B1 (en) 2003-12-17 2011-06-28 Creative Technology Ltd Extracting and modifying a panned source for enhancement and upmix of audio signals
KR20050060789A (ko) * 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
KR101086398B1 (ko) * 2003-12-24 2011-11-25 삼성전자주식회사 다수의 마이크로폰을 이용한 지향성 제어 가능 스피커시스템 및 그 방법
JP2006319801A (ja) * 2005-05-13 2006-11-24 Pioneer Electronic Corp バーチャルサラウンドデコーダ装置
JP2006319802A (ja) * 2005-05-13 2006-11-24 Pioneer Electronic Corp バーチャルサラウンドデコーダ装置
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1915818A1 (en) * 2005-07-29 2008-04-30 Harman International Industries, Incorporated Audio tuning system
KR100739776B1 (ko) 2005-09-22 2007-07-13 삼성전자주식회사 입체 음향 생성 방법 및 장치
KR100636248B1 (ko) * 2005-09-26 2006-10-19 삼성전자주식회사 보컬 제거 장치 및 방법
KR100739762B1 (ko) 2005-09-26 2007-07-13 삼성전자주식회사 크로스토크 제거 장치 및 그를 적용한 입체 음향 생성 시스템
US8411869B2 (en) * 2006-01-19 2013-04-02 Lg Electronics Inc. Method and apparatus for processing a media signal
KR100878816B1 (ko) 2006-02-07 2009-01-14 엘지전자 주식회사 부호화/복호화 장치 및 방법
KR20090054412A (ko) * 2006-09-28 2009-05-29 파나소닉 주식회사 파형등화장치
US8805743B2 (en) * 2006-12-27 2014-08-12 International Business Machines Corporation Tracking, distribution and management of apportionable licenses granted for distributed software products
US7953233B2 (en) * 2007-03-20 2011-05-31 National Semiconductor Corporation Synchronous detection and calibration system and method for differential acoustic sensors
US8229143B2 (en) * 2007-05-07 2012-07-24 Sunil Bharitkar Stereo expansion with binaural modeling
US7948862B2 (en) * 2007-09-26 2011-05-24 Solarflare Communications, Inc. Crosstalk cancellation using sliding filters
US20090086982A1 (en) * 2007-09-28 2009-04-02 Qualcomm Incorporated Crosstalk cancellation for closely spaced speakers
UA101542C2 (ru) * 2008-12-15 2013-04-10 Долби Лабораторис Лайсензин Корпорейшн Виртуализатор окружающего звука с динамическим сжатием диапазона и способ
CN102197662B (zh) * 2009-05-18 2014-04-23 哈曼国际工业有限公司 效率优化的音频系统
US8259960B2 (en) * 2009-09-11 2012-09-04 BSG Laboratory, LLC Phase layering apparatus and method for a complete audio signal
US8194869B2 (en) 2010-03-17 2012-06-05 Harman International Industries, Incorporated Audio power management system
US9107021B2 (en) * 2010-04-30 2015-08-11 Microsoft Technology Licensing, Llc Audio spatialization using reflective room model
US9351073B1 (en) * 2012-06-20 2016-05-24 Amazon Technologies, Inc. Enhanced stereo playback
US9277343B1 (en) 2012-06-20 2016-03-01 Amazon Technologies, Inc. Enhanced stereo playback with listener position tracking
US9271102B2 (en) * 2012-08-16 2016-02-23 Turtle Beach Corporation Multi-dimensional parametric audio system and method
US9560464B2 (en) 2014-11-25 2017-01-31 The Trustees Of Princeton University System and method for producing head-externalized 3D audio through headphones
US9830927B2 (en) * 2014-12-16 2017-11-28 Psyx Research, Inc. System and method for decorrelating audio data
MX367429B (es) * 2015-02-18 2019-08-21 Huawei Tech Co Ltd Un aparato de procesamiento de señal de audio y metodo para filtrar una señal de audio.
US9773491B2 (en) * 2015-09-16 2017-09-26 Bose Corporation Estimating secondary path magnitude in active noise control
US9923550B2 (en) 2015-09-16 2018-03-20 Bose Corporation Estimating secondary path phase in active noise control
US9756423B2 (en) * 2015-09-16 2017-09-05 Océ-Technologies B.V. Method for removing electric crosstalk
JP6454916B2 (ja) * 2017-03-28 2019-01-23 本田技研工業株式会社 音声処理装置、音声処理方法及びプログラム
US10771896B2 (en) 2017-04-14 2020-09-08 Hewlett-Packard Development Company, L.P. Crosstalk cancellation for speaker-based spatial rendering
JP2022504233A (ja) 2018-10-05 2022-01-13 マジック リープ, インコーポレイテッド 両耳オーディオレンダリングのための両耳間時間差クロスフェーダ
US11246001B2 (en) * 2020-04-23 2022-02-08 Thx Ltd. Acoustic crosstalk cancellation and virtual speakers techniques

Family Cites Families (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE25652E (en) * 1964-10-06 Sound reproducing apparatus
GB394325A (en) 1931-12-14 1933-06-14 Alan Dower Blumlein Improvements in and relating to sound-transmission, sound-recording and sound-reproducing systems
GB781186A (en) 1954-08-18 1957-08-14 Emi Ltd Improvements in or relating to electrical sound transmission systems
GB871992A (en) 1956-10-13 1961-07-05 Emi Ltd Improvements relating to stereophonic sound transmission systems
US3249696A (en) 1961-10-16 1966-05-03 Zenith Radio Corp Simplified extended stereo
US3219757A (en) 1962-08-06 1965-11-23 Gen Electric Sound reproduction from monaural information
US3238304A (en) 1962-09-24 1966-03-01 Victor Company Of Japan Stereophonic effect emphasizing system
US3236949A (en) 1962-11-19 1966-02-22 Bell Telephone Labor Inc Apparent sound source translator
US3170991A (en) 1963-11-27 1965-02-23 Glasgal Ralph System for stereo separation ratio control, elimination of cross-talk and the like
US3892624A (en) 1970-02-03 1975-07-01 Sony Corp Stereophonic sound reproducing system
US4060696A (en) * 1975-06-20 1977-11-29 Victor Company Of Japan, Limited Binaural four-channel stereophony
AT338011B (de) 1975-09-30 1977-07-25 Akg Akustische Kino Geraete Anordnung zur drahtlosen ubertragung von niederfrequenzsignalen
US4118599A (en) 1976-02-27 1978-10-03 Victor Company Of Japan, Limited Stereophonic sound reproduction system
JPS52125301A (en) 1976-04-13 1977-10-21 Victor Co Of Japan Ltd Signal processing circuit
DE2736558A1 (de) 1976-08-17 1978-02-23 Novanex Automation Nv Phasenstereosystem
US4159397A (en) 1977-05-08 1979-06-26 Victor Company Of Japan, Limited Acoustic translation of quadraphonic signals for two- and four-speaker sound reproduction
US4209665A (en) 1977-08-29 1980-06-24 Victor Company Of Japan, Limited Audio signal translation for loudspeaker and headphone sound reproduction
JPS5832840B2 (ja) 1977-09-10 1983-07-15 日本ビクター株式会社 立体音場拡大装置
JPS5442102A (en) 1977-09-10 1979-04-03 Victor Co Of Japan Ltd Stereo reproduction system
US4218585A (en) 1979-04-05 1980-08-19 Carver R W Dimensional sound producing apparatus and method
US4309570A (en) 1979-04-05 1982-01-05 Carver R W Dimensional sound recording and apparatus and method for producing the same
US4603429A (en) 1979-04-05 1986-07-29 Carver R W Dimensional sound recording and apparatus and method for producing the same
US4388494A (en) 1980-01-12 1983-06-14 Schoene Peter Process and apparatus for improved dummy head stereophonic reproduction
US4356349A (en) 1980-03-12 1982-10-26 Trod Nossel Recording Studios, Inc. Acoustic image enhancing method and apparatus
JPS575500A (en) 1980-06-12 1982-01-12 Mitsubishi Electric Corp Acoustic reproducing device
JPS57104400A (en) 1980-12-19 1982-06-29 Matsushita Electric Ind Co Ltd 4 channel stereo device
US4567607A (en) 1983-05-03 1986-01-28 Stereo Concepts, Inc. Stereo image recovery
NL8303945A (nl) 1983-11-17 1985-06-17 Philips Nv Inrichting voor het realiseren van een pseudo-stereo signaal.
US4661851A (en) * 1984-03-27 1987-04-28 Rca Corporation Apparatus for reducing the effect of noise interference in audio companding system
US4706287A (en) 1984-10-17 1987-11-10 Kintek, Inc. Stereo generator
US4700389A (en) 1985-02-15 1987-10-13 Pioneer Electronic Corporation Stereo sound field enlarging circuit
IT1185876B (it) 1985-08-09 1987-11-18 Sgs Microelettronica Spa Sistema di espansione della base stereo per apparati di diffusione acustica stereofonica
IT1185706B (it) 1985-09-12 1987-11-12 Sgs Microelettronica Spa Sistema non recursivo di espansione della base stereo per apparati di diffusione acustica stereofonica
US5056149A (en) 1987-03-10 1991-10-08 Broadie Richard G Monaural to stereophonic sound translation process and apparatus
JPS63224599A (ja) 1987-03-13 1988-09-19 Asa Plan:Kk ステレオ処理装置
US5034983A (en) 1987-10-15 1991-07-23 Cooper Duane H Head diffraction compensated stereo system
US4893342A (en) 1987-10-15 1990-01-09 Cooper Duane H Head diffraction compensated stereo system
US4975954A (en) 1987-10-15 1990-12-04 Cooper Duane H Head diffraction compensated stereo system with optimal equalization
US4910779A (en) 1987-10-15 1990-03-20 Cooper Duane H Head diffraction compensated stereo system with optimal equalization
US5136651A (en) 1987-10-15 1992-08-04 Cooper Duane H Head diffraction compensated stereo system
US4910778A (en) 1987-10-16 1990-03-20 Barton Geoffrey J Signal enhancement processor for stereo system
EP0434691B1 (en) 1988-07-08 1995-03-22 Adaptive Audio Limited Improvements in or relating to sound reproduction systems
FI111789B (fi) 1989-01-10 2003-09-15 Nintendo Co Ltd Elektroninen pelilaite, jossa on mahdollisuus pseudostereofoniseen äänen kehittämiseen
US5095507A (en) 1990-07-24 1992-03-10 Lowe Danny D Method and apparatus for generating incoherent multiples of a monaural input signal for sound image placement
JPH07105999B2 (ja) 1990-10-11 1995-11-13 ヤマハ株式会社 音像定位装置
US5208493A (en) 1991-04-30 1993-05-04 Thomson Consumer Electronics, Inc. Stereo expansion selection switch
JPH05191896A (ja) 1992-01-13 1993-07-30 Pioneer Electron Corp 擬似ステレオ装置
JPH05191899A (ja) 1992-01-16 1993-07-30 Pioneer Electron Corp ステレオサラウンド装置
US5173944A (en) 1992-01-29 1992-12-22 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Head related transfer function pseudo-stereophony
EP0553832B1 (en) 1992-01-30 1998-07-08 Matsushita Electric Industrial Co., Ltd. Sound field controller
DE69322805T2 (de) * 1992-04-03 1999-08-26 Yamaha Corp. Verfahren zur Steuerung von Tonquellenposition
US5420929A (en) 1992-05-26 1995-05-30 Ford Motor Company Signal processor for sound image enhancement
JP3565846B2 (ja) 1992-07-06 2004-09-15 アダプティブ オーディオ リミテッド 適応音響システム及び音再生システム
US5440639A (en) 1992-10-14 1995-08-08 Yamaha Corporation Sound localization control apparatus
US5319713A (en) 1992-11-12 1994-06-07 Rocktron Corporation Multi dimensional sound circuit
JPH06165296A (ja) 1992-11-18 1994-06-10 Matsushita Electric Ind Co Ltd 音場信号再生装置
US5598478A (en) * 1992-12-18 1997-01-28 Victor Company Of Japan, Ltd. Sound image localization control apparatus
JP2886402B2 (ja) 1992-12-22 1999-04-26 株式会社河合楽器製作所 ステレオ信号発生装置
JP2897586B2 (ja) 1993-03-05 1999-05-31 ヤマハ株式会社 音場制御装置
EP0637191B1 (en) * 1993-07-30 2003-10-22 Victor Company Of Japan, Ltd. Surround signal processing apparatus
DE4326811A1 (de) 1993-08-10 1995-02-16 Philips Patentverwaltung Schaltungsanordnung zum Umwandeln eines Stereosignals
US5438623A (en) * 1993-10-04 1995-08-01 The United States Of America As Represented By The Administrator Of National Aeronautics And Space Administration Multi-channel spatialization system for audio signals
KR0135850B1 (ko) 1993-11-18 1998-05-15 김광호 음성재생장치
US5517570A (en) 1993-12-14 1996-05-14 Taylor Group Of Companies, Inc. Sound reproducing array processor system
BE1008027A3 (nl) 1994-01-17 1995-12-12 Philips Electronics Nv Signaalcombinatieschakeling, signaalbewerkingsschakeling voorzien van de signaalcombinatieschakeling, stereofonische audioweergave-inrichting voorzien de signaalbewerkingsschakeling, alsmede een audio-visuele weergave-inrichting voorzien van de stereofonische audioweergave-inrichting.
US5436975A (en) 1994-02-02 1995-07-25 Qsound Ltd. Apparatus for cross fading out of the head sound locations
US5659619A (en) 1994-05-11 1997-08-19 Aureal Semiconductor, Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
JP2944424B2 (ja) 1994-06-16 1999-09-06 三洋電機株式会社 音響再生回路
JPH0819100A (ja) 1994-07-01 1996-01-19 Matsushita Electric Ind Co Ltd サラウンドステレオ
US5533129A (en) 1994-08-24 1996-07-02 Gefvert; Herbert I. Multi-dimensional sound reproduction system
GB9417185D0 (en) * 1994-08-25 1994-10-12 Adaptive Audio Ltd Sounds recording and reproduction systems
JP3500746B2 (ja) 1994-12-21 2004-02-23 松下電器産業株式会社 音像定位装置及びフィルタ設定方法
US5844993A (en) 1995-01-25 1998-12-01 Victor Company Of Japan, Ltd. Surround signal processing apparatus
US5889867A (en) * 1996-09-18 1999-03-30 Bauck; Jerald L. Stereophonic Reformatter

Also Published As

Publication number Publication date
CA2283838C (en) 2006-01-24
ATE311733T1 (de) 2005-12-15
WO1998042162A2 (en) 1998-09-24
CA2283838A1 (en) 1998-09-24
EP0966865B1 (en) 2005-11-30
JP2001516537A (ja) 2001-09-25
DE69832595T2 (de) 2006-08-10
DE69832595D1 (de) 2006-01-05
EP0966865A2 (en) 1999-12-29
DK0966865T3 (da) 2006-03-27
KR100591008B1 (ko) 2006-06-22
AU6671798A (en) 1998-10-12
WO1998042162A3 (en) 1998-12-03
AU747377B2 (en) 2002-05-16
KR20000075880A (ko) 2000-12-26
US6449368B1 (en) 2002-09-10

Similar Documents

Publication Publication Date Title
ES2249823T3 (es) Descodificacion de audio multifuncional.
JP4732807B2 (ja) オーディオ信号処理
TWI489887B (zh) 用於喇叭或耳機播放之虛擬音訊處理技術
CA2744459C (en) Surround sound virtualizer and method with dynamic range compression
US6937737B2 (en) Multi-channel audio surround sound from front located loudspeakers
US8442237B2 (en) Apparatus and method of reproducing virtual sound of two channels
US8477951B2 (en) Front surround system and method of reproducing sound using psychoacoustic models
KR100626233B1 (ko) 스테레오 확장 네트워크에서의 출력의 등화
KR100608025B1 (ko) 2채널 헤드폰용 입체 음향 생성 방법 및 장치
KR20050119605A (ko) 7.1 채널 오디오 재생 방법 및 장치
US5844993A (en) Surround signal processing apparatus
EP2229012B1 (en) Device, method, program, and system for canceling crosstalk when reproducing sound through plurality of speakers arranged around listener
US8817997B2 (en) Stereophonic sound output apparatus and early reflection generation method thereof
JP2956545B2 (ja) 音場制御装置
NL1032538C2 (nl) Apparaat en werkwijze voor het reproduceren van virtueel geluid van twee kanalen.
JP2002291100A (ja) オーディオ信号再生方法、及びパッケージメディア
KR100641454B1 (ko) 오디오 시스템의 크로스토크 제거 장치
EP1212923B1 (en) Method and apparatus for generating a second audio signal from a first audio signal
CN114363793B (zh) 双声道音频转换为虚拟环绕5.1声道音频的系统及方法
JP2007202020A (ja) 音声信号処理装置、音声信号処理方法、プログラム
KR20050060552A (ko) 입체 음향 시스템 및 입체 음향 구현 방법
WO2024081957A1 (en) Binaural externalization processing
JP2006042316A (ja) 音像上方拡大回路
JP2003125500A (ja) マルチチャンネル再生装置