ES2269137T3 - Cancelacion del eco acustico. - Google Patents

Cancelacion del eco acustico. Download PDF

Info

Publication number
ES2269137T3
ES2269137T3 ES00927602T ES00927602T ES2269137T3 ES 2269137 T3 ES2269137 T3 ES 2269137T3 ES 00927602 T ES00927602 T ES 00927602T ES 00927602 T ES00927602 T ES 00927602T ES 2269137 T3 ES2269137 T3 ES 2269137T3
Authority
ES
Spain
Prior art keywords
echo
signal
estimate
hat
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00927602T
Other languages
English (en)
Inventor
Martin University of Essex REED
Malcolm John University of Essex HAWKSFORD
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Telecommunications PLC
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Application granted granted Critical
Publication of ES2269137T3 publication Critical patent/ES2269137T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

Procedimiento de cancelación del eco acústico para una señal espacializada orientada de canal múltiple, estando generada la señal espacializada orientada a partir de una entrada de señal (12) modificada según las funciones de ganancia de espacialización (g1, g2) respectivas para generar una pluralidad de canales de audio (x1(t), x2(t)), utilizando el proceso de cancelación de eco una espacialización y una estimación de los trayectos de eco combinadas (h1, h2), desviándose la estimación a partir de las funciones de ganancia aplicadas a los canales respectivos, con lo cual, cuando cambian las funciones de ganancia aplicadas a los canales respectivos, se genera una estimación (h1, h2) de los trayectos de eco (h1, h2), basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia (g1, g2), utilizándose las estimaciones de los trayectos de eco (h1, h2) para generar una señal de cancelación de eco e(t).

Description

Cancelación del eco acústico.
La presente invención se refiere a un procedimiento para la cancelación del eco acústico de canal múltiple (AEC) aplicable a sistemas que derivan una señal multicanal espacializada a partir de una señal monofónica, cada canal de la cual se aplica a un elemento respectivo de una serie de altavoces a diferentes ganancias para proporcionar la percepción o ilusión audible de direccionalidad. Esta clase de señal espacializada se denominará en este documento mono orientado. Un sistema mono orientado utiliza dos o más elementos de ganancia para representar la espacialización, que se representa en un procesador panorámico para generar las salidas de altavoz correspondientes. En las formas de realización que se describirán se utiliza una señal estereofónica de dos canales, con dos altavoces - un sistema conocido como "estéreo a partir de mono orientado" (SSM), pero los principios de la invención pueden aplicarse a sistemas con más de dos canales. La invención tiene aplicación en sistemas de teleconferencia en los cuales se proporciona a la voz de cada interlocutor posicionamiento espacial en provecho del oyente.
En el caso de una comunicación de voz cómoda en un sistema de teleconferencia que utiliza un altavoz y un micrófono, a diferencia del casco con auriculares, se necesita un procedimiento de cancelación del eco acústico (AEC). Para sistemas monofónicos puede utilizarse la topología que muestra la figura 1, con diversos procesos adaptativos diferentes como por ejemplo el de mínimos cuadráticos medios (LMS), mínimos cuadrados recursivos (RLS) o proyección rápida afín (FAP). No obstante, en el caso de sistema estereofónicos y de canal múltiple, las soluciones existentes están mucho menos avanzadas y todavía presentan obstáculos importantes que deben superarse. El ejemplo de la figura 2 muestra que en el caso de un sistema estereofónico hay dos trayectos de eco, h_{1} y h_{2} (que comprenden las respuestas de impulso del micrófono y el altavoz), en comparación con el trayecto único en el caso del sistema monofónico. (Se supone que se utiliza un solo micrófono, como ocurre generalmente cuando la espacialización debe crearse artificialmente. Más generalmente, el número de trayectos de eco es el producto del número de altavoces por el número de micrófonos).
Las soluciones existentes para el problema de cancelación del eco acústico generalmente presentan la disposición del sistema que muestra la figura 2, en la cual las respuestas del trayecto de la persona que habla al micrófono son desconocidas. El objetivo del proceso adaptativo en el cancelador de eco es utilizar las señales x_{1}(t), x_{2}(t) y e(t) para entrenar los filtros adaptativos \hat{h}_{1} y \hat{h}_{2} para que
(1)e(t) \rightarrow 0
Con los procesos existentes de filtro adaptativo no es posible alcanzar un ajuste convergente de los filtros como por ejemplo
(2)h_{1} = \hat{h}_{1}\ y\ h_{2} = \hat{h}_{2}
En lugar de ello, se obtiene una solución convergente como la siguiente
(3)h_{1} * g_{1} + h_{2} * g_{2} = \hat{h}_{1} * g_{1} + \hat{h}_{2} * g_{2}
en la que * es el operador de convolución. Debe tenerse en cuenta que la ecuación (3) satisface la ecuación (1), pero la ecuación (2) no es la única solución para la ecuación (3), por lo tanto los valores de h_{1} y h_{2} no pueden derivarse de este resultado.
Si los filtros g_{1} o g_{2} cambian, posiblemente debido al movimiento de la persona que habla, la igualdad de la ecuación (3) ya no se mantiene (a no ser que también se cumpla la ecuación (2)). Por lo tanto, el cancelador de eco ya no produce una solución convergente y el eco que oye la persona que habla aumenta de nivel.
Se han propuesto diversas soluciones para este problema, que consisten en manipular las señales del altavoz x_{1} y x_{2}, o en utilizar las propiedades de la señales x_{1} y x_{2}. El propósito de estas soluciones es utilizar las propiedades de correlación mutua de las dos señales, ya que puede demostrarse que existe una solución a la ecuación (2) cuando las dos señales se encuentran suficientemente descorrelacionadas. No obstante, al estar, en un sistema de teleconferencia las señales x_{1} y x_{2}, inherentemente correlacionadas, las técnicas que aprovechan las pequeñas características descorrelacionadas de las señales presentan un bajo rendimiento, excepto en condiciones ideales.
Se ha propuesto añadir una pequeña cantidad de ruido blanco independiente a las señales x_{1} y x_{2}. Introduciendo alguna señal descorrelacionada, se ha comprobado que esto contribuye significativamente a la convergencia de la solución hacia la presentada en la Ecuación (2). No obstante, aunque añadir ruido de este modo mejorar la convergencia, el ruido debe añadirse a un nivel tal que resulta indeseablemente audible.
Un artículo titulado "A Multichannel Affine projection Algorithm With Applications To Multichannel Accoustic Echo Cancellation" de Benesty et al en "IEEE Signal Processing Letters", vol. 3, nº 2, páginas 36-37, publicado en 1996 por la IEEE Signal Processing Society describe un sistema de supresión de eco multicanal que alimenta los respectivos canales con filtros adaptativos correspondientes, pero no tiene en cuenta los factores de ganancia de los respectivos canales.
Según la presente invención, se dispone un procedimiento de cancelación de eco acústico para una señal espacializada orientada de canal múltiple generada a partir de una entrada de señal modificada según las funciones de ganancia de espacialización respectivas para generar una pluralidad de canales de audio, utilizando el proceso de cancelación de eco una espacialización y una estimación de los trayectos de eco combinadas, calculándose la estimación a partir de las funciones de ganancia aplicadas a los canales respectivos, con lo cual, cuando cambian las funciones de ganancia aplicadas a los canales respectivos, se genera una estimación de los trayectos de eco, basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia, utilizándose la estimación de los trayectos de eco para generar una señal de cancelación de eco.
Según otro aspecto de la presente invención, se dispone un aparato para cancelación del eco acústico en un sistema de audio espacializado orientado de canal múltiple, en el que el sistema de audio espacializado comprende:
unos medios de entrada de señal para recibir una señal de audio,
una pluralidad de medios de salida de audio para generar señales acústicas derivadas de la señal de audio;
unos medios de control asociados con los medios de salida de audio para generar entradas de control de ganancia que controlan los medios de salida de audio de manera que dicha pluralidad de medios de salida de audio generan una versión espacializada de la señal de audio;
unos medios de entrada de audio para detectar señales acústicas;
unos medios de salida de señales para transmitir una señal derivada de las señales acústicas detectadas por los medios de entrada de audio;
unos medios de estimación de trayectos de eco que comprenden unos medios de detección para identificar cambios en las funciones de ganancia de los medios de control respectivos, y medios de estimación para generar una estimación del trayecto de eco entre los medios de salida acústica y los medios de entrada acústica, basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia detectadas por los medios de detección;
unos medios de generación de señales de cancelación de eco para generar una señal de cancelación de eco derivada de las señales de audio espacializadas generadas por los medios de control y la estimación derivada por los medios de estimación del trayecto de eco, y
unos medios de combinación de señales para aplicar la señal de cancelación de eco a la señal generada por los medios de entrada de audio.
La presente invención es una adaptación del proceso LMS monofónico. La invención evita actualizaciones múltiples de dos o más estimaciones de trayectos de eco, tales como \hat{h}_{1} y \hat{h}_{2}, y reduce el número de operaciones de filtración requeridas en comparación con los procesos de cancelación de eco estéreo existentes, tales como \hat{h}_{1} * x_{1} y \hat{h}_{2} * x_{2}. Adicionalmente, la invención utiliza los parámetros de espacialización en el proceso adaptativo, a diferencia de los procesos de cancelación de eco existentes. La actualización del LMS se modifica para tomar en consideración los parámetros de espacialización que se utilizan para actualizar la estimación del trayecto de eco agregado cada vez que cambia la espacialización. Después de cambiar la espacialización N, (donde N es el número de canales del sistema), la estimación del trayecto de eco agregado converge con el trayecto de eco agregado para futuros cambios en las espacialización. Antes del cambio N de la espacialización. el proceso converge hacia una solución local para la estimación del trayecto de eco agregado, de modo que sigue existiendo alguna reducción de la señal de eco en el estadio de aprendizaje del proceso.
El estadio de aprendizaje puede ser parte de una fase de preparación del sistema antes de la utilización del mismo en funcionamiento operativo. Por ejemplo, el número requerido de cambios de espacialización puede alcanzarse operando el proceso LMS monofónico para cada canal sucesivamente, ajustando las ganancias de los demás canales a cero.
A continuación se describe, a título de ejemplo, una forma de realización de la invención considerada conjuntamente con las figuras en las cuales
la figura 1 ilustra los principios de la cancelación de eco monofónico,
la figura 2 ilustra los principios básicos de la cancelación de eco estereofónico, (sólo se muestra la mitad del trayecto de retorno)
la figura 3 ilustra una forma de realización de la invención,
la figura 4 ilustra un sistema teórico equivalente al de la figura 3,
la figura 5 es una ilustración gráfica del error medio del sistema que muestra la figura 3 comparando sistemas anteriores con el de la invención,
la figura 6 ilustra el descenso a lo largo del tiempo del desajuste de las estimaciones de trayecto erróneas \hat{h}_{1} y \hat{h}_{2} utilizando el procedimiento según la invención.
la figura 7 es un diagrama de flujo que muestra el proceso de actualización de la forma de realización preferida.
El sistema monofónico ilustrado en la figura 1 comprende un trayecto de entrada 12 conectado a la fuente (micrófono 11 y altavoz 10) de la señal original s(t). Esta señal s(t) se modifica mediante el trayecto de transmisión 12 para generar una señal de altavoz x(t) que se suministra al altavoz 13. El trayecto de retorno consiste en un micrófono 21, un trayecto de transmisión de retorno 22 y un altavoz 23. Entre el altavoz 13 de un trayecto y el micrófono 21 del otro trayecto existe un trayecto acústico h_{1}. Por lo tanto, algunos sonidos originados por la persona que habla 10 serán devueltos al altavoz 23 y oídos por la persona que habla 10 como eco. Este efecto puede resultar intrusivo, especialmente cuando los trayectos de transmisión 12, 22 pueden introducir retardos, de modo que se instala un procesador de cancelación de eco 24, 25, 26 para eliminar esta señal. Un procesador adaptativo 24 compara la señal e(t) que debe transmitirse por la vía de retorno 22 con la señal x(t) que llega por el trayecto de entrada 12 e identifica las correlaciones entre ellas. Esto se utiliza para controlar un banco de filtros adaptativos 25 para generar un vector \hat{h}_{1}. Este vector es una estimación del trayecto acústico h_{1}. Este vector se aplica a la señal de entrada x(t) mediante el filtro y el resultado se sustrae de la entrada y(t) del micrófono 21 en un combinador 26 para generar una señal de retorno e(t). Si el filtro adaptativo 25 genera una estimación \hat{h}_{1} exacta de la función h_{1}, la señal de eco y(t) debería ser anulada por la salida del filtro adaptativo 25 y e(t) debería ser cero. Por lo tanto, las únicas señales transmitidas por el trayecto de retorno 22 serán los sonidos generados cerca del micrófono 21 y no recibidos del altavoz 13.
La figura 2 ilustra un sistema estereofónico generalizado. La situación es similar a la de la figura 1, excepto porque en este caso se han dispuesto dos altavoces y dos micrófonos (indicados por los sufijos "L" y "R" en la figura 2) en cada extremo. Sólo se muestra un canal 22L del trayecto de retorno. Para cada trayecto de retorno 22L, (22R) existen dos estimaciones de trayecto de eco \hat{h}_{1L}, \hat{h}_{2L}, una para cada trayecto de ida 12_{L}, 12_{R}, porque cada micrófono 21L, (21R) es capaz de recibir retroalimentación acústica de ambos altavoces 13L, 13R. Debido a que los dos trayectos de ida 12_{L}, 12_{R} transportan señales de la misma fuente 10, existe una correlación significativa entre las dos estimaciones \hat{h}_{1L}, \hat{h}_{2L} y, por lo tanto, los procesos que generan los valores de los filtros adaptativos 25LL, 25RL no son independientes.
En el caso general que muestra la figura 2, las funciones originales g_{1}, g_{2} son desconocidas en el extremo receptor, siendo dependientes de las posiciones relativas de los micrófonos 11L, 11R y la persona que habla 10. Por lo tanto, no es posible calcular una solución única para \hat{h}_{1L}, \hat{h}_{2L}. Para una espacialización determinada, el procesador adaptativo 24L generará dos funciones adecuadas \hat{h}_{1L}, \hat{h}_{2L} para las cuales resulta válida la ecuación (3) anteriormente citada:
(3)h_{1} * g_{1} + h_{2} * g_{2} = \hat{h}_{1} * g_{1} + \hat{h}_{2} * g_{2}
pero esto no implica necesariamente que también pueda aplicarse la ecuación (2):
(2)h_{1} = \hat{h}_{1}\ y\ h_{2} = \hat{h}_{2}
Si la espacialización, y por lo tanto las funciones g_{1}, g_{2} cambian, se apreciará que los filtros adaptativos deben reiniciarse para corresponder a la nueva espacialización.
En un sistema orientado como el que ilustran las figura 3 y 4, se utiliza una fuente monofónica y las funciones g_{1}, g_{2} se convierten en valores escalares g_{1}, g_{2} que representan ganancia. Por consiguiente, sólo hay un trayecto de transmisión 12, 22 en cada dirección. La información de control, generada tanto en el extremo receptor como en el transmisor con la señal monofónica s(t), se utiliza para controlar los amplificadores de ganancia variable 14L, 14R para variar las funciones de ganancia g_{1}, g_{2} definiendo la espacialización en el extremo receptor, para emular una fuente estereofónica. El hecho de que las funciones de ganancia g_{1}, g_{2} sean conocidas en el extremo receptor permite utilizarlas en el procesador adaptativo 24, 25.
A continuación se describirá el funcionamiento del procesador adaptativo 24, 25 con referencia a la figura 7. La teoría matemática subyacente se describirá a continuación con referencia a las figuras 3 y 4.
Después de la etapa de inicialización 101, en la cual se ajustan valores nocionales para las funciones de ganancia g_{1}, g_{2}, el proceso se ejecuta en un bucle iterativo para cada periodo muestreado n del modo siguiente.
En primer lugar, se ajustan los valores k_{1}, k_{2}, k_{3} (etapa 102). Estos valores identifican los tres últimos períodos muestreados en los cuales han cambiado los valores de espacialización g_{1}, g_{2}. Si los valores de ganancia de espacialización g_{1}, g_{2} no han cambiado desde la muestra previa n-1 los valores de k_{1}, k_{2}, k_{3} son los mismos que para la muestra anterior. No obstante, si los valores han cambiado, k_{3} se ajusta al valor previo de k_{2}, k_{2} se ajusta al valor previo de k_{1}, y k_{1} se ajusta a n-1.
A continuación se determina la función de la ganancia estimada (etapa 103). Esta función es la matriz
1 Si los valores de espacialización g_{1}, g_{2} no han cambiado, esta matriz tampoco cambia y no es necesario volver a calcularla. A continuación se determina la inversa de esta matriz.
2
De nuevo, si los valores de espacialización g_{1}, g_{2} no han cambiado, esta matriz tampoco cambia y por lo tanto no es necesario volver a calcularla.
A continuación, (etapa 104), si r = n - k_{1} + 1 es inferior al número de términos L en el vector de trayecto de eco \hat{h} estimado (en otras palabras, si el número de muestras r transcurrido desde el último cambio de espacialización es inferior a L), se corrige un término del vector de trayecto de eco estimado \hat{h}_{n-1} como sigue
3
(siendo \hat{h}_{n-1} el caso específico de la función de trayecto de eco estimado \hat{h} de la iteración previa). Todos los demás términos \hat{h}_{n-1}(0)...\hat{h}_{n-1}(r-1) y \hat{h}_{n-1}(r+1)...\hat{h}_{n-1}(L-1) permanecen sin cambios.
A continuación se genera la señal de cancelación de error s_{n}^{T} \hat{h}_{n-1} (en la que s_{n} es el vector que representa las últimas muestras L de la señal de entrada s(n)), utilizando el vector de trayecto de eco estimado \hat{h}_{n-1} (etapa 105), y se sustrae de la señal y(n) para generar la señal de salida e(n).
El vector de trayecto de eco estimado \hat{h}_{n-1} se adapta, a continuación, como respuesta a la señal de eco e(n) (etapa 106) para utilizarlo en la siguiente iteración.
\hat{h}_{n} = \hat{h}_{n-1} + \mu s_{n} \varepsilon(n)
en la que \varepsilon(n) = s_{n}^{T}s_{n}e(n) y \mu es el tamaño de la etapa.
El progreso es estable a no ser que la espacialización cambie en una escala de tiempo superior al período L, y que 0 \leq \mu < 2.
La complejidad de cálculo de las etapas 105 y 106 del proceso anterior es la misma que la del proceso LMS normalizado, que es del orden de 2L. El número de cálculos es del orden de dos multiplicaciones y una división para la inversión de matriz utilizada en la etapa 103. Como que se realiza solamente una vez después de cada cambio de las espacialización, aumenta poco la complejidad del proceso para L grandes. La etapa 104 sólo se calcula en las L primeras muestras después de un cambio de la espacialización y es insignificante para las L grandes. Por lo tanto, cuando se utiliza el proceso mostrado anteriormente para la cancelación del eco acústico con un sistema orientado mono, para el cual es probable que L > 100, el proceso presenta una complejidad de aproximadamente 2L.
Sigue una descripción matemática, que se iniciará a partir del sistema mostrado en la figura 4 y a continuación procederá a mostrar que es equivalente al sistema según la invención mostrado en la figura 3 que utiliza una única estimación de trayecto de eco agregado.
Como muestra la figura 4, los dos trayectos de respuesta de impulso de micrófono 12L, 12R (figura 2) se sustituyen por dos respuestas de impulso generadas artificialmente g_{1} y g_{2} que actúan sobre una única señal de micrófono s(t) recibida a través del trayecto monofónico 12 para generar la percepción o ilusión de espacialización. En el caso de la solución presentada aquí, las funciones g_{1} y g_{2} se han simplificado todavía más representándolas como simples funciones de ganancia antes que como respuestas de impulso. Este sistema trabaja de un modo completamente diferente al del sistema anterior de la figura 2 ya que, antes que intentar descorrelacionar las señales x_{1} y x_{2} para ayudar a la convergencia, el procedimiento presentado aquí depende de la naturaleza inherentemente altamente correlacionada de las señales x_{1} y x_{2}. El procedimiento utiliza el conocimiento de las funciones g_{1} y g_{2} (que son desconocidas en los sistemas de la técnica anterior) para conseguir una cancelación de eco convergente. Antes de describir una solución de filtro adaptativo al problema del eco, se demostrará que existe una solución al problema.
Haciendo que la entrada al bloque de espacialización en el tiempo de muestra n esté representada por un vector de columna s_{n} = [s(n) s(n-1) ... s(n-(L-1))]^{T}, la entrada al micrófono del extremo del oyente esté representada por y_{n} = [y(n) y(n-1) ... y(n-(L-1))]^{T} y que los dos trayectos de eco del altavoz al micrófono sean los vectores L de columna h_{1} y h_{2} (que incorporan las respuestas de impulso del altavoz y el micrófono) de longitud L, entonces
(4)y_{n} = g_{1}(n)S_{n}h_{1} + g_{2}(n)S_{n}h_{2}
en la que la espacialización está representada como valores de ganancia g_{1}(n) y g_{2}(n) que son constantes a lo largo de los períodos de muestra n-(L-1) ... n, y S_{n} = [s_{n} ... s_{n-(L-1)}]^{T} (es una matriz de "Toeplitz", es decir, una matriz simétrica de orden L x L, que presenta los términos de s_{n} en la primera fila y la primera columna, los términos de s_{n-1} en la segunda fila y columna, y así sucesivamente). Puede apreciarse que h_{1} y h_{2} no pueden resolverse a partir de la ecuación (4).
No obstante, considerando ahora la utilización de un segundo conjunto de observaciones de entradas y salidas en un tiempo de muestra n + a, en la que a \geq L y
4
en otras palabras, las funciones g_{1} y g_{2} han cambiado entre el tiempo de muestra n y el tiempo de muestra n + 1, pero a continuación se han mantenido sin cambios entre el tiempo n + 1 y el tiempo de muestra n + a.
Por lo tanto,
5
en en la que I_{L} es la matriz de identidad L x L,
6
y \oplus es el producto de Kronecker. (El producto de Kronecker de dos matrices A y B se obtienen multiplicando la matriz B independientemente por cada término individual de la matriz A y formando una nueva matriz (cuyo orden es el producto de las dos matrices originales) con los términos resultantes).
La solución a la ecuación (6) es
7
y utilizando las identidades del producto de Kronecker
8
Por lo tanto existe una solución para h_{1} y h_{2} si la señal s excita persistentemente (es decir, presenta un contenido totalmente espectral) y la matriz G_{n\cdot n+a} es no singular, es decir, tiene una matriz inversa. La condición de no singular de la matriz G_{n\cdot n+a} se cumple si los valores de espacialización en los tiempos de muestra n y n+a son diferentes y no son múltiplos escalares uno de otro (es decir, g_{1} (n) / g_{2}(n) \neq g_{1}(n + a) / g_{2}(n + a). Idealmente, los valores deberían ser suficientemente diferentes para que la solución de la ecuación (9) presente las condiciones adecuadas.
Una vez establecido que existe una solución, a continuación se deriva del proceso LMS el proceso adaptativo para la solución. El proceso LMS normalizado (NLMS) se utiliza para efectuar la cancelación del eco monofónico, como se ha mencionado con referencia a la figura 1, utilizando las actualizaciones siguientes
(10)e(n) = y(n) - s^{T}_{n} \hat{h}_{n-1}
(11)\varepsilon(n) = s^{T}_{n}S_{n}e(n)
(12)\hat{h}_{n} = \hat{h}_{n-1} + \mu s_{n} \varepsilon(n)
en las que e(n) es la señal de eco, \mu es el parámetro de tamaño de la etapa y \hat{h}_{n} es la estimación del trayecto de eco en el caso de muestra n. Las ecuaciones anteriores del LMS normalizado pueden modificarse para el caso mono orientado utilizando una estimación de trayecto de eco agregado único y redefiniendo \hat{h}_{n-1} como
9
en la que \hat{h}_{1}(t) y \hat{h}_{2}(t) son funciones que representan las dos estimaciones de eco en el intervalo de muestra n. Similarmente se define h como la combinación de h_{1}(t) y h_{2}(t) en una forma equivalente a la que muestra la ecuación 13
10
La tarea consiste entonces en utilizar y actualizar \hat{h} de modo que las actualizaciones del LMS normalizado de las ecuaciones 10, 11 y 12 se utilizan para la cancelación de eco en vez de utilizar explícitamente dos estimaciones de trayecto de eco. Si los valores de g_{1}(n) y g_{2}(n) son constantes para todos los n, las actualizaciones de la ecuación 10, 11 y 12 pueden utilizarse sin cambios para determinar una estimación de h, cuando h es constante a lo largo del tiempo. No obstante, si g_{1}(n) y g_{2}(n) cambian a lo largo del tiempo, esta solución no puede utilizarse, ya que un cambio en h no se tiene en cuenta en las actualizaciones del LMS de las ecuaciones 10, 11 y 12.
Considerando tres épocas de muestra i, i-a e i-b donde
11
y similarmente para g_{2}(n), es decir, los valores de g_{1}(n) y g_{2}(n) cambian sólo en las épocas i-a e i-b.
Considerando que el valor del coeficiente j en el trayecto de eco combinado en las épocas i-a-1 e i-b-1 (es decir, justo antes de los cambios en la espacialización) que forman las ecuaciones 14 y 16 viene dado por
12
Las ecuaciones 17 y 18 pueden expresarse como
13
y por lo tanto
14
utilizando la definición de G de (7).
Además, considerando el valor del coeficiente j en el trayecto de eco combinado en la época i que, a partir de (14) y (16), viene dada por
\vskip1.000000\baselineskip
15
\vskip1.000000\baselineskip
Si los elementos de G^{-1} se definen mediante una variable \gamma tal como
\vskip1.000000\baselineskip
16
\vskip1.000000\baselineskip
a partir de (19), (21) y (22)
17
Esta ecuación es la actualización adicional requerida para la actualización del LMS normalizado de las ecuaciones (10), (11) y (12). Debe tenerse en cuenta que a partir de (21) sólo necesita actualizarse un coeficiente en h de cada período de muestra para tomar en consideración un cambio en la espacialización.
El proceso puede extenderse a un sistema que presenta más de dos canales efectuando una pequeña modificación para el proceso. Específicamente, para un sistema de N canales, los cambios previos N+1 en la posición de espacialización se registran en variables k_{N+1}, ..., k_{1} desde el menor al más reciente respectivamente. La matriz G se generaliza como
18
La etapa 104 puede generalizarse como
19
Las etapas 105 y 106 permanecen sin cambios.
Para demostrar el proceso descrito, tanto el proceso de mínimos cuadráticos medios normalizados estéreo según la presente invención como el de mínimos cuadráticos medios normalizados se simularon utilizando la configuración mostrada en la figura 3 y con trayectos de eco tomados de los trayectos micrófono/persona que habla reales medidos. La posición de espacialización se cambió cinco veces durante la simulación para comprobar la capacidad del proceso para adaptarse a la espacialización cambiante. La figura 5 muestra el error medio de conjunto en la cancelación del eco para una entrada de ruido blanco gausiano (GWN). Para la simulación, el parámetro de tamaño de etapa \mu era 0,1, la longitud del filtro era de L = 200, la velocidad de muestra era de 8 KHz y se añadió una señal de ruido de 40 dB debajo de la señal de entrada. La figura 5 muestra que inicialmente el proceso LMS normalizado (figura 5a) y el proceso LMS normalizado estéreo según la invención (figura 5b) presentan el mismo rendimiento hasta 40.000 muestras. Debe tenerse en cuenta que el error en ambos procesos se produce inicialmente cuando los filtros adaptativos convergen con el valor estático del vector de trayecto agregado h. No obstante, en 19.000 períodos de muestra la espacialización cambia, de modo que h cambia y por consiguiente el error aumenta de repente en ambos procesos. El proceso LMS normalizado (figura 5a) todavía no dispone de suficiente información para formar el vector de trayecto agregado correcto h, ya que necesita dos posiciones de espacialización para determinar los vectores de trayecto individuales h_{1} y h_{2}. No obstante, después de la segunda posición de espacialización, el procedimiento según la invención puede efectuar una estimación del valor del h cambiado. Esto puede observarse en la figura 5 cuando el error no aumenta después de la muestra 40.000 para la curva de error en b), a diferencia de lo que ocurre en el proceso LMS normalizado en a) que demuestra incrementos del error cada vez que cambia la espacialización.
También puede observarse el rendimiento del procedimiento según la invención para señales de voz en la figura 6, que muestra el desajuste en los dos vectores de trayecto de eco estimados \hat{h}_{1} y \hat{h}_{2}. Estos vectores no se calculan realmente de forma explícita en este proceso: no obstante, se utiliza una solución para ellos como parte de la espacialización. La ecuación 20 se utilizó para formar los gráficos que muestra la figura 6. Puede apreciarse que el desajuste desciende en uno de los filtros y aumenta en el otro a lo largo de la trayectoria de la primera posición de espacialización, que está situada entre las muestra 0 y 19.000. Esto se debe al hecho de que g_{1}(0) = 0,2 y g_{2}(0) = 0,8, lo cual significa que la mayor parte de la energía de señal se deriva del segundo trayecto de filtro, de modo que la estimación del filtro agregado \hat{h} tiende al segundo trayecto de filtro h_{2}. En este punto, no existe una información a priori que permita la solución verdadera de \hat{h}_{1} y \hat{h}_{2} No obstante, tan pronto como se inicia la segunda posición de espacialización en la muestra 19.000, el desajuste en \hat{h}_{1} y \hat{h}_{2} empieza a descender y el proceso LMS normalizado estéreo permite que se forme una solución para h_{1} y h_{2}.
El procedimiento descrito utiliza el filtro adaptativo de mínimos cuadráticos medios normalizado para formar la actualización de la estimación del trayecto de eco combinado. No obstante, puede utilizarse cualquier procedimiento adaptativo actual o futuro que actualice una estimación de un filtro desconocido sobre la base muestra a muestra en lugar del algoritmo de mínimos cuadráticos medios normalizados descrito. La única modificación requerida es sustituir la etapa del proceso 106 por otra actualización de filtro. Son ejemplos adecuados existentes la proyección afín rápida, y los filtros adaptativos de mínimos cuadráticos medios o de mínimos cuadráticos medios recursivos.

Claims (10)

1. Procedimiento de cancelación del eco acústico para una señal espacializada orientada de canal múltiple, estando generada la señal espacializada orientada a partir de una entrada de señal (12) modificada según las funciones de ganancia de espacialización (g_{1}, g_{2}) respectivas para generar una pluralidad de canales de audio (x_{1}(t), x_{2}(t)), utilizando el proceso de cancelación de eco una espacialización y una estimación de los trayectos de eco combinadas (\hat{h}_{1}, \hat{h}_{2}), desviándose la estimación a partir de las funciones de ganancia aplicadas a los canales respectivos, con lo cual, cuando cambian las funciones de ganancia aplicadas a los canales respectivos, se genera una estimación (\hat{h}_{1}, \hat{h}_{2}) de los trayectos de eco (h_{1}, h_{2}), basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia (g_{1}, g_{2}), utilizándose las estimaciones de los trayectos de eco (\hat{h}_{1}, \hat{h}_{2}) para generar una señal de cancelación de
eco e(t).
2. Procedimiento según la reivindicación 1, en el que las funciones de ganancia aplicadas a los canales respectivos son factores de ganancia escalares.
3. Procedimiento según la reivindicación 1 ó 2, en el que se utiliza un filtro adaptativo de mínimos cuadráticos medios normalizado para formar la actualización de la estimación de los trayectos de eco combinada.
4. Procedimiento según la reivindicación 1 ó 2, en el que se utiliza un filtro adaptativo de proyección afín rápida para formar la actualización de la estimación de los trayectos de eco combinada.
5. Procedimiento según la reivindicación 1 ó 2, en el que se utiliza un filtro adaptativo de mínimos cuadráticos medios recursivo para formar la actualización de la estimación de los trayectos de eco combinada.
6. Aparato para la cancelación del eco acústico en un sistema de audio espacializado orientado de canal múltiple, comprendiendo el sistema de audio espacializado:
\bullet
unos medios de entrada de señal (12) para recibir una señal de audio s(t),
\bullet
una pluralidad de medios de salida de audio (13L, 13R) para generar señales acústicas (x_{1}(t), x_{2}(t)) derivadas de la señal de audio s(t);
\bullet
unos medios de control (14L, 14R) asociados con los medios de salida de audio (13L, 13R) para generar entradas de control de ganancia g_{1}, g_{2} que controlan los medios de salida de audio de manera que dicha pluralidad de medios de salida de audio (13L, 13R) generan una versión espacializada h_{1,} h_{2} de la señal de audio s(t);
\bullet
unos medios de entrada de audio (21) para detectar señales acústicas;
\bullet
unos medios de salida de señales (22) para transmitir una señal y(t) derivada de las señales acústicas detectadas por los medios de entrada de audio (21);
\bullet
unos medios de estimación de trayectos de eco (25) que comprenden unos medios de detección para identificar cambios en las funciones de ganancia g_{1}, g_{2} de los medios de control (14L, 14R) respectivos, y unos medios de estimación para generar una estimación del trayecto de eco entre los medios de salida acústica 13L, 13R y los medios de entrada acústica (21), basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia g_{1,} g_{2} detectadas por los medios de detección;
\bullet
unos medios de generación de señales de cancelación de eco (24L, 24R) para generar una señal de cancelación de eco derivada de las señales de audio espacializadas generadas por los medios de control (14L, 14R) y las estimaciones derivadas por los medios de estimación del trayecto de eco (25), y
\bullet
unos medios de combinación de señales (26) para aplicar la señal de cancelación de eco a la señal generada por los medios de entrada de audio.
7. Aparato según la reivindicación 6, en el que las funciones de ganancia aplicadas a los canales respectivos son factores escalares de ganancia.
8. Aparato según la reivindicación 6 ó 7, en el que se utiliza un filtro adaptativo de mínimos cuadráticos medios normalizado para formar la actualización de las estimaciones de trayecto de eco.
9. Aparato según la reivindicación 6 ó 7, en el que se utiliza un filtro adaptativo de proyección afín rápida para formar la actualización de las estimaciones de trayecto de eco.
10. Aparato según la reivindicación 6 ó 7, en el que se utiliza un filtro adaptativo de mínimos cuadráticos medios recursivo para formar la actualización de las estimaciones de trayecto de eco.
ES00927602T 1999-05-25 2000-05-18 Cancelacion del eco acustico. Expired - Lifetime ES2269137T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP99304040 1999-05-25
EP99304040 1999-05-25

Publications (1)

Publication Number Publication Date
ES2269137T3 true ES2269137T3 (es) 2007-04-01

Family

ID=8241410

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00927602T Expired - Lifetime ES2269137T3 (es) 1999-05-25 2000-05-18 Cancelacion del eco acustico.

Country Status (9)

Country Link
US (1) US7660425B1 (es)
EP (1) EP1180300B1 (es)
JP (1) JP2003500937A (es)
CN (1) CN1351795A (es)
AU (1) AU4599300A (es)
CA (1) CA2373114C (es)
DE (1) DE60029436T2 (es)
ES (1) ES2269137T3 (es)
WO (1) WO2000072567A1 (es)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7903137B2 (en) * 2004-10-15 2011-03-08 Lifesize Communications, Inc. Videoconferencing echo cancellers
NO328256B1 (no) * 2004-12-29 2010-01-18 Tandberg Telecom As Audiosystem
JP5053849B2 (ja) * 2005-09-01 2012-10-24 パナソニック株式会社 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
JP4688701B2 (ja) * 2006-03-09 2011-05-25 富士通東芝モバイルコミュニケーションズ株式会社 通信端末
US8385557B2 (en) * 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction
US8208649B2 (en) * 2009-04-28 2012-06-26 Hewlett-Packard Development Company, L.P. Methods and systems for robust approximations of impulse responses in multichannel audio-communication systems
JP4924652B2 (ja) * 2009-05-07 2012-04-25 株式会社デンソー 音声認識装置及びカーナビゲーション装置
EP2438766B1 (en) * 2009-06-02 2015-05-06 Koninklijke Philips N.V. Acoustic multi-channel echo cancellation
US8634569B2 (en) 2010-01-08 2014-01-21 Conexant Systems, Inc. Systems and methods for echo cancellation and echo suppression
CN102223456B (zh) * 2010-04-14 2013-09-11 华为终端有限公司 回声信号处理方法及装置
CN102387269B (zh) * 2010-08-27 2013-12-04 华为终端有限公司 一种单讲状态下回声抵消的方法、装置及系统
JP5017441B2 (ja) * 2010-10-28 2012-09-05 株式会社東芝 携帯型電子機器
WO2012094528A1 (en) 2011-01-05 2012-07-12 Conexant Systems, Inc., A Delaware Corporation Systems and methods for stereo echo cancellation
EP2487891B1 (de) * 2011-02-11 2018-09-05 Deutsche Telekom AG Vermeiden eines akustischen Echos bei Vollduplexsystemen
CN102646418B (zh) * 2012-03-29 2014-07-23 北京华夏电通科技股份有限公司 一种远程音频交互的多路声学回音消除方法及系统
CN102820036B (zh) * 2012-09-07 2014-04-16 歌尔声学股份有限公司 一种自适应消除噪声的方法和装置
CN104392727A (zh) * 2014-11-12 2015-03-04 华为技术有限公司 音频信号处理方法和相关装置
WO2016108166A1 (en) * 2014-12-28 2016-07-07 Silentium Ltd. Apparatus, system and method of controlling noise within a noise-controlled volume
CN105407243B (zh) * 2015-10-26 2019-02-19 南京邮电大学 一种Android平台上使用改进仿射投影算法的回声消除VOIP系统
DE102015222105A1 (de) * 2015-11-10 2017-05-11 Volkswagen Aktiengesellschaft Audiosignalverarbeitung in einem Fahrzeug
CN110956973A (zh) * 2018-09-27 2020-04-03 深圳市冠旭电子股份有限公司 一种回声消除方法、装置及智能终端
CN111756943B (zh) * 2020-06-05 2021-04-20 中原工学院 一种增广复值成比例子带自适应立体声学回声消除方法
CN112700788B (zh) * 2020-12-23 2024-05-03 普联国际有限公司 回声消除中回声路径的建模方法、装置、设备及存储介质

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2635684B2 (ja) 1988-05-31 1997-07-30 株式会社東芝 ステレオ音声伝送システム
JP2792311B2 (ja) 1992-01-31 1998-09-03 日本電気株式会社 多チャンネルエコー除去方法および装置
JPH05316239A (ja) 1992-05-08 1993-11-26 Toshiba Corp 会議システム
GB9211756D0 (en) * 1992-06-03 1992-07-15 Gerzon Michael A Stereophonic directional dispersion method
JP2523258B2 (ja) 1993-06-17 1996-08-07 沖電気工業株式会社 多地点間エコ―キャンセラ
FR2713417B1 (fr) * 1993-12-02 1996-02-02 Europ Agence Spatiale Procédé de réglage adaptatif d'un suppresseur d'écho.
DE69532394T2 (de) * 1994-02-10 2004-11-04 Nippon Telegraph And Telephone Corp. Verfahren und Vorrichtung zur Echokompensation mit Anwendung der "fast projection scheme"
JP3397269B2 (ja) * 1994-10-26 2003-04-14 日本電信電話株式会社 多チャネル反響消去方法
US5828756A (en) * 1994-11-22 1998-10-27 Lucent Technologies Inc. Stereophonic acoustic echo cancellation using non-linear transformations
US5745564A (en) 1995-01-26 1998-04-28 Northern Telecom Limited Echo cancelling arrangement
US5734724A (en) 1995-03-01 1998-03-31 Nippon Telegraph And Telephone Corporation Audio communication control unit
CA2186416C (en) * 1995-09-26 2000-04-18 Suehiro Shimauchi Method and apparatus for multi-channel acoustic echo cancellation
JP3625325B2 (ja) 1995-10-31 2005-03-02 株式会社東芝 拡声通話装置およびエコーキャンセラ
US7012630B2 (en) * 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
JP3483086B2 (ja) 1996-03-22 2004-01-06 日本電信電話株式会社 音声電話会議装置
JPH09307651A (ja) 1996-05-17 1997-11-28 Hitachi Ltd 簡易ステレオ伝送方式
JP3654470B2 (ja) * 1996-09-13 2005-06-02 日本電信電話株式会社 サブバンド多チャネル音声通信会議用反響消去方法
FR2762467B1 (fr) * 1997-04-16 1999-07-02 France Telecom Procede d'annulation d'echo acoustique multi-voies et annuleur d'echo acoustique multi-voies
US6895093B1 (en) * 1998-03-03 2005-05-17 Texas Instruments Incorporated Acoustic echo-cancellation system
DE69908463T2 (de) * 1998-03-05 2004-05-13 Nippon Telegraph And Telephone Corp. Verfahren und Einrichtung zur mehrkanaligen Kompensation eines akustischen Echos
WO1999053674A1 (en) * 1998-04-08 1999-10-21 British Telecommunications Public Limited Company Echo cancellation
US6990205B1 (en) * 1998-05-20 2006-01-24 Agere Systems, Inc. Apparatus and method for producing virtual acoustic sound
US6707912B2 (en) * 1999-03-11 2004-03-16 Motorola, Inc. Method and apparatus for setting a step size for an adaptive filter coefficient of an echo canceller

Also Published As

Publication number Publication date
US7660425B1 (en) 2010-02-09
EP1180300B1 (en) 2006-07-19
DE60029436D1 (de) 2006-08-31
CA2373114A1 (en) 2000-11-30
DE60029436T2 (de) 2006-12-28
JP2003500937A (ja) 2003-01-07
CA2373114C (en) 2007-03-27
WO2000072567A1 (en) 2000-11-30
CN1351795A (zh) 2002-05-29
EP1180300A1 (en) 2002-02-20
AU4599300A (en) 2000-12-12

Similar Documents

Publication Publication Date Title
ES2269137T3 (es) Cancelacion del eco acustico.
US8204252B1 (en) System and method for providing close microphone adaptive array processing
US8194880B2 (en) System and method for utilizing omni-directional microphones for speech enhancement
US7925008B2 (en) Multi-channel echo cancel method, multi-channel sound transfer method, stereo echo canceller, stereo sound transfer apparatus and transfer function calculation apparatus
EP3312839B1 (en) Device for assisting two-way conversation and method for assisting two-way conversation
US6895093B1 (en) Acoustic echo-cancellation system
US8391472B2 (en) Acoustic echo cancellation solution for video conferencing
JPH10190848A (ja) 音響エコーキャンセル方法とそのシステム
US20140044274A1 (en) Estimating Direction of Arrival From Plural Microphones
SK282101B6 (sk) Sieť s potlačenou ozvenou
US7324466B2 (en) Echo canceling system and echo canceling method
Franzen et al. Improved measurement noise covariance estimation for N-channel feedback cancellation based on the frequency domain adaptive Kalman filter
JP2006033789A (ja) 反響路結合量推定方法、反響路結合量推定装置、反響路結合量推定プログラム、エコー抑圧方法、エコー抑圧装置、エコー抑圧プログラム、エコーサプレス方法、エコーサプレッサ、エコーサプレッサプログラム、通信路上の損失量制御方法、通信路上の損失量制御装置、通信路上の損失制御プログラム、多チャネルエコー抑圧方法、多チャネルエコー抑圧装置、多チャネルエコー抑圧プログラム、記録媒体
JP4920511B2 (ja) マルチチャンネルエコーキャンセラ
JP3616341B2 (ja) 多チャネルエコーキャンセル方法、その装置、そのプログラム及び記録媒体
JPS6172420A (ja) 多通路反響消去方式
JP4162860B2 (ja) 不要音信号除去装置
JP4159967B2 (ja) 多チャネル音響エコー消去方法及び装置
Buchner et al. An acoustic human-machine interface with multi-channel sound reproduction
JPH01215130A (ja) エコーキャンセラー装置
JP5058052B2 (ja) エコー消去装置
JP3700838B2 (ja) 多チャネル反響消去方法・多チャネル反響消去装置・多チャネル反響消去プログラム
JP2002252577A (ja) 多チャネル音響エコー消去方法、その装置、そのプログラム及びその記録媒体
JPH02278926A (ja) Fir・ラティス混合形エコーキャンセラ
Tran Robust Techniques for Acoustic Feedback Control in Hearing Aids