ES2269137T3 - Cancelacion del eco acustico. - Google Patents
Cancelacion del eco acustico. Download PDFInfo
- Publication number
- ES2269137T3 ES2269137T3 ES00927602T ES00927602T ES2269137T3 ES 2269137 T3 ES2269137 T3 ES 2269137T3 ES 00927602 T ES00927602 T ES 00927602T ES 00927602 T ES00927602 T ES 00927602T ES 2269137 T3 ES2269137 T3 ES 2269137T3
- Authority
- ES
- Spain
- Prior art keywords
- echo
- signal
- estimate
- hat
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
Abstract
Procedimiento de cancelación del eco acústico para una señal espacializada orientada de canal múltiple, estando generada la señal espacializada orientada a partir de una entrada de señal (12) modificada según las funciones de ganancia de espacialización (g1, g2) respectivas para generar una pluralidad de canales de audio (x1(t), x2(t)), utilizando el proceso de cancelación de eco una espacialización y una estimación de los trayectos de eco combinadas (h1, h2), desviándose la estimación a partir de las funciones de ganancia aplicadas a los canales respectivos, con lo cual, cuando cambian las funciones de ganancia aplicadas a los canales respectivos, se genera una estimación (h1, h2) de los trayectos de eco (h1, h2), basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia (g1, g2), utilizándose las estimaciones de los trayectos de eco (h1, h2) para generar una señal de cancelación de eco e(t).
Description
Cancelación del eco acústico.
La presente invención se refiere a un
procedimiento para la cancelación del eco acústico de canal múltiple
(AEC) aplicable a sistemas que derivan una señal multicanal
espacializada a partir de una señal monofónica, cada canal de la
cual se aplica a un elemento respectivo de una serie de altavoces a
diferentes ganancias para proporcionar la percepción o ilusión
audible de direccionalidad. Esta clase de señal espacializada se
denominará en este documento mono orientado. Un sistema mono
orientado utiliza dos o más elementos de ganancia para representar
la espacialización, que se representa en un procesador panorámico
para generar las salidas de altavoz correspondientes. En las formas
de realización que se describirán se utiliza una señal estereofónica
de dos canales, con dos altavoces - un sistema conocido como
"estéreo a partir de mono orientado" (SSM), pero los principios
de la invención pueden aplicarse a sistemas con más de dos canales.
La invención tiene aplicación en sistemas de teleconferencia en los
cuales se proporciona a la voz de cada interlocutor posicionamiento
espacial en provecho del oyente.
En el caso de una comunicación de voz cómoda en
un sistema de teleconferencia que utiliza un altavoz y un micrófono,
a diferencia del casco con auriculares, se necesita un procedimiento
de cancelación del eco acústico (AEC). Para sistemas monofónicos
puede utilizarse la topología que muestra la figura 1, con diversos
procesos adaptativos diferentes como por ejemplo el de mínimos
cuadráticos medios (LMS), mínimos cuadrados recursivos (RLS) o
proyección rápida afín (FAP). No obstante, en el caso de sistema
estereofónicos y de canal múltiple, las soluciones existentes están
mucho menos avanzadas y todavía presentan obstáculos importantes que
deben superarse. El ejemplo de la figura 2 muestra que en el caso
de un sistema estereofónico hay dos trayectos de eco, h_{1} y
h_{2} (que comprenden las respuestas de impulso del micrófono y el
altavoz), en comparación con el trayecto único en el caso del
sistema monofónico. (Se supone que se utiliza un solo micrófono,
como ocurre generalmente cuando la espacialización debe crearse
artificialmente. Más generalmente, el número de trayectos de eco es
el producto del número de altavoces por el número de
micrófonos).
Las soluciones existentes para el problema de
cancelación del eco acústico generalmente presentan la disposición
del sistema que muestra la figura 2, en la cual las respuestas del
trayecto de la persona que habla al micrófono son desconocidas. El
objetivo del proceso adaptativo en el cancelador de eco es utilizar
las señales x_{1}(t), x_{2}(t) y e(t) para
entrenar los filtros adaptativos \hat{h}_{1} y \hat{h}_{2}
para que
(1)e(t)
\rightarrow
0
Con los procesos existentes de filtro adaptativo
no es posible alcanzar un ajuste convergente de los filtros como por
ejemplo
(2)h_{1} =
\hat{h}_{1}\ y\ h_{2} =
\hat{h}_{2}
En lugar de ello, se obtiene una solución
convergente como la siguiente
(3)h_{1} *
g_{1} + h_{2} * g_{2} = \hat{h}_{1} * g_{1} + \hat{h}_{2} *
g_{2}
en la que * es el operador de
convolución. Debe tenerse en cuenta que la ecuación (3) satisface la
ecuación (1), pero la ecuación (2) no es la única solución para la
ecuación (3), por lo tanto los valores de h_{1} y h_{2} no
pueden derivarse de este
resultado.
Si los filtros g_{1} o g_{2} cambian,
posiblemente debido al movimiento de la persona que habla, la
igualdad de la ecuación (3) ya no se mantiene (a no ser que también
se cumpla la ecuación (2)). Por lo tanto, el cancelador de eco ya no
produce una solución convergente y el eco que oye la persona que
habla aumenta de nivel.
Se han propuesto diversas soluciones para este
problema, que consisten en manipular las señales del altavoz x_{1}
y x_{2}, o en utilizar las propiedades de la señales x_{1} y
x_{2}. El propósito de estas soluciones es utilizar las
propiedades de correlación mutua de las dos señales, ya que puede
demostrarse que existe una solución a la ecuación (2) cuando las dos
señales se encuentran suficientemente descorrelacionadas. No
obstante, al estar, en un sistema de teleconferencia las señales
x_{1} y x_{2}, inherentemente correlacionadas, las técnicas que
aprovechan las pequeñas características descorrelacionadas de las
señales presentan un bajo rendimiento, excepto en condiciones
ideales.
Se ha propuesto añadir una pequeña cantidad de
ruido blanco independiente a las señales x_{1} y x_{2}.
Introduciendo alguna señal descorrelacionada, se ha comprobado que
esto contribuye significativamente a la convergencia de la solución
hacia la presentada en la Ecuación (2). No obstante, aunque añadir
ruido de este modo mejorar la convergencia, el ruido debe añadirse a
un nivel tal que resulta indeseablemente audible.
Un artículo titulado "A Multichannel Affine
projection Algorithm With Applications To Multichannel Accoustic
Echo Cancellation" de Benesty et al en "IEEE
Signal Processing Letters", vol. 3, nº 2, páginas
36-37, publicado en 1996 por la IEEE Signal
Processing Society describe un sistema de supresión de eco
multicanal que alimenta los respectivos canales con filtros
adaptativos correspondientes, pero no tiene en cuenta los factores
de ganancia de los respectivos canales.
Según la presente invención, se dispone un
procedimiento de cancelación de eco acústico para una señal
espacializada orientada de canal múltiple generada a partir de una
entrada de señal modificada según las funciones de ganancia de
espacialización respectivas para generar una pluralidad de canales
de audio, utilizando el proceso de cancelación de eco una
espacialización y una estimación de los trayectos de eco combinadas,
calculándose la estimación a partir de las funciones de ganancia
aplicadas a los canales respectivos, con lo cual, cuando cambian las
funciones de ganancia aplicadas a los canales respectivos, se genera
una estimación de los trayectos de eco, basándose la estimación en
una estimación previa del trayecto de eco y en las funciones de
ganancia, utilizándose la estimación de los trayectos de eco para
generar una señal de cancelación de eco.
Según otro aspecto de la presente invención, se
dispone un aparato para cancelación del eco acústico en un sistema
de audio espacializado orientado de canal múltiple, en el que el
sistema de audio espacializado comprende:
unos medios de entrada de señal para recibir una
señal de audio,
una pluralidad de medios de salida de audio para
generar señales acústicas derivadas de la señal de audio;
unos medios de control asociados con los medios
de salida de audio para generar entradas de control de ganancia que
controlan los medios de salida de audio de manera que dicha
pluralidad de medios de salida de audio generan una versión
espacializada de la señal de audio;
unos medios de entrada de audio para detectar
señales acústicas;
unos medios de salida de señales para transmitir
una señal derivada de las señales acústicas detectadas por los
medios de entrada de audio;
unos medios de estimación de trayectos de eco
que comprenden unos medios de detección para identificar cambios en
las funciones de ganancia de los medios de control respectivos, y
medios de estimación para generar una estimación del trayecto de eco
entre los medios de salida acústica y los medios de entrada
acústica, basándose la estimación en una estimación previa del
trayecto de eco y en las funciones de ganancia detectadas por los
medios de detección;
unos medios de generación de señales de
cancelación de eco para generar una señal de cancelación de eco
derivada de las señales de audio espacializadas generadas por los
medios de control y la estimación derivada por los medios de
estimación del trayecto de eco, y
unos medios de combinación de señales para
aplicar la señal de cancelación de eco a la señal generada por los
medios de entrada de audio.
La presente invención es una adaptación del
proceso LMS monofónico. La invención evita actualizaciones múltiples
de dos o más estimaciones de trayectos de eco, tales como
\hat{h}_{1} y \hat{h}_{2}, y reduce el número de operaciones
de filtración requeridas en comparación con los procesos de
cancelación de eco estéreo existentes, tales como \hat{h}_{1} *
x_{1} y \hat{h}_{2} * x_{2}. Adicionalmente, la invención
utiliza los parámetros de espacialización en el proceso adaptativo,
a diferencia de los procesos de cancelación de eco existentes. La
actualización del LMS se modifica para tomar en consideración los
parámetros de espacialización que se utilizan para actualizar la
estimación del trayecto de eco agregado cada vez que cambia la
espacialización. Después de cambiar la espacialización N, (donde N
es el número de canales del sistema), la estimación del trayecto de
eco agregado converge con el trayecto de eco agregado para futuros
cambios en las espacialización. Antes del cambio N de la
espacialización. el proceso converge hacia una solución local para
la estimación del trayecto de eco agregado, de modo que sigue
existiendo alguna reducción de la señal de eco en el estadio de
aprendizaje del proceso.
El estadio de aprendizaje puede ser parte de una
fase de preparación del sistema antes de la utilización del mismo en
funcionamiento operativo. Por ejemplo, el número requerido de
cambios de espacialización puede alcanzarse operando el proceso LMS
monofónico para cada canal sucesivamente, ajustando las ganancias de
los demás canales a cero.
A continuación se describe, a título de ejemplo,
una forma de realización de la invención considerada conjuntamente
con las figuras en las cuales
la figura 1 ilustra los principios de la
cancelación de eco monofónico,
la figura 2 ilustra los principios básicos de la
cancelación de eco estereofónico, (sólo se muestra la mitad del
trayecto de retorno)
la figura 3 ilustra una forma de realización de
la invención,
la figura 4 ilustra un sistema teórico
equivalente al de la figura 3,
la figura 5 es una ilustración gráfica del error
medio del sistema que muestra la figura 3 comparando sistemas
anteriores con el de la invención,
la figura 6 ilustra el descenso a lo largo del
tiempo del desajuste de las estimaciones de trayecto erróneas
\hat{h}_{1} y \hat{h}_{2} utilizando el procedimiento según
la invención.
la figura 7 es un diagrama de flujo que muestra
el proceso de actualización de la forma de realización
preferida.
El sistema monofónico ilustrado en la figura 1
comprende un trayecto de entrada 12 conectado a la fuente (micrófono
11 y altavoz 10) de la señal original s(t). Esta señal
s(t) se modifica mediante el trayecto de transmisión 12 para
generar una señal de altavoz x(t) que se suministra al
altavoz 13. El trayecto de retorno consiste en un micrófono 21, un
trayecto de transmisión de retorno 22 y un altavoz 23. Entre el
altavoz 13 de un trayecto y el micrófono 21 del otro trayecto
existe un trayecto acústico h_{1}. Por lo tanto, algunos sonidos
originados por la persona que habla 10 serán devueltos al altavoz 23
y oídos por la persona que habla 10 como eco. Este efecto puede
resultar intrusivo, especialmente cuando los trayectos de
transmisión 12, 22 pueden introducir retardos, de modo que se
instala un procesador de cancelación de eco 24, 25, 26 para eliminar
esta señal. Un procesador adaptativo 24 compara la señal e(t)
que debe transmitirse por la vía de retorno 22 con la señal
x(t) que llega por el trayecto de entrada 12 e identifica las
correlaciones entre ellas. Esto se utiliza para controlar un banco
de filtros adaptativos 25 para generar un vector \hat{h}_{1}.
Este vector es una estimación del trayecto acústico h_{1}. Este
vector se aplica a la señal de entrada x(t) mediante el
filtro y el resultado se sustrae de la entrada y(t) del
micrófono 21 en un combinador 26 para generar una señal de retorno
e(t). Si el filtro adaptativo 25 genera una estimación
\hat{h}_{1} exacta de la función h_{1}, la señal de eco
y(t) debería ser anulada por la salida del filtro adaptativo
25 y e(t) debería ser cero. Por lo tanto, las únicas señales
transmitidas por el trayecto de retorno 22 serán los sonidos
generados cerca del micrófono 21 y no recibidos del altavoz 13.
La figura 2 ilustra un sistema estereofónico
generalizado. La situación es similar a la de la figura 1, excepto
porque en este caso se han dispuesto dos altavoces y dos micrófonos
(indicados por los sufijos "L" y "R" en la figura 2) en
cada extremo. Sólo se muestra un canal 22L del trayecto de retorno.
Para cada trayecto de retorno 22L, (22R) existen dos estimaciones de
trayecto de eco \hat{h}_{1L}, \hat{h}_{2L}, una para cada
trayecto de ida 12_{L}, 12_{R}, porque cada micrófono 21L, (21R)
es capaz de recibir retroalimentación acústica de ambos altavoces
13L, 13R. Debido a que los dos trayectos de ida 12_{L}, 12_{R}
transportan señales de la misma fuente 10, existe una correlación
significativa entre las dos estimaciones \hat{h}_{1L},
\hat{h}_{2L} y, por lo tanto, los procesos que generan los
valores de los filtros adaptativos 25LL, 25RL no son
independientes.
En el caso general que muestra la figura 2, las
funciones originales g_{1}, g_{2} son desconocidas en el extremo
receptor, siendo dependientes de las posiciones relativas de los
micrófonos 11L, 11R y la persona que habla 10. Por lo tanto, no es
posible calcular una solución única para \hat{h}_{1L},
\hat{h}_{2L}. Para una espacialización determinada, el
procesador adaptativo 24L generará dos funciones adecuadas
\hat{h}_{1L}, \hat{h}_{2L} para las cuales resulta válida la
ecuación (3) anteriormente citada:
(3)h_{1} *
g_{1} + h_{2} * g_{2} = \hat{h}_{1} * g_{1} + \hat{h}_{2} *
g_{2}
pero esto no implica necesariamente
que también pueda aplicarse la ecuación
(2):
(2)h_{1} =
\hat{h}_{1}\ y\ h_{2} =
\hat{h}_{2}
Si la espacialización, y por lo tanto las
funciones g_{1}, g_{2} cambian, se apreciará que los filtros
adaptativos deben reiniciarse para corresponder a la nueva
espacialización.
En un sistema orientado como el que ilustran las
figura 3 y 4, se utiliza una fuente monofónica y las funciones
g_{1}, g_{2} se convierten en valores escalares g_{1}, g_{2}
que representan ganancia. Por consiguiente, sólo hay un trayecto de
transmisión 12, 22 en cada dirección. La información de control,
generada tanto en el extremo receptor como en el transmisor con la
señal monofónica s(t), se utiliza para controlar los
amplificadores de ganancia variable 14L, 14R para variar las
funciones de ganancia g_{1}, g_{2} definiendo la espacialización
en el extremo receptor, para emular una fuente estereofónica. El
hecho de que las funciones de ganancia g_{1}, g_{2} sean
conocidas en el extremo receptor permite utilizarlas en el
procesador adaptativo 24, 25.
A continuación se describirá el funcionamiento
del procesador adaptativo 24, 25 con referencia a la figura 7. La
teoría matemática subyacente se describirá a continuación con
referencia a las figuras 3 y 4.
Después de la etapa de inicialización 101, en la
cual se ajustan valores nocionales para las funciones de ganancia
g_{1}, g_{2}, el proceso se ejecuta en un bucle iterativo para
cada periodo muestreado n del modo siguiente.
En primer lugar, se ajustan los valores k_{1},
k_{2}, k_{3} (etapa 102). Estos valores identifican los tres
últimos períodos muestreados en los cuales han cambiado los valores
de espacialización g_{1}, g_{2}. Si los valores de ganancia de
espacialización g_{1}, g_{2} no han cambiado desde la muestra
previa n-1 los valores de k_{1}, k_{2}, k_{3}
son los mismos que para la muestra anterior. No obstante, si los
valores han cambiado, k_{3} se ajusta al valor previo de k_{2},
k_{2} se ajusta al valor previo de k_{1}, y k_{1} se ajusta a
n-1.
A continuación se determina la función de la
ganancia estimada (etapa 103). Esta función es la matriz
1 Si los valores de espacialización g_{1}, g_{2}
no han cambiado, esta matriz tampoco cambia y no es necesario volver
a calcularla. A continuación se determina la inversa de esta
matriz.
De nuevo, si los valores de espacialización
g_{1}, g_{2} no han cambiado, esta matriz tampoco cambia y por
lo tanto no es necesario volver a calcularla.
A continuación, (etapa 104), si r = n - k_{1}
+ 1 es inferior al número de términos L en el vector de trayecto de
eco \hat{h} estimado (en otras palabras, si el número de muestras
r transcurrido desde el último cambio de espacialización es inferior
a L), se corrige un término del vector de trayecto de eco estimado
\hat{h}_{n-1} como sigue
(siendo
\hat{h}_{n-1} el caso específico de la función
de trayecto de eco estimado \hat{h} de la iteración previa). Todos
los demás términos
\hat{h}_{n-1}(0)...\hat{h}_{n-1}(r-1)
y
\hat{h}_{n-1}(r+1)...\hat{h}_{n-1}(L-1)
permanecen sin
cambios.
A continuación se genera la señal de cancelación
de error s_{n}^{T} \hat{h}_{n-1} (en la que
s_{n} es el vector que representa las últimas muestras L de la
señal de entrada s(n)), utilizando el vector de trayecto de
eco estimado \hat{h}_{n-1} (etapa 105), y se
sustrae de la señal y(n) para generar la señal de salida
e(n).
El vector de trayecto de eco estimado
\hat{h}_{n-1} se adapta, a continuación, como
respuesta a la señal de eco e(n) (etapa 106) para utilizarlo
en la siguiente iteración.
\hat{h}_{n} =
\hat{h}_{n-1} + \mu s_{n}
\varepsilon(n)
en la que \varepsilon(n) =
s_{n}^{T}s_{n}e(n) y \mu es el tamaño de la
etapa.
El progreso es estable a no ser que la
espacialización cambie en una escala de tiempo superior al período
L, y que 0 \leq \mu < 2.
La complejidad de cálculo de las etapas 105 y
106 del proceso anterior es la misma que la del proceso LMS
normalizado, que es del orden de 2L. El número de cálculos es del
orden de dos multiplicaciones y una división para la inversión de
matriz utilizada en la etapa 103. Como que se realiza solamente una
vez después de cada cambio de las espacialización, aumenta poco la
complejidad del proceso para L grandes. La etapa 104 sólo se calcula
en las L primeras muestras después de un cambio de la
espacialización y es insignificante para las L grandes. Por lo
tanto, cuando se utiliza el proceso mostrado anteriormente para la
cancelación del eco acústico con un sistema orientado mono, para el
cual es probable que L > 100, el proceso presenta una complejidad
de aproximadamente 2L.
Sigue una descripción matemática, que se
iniciará a partir del sistema mostrado en la figura 4 y a
continuación procederá a mostrar que es equivalente al sistema según
la invención mostrado en la figura 3 que utiliza una única
estimación de trayecto de eco agregado.
Como muestra la figura 4, los dos trayectos de
respuesta de impulso de micrófono 12L, 12R (figura 2) se sustituyen
por dos respuestas de impulso generadas artificialmente g_{1} y
g_{2} que actúan sobre una única señal de micrófono s(t)
recibida a través del trayecto monofónico 12 para generar la
percepción o ilusión de espacialización. En el caso de la solución
presentada aquí, las funciones g_{1} y g_{2} se han simplificado
todavía más representándolas como simples funciones de ganancia
antes que como respuestas de impulso. Este sistema trabaja de un
modo completamente diferente al del sistema anterior de la figura 2
ya que, antes que intentar descorrelacionar las señales x_{1} y
x_{2} para ayudar a la convergencia, el procedimiento presentado
aquí depende de la naturaleza inherentemente altamente
correlacionada de las señales x_{1} y x_{2}. El procedimiento
utiliza el conocimiento de las funciones g_{1} y g_{2} (que son
desconocidas en los sistemas de la técnica anterior) para conseguir
una cancelación de eco convergente. Antes de describir una solución
de filtro adaptativo al problema del eco, se demostrará que existe
una solución al problema.
Haciendo que la entrada al bloque de
espacialización en el tiempo de muestra n esté representada por un
vector de columna s_{n} = [s(n)
s(n-1) ...
s(n-(L-1))]^{T}, la entrada al micrófono
del extremo del oyente esté representada por y_{n} = [y(n)
y(n-1) ...
y(n-(L-1))]^{T} y que los dos trayectos de
eco del altavoz al micrófono sean los vectores L de columna h_{1}
y h_{2} (que incorporan las respuestas de impulso del altavoz y el
micrófono) de longitud L, entonces
(4)y_{n} =
g_{1}(n)S_{n}h_{1} +
g_{2}(n)S_{n}h_{2}
en la que la espacialización está
representada como valores de ganancia g_{1}(n) y
g_{2}(n) que son constantes a lo largo de los períodos de
muestra n-(L-1) ... n, y S_{n} = [s_{n} ...
s_{n-(L-1)}]^{T} (es una matriz de
"Toeplitz", es decir, una matriz simétrica de orden L x L, que
presenta los términos de s_{n} en la primera fila y la primera
columna, los términos de s_{n-1} en la segunda
fila y columna, y así sucesivamente). Puede apreciarse que h_{1} y
h_{2} no pueden resolverse a partir de la ecuación
(4).
No obstante, considerando ahora la utilización
de un segundo conjunto de observaciones de entradas y salidas en un
tiempo de muestra n + a, en la que a \geq L y
en otras palabras, las funciones
g_{1} y g_{2} han cambiado entre el tiempo de muestra n y el
tiempo de muestra n + 1, pero a continuación se han mantenido sin
cambios entre el tiempo n + 1 y el tiempo de muestra n +
a.
Por lo tanto,
en en la que I_{L} es la matriz
de identidad L x
L,
y \oplus es el producto de
Kronecker. (El producto de Kronecker de dos matrices A y B se
obtienen multiplicando la matriz B independientemente por cada
término individual de la matriz A y formando una nueva matriz (cuyo
orden es el producto de las dos matrices originales) con los
términos
resultantes).
La solución a la ecuación (6) es
y utilizando las identidades del
producto de
Kronecker
Por lo tanto existe una solución para h_{1} y
h_{2} si la señal s excita persistentemente (es decir, presenta un
contenido totalmente espectral) y la matriz G_{n\cdot n+a} es no
singular, es decir, tiene una matriz inversa. La condición de no
singular de la matriz G_{n\cdot n+a} se cumple si los valores de
espacialización en los tiempos de muestra n y n+a son diferentes y
no son múltiplos escalares uno de otro (es decir, g_{1} (n) /
g_{2}(n) \neq g_{1}(n + a) / g_{2}(n +
a). Idealmente, los valores deberían ser suficientemente diferentes
para que la solución de la ecuación (9) presente las condiciones
adecuadas.
Una vez establecido que existe una solución, a
continuación se deriva del proceso LMS el proceso adaptativo para la
solución. El proceso LMS normalizado (NLMS) se utiliza para efectuar
la cancelación del eco monofónico, como se ha mencionado con
referencia a la figura 1, utilizando las actualizaciones
siguientes
(10)e(n) = y(n) -
s^{T}_{n}
\hat{h}_{n-1}
(11)\varepsilon(n) =
s^{T}_{n}S_{n}e(n)
(12)\hat{h}_{n} =
\hat{h}_{n-1} + \mu s_{n}
\varepsilon(n)
en las que e(n) es la señal
de eco, \mu es el parámetro de tamaño de la etapa y
\hat{h}_{n} es la estimación del trayecto de eco en el caso de
muestra n. Las ecuaciones anteriores del LMS normalizado pueden
modificarse para el caso mono orientado utilizando una estimación de
trayecto de eco agregado único y redefiniendo
\hat{h}_{n-1}
como
en la que \hat{h}_{1}(t)
y \hat{h}_{2}(t) son funciones que representan las dos
estimaciones de eco en el intervalo de muestra n. Similarmente se
define h como la combinación de h_{1}(t) y
h_{2}(t) en una forma equivalente a la que muestra la
ecuación
13
La tarea consiste entonces en utilizar y
actualizar \hat{h} de modo que las actualizaciones del LMS
normalizado de las ecuaciones 10, 11 y 12 se utilizan para la
cancelación de eco en vez de utilizar explícitamente dos
estimaciones de trayecto de eco. Si los valores de g_{1}(n)
y g_{2}(n) son constantes para todos los n, las
actualizaciones de la ecuación 10, 11 y 12 pueden utilizarse sin
cambios para determinar una estimación de h, cuando h es constante a
lo largo del tiempo. No obstante, si g_{1}(n) y
g_{2}(n) cambian a lo largo del tiempo, esta solución no
puede utilizarse, ya que un cambio en h no se tiene en cuenta en las
actualizaciones del LMS de las ecuaciones 10, 11 y 12.
Considerando tres épocas de muestra i,
i-a e i-b donde
y similarmente para
g_{2}(n), es decir, los valores de g_{1}(n) y
g_{2}(n) cambian sólo en las épocas i-a e
i-b.
Considerando que el valor del coeficiente j en
el trayecto de eco combinado en las épocas
i-a-1 e
i-b-1 (es decir, justo antes de los
cambios en la espacialización) que forman las ecuaciones 14 y 16
viene dado por
Las ecuaciones 17 y 18 pueden expresarse
como
y por lo
tanto
utilizando la definición de G de
(7).
Además, considerando el valor del coeficiente j
en el trayecto de eco combinado en la época i que, a partir de (14)
y (16), viene dada por
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Si los elementos de G^{-1} se definen mediante
una variable \gamma tal como
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
a partir de (19), (21) y
(22)
Esta ecuación es la actualización adicional
requerida para la actualización del LMS normalizado de las
ecuaciones (10), (11) y (12). Debe tenerse en cuenta que a partir de
(21) sólo necesita actualizarse un coeficiente en h de cada período
de muestra para tomar en consideración un cambio en la
espacialización.
El proceso puede extenderse a un sistema que
presenta más de dos canales efectuando una pequeña modificación para
el proceso. Específicamente, para un sistema de N canales, los
cambios previos N+1 en la posición de espacialización se registran
en variables k_{N+1}, ..., k_{1} desde el menor al más reciente
respectivamente. La matriz G se generaliza como
La etapa 104 puede generalizarse como
Las etapas 105 y 106 permanecen sin cambios.
Para demostrar el proceso descrito, tanto el
proceso de mínimos cuadráticos medios normalizados estéreo según la
presente invención como el de mínimos cuadráticos medios
normalizados se simularon utilizando la configuración mostrada en la
figura 3 y con trayectos de eco tomados de los trayectos
micrófono/persona que habla reales medidos. La posición de
espacialización se cambió cinco veces durante la simulación para
comprobar la capacidad del proceso para adaptarse a la
espacialización cambiante. La figura 5 muestra el error medio de
conjunto en la cancelación del eco para una entrada de ruido blanco
gausiano (GWN). Para la simulación, el parámetro de tamaño de etapa
\mu era 0,1, la longitud del filtro era de L = 200, la velocidad
de muestra era de 8 KHz y se añadió una señal de ruido de 40 dB
debajo de la señal de entrada. La figura 5 muestra que inicialmente
el proceso LMS normalizado (figura 5a) y el proceso LMS normalizado
estéreo según la invención (figura 5b) presentan el mismo
rendimiento hasta 40.000 muestras. Debe tenerse en cuenta que el
error en ambos procesos se produce inicialmente cuando los filtros
adaptativos convergen con el valor estático del vector de trayecto
agregado h. No obstante, en 19.000 períodos de muestra la
espacialización cambia, de modo que h cambia y por consiguiente el
error aumenta de repente en ambos procesos. El proceso LMS
normalizado (figura 5a) todavía no dispone de suficiente información
para formar el vector de trayecto agregado correcto h, ya que
necesita dos posiciones de espacialización para determinar los
vectores de trayecto individuales h_{1} y h_{2}. No obstante,
después de la segunda posición de espacialización, el procedimiento
según la invención puede efectuar una estimación del valor del h
cambiado. Esto puede observarse en la figura 5 cuando el error no
aumenta después de la muestra 40.000 para la curva de error en b), a
diferencia de lo que ocurre en el proceso LMS normalizado en a) que
demuestra incrementos del error cada vez que cambia la
espacialización.
También puede observarse el rendimiento del
procedimiento según la invención para señales de voz en la figura 6,
que muestra el desajuste en los dos vectores de trayecto de eco
estimados \hat{h}_{1} y \hat{h}_{2}. Estos vectores no se
calculan realmente de forma explícita en este proceso: no obstante,
se utiliza una solución para ellos como parte de la espacialización.
La ecuación 20 se utilizó para formar los gráficos que muestra la
figura 6. Puede apreciarse que el desajuste desciende en uno de los
filtros y aumenta en el otro a lo largo de la trayectoria de la
primera posición de espacialización, que está situada entre las
muestra 0 y 19.000. Esto se debe al hecho de que g_{1}(0) =
0,2 y g_{2}(0) = 0,8, lo cual significa que la mayor parte
de la energía de señal se deriva del segundo trayecto de filtro, de
modo que la estimación del filtro agregado \hat{h} tiende al
segundo trayecto de filtro h_{2}. En este punto, no existe una
información a priori que permita la solución verdadera de
\hat{h}_{1} y \hat{h}_{2} No obstante, tan pronto como se
inicia la segunda posición de espacialización en la muestra 19.000,
el desajuste en \hat{h}_{1} y \hat{h}_{2} empieza a
descender y el proceso LMS normalizado estéreo permite que se forme
una solución para h_{1} y h_{2}.
El procedimiento descrito utiliza el filtro
adaptativo de mínimos cuadráticos medios normalizado para formar la
actualización de la estimación del trayecto de eco combinado. No
obstante, puede utilizarse cualquier procedimiento adaptativo actual
o futuro que actualice una estimación de un filtro desconocido sobre
la base muestra a muestra en lugar del algoritmo de mínimos
cuadráticos medios normalizados descrito. La única modificación
requerida es sustituir la etapa del proceso 106 por otra
actualización de filtro. Son ejemplos adecuados existentes la
proyección afín rápida, y los filtros adaptativos de mínimos
cuadráticos medios o de mínimos cuadráticos medios recursivos.
Claims (10)
1. Procedimiento de cancelación del eco
acústico para una señal espacializada orientada de canal múltiple,
estando generada la señal espacializada orientada a partir de una
entrada de señal (12) modificada según las funciones de ganancia de
espacialización (g_{1}, g_{2}) respectivas para generar una
pluralidad de canales de audio (x_{1}(t),
x_{2}(t)), utilizando el proceso de cancelación de eco una
espacialización y una estimación de los trayectos de eco combinadas
(\hat{h}_{1}, \hat{h}_{2}), desviándose la estimación a
partir de las funciones de ganancia aplicadas a los canales
respectivos, con lo cual, cuando cambian las funciones de ganancia
aplicadas a los canales respectivos, se genera una estimación
(\hat{h}_{1}, \hat{h}_{2}) de los trayectos de eco (h_{1},
h_{2}), basándose la estimación en una estimación previa del
trayecto de eco y en las funciones de ganancia (g_{1}, g_{2}),
utilizándose las estimaciones de los trayectos de eco
(\hat{h}_{1}, \hat{h}_{2}) para generar una señal de
cancelación de
eco e(t).
eco e(t).
2. Procedimiento según la reivindicación 1,
en el que las funciones de ganancia aplicadas a los canales
respectivos son factores de ganancia escalares.
3. Procedimiento según la reivindicación 1 ó
2, en el que se utiliza un filtro adaptativo de mínimos cuadráticos
medios normalizado para formar la actualización de la estimación de
los trayectos de eco combinada.
4. Procedimiento según la reivindicación 1 ó
2, en el que se utiliza un filtro adaptativo de proyección afín
rápida para formar la actualización de la estimación de los
trayectos de eco combinada.
5. Procedimiento según la reivindicación 1 ó
2, en el que se utiliza un filtro adaptativo de mínimos cuadráticos
medios recursivo para formar la actualización de la estimación de
los trayectos de eco combinada.
6. Aparato para la cancelación del eco
acústico en un sistema de audio espacializado orientado de canal
múltiple, comprendiendo el sistema de audio espacializado:
- \bullet
- unos medios de entrada de señal (12) para recibir una señal de audio s(t),
- \bullet
- una pluralidad de medios de salida de audio (13L, 13R) para generar señales acústicas (x_{1}(t), x_{2}(t)) derivadas de la señal de audio s(t);
- \bullet
- unos medios de control (14L, 14R) asociados con los medios de salida de audio (13L, 13R) para generar entradas de control de ganancia g_{1}, g_{2} que controlan los medios de salida de audio de manera que dicha pluralidad de medios de salida de audio (13L, 13R) generan una versión espacializada h_{1,} h_{2} de la señal de audio s(t);
- \bullet
- unos medios de entrada de audio (21) para detectar señales acústicas;
- \bullet
- unos medios de salida de señales (22) para transmitir una señal y(t) derivada de las señales acústicas detectadas por los medios de entrada de audio (21);
- \bullet
- unos medios de estimación de trayectos de eco (25) que comprenden unos medios de detección para identificar cambios en las funciones de ganancia g_{1}, g_{2} de los medios de control (14L, 14R) respectivos, y unos medios de estimación para generar una estimación del trayecto de eco entre los medios de salida acústica 13L, 13R y los medios de entrada acústica (21), basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia g_{1,} g_{2} detectadas por los medios de detección;
- \bullet
- unos medios de generación de señales de cancelación de eco (24L, 24R) para generar una señal de cancelación de eco derivada de las señales de audio espacializadas generadas por los medios de control (14L, 14R) y las estimaciones derivadas por los medios de estimación del trayecto de eco (25), y
- \bullet
- unos medios de combinación de señales (26) para aplicar la señal de cancelación de eco a la señal generada por los medios de entrada de audio.
7. Aparato según la reivindicación 6, en el
que las funciones de ganancia aplicadas a los canales respectivos
son factores escalares de ganancia.
8. Aparato según la reivindicación 6 ó 7, en
el que se utiliza un filtro adaptativo de mínimos cuadráticos medios
normalizado para formar la actualización de las estimaciones de
trayecto de eco.
9. Aparato según la reivindicación 6 ó 7, en
el que se utiliza un filtro adaptativo de proyección afín rápida
para formar la actualización de las estimaciones de trayecto de
eco.
10. Aparato según la reivindicación 6 ó 7, en
el que se utiliza un filtro adaptativo de mínimos cuadráticos medios
recursivo para formar la actualización de las estimaciones de
trayecto de eco.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP99304040 | 1999-05-25 | ||
EP99304040 | 1999-05-25 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2269137T3 true ES2269137T3 (es) | 2007-04-01 |
Family
ID=8241410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES00927602T Expired - Lifetime ES2269137T3 (es) | 1999-05-25 | 2000-05-18 | Cancelacion del eco acustico. |
Country Status (9)
Country | Link |
---|---|
US (1) | US7660425B1 (es) |
EP (1) | EP1180300B1 (es) |
JP (1) | JP2003500937A (es) |
CN (1) | CN1351795A (es) |
AU (1) | AU4599300A (es) |
CA (1) | CA2373114C (es) |
DE (1) | DE60029436T2 (es) |
ES (1) | ES2269137T3 (es) |
WO (1) | WO2000072567A1 (es) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7903137B2 (en) * | 2004-10-15 | 2011-03-08 | Lifesize Communications, Inc. | Videoconferencing echo cancellers |
NO328256B1 (no) * | 2004-12-29 | 2010-01-18 | Tandberg Telecom As | Audiosystem |
JP5053849B2 (ja) * | 2005-09-01 | 2012-10-24 | パナソニック株式会社 | マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法 |
JP4688701B2 (ja) * | 2006-03-09 | 2011-05-25 | 富士通東芝モバイルコミュニケーションズ株式会社 | 通信端末 |
US8385557B2 (en) * | 2008-06-19 | 2013-02-26 | Microsoft Corporation | Multichannel acoustic echo reduction |
US8208649B2 (en) * | 2009-04-28 | 2012-06-26 | Hewlett-Packard Development Company, L.P. | Methods and systems for robust approximations of impulse responses in multichannel audio-communication systems |
JP4924652B2 (ja) * | 2009-05-07 | 2012-04-25 | 株式会社デンソー | 音声認識装置及びカーナビゲーション装置 |
EP2438766B1 (en) * | 2009-06-02 | 2015-05-06 | Koninklijke Philips N.V. | Acoustic multi-channel echo cancellation |
US8634569B2 (en) | 2010-01-08 | 2014-01-21 | Conexant Systems, Inc. | Systems and methods for echo cancellation and echo suppression |
CN102223456B (zh) * | 2010-04-14 | 2013-09-11 | 华为终端有限公司 | 回声信号处理方法及装置 |
CN102387269B (zh) * | 2010-08-27 | 2013-12-04 | 华为终端有限公司 | 一种单讲状态下回声抵消的方法、装置及系统 |
JP5017441B2 (ja) * | 2010-10-28 | 2012-09-05 | 株式会社東芝 | 携帯型電子機器 |
WO2012094528A1 (en) | 2011-01-05 | 2012-07-12 | Conexant Systems, Inc., A Delaware Corporation | Systems and methods for stereo echo cancellation |
EP2487891B1 (de) * | 2011-02-11 | 2018-09-05 | Deutsche Telekom AG | Vermeiden eines akustischen Echos bei Vollduplexsystemen |
CN102646418B (zh) * | 2012-03-29 | 2014-07-23 | 北京华夏电通科技股份有限公司 | 一种远程音频交互的多路声学回音消除方法及系统 |
CN102820036B (zh) * | 2012-09-07 | 2014-04-16 | 歌尔声学股份有限公司 | 一种自适应消除噪声的方法和装置 |
CN104392727A (zh) * | 2014-11-12 | 2015-03-04 | 华为技术有限公司 | 音频信号处理方法和相关装置 |
WO2016108166A1 (en) * | 2014-12-28 | 2016-07-07 | Silentium Ltd. | Apparatus, system and method of controlling noise within a noise-controlled volume |
CN105407243B (zh) * | 2015-10-26 | 2019-02-19 | 南京邮电大学 | 一种Android平台上使用改进仿射投影算法的回声消除VOIP系统 |
DE102015222105A1 (de) * | 2015-11-10 | 2017-05-11 | Volkswagen Aktiengesellschaft | Audiosignalverarbeitung in einem Fahrzeug |
CN110956973A (zh) * | 2018-09-27 | 2020-04-03 | 深圳市冠旭电子股份有限公司 | 一种回声消除方法、装置及智能终端 |
CN111756943B (zh) * | 2020-06-05 | 2021-04-20 | 中原工学院 | 一种增广复值成比例子带自适应立体声学回声消除方法 |
CN112700788B (zh) * | 2020-12-23 | 2024-05-03 | 普联国际有限公司 | 回声消除中回声路径的建模方法、装置、设备及存储介质 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2635684B2 (ja) | 1988-05-31 | 1997-07-30 | 株式会社東芝 | ステレオ音声伝送システム |
JP2792311B2 (ja) | 1992-01-31 | 1998-09-03 | 日本電気株式会社 | 多チャンネルエコー除去方法および装置 |
JPH05316239A (ja) | 1992-05-08 | 1993-11-26 | Toshiba Corp | 会議システム |
GB9211756D0 (en) * | 1992-06-03 | 1992-07-15 | Gerzon Michael A | Stereophonic directional dispersion method |
JP2523258B2 (ja) | 1993-06-17 | 1996-08-07 | 沖電気工業株式会社 | 多地点間エコ―キャンセラ |
FR2713417B1 (fr) * | 1993-12-02 | 1996-02-02 | Europ Agence Spatiale | Procédé de réglage adaptatif d'un suppresseur d'écho. |
DE69532394T2 (de) * | 1994-02-10 | 2004-11-04 | Nippon Telegraph And Telephone Corp. | Verfahren und Vorrichtung zur Echokompensation mit Anwendung der "fast projection scheme" |
JP3397269B2 (ja) * | 1994-10-26 | 2003-04-14 | 日本電信電話株式会社 | 多チャネル反響消去方法 |
US5828756A (en) * | 1994-11-22 | 1998-10-27 | Lucent Technologies Inc. | Stereophonic acoustic echo cancellation using non-linear transformations |
US5745564A (en) | 1995-01-26 | 1998-04-28 | Northern Telecom Limited | Echo cancelling arrangement |
US5734724A (en) | 1995-03-01 | 1998-03-31 | Nippon Telegraph And Telephone Corporation | Audio communication control unit |
CA2186416C (en) * | 1995-09-26 | 2000-04-18 | Suehiro Shimauchi | Method and apparatus for multi-channel acoustic echo cancellation |
JP3625325B2 (ja) | 1995-10-31 | 2005-03-02 | 株式会社東芝 | 拡声通話装置およびエコーキャンセラ |
US7012630B2 (en) * | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
JP3483086B2 (ja) | 1996-03-22 | 2004-01-06 | 日本電信電話株式会社 | 音声電話会議装置 |
JPH09307651A (ja) | 1996-05-17 | 1997-11-28 | Hitachi Ltd | 簡易ステレオ伝送方式 |
JP3654470B2 (ja) * | 1996-09-13 | 2005-06-02 | 日本電信電話株式会社 | サブバンド多チャネル音声通信会議用反響消去方法 |
FR2762467B1 (fr) * | 1997-04-16 | 1999-07-02 | France Telecom | Procede d'annulation d'echo acoustique multi-voies et annuleur d'echo acoustique multi-voies |
US6895093B1 (en) * | 1998-03-03 | 2005-05-17 | Texas Instruments Incorporated | Acoustic echo-cancellation system |
DE69908463T2 (de) * | 1998-03-05 | 2004-05-13 | Nippon Telegraph And Telephone Corp. | Verfahren und Einrichtung zur mehrkanaligen Kompensation eines akustischen Echos |
WO1999053674A1 (en) * | 1998-04-08 | 1999-10-21 | British Telecommunications Public Limited Company | Echo cancellation |
US6990205B1 (en) * | 1998-05-20 | 2006-01-24 | Agere Systems, Inc. | Apparatus and method for producing virtual acoustic sound |
US6707912B2 (en) * | 1999-03-11 | 2004-03-16 | Motorola, Inc. | Method and apparatus for setting a step size for an adaptive filter coefficient of an echo canceller |
-
2000
- 2000-05-18 CN CN00807985.4A patent/CN1351795A/zh active Pending
- 2000-05-18 CA CA002373114A patent/CA2373114C/en not_active Expired - Fee Related
- 2000-05-18 JP JP2000619910A patent/JP2003500937A/ja not_active Withdrawn
- 2000-05-18 WO PCT/GB2000/001904 patent/WO2000072567A1/en active IP Right Grant
- 2000-05-18 DE DE60029436T patent/DE60029436T2/de not_active Expired - Lifetime
- 2000-05-18 US US09/959,450 patent/US7660425B1/en not_active Expired - Fee Related
- 2000-05-18 ES ES00927602T patent/ES2269137T3/es not_active Expired - Lifetime
- 2000-05-18 EP EP00927602A patent/EP1180300B1/en not_active Expired - Lifetime
- 2000-05-18 AU AU45993/00A patent/AU4599300A/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US7660425B1 (en) | 2010-02-09 |
EP1180300B1 (en) | 2006-07-19 |
DE60029436D1 (de) | 2006-08-31 |
CA2373114A1 (en) | 2000-11-30 |
DE60029436T2 (de) | 2006-12-28 |
JP2003500937A (ja) | 2003-01-07 |
CA2373114C (en) | 2007-03-27 |
WO2000072567A1 (en) | 2000-11-30 |
CN1351795A (zh) | 2002-05-29 |
EP1180300A1 (en) | 2002-02-20 |
AU4599300A (en) | 2000-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2269137T3 (es) | Cancelacion del eco acustico. | |
US8204252B1 (en) | System and method for providing close microphone adaptive array processing | |
US8194880B2 (en) | System and method for utilizing omni-directional microphones for speech enhancement | |
US7925008B2 (en) | Multi-channel echo cancel method, multi-channel sound transfer method, stereo echo canceller, stereo sound transfer apparatus and transfer function calculation apparatus | |
EP3312839B1 (en) | Device for assisting two-way conversation and method for assisting two-way conversation | |
US6895093B1 (en) | Acoustic echo-cancellation system | |
US8391472B2 (en) | Acoustic echo cancellation solution for video conferencing | |
JPH10190848A (ja) | 音響エコーキャンセル方法とそのシステム | |
US20140044274A1 (en) | Estimating Direction of Arrival From Plural Microphones | |
SK282101B6 (sk) | Sieť s potlačenou ozvenou | |
US7324466B2 (en) | Echo canceling system and echo canceling method | |
Franzen et al. | Improved measurement noise covariance estimation for N-channel feedback cancellation based on the frequency domain adaptive Kalman filter | |
JP2006033789A (ja) | 反響路結合量推定方法、反響路結合量推定装置、反響路結合量推定プログラム、エコー抑圧方法、エコー抑圧装置、エコー抑圧プログラム、エコーサプレス方法、エコーサプレッサ、エコーサプレッサプログラム、通信路上の損失量制御方法、通信路上の損失量制御装置、通信路上の損失制御プログラム、多チャネルエコー抑圧方法、多チャネルエコー抑圧装置、多チャネルエコー抑圧プログラム、記録媒体 | |
JP4920511B2 (ja) | マルチチャンネルエコーキャンセラ | |
JP3616341B2 (ja) | 多チャネルエコーキャンセル方法、その装置、そのプログラム及び記録媒体 | |
JPS6172420A (ja) | 多通路反響消去方式 | |
JP4162860B2 (ja) | 不要音信号除去装置 | |
JP4159967B2 (ja) | 多チャネル音響エコー消去方法及び装置 | |
Buchner et al. | An acoustic human-machine interface with multi-channel sound reproduction | |
JPH01215130A (ja) | エコーキャンセラー装置 | |
JP5058052B2 (ja) | エコー消去装置 | |
JP3700838B2 (ja) | 多チャネル反響消去方法・多チャネル反響消去装置・多チャネル反響消去プログラム | |
JP2002252577A (ja) | 多チャネル音響エコー消去方法、その装置、そのプログラム及びその記録媒体 | |
JPH02278926A (ja) | Fir・ラティス混合形エコーキャンセラ | |
Tran | Robust Techniques for Acoustic Feedback Control in Hearing Aids |