ES2269137T3

ES2269137T3 - Cancelacion del eco acustico.

Info

Publication number: ES2269137T3
Application number: ES00927602T
Authority: ES
Inventors: Martin University of Essex REED; Malcolm John University of Essex HAWKSFORD
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 1999-05-25
Filing date: 2000-05-18
Publication date: 2007-04-01
Anticipated expiration: 2020-05-18
Also published as: EP1180300A1; US7660425B1; CA2373114A1; JP2003500937A; CA2373114C; DE60029436T2; WO2000072567A1; AU4599300A; DE60029436D1; EP1180300B1; CN1351795A

Abstract

Procedimiento de cancelación del eco acústico para una señal espacializada orientada de canal múltiple, estando generada la señal espacializada orientada a partir de una entrada de señal (12) modificada según las funciones de ganancia de espacialización (g1, g2) respectivas para generar una pluralidad de canales de audio (x1(t), x2(t)), utilizando el proceso de cancelación de eco una espacialización y una estimación de los trayectos de eco combinadas (h1, h2), desviándose la estimación a partir de las funciones de ganancia aplicadas a los canales respectivos, con lo cual, cuando cambian las funciones de ganancia aplicadas a los canales respectivos, se genera una estimación (h1, h2) de los trayectos de eco (h1, h2), basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia (g1, g2), utilizándose las estimaciones de los trayectos de eco (h1, h2) para generar una señal de cancelación de eco e(t).

Description

Cancelación del eco acústico.

La presente invención se refiere a un procedimiento para la cancelación del eco acústico de canal múltiple (AEC) aplicable a sistemas que derivan una señal multicanal espacializada a partir de una señal monofónica, cada canal de la cual se aplica a un elemento respectivo de una serie de altavoces a diferentes ganancias para proporcionar la percepción o ilusión audible de direccionalidad. Esta clase de señal espacializada se denominará en este documento mono orientado. Un sistema mono orientado utiliza dos o más elementos de ganancia para representar la espacialización, que se representa en un procesador panorámico para generar las salidas de altavoz correspondientes. En las formas de realización que se describirán se utiliza una señal estereofónica de dos canales, con dos altavoces - un sistema conocido como "estéreo a partir de mono orientado" (SSM), pero los principios de la invención pueden aplicarse a sistemas con más de dos canales. La invención tiene aplicación en sistemas de teleconferencia en los cuales se proporciona a la voz de cada interlocutor posicionamiento espacial en provecho del oyente.

En el caso de una comunicación de voz cómoda en un sistema de teleconferencia que utiliza un altavoz y un micrófono, a diferencia del casco con auriculares, se necesita un procedimiento de cancelación del eco acústico (AEC). Para sistemas monofónicos puede utilizarse la topología que muestra la figura 1, con diversos procesos adaptativos diferentes como por ejemplo el de mínimos cuadráticos medios (LMS), mínimos cuadrados recursivos (RLS) o proyección rápida afín (FAP). No obstante, en el caso de sistema estereofónicos y de canal múltiple, las soluciones existentes están mucho menos avanzadas y todavía presentan obstáculos importantes que deben superarse. El ejemplo de la figura 2 muestra que en el caso de un sistema estereofónico hay dos trayectos de eco, h_{1} y h_{2} (que comprenden las respuestas de impulso del micrófono y el altavoz), en comparación con el trayecto único en el caso del sistema monofónico. (Se supone que se utiliza un solo micrófono, como ocurre generalmente cuando la espacialización debe crearse artificialmente. Más generalmente, el número de trayectos de eco es el producto del número de altavoces por el número de micrófonos).

Las soluciones existentes para el problema de cancelación del eco acústico generalmente presentan la disposición del sistema que muestra la figura 2, en la cual las respuestas del trayecto de la persona que habla al micrófono son desconocidas. El objetivo del proceso adaptativo en el cancelador de eco es utilizar las señales x_{1}(t), x_{2}(t) y e(t) para entrenar los filtros adaptativos \hat{h}_{1} y \hat{h}_{2} para que

(1)e(t) \rightarrow 0

Con los procesos existentes de filtro adaptativo no es posible alcanzar un ajuste convergente de los filtros como por ejemplo

(2)h_{1} = \hat{h}_{1}\ y\ h_{2} = \hat{h}_{2}

En lugar de ello, se obtiene una solución convergente como la siguiente

(3)h_{1} * g_{1} + h_{2} * g_{2} = \hat{h}_{1} * g_{1} + \hat{h}_{2} * g_{2}

en la que * es el operador de convolución. Debe tenerse en cuenta que la ecuación (3) satisface la ecuación (1), pero la ecuación (2) no es la única solución para la ecuación (3), por lo tanto los valores de h_{1} y h_{2} no pueden derivarse de este resultado.

Si los filtros g_{1} o g_{2} cambian, posiblemente debido al movimiento de la persona que habla, la igualdad de la ecuación (3) ya no se mantiene (a no ser que también se cumpla la ecuación (2)). Por lo tanto, el cancelador de eco ya no produce una solución convergente y el eco que oye la persona que habla aumenta de nivel.

Se han propuesto diversas soluciones para este problema, que consisten en manipular las señales del altavoz x_{1} y x_{2}, o en utilizar las propiedades de la señales x_{1} y x_{2}. El propósito de estas soluciones es utilizar las propiedades de correlación mutua de las dos señales, ya que puede demostrarse que existe una solución a la ecuación (2) cuando las dos señales se encuentran suficientemente descorrelacionadas. No obstante, al estar, en un sistema de teleconferencia las señales x_{1} y x_{2}, inherentemente correlacionadas, las técnicas que aprovechan las pequeñas características descorrelacionadas de las señales presentan un bajo rendimiento, excepto en condiciones ideales.

Se ha propuesto añadir una pequeña cantidad de ruido blanco independiente a las señales x_{1} y x_{2}. Introduciendo alguna señal descorrelacionada, se ha comprobado que esto contribuye significativamente a la convergencia de la solución hacia la presentada en la Ecuación (2). No obstante, aunque añadir ruido de este modo mejorar la convergencia, el ruido debe añadirse a un nivel tal que resulta indeseablemente audible.

Un artículo titulado "A Multichannel Affine projection Algorithm With Applications To Multichannel Accoustic Echo Cancellation" de Benesty et al en "IEEE Signal Processing Letters", vol. 3, nº 2, páginas 36-37, publicado en 1996 por la IEEE Signal Processing Society describe un sistema de supresión de eco multicanal que alimenta los respectivos canales con filtros adaptativos correspondientes, pero no tiene en cuenta los factores de ganancia de los respectivos canales.

Según la presente invención, se dispone un procedimiento de cancelación de eco acústico para una señal espacializada orientada de canal múltiple generada a partir de una entrada de señal modificada según las funciones de ganancia de espacialización respectivas para generar una pluralidad de canales de audio, utilizando el proceso de cancelación de eco una espacialización y una estimación de los trayectos de eco combinadas, calculándose la estimación a partir de las funciones de ganancia aplicadas a los canales respectivos, con lo cual, cuando cambian las funciones de ganancia aplicadas a los canales respectivos, se genera una estimación de los trayectos de eco, basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia, utilizándose la estimación de los trayectos de eco para generar una señal de cancelación de eco.

Según otro aspecto de la presente invención, se dispone un aparato para cancelación del eco acústico en un sistema de audio espacializado orientado de canal múltiple, en el que el sistema de audio espacializado comprende:

unos medios de entrada de señal para recibir una señal de audio,

una pluralidad de medios de salida de audio para generar señales acústicas derivadas de la señal de audio;

unos medios de control asociados con los medios de salida de audio para generar entradas de control de ganancia que controlan los medios de salida de audio de manera que dicha pluralidad de medios de salida de audio generan una versión espacializada de la señal de audio;

unos medios de entrada de audio para detectar señales acústicas;

unos medios de salida de señales para transmitir una señal derivada de las señales acústicas detectadas por los medios de entrada de audio;

unos medios de estimación de trayectos de eco que comprenden unos medios de detección para identificar cambios en las funciones de ganancia de los medios de control respectivos, y medios de estimación para generar una estimación del trayecto de eco entre los medios de salida acústica y los medios de entrada acústica, basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia detectadas por los medios de detección;

unos medios de generación de señales de cancelación de eco para generar una señal de cancelación de eco derivada de las señales de audio espacializadas generadas por los medios de control y la estimación derivada por los medios de estimación del trayecto de eco, y

unos medios de combinación de señales para aplicar la señal de cancelación de eco a la señal generada por los medios de entrada de audio.

La presente invención es una adaptación del proceso LMS monofónico. La invención evita actualizaciones múltiples de dos o más estimaciones de trayectos de eco, tales como \hat{h}_{1} y \hat{h}_{2}, y reduce el número de operaciones de filtración requeridas en comparación con los procesos de cancelación de eco estéreo existentes, tales como \hat{h}_{1} * x_{1} y \hat{h}_{2} * x_{2}. Adicionalmente, la invención utiliza los parámetros de espacialización en el proceso adaptativo, a diferencia de los procesos de cancelación de eco existentes. La actualización del LMS se modifica para tomar en consideración los parámetros de espacialización que se utilizan para actualizar la estimación del trayecto de eco agregado cada vez que cambia la espacialización. Después de cambiar la espacialización N, (donde N es el número de canales del sistema), la estimación del trayecto de eco agregado converge con el trayecto de eco agregado para futuros cambios en las espacialización. Antes del cambio N de la espacialización. el proceso converge hacia una solución local para la estimación del trayecto de eco agregado, de modo que sigue existiendo alguna reducción de la señal de eco en el estadio de aprendizaje del proceso.

El estadio de aprendizaje puede ser parte de una fase de preparación del sistema antes de la utilización del mismo en funcionamiento operativo. Por ejemplo, el número requerido de cambios de espacialización puede alcanzarse operando el proceso LMS monofónico para cada canal sucesivamente, ajustando las ganancias de los demás canales a cero.

A continuación se describe, a título de ejemplo, una forma de realización de la invención considerada conjuntamente con las figuras en las cuales

la figura 1 ilustra los principios de la cancelación de eco monofónico,

la figura 2 ilustra los principios básicos de la cancelación de eco estereofónico, (sólo se muestra la mitad del trayecto de retorno)

la figura 3 ilustra una forma de realización de la invención,

la figura 4 ilustra un sistema teórico equivalente al de la figura 3,

la figura 5 es una ilustración gráfica del error medio del sistema que muestra la figura 3 comparando sistemas anteriores con el de la invención,

la figura 6 ilustra el descenso a lo largo del tiempo del desajuste de las estimaciones de trayecto erróneas \hat{h}_{1} y \hat{h}_{2} utilizando el procedimiento según la invención.

la figura 7 es un diagrama de flujo que muestra el proceso de actualización de la forma de realización preferida.

El sistema monofónico ilustrado en la figura 1 comprende un trayecto de entrada 12 conectado a la fuente (micrófono 11 y altavoz 10) de la señal original s(t). Esta señal s(t) se modifica mediante el trayecto de transmisión 12 para generar una señal de altavoz x(t) que se suministra al altavoz 13. El trayecto de retorno consiste en un micrófono 21, un trayecto de transmisión de retorno 22 y un altavoz 23. Entre el altavoz 13 de un trayecto y el micrófono 21 del otro trayecto existe un trayecto acústico h_{1}. Por lo tanto, algunos sonidos originados por la persona que habla 10 serán devueltos al altavoz 23 y oídos por la persona que habla 10 como eco. Este efecto puede resultar intrusivo, especialmente cuando los trayectos de transmisión 12, 22 pueden introducir retardos, de modo que se instala un procesador de cancelación de eco 24, 25, 26 para eliminar esta señal. Un procesador adaptativo 24 compara la señal e(t) que debe transmitirse por la vía de retorno 22 con la señal x(t) que llega por el trayecto de entrada 12 e identifica las correlaciones entre ellas. Esto se utiliza para controlar un banco de filtros adaptativos 25 para generar un vector \hat{h}_{1}. Este vector es una estimación del trayecto acústico h_{1}. Este vector se aplica a la señal de entrada x(t) mediante el filtro y el resultado se sustrae de la entrada y(t) del micrófono 21 en un combinador 26 para generar una señal de retorno e(t). Si el filtro adaptativo 25 genera una estimación \hat{h}_{1} exacta de la función h_{1}, la señal de eco y(t) debería ser anulada por la salida del filtro adaptativo 25 y e(t) debería ser cero. Por lo tanto, las únicas señales transmitidas por el trayecto de retorno 22 serán los sonidos generados cerca del micrófono 21 y no recibidos del altavoz 13.

La figura 2 ilustra un sistema estereofónico generalizado. La situación es similar a la de la figura 1, excepto porque en este caso se han dispuesto dos altavoces y dos micrófonos (indicados por los sufijos "L" y "R" en la figura 2) en cada extremo. Sólo se muestra un canal 22L del trayecto de retorno. Para cada trayecto de retorno 22L, (22R) existen dos estimaciones de trayecto de eco \hat{h}_{1L}, \hat{h}_{2L}, una para cada trayecto de ida 12_{L}, 12_{R}, porque cada micrófono 21L, (21R) es capaz de recibir retroalimentación acústica de ambos altavoces 13L, 13R. Debido a que los dos trayectos de ida 12_{L}, 12_{R} transportan señales de la misma fuente 10, existe una correlación significativa entre las dos estimaciones \hat{h}_{1L}, \hat{h}_{2L} y, por lo tanto, los procesos que generan los valores de los filtros adaptativos 25LL, 25RL no son independientes.

En el caso general que muestra la figura 2, las funciones originales g_{1}, g_{2} son desconocidas en el extremo receptor, siendo dependientes de las posiciones relativas de los micrófonos 11L, 11R y la persona que habla 10. Por lo tanto, no es posible calcular una solución única para \hat{h}_{1L}, \hat{h}_{2L}. Para una espacialización determinada, el procesador adaptativo 24L generará dos funciones adecuadas \hat{h}_{1L}, \hat{h}_{2L} para las cuales resulta válida la ecuación (3) anteriormente citada:

(3)h_{1} * g_{1} + h_{2} * g_{2} = \hat{h}_{1} * g_{1} + \hat{h}_{2} * g_{2}

pero esto no implica necesariamente que también pueda aplicarse la ecuación (2):

(2)h_{1} = \hat{h}_{1}\ y\ h_{2} = \hat{h}_{2}

Si la espacialización, y por lo tanto las funciones g_{1}, g_{2} cambian, se apreciará que los filtros adaptativos deben reiniciarse para corresponder a la nueva espacialización.

En un sistema orientado como el que ilustran las figura 3 y 4, se utiliza una fuente monofónica y las funciones g_{1}, g_{2} se convierten en valores escalares g_{1}, g_{2} que representan ganancia. Por consiguiente, sólo hay un trayecto de transmisión 12, 22 en cada dirección. La información de control, generada tanto en el extremo receptor como en el transmisor con la señal monofónica s(t), se utiliza para controlar los amplificadores de ganancia variable 14L, 14R para variar las funciones de ganancia g_{1}, g_{2} definiendo la espacialización en el extremo receptor, para emular una fuente estereofónica. El hecho de que las funciones de ganancia g_{1}, g_{2} sean conocidas en el extremo receptor permite utilizarlas en el procesador adaptativo 24, 25.

A continuación se describirá el funcionamiento del procesador adaptativo 24, 25 con referencia a la figura 7. La teoría matemática subyacente se describirá a continuación con referencia a las figuras 3 y 4.

Después de la etapa de inicialización 101, en la cual se ajustan valores nocionales para las funciones de ganancia g_{1}, g_{2}, el proceso se ejecuta en un bucle iterativo para cada periodo muestreado n del modo siguiente.

En primer lugar, se ajustan los valores k_{1}, k_{2}, k_{3} (etapa 102). Estos valores identifican los tres últimos períodos muestreados en los cuales han cambiado los valores de espacialización g_{1}, g_{2}. Si los valores de ganancia de espacialización g_{1}, g_{2} no han cambiado desde la muestra previa n-1 los valores de k_{1}, k_{2}, k_{3} son los mismos que para la muestra anterior. No obstante, si los valores han cambiado, k_{3} se ajusta al valor previo de k_{2}, k_{2} se ajusta al valor previo de k_{1}, y k_{1} se ajusta a n-1.

A continuación se determina la función de la ganancia estimada (etapa 103). Esta función es la matriz
1 Si los valores de espacialización g_{1}, g_{2} no han cambiado, esta matriz tampoco cambia y no es necesario volver a calcularla. A continuación se determina la inversa de esta matriz.

2

De nuevo, si los valores de espacialización g_{1}, g_{2} no han cambiado, esta matriz tampoco cambia y por lo tanto no es necesario volver a calcularla.

A continuación, (etapa 104), si r = n - k_{1} + 1 es inferior al número de términos L en el vector de trayecto de eco \hat{h} estimado (en otras palabras, si el número de muestras r transcurrido desde el último cambio de espacialización es inferior a L), se corrige un término del vector de trayecto de eco estimado \hat{h}_{n-1} como sigue

3

(siendo \hat{h}_{n-1} el caso específico de la función de trayecto de eco estimado \hat{h} de la iteración previa). Todos los demás términos \hat{h}_{n-1}(0)...\hat{h}_{n-1}(r-1) y \hat{h}_{n-1}(r+1)...\hat{h}_{n-1}(L-1) permanecen sin cambios.

A continuación se genera la señal de cancelación de error s_{n}^{T} \hat{h}_{n-1} (en la que s_{n} es el vector que representa las últimas muestras L de la señal de entrada s(n)), utilizando el vector de trayecto de eco estimado \hat{h}_{n-1} (etapa 105), y se sustrae de la señal y(n) para generar la señal de salida e(n).

El vector de trayecto de eco estimado \hat{h}_{n-1} se adapta, a continuación, como respuesta a la señal de eco e(n) (etapa 106) para utilizarlo en la siguiente iteración.

\hat{h}_{n} = \hat{h}_{n-1} + \mu s_{n} \varepsilon(n)

en la que \varepsilon(n) = s_{n}^{T}s_{n}e(n) y \mu es el tamaño de la etapa.

El progreso es estable a no ser que la espacialización cambie en una escala de tiempo superior al período L, y que 0 \leq \mu < 2.

La complejidad de cálculo de las etapas 105 y 106 del proceso anterior es la misma que la del proceso LMS normalizado, que es del orden de 2L. El número de cálculos es del orden de dos multiplicaciones y una división para la inversión de matriz utilizada en la etapa 103. Como que se realiza solamente una vez después de cada cambio de las espacialización, aumenta poco la complejidad del proceso para L grandes. La etapa 104 sólo se calcula en las L primeras muestras después de un cambio de la espacialización y es insignificante para las L grandes. Por lo tanto, cuando se utiliza el proceso mostrado anteriormente para la cancelación del eco acústico con un sistema orientado mono, para el cual es probable que L > 100, el proceso presenta una complejidad de aproximadamente 2L.

Sigue una descripción matemática, que se iniciará a partir del sistema mostrado en la figura 4 y a continuación procederá a mostrar que es equivalente al sistema según la invención mostrado en la figura 3 que utiliza una única estimación de trayecto de eco agregado.

Como muestra la figura 4, los dos trayectos de respuesta de impulso de micrófono 12L, 12R (figura 2) se sustituyen por dos respuestas de impulso generadas artificialmente g_{1} y g_{2} que actúan sobre una única señal de micrófono s(t) recibida a través del trayecto monofónico 12 para generar la percepción o ilusión de espacialización. En el caso de la solución presentada aquí, las funciones g_{1} y g_{2} se han simplificado todavía más representándolas como simples funciones de ganancia antes que como respuestas de impulso. Este sistema trabaja de un modo completamente diferente al del sistema anterior de la figura 2 ya que, antes que intentar descorrelacionar las señales x_{1} y x_{2} para ayudar a la convergencia, el procedimiento presentado aquí depende de la naturaleza inherentemente altamente correlacionada de las señales x_{1} y x_{2}. El procedimiento utiliza el conocimiento de las funciones g_{1} y g_{2} (que son desconocidas en los sistemas de la técnica anterior) para conseguir una cancelación de eco convergente. Antes de describir una solución de filtro adaptativo al problema del eco, se demostrará que existe una solución al problema.

Haciendo que la entrada al bloque de espacialización en el tiempo de muestra n esté representada por un vector de columna s_{n} = [s(n) s(n-1) ... s(n-(L-1))]^{T}, la entrada al micrófono del extremo del oyente esté representada por y_{n} = [y(n) y(n-1) ... y(n-(L-1))]^{T} y que los dos trayectos de eco del altavoz al micrófono sean los vectores L de columna h_{1} y h_{2} (que incorporan las respuestas de impulso del altavoz y el micrófono) de longitud L, entonces

(4)y_{n} = g_{1}(n)S_{n}h_{1} + g_{2}(n)S_{n}h_{2}

en la que la espacialización está representada como valores de ganancia g_{1}(n) y g_{2}(n) que son constantes a lo largo de los períodos de muestra n-(L-1) ... n, y S_{n} = [s_{n} ... s_{n-(L-1)}]^{T} (es una matriz de "Toeplitz", es decir, una matriz simétrica de orden L x L, que presenta los términos de s_{n} en la primera fila y la primera columna, los términos de s_{n-1} en la segunda fila y columna, y así sucesivamente). Puede apreciarse que h_{1} y h_{2} no pueden resolverse a partir de la ecuación (4).

No obstante, considerando ahora la utilización de un segundo conjunto de observaciones de entradas y salidas en un tiempo de muestra n + a, en la que a \geq L y

4

en otras palabras, las funciones g_{1} y g_{2} han cambiado entre el tiempo de muestra n y el tiempo de muestra n + 1, pero a continuación se han mantenido sin cambios entre el tiempo n + 1 y el tiempo de muestra n + a.

Por lo tanto,

5

en en la que I_{L} es la matriz de identidad L x L,

6

y \oplus es el producto de Kronecker. (El producto de Kronecker de dos matrices A y B se obtienen multiplicando la matriz B independientemente por cada término individual de la matriz A y formando una nueva matriz (cuyo orden es el producto de las dos matrices originales) con los términos resultantes).

La solución a la ecuación (6) es

7

y utilizando las identidades del producto de Kronecker

8

Por lo tanto existe una solución para h_{1} y h_{2} si la señal s excita persistentemente (es decir, presenta un contenido totalmente espectral) y la matriz G_{n\cdot n+a} es no singular, es decir, tiene una matriz inversa. La condición de no singular de la matriz G_{n\cdot n+a} se cumple si los valores de espacialización en los tiempos de muestra n y n+a son diferentes y no son múltiplos escalares uno de otro (es decir, g_{1} (n) / g_{2}(n) \neq g_{1}(n + a) / g_{2}(n + a). Idealmente, los valores deberían ser suficientemente diferentes para que la solución de la ecuación (9) presente las condiciones adecuadas.

Una vez establecido que existe una solución, a continuación se deriva del proceso LMS el proceso adaptativo para la solución. El proceso LMS normalizado (NLMS) se utiliza para efectuar la cancelación del eco monofónico, como se ha mencionado con referencia a la figura 1, utilizando las actualizaciones siguientes

(10)e(n) = y(n) - s^{T}_{n} \hat{h}_{n-1}

(11)\varepsilon(n) = s^{T}_{n}S_{n}e(n)

(12)\hat{h}_{n} = \hat{h}_{n-1} + \mu s_{n} \varepsilon(n)

en las que e(n) es la señal de eco, \mu es el parámetro de tamaño de la etapa y \hat{h}_{n} es la estimación del trayecto de eco en el caso de muestra n. Las ecuaciones anteriores del LMS normalizado pueden modificarse para el caso mono orientado utilizando una estimación de trayecto de eco agregado único y redefiniendo \hat{h}_{n-1} como

9

en la que \hat{h}_{1}(t) y \hat{h}_{2}(t) son funciones que representan las dos estimaciones de eco en el intervalo de muestra n. Similarmente se define h como la combinación de h_{1}(t) y h_{2}(t) en una forma equivalente a la que muestra la ecuación 13

10

La tarea consiste entonces en utilizar y actualizar \hat{h} de modo que las actualizaciones del LMS normalizado de las ecuaciones 10, 11 y 12 se utilizan para la cancelación de eco en vez de utilizar explícitamente dos estimaciones de trayecto de eco. Si los valores de g_{1}(n) y g_{2}(n) son constantes para todos los n, las actualizaciones de la ecuación 10, 11 y 12 pueden utilizarse sin cambios para determinar una estimación de h, cuando h es constante a lo largo del tiempo. No obstante, si g_{1}(n) y g_{2}(n) cambian a lo largo del tiempo, esta solución no puede utilizarse, ya que un cambio en h no se tiene en cuenta en las actualizaciones del LMS de las ecuaciones 10, 11 y 12.

Considerando tres épocas de muestra i, i-a e i-b donde

11

y similarmente para g_{2}(n), es decir, los valores de g_{1}(n) y g_{2}(n) cambian sólo en las épocas i-a e i-b.

Considerando que el valor del coeficiente j en el trayecto de eco combinado en las épocas i-a-1 e i-b-1 (es decir, justo antes de los cambios en la espacialización) que forman las ecuaciones 14 y 16 viene dado por

12

Las ecuaciones 17 y 18 pueden expresarse como

13

y por lo tanto

14

utilizando la definición de G de (7).

Además, considerando el valor del coeficiente j en el trayecto de eco combinado en la época i que, a partir de (14) y (16), viene dada por

\vskip1.000000\baselineskip

15

\vskip1.000000\baselineskip

Si los elementos de G^{-1} se definen mediante una variable \gamma tal como

\vskip1.000000\baselineskip

16

\vskip1.000000\baselineskip

a partir de (19), (21) y (22)

17

Esta ecuación es la actualización adicional requerida para la actualización del LMS normalizado de las ecuaciones (10), (11) y (12). Debe tenerse en cuenta que a partir de (21) sólo necesita actualizarse un coeficiente en h de cada período de muestra para tomar en consideración un cambio en la espacialización.

El proceso puede extenderse a un sistema que presenta más de dos canales efectuando una pequeña modificación para el proceso. Específicamente, para un sistema de N canales, los cambios previos N+1 en la posición de espacialización se registran en variables k_{N+1}, ..., k_{1} desde el menor al más reciente respectivamente. La matriz G se generaliza como

18

La etapa 104 puede generalizarse como

19

Las etapas 105 y 106 permanecen sin cambios.

Para demostrar el proceso descrito, tanto el proceso de mínimos cuadráticos medios normalizados estéreo según la presente invención como el de mínimos cuadráticos medios normalizados se simularon utilizando la configuración mostrada en la figura 3 y con trayectos de eco tomados de los trayectos micrófono/persona que habla reales medidos. La posición de espacialización se cambió cinco veces durante la simulación para comprobar la capacidad del proceso para adaptarse a la espacialización cambiante. La figura 5 muestra el error medio de conjunto en la cancelación del eco para una entrada de ruido blanco gausiano (GWN). Para la simulación, el parámetro de tamaño de etapa \mu era 0,1, la longitud del filtro era de L = 200, la velocidad de muestra era de 8 KHz y se añadió una señal de ruido de 40 dB debajo de la señal de entrada. La figura 5 muestra que inicialmente el proceso LMS normalizado (figura 5a) y el proceso LMS normalizado estéreo según la invención (figura 5b) presentan el mismo rendimiento hasta 40.000 muestras. Debe tenerse en cuenta que el error en ambos procesos se produce inicialmente cuando los filtros adaptativos convergen con el valor estático del vector de trayecto agregado h. No obstante, en 19.000 períodos de muestra la espacialización cambia, de modo que h cambia y por consiguiente el error aumenta de repente en ambos procesos. El proceso LMS normalizado (figura 5a) todavía no dispone de suficiente información para formar el vector de trayecto agregado correcto h, ya que necesita dos posiciones de espacialización para determinar los vectores de trayecto individuales h_{1} y h_{2}. No obstante, después de la segunda posición de espacialización, el procedimiento según la invención puede efectuar una estimación del valor del h cambiado. Esto puede observarse en la figura 5 cuando el error no aumenta después de la muestra 40.000 para la curva de error en b), a diferencia de lo que ocurre en el proceso LMS normalizado en a) que demuestra incrementos del error cada vez que cambia la espacialización.

También puede observarse el rendimiento del procedimiento según la invención para señales de voz en la figura 6, que muestra el desajuste en los dos vectores de trayecto de eco estimados \hat{h}_{1} y \hat{h}_{2}. Estos vectores no se calculan realmente de forma explícita en este proceso: no obstante, se utiliza una solución para ellos como parte de la espacialización. La ecuación 20 se utilizó para formar los gráficos que muestra la figura 6. Puede apreciarse que el desajuste desciende en uno de los filtros y aumenta en el otro a lo largo de la trayectoria de la primera posición de espacialización, que está situada entre las muestra 0 y 19.000. Esto se debe al hecho de que g_{1}(0) = 0,2 y g_{2}(0) = 0,8, lo cual significa que la mayor parte de la energía de señal se deriva del segundo trayecto de filtro, de modo que la estimación del filtro agregado \hat{h} tiende al segundo trayecto de filtro h_{2}. En este punto, no existe una información a priori que permita la solución verdadera de \hat{h}_{1} y \hat{h}_{2} No obstante, tan pronto como se inicia la segunda posición de espacialización en la muestra 19.000, el desajuste en \hat{h}_{1} y \hat{h}_{2} empieza a descender y el proceso LMS normalizado estéreo permite que se forme una solución para h_{1} y h_{2}.

El procedimiento descrito utiliza el filtro adaptativo de mínimos cuadráticos medios normalizado para formar la actualización de la estimación del trayecto de eco combinado. No obstante, puede utilizarse cualquier procedimiento adaptativo actual o futuro que actualice una estimación de un filtro desconocido sobre la base muestra a muestra en lugar del algoritmo de mínimos cuadráticos medios normalizados descrito. La única modificación requerida es sustituir la etapa del proceso 106 por otra actualización de filtro. Son ejemplos adecuados existentes la proyección afín rápida, y los filtros adaptativos de mínimos cuadráticos medios o de mínimos cuadráticos medios recursivos.

Claims

1. Procedimiento de cancelación del eco acústico para una señal espacializada orientada de canal múltiple, estando generada la señal espacializada orientada a partir de una entrada de señal (12) modificada según las funciones de ganancia de espacialización (g_{1}, g_{2}) respectivas para generar una pluralidad de canales de audio (x_{1}(t), x_{2}(t)), utilizando el proceso de cancelación de eco una espacialización y una estimación de los trayectos de eco combinadas (\hat{h}_{1}, \hat{h}_{2}), desviándose la estimación a partir de las funciones de ganancia aplicadas a los canales respectivos, con lo cual, cuando cambian las funciones de ganancia aplicadas a los canales respectivos, se genera una estimación (\hat{h}_{1}, \hat{h}_{2}) de los trayectos de eco (h_{1}, h_{2}), basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia (g_{1}, g_{2}), utilizándose las estimaciones de los trayectos de eco (\hat{h}_{1}, \hat{h}_{2}) para generar una señal de cancelación de
eco e(t).

2. Procedimiento según la reivindicación 1, en el que las funciones de ganancia aplicadas a los canales respectivos son factores de ganancia escalares.

3. Procedimiento según la reivindicación 1 ó 2, en el que se utiliza un filtro adaptativo de mínimos cuadráticos medios normalizado para formar la actualización de la estimación de los trayectos de eco combinada.

4. Procedimiento según la reivindicación 1 ó 2, en el que se utiliza un filtro adaptativo de proyección afín rápida para formar la actualización de la estimación de los trayectos de eco combinada.

5. Procedimiento según la reivindicación 1 ó 2, en el que se utiliza un filtro adaptativo de mínimos cuadráticos medios recursivo para formar la actualización de la estimación de los trayectos de eco combinada.

6. Aparato para la cancelación del eco acústico en un sistema de audio espacializado orientado de canal múltiple, comprendiendo el sistema de audio espacializado:

\bullet: unos medios de entrada de señal (12) para recibir una señal de audio s(t),

\bullet: una pluralidad de medios de salida de audio (13L, 13R) para generar señales acústicas (x_{1}(t), x_{2}(t)) derivadas de la señal de audio s(t);

\bullet: unos medios de control (14L, 14R) asociados con los medios de salida de audio (13L, 13R) para generar entradas de control de ganancia g_{1}, g_{2} que controlan los medios de salida de audio de manera que dicha pluralidad de medios de salida de audio (13L, 13R) generan una versión espacializada h_{1,} h_{2} de la señal de audio s(t);

\bullet: unos medios de entrada de audio (21) para detectar señales acústicas;

\bullet: unos medios de salida de señales (22) para transmitir una señal y(t) derivada de las señales acústicas detectadas por los medios de entrada de audio (21);

\bullet: unos medios de estimación de trayectos de eco (25) que comprenden unos medios de detección para identificar cambios en las funciones de ganancia g_{1}, g_{2} de los medios de control (14L, 14R) respectivos, y unos medios de estimación para generar una estimación del trayecto de eco entre los medios de salida acústica 13L, 13R y los medios de entrada acústica (21), basándose la estimación en una estimación previa del trayecto de eco y en las funciones de ganancia g_{1,} g_{2} detectadas por los medios de detección;

\bullet: unos medios de generación de señales de cancelación de eco (24L, 24R) para generar una señal de cancelación de eco derivada de las señales de audio espacializadas generadas por los medios de control (14L, 14R) y las estimaciones derivadas por los medios de estimación del trayecto de eco (25), y

\bullet: unos medios de combinación de señales (26) para aplicar la señal de cancelación de eco a la señal generada por los medios de entrada de audio.

7. Aparato según la reivindicación 6, en el que las funciones de ganancia aplicadas a los canales respectivos son factores escalares de ganancia.

8. Aparato según la reivindicación 6 ó 7, en el que se utiliza un filtro adaptativo de mínimos cuadráticos medios normalizado para formar la actualización de las estimaciones de trayecto de eco.

9. Aparato según la reivindicación 6 ó 7, en el que se utiliza un filtro adaptativo de proyección afín rápida para formar la actualización de las estimaciones de trayecto de eco.

10. Aparato según la reivindicación 6 ó 7, en el que se utiliza un filtro adaptativo de mínimos cuadráticos medios recursivo para formar la actualización de las estimaciones de trayecto de eco.