FR2767941A1

FR2767941A1 - Suppresseur d'echo par transformation de sens et procede associe

Info

Publication number: FR2767941A1
Application number: FR9810127A
Authority: FR
Inventors: Tom Hong Li
Original assignee: Motorola Inc
Current assignee: Motorola Solutions Inc
Priority date: 1997-09-04
Filing date: 1998-08-06
Publication date: 1999-03-05
Also published as: CN1212555A; GB2329097A; GB9819078D0; GB2329097B; DE19836995A1; JPH11154894A

Abstract

Un suppresseur d'écho (200) transforme les paroles d'entrée distantes en son résidu de prévision linéaire. Le sens de mise à jour des coefficients du suppresseur d'écho est formé en deux étapes dans un circuit de génération de coefficient (204). Au cours de la première étape, le sens de mise à jour est formé dans le domaine résiduel de prévision linéaire. Au cours de la deuxième étape, le sens de mise à jour utilisé dans l'adaptation des coefficients est obtenu en transformant le sens de mise à jour du domaine résiduel au domaine vocal.

Description

Titre Suppresseur d'écho par transformation de sens et procédé associé

Domaine de l'invention La présente invention concerne les suppresseurs d'écho et plus particulièrement les suppresseurs d'écho

convergeant rapidement.

Arrière-plan de l'invention Certains systèmes de communication bidirectionnels présentent des chemins séparés pour des signaux transmis dans des sens opposés. Dans ces systèmes, les signaux d'un chemin peuvent être réfléchis dans d'autres chemins. Ces signaux réfléchis, appelés couramment signaux d'écho, interfèrent avec les signaux de communication souhaités. Par conséquent, des suppresseurs d'écho ont été mis au point pour supprimer

les signaux réfléchis.

Les suppresseurs d'écho utilisent des filtres adaptatifs pour estimer le signal d'écho réfléchi dans l'un des chemins de signaux. L'estimation d'écho est soustraite au chemin de signal comportant le signal d'écho pour générer un signal sensiblement sans écho ou

à écho supprimé.

Puisque les filtres adaptatifs de filtrage d'erreur quadratique moyenne (LMS) présentent des structures relativement simples et sont stables et efficaces du point de vue des calculs, ils sont largement utilisés dans des suppresseurs d'écho pour estimer les signaux d'écho. Toutefois, les filtres adaptatifs LMS souffrent d'une faible vitesse de convergence lorsqu'ils sont employés dans des applications de suppression d'écho acoustique par exemple pendant une téléconférence et pendant une

communication cellulaire mains libres.

Un autre inconvénient des filtres adaptatifs LMS est qu'ils ne retirent souvent du signal d'écho qu'un maximum de 30 dB (décibels). Dans une application acoustique typique, les signaux d'écho sont très forts et peuvent être aussi forts que les signaux de communication désirés. Dans un tel environnement, le filtre adaptatif doit converger rapidement pour simuler un chemin d'écho changeant rapidement et il est très souhaitable qu'on retire du signal d'écho au moins 40 dB. Si ces deux exigences ne peuvent être remplies, des erreurs d'estimation d'écho importantes apparaissent et ces erreurs importantes peuvent entraîner une sérieuse dégradation de la qualité des signaux de communication souhaités. Les filtres adaptatifs utilisant d'autres algorithmes, tels que les algorithmes de projection affine et d'erreur quadratique récurrente (RLS), s'adaptent plus rapidement que les suppresseurs d'écho utilisant des filtres LMS mais soit ils sont instables, soit ils reviennent chers en calculs. Un filtre revenant cher en calculs nécessite des ressources de traitement significatives ou un grand circuit. Un filtre adaptatif instable produit des estimations erronées et ne parvient pas à assurer un fonctionnement suffisamment fiable pour assurer que les utilisateurs

communiquent clairement tout au long d'un appel.

Le besoin d'un filtre adaptatif efficace du point de vue des calculs à suppression importante, stable, et convergeant rapidement, est particulièrement important dans des environnements o ont lieu des téléconférences mains libres ou dans des environnements o agissent des téléphones mobiles mains libres. Dans un tel environnement, le chemin d'écho est soumis à des changements rapides, des échos importants et des bruits de fond sourds. Par conséquent, il est nécessaire que le filtre adaptatif du suppresseur d'écho converge

rapidement et retire des signaux d'écho au moins 40 dB.

Il est également souhaitable que le suppresseur d'écho soit efficace du point de vue des calculs, de sorte qu'il puisse être mis en oeuvre dans un circuit relativement petit ayant des caractéristiques de drain

de courant faibles.

Par conséquent, il subsiste toujours un besoin d'un filtre stable et efficace du point de vue des calculs adapté à des environnements tels que ceux qui sont soumis à des échos acoustiques dans lesquels le chemin d'écho subit des changements rapides et dans

lesquels les signaux d'écho sont importants.

Brève description des dessins

La figure 1 est un schéma des circuits illustrant

un suppresseur d'écho selon la technique antérieure.

La figure 2 illustre des exemples de courbes d'erreur quadratique moyenne de l'estimation d'écho provoquée par l'estimation imprécise des coefficient du suppresseur d'écho du filtre adaptatif LMS lorsqu'il

n'y a que deux coefficients, c'est-à-dire L = 2.

La figure 3 illustre un autre exemple de courbes d'erreur quadratique moyenne de l'estimation d'écho provoquée par l'estimation imprécise du suppresseur d'écho du filtre adaptatif LMS lorsqu'il n'y a que deux

coefficients, c'est-à-dire L = 2.

La figure 4 est un schéma des circuits illustrant

un suppresseur d'écho.

La figure 5 illustre un exemple des courbes d'erreur quadratique moyenne de l'estimation d'écho provoquée par l'estimation imprécise des coefficients du suppresseur d'écho adaptatif si le sens de mise à jour dans le domaine résiduel de prévision linéaire est utilisé avec seulement deux coefficients, c'est-à-dire

L = 2.

La figure 6 illustre un exemple des courbes d'erreur quadratique moyenne de l'estimation d'écho provoquée par l'estimation imprécise des coefficients du suppresseur d'écho adaptatif si le sens de mise à jour dans le domaine vocal qui est transformé à partir du sens de mise à jour dans le domaine résiduel de prévision linéaire est utilisé avec seulement deux

coefficients, c'est-à-dire L = 2.

La figure 7 est un organigramme illustrant la

génération du sens de mise à jour.

Description détaillée des dessins

Un suppresseur d'écho transforme des échantillons de parole distants en des échantillons résiduels de prévision linéaire. Le sens de mise à jour des coefficients du suppresseur d'écho est formé dans le domaine résiduel de prévision linéaire. Ensuite, le sens de mise à jour dans le domaine résiduel est transformé en le sens de mise à jour dans le domaine vocal. L'adaptation des coefficients du suppresseur d'écho est exécutée en utilisant le sens de mise à jour transformé dans le domaine vocal. En calculant le sens de mise à jour par le biais de la transformation du domaine résiduel de prévision linéaire en domaine

vocal, le sens de mise à jour optimal peut être obtenu.

Cela permet au suppresseur d'écho de s'adapter beaucoup plus vite au chemin d'écho, ce qui lui permet de supprimer une plus grande partie de l'écho tout en

restant stable, efficace et robuste.

Un suppresseur d'écho par filtrage d'erreur quadratique moyenne (LMS) classique 100 est illustré sur la figure 1 dans un dispositif 101. Le dispositif 101 comporte un microphone 104 et un haut-parleur 102 permettant un fonctionnement mains libres. Le chemin du haut-parleur comporte un décodeur 106 et un convertisseur numérique/analogique (N/A) 108 connecté à la sortie récepteur d'un émetteur-récepteur 120. Le chemin du microphone comporte un convertisseur analogique/numérique (A/N) 114, un circuit mélangeur

112 et un codeur 116 couplé à l'émetteur de l'émetteur-

récepteur 120. Les signaux x(n), y(n) et e(n) sont donc des signaux numériques. L'émetteur-récepteur 120 est

couplé à l'antenne 122 dans un radiotéléphone.

Le dispositif 101 peut être un accessoire mains libres connecté à un radiotéléphone mobile ou peut être un radiotéléphone ou un dispositif de téléconférence mains libres. Les spécialistes de la technique reconnaîtront que le suppresseur d'écho 100 peut être mis en oeuvre dans des dispositifs de communication bidirectionnels ayant des circuits numériques et/ou analogiques. Ainsi, le décodeur 106 et le codeur 116 ne servent que d'illustration. Le décodeur 106 peut être un convertisseur A/N si l'émetteur-récepteur 120 est un téléphone cellulaire analogique ou un téléphone par ligne terrestre analogique, ou bien si le dispositif 101 est connecté à une sortie analogique d'un téléphone cellulaire numérique ou d'un téléphone par ligne terrestre numérique. Selon une autre solution, le décodeur 106 peut être un décodeur numérique dans un dispositif numérique tel qu'un téléphone cellulaire numérique. Le codeur 116 peut être un convertisseur N/A si l'émetteur-récepteur 120 se trouve dans un téléphone cellulaire analogique ou un téléphone par ligne terrestre analogique ou bien si le dispositif 101 est connecté à une entrée analogique d'un dispositif numérique tel qu'un téléphone cellulaire numérique ou un téléphone par ligne terrestre numérique. Selon une autre solution, le codeur 116 peut être un codeur numérique dans un dispositif numérique tel qu'un

téléphone cellulaire numérique.

Le suppresseur d'écho 100 va maintenant être décrit en référence aux figures 1 à 3. L'instant d'échantillonnage du courant est n, l'échantillon vocal distant x(n) correspond à la sortie du haut parleur 102, le signal audio proche y(n) est reçu du microphone

104 et, pour faciliter la présente description, les

signaux x(n) et y(n) sont synchronisés, ce qui signifie que le convertisseur numérique/analogique 108 et le convertisseur analogique/numérique 114 utilisent la même horloge. Le signal audio proche y(n) comprend les paroles proches s(n), l'écho t(n) et le bruit proche N(n). L'écho t(n) est la partie du signal x(n) émis par le haut- parleur 102 qui est réfléchi par le microphone 104. Le bruit N(n) peut par exemple être du bruit

ambiant dans l'habitacle d'un véhicule.

Dans la description suivante, les paroles proches

s(n) sont supposées être nulles (c'est-à-dire que les paroles proches s(n) n'existent pas) tandis que l'adaptation des coefficients des filtres adaptatifs est exécutée. Lorsque les paroles proches et distantes sont toutes les deux présentes, ce que l'on appelle couramment les superpositions de signaux vocaux, l'adaptation doit s'arrêter. Les détecteurs de superposition de signaux vocaux permettant de détecter cette situation et d'empêcher l'adaptation au cours de cet état sont connus dans la technique et ne seront pas décrits plus en détail par la suite à des fins de brièveté. Ainsi, tel qu'on l'a précisé dans le présent document, le signal audio proche y(n) comprend l'écho

t(n) et le bruit N(n) seulement.

Le suppresseur d'écho 100 comporte un circuit de génération de coefficients 109 et un filtre adaptation LMS 110 pour modéliser le chemin d'écho. L'estimation d'écho z(n) générée par le filtre adaptatif LMS 110 est combinée au signal y(n) dans le circuit mélangeur 112 pour éliminer ou supprimer le signal d'écho. L'erreur d'estimation d'écho e(n) est égale à la différence entre l'estimation d'écho z(n) et le signal proche y(n). Les coefficients du filtre adaptatif LMS 110 sont mis à jour par le circuit de génération de coefficients 109 en fonction des échantillons vocaux distants reçus

et de l'erreur d'estimation d'écho.

A l'instant n, les coefficients du filtre

adaptatif LMS 110 sont W(n) = [w0(n) w1(n)... wl-l(n)]T.

L est la longueur de filtre et l'exposant T (c'est-à-

dire []T) signifie la transposition du vecteur. Les échantillons vocaux distant reçus L sont égaux à X(n) = [x(n), x(n-1)... x(n-L+1)] T. L'estimation d'écho z(n) du filtre adaptatif LMS est égale à: z(n) = X(n) W(n). (1) L'erreur d'estimation d'écho e(n) du filtre adaptatif LMS 110 est égale à: e(n) = y(n)- z(n) (2) Les coefficients W(n) du filtre adaptatif LMS 110 sont mis à jour selon l'équation suivante: W(n + 1) = W(n)+ n2 e(n)Xn) (3) o p est la taille de l'étape d'adaptation et

2 T

valeur absolue de IXnil = X(n) W(n).

T R(n) = E{X(n)X(n)} = {rij(n) li,j=0,1,..., L-l} est la matrice d'autocorrélation des échantillons

vocaux proches. E{*} est la moyenne statistique.

Puisque le signal vocal distant n'est pas stationnaire, R(n) est égal à L variant dans le temps fois matrice L et présente des valeurs propres positives à variation temporelle L {<i(n) i = 0, 1,..., L-l} et des vecteurs propres à variation temporelle L {vi(n) i = 0,1,..., L-l}. S(n) = E{y(n)X(n)} = [So(n) Sl(n)... SL_.(n)]T T = [E{y(n)x(n)} E{y(n)x(n-1)}... E{y(n)X(n-L+1)}] est le vecteur d'intercorrélation des échantillons vocaux

distants et du signal audio proche.

La performance des filtres adaptatifs dépend des valeurs des vecteurs propres et des valeurs propres à variation temporelle L. On sait que M est fixé et doit être choisi de façon à satisfaire à: 0 < p < X(n) (4)

O Xmax(n) est la valeur propre maximale de R(n).

Puisque les paroles distantes ne sont pas stationnaires, nmax(n) présente une gamme dynamique importante. Toutefois, pour conserver la stabilité du filtre adaptatif, p doit être très petit pour rester dans l'équation (4) en permanence. Cette faible valeur de p qui permet de conserver la stabilité est l'une des causes de la convergence lente des filtres adaptatif LMS. Les coefficients optimaux du filtre adaptatif LMS T sont W0 = [w0, w1,... WL-1]T. En général, W0 varie très lentement dans le temps. Par conséquent, on le considère dans le cas présent comme un vecteur constant. L'erreur d'estimation d'écho générée par le filtre adaptatif LMS en utilisant les coefficients actuels W(n) est donnée par: s(n) = y(n) z(n) = y(n) - X(n)T W(n) (5) o y(n) est le signal d'écho proche. Le cas o y(n) est composé de l'écho et du bruit est considéré ci- dessous. Dans l'analyse suivante, on suppose que le bruit proche n'existe pas. Lorsque W(n) n'est pas mis en corrélation avec y(n) et X(n) (cette supposition est approximativement correcte lorsque W(n) converge de telle sorte que W(n) est considéré comme étant un vecteur constant), l'erreur quadratique moyenne de l'estimation d'écho du suppresseur d'écho adaptatif est définie par: = E{s2(n)}=E{[y(n)-X(n)T W(n)]2} = E{y(n)2} + E{W(n)T X(n)X(n)T W(n)} - 2E{y(n)X(n)W(n)T} o = E{y(n)2} + W(n)T E{X(n)X(n)T} W(n) 2E{y(n)X(n)}W(n)T = E{y(n)} + W(n)T R(n) W(n) -2S(n)W(n)T (6) Puisque W0 est la solution optimale de W(n) et que est une fonction de W(n) le gradient de, à W0 est nul. Il satisfait à l'équation suivante: cW(n)=O = 2R(n)Wo-2S(n) = O > Wo=R(n)-' S(n), (7) En remplaçant (7) dans (6) on peut obtenir l'erreur quadratique moyenne minimum de l'estimation d'écho en utilisant l'équation suivante: min = E{y(n)2} - S(n)T Wo (8) Bien que min varie dans le temps, il change lentement dans le temps de sorte qu'il est considéré dans le présent document comme une constante. En remplaçant (8) et (7) dans (6), on obtient la relation suivante: = min + [W(n) - WO]T R(n) [W(n) - Wo]. (9) Les filtres adaptatifs LMS tentent d'entraîner W(n) vers sa valeur réelle W0 ou d'entraîner, vers min Le comportement de convergence du filtre adaptatif peut être compris dans le cas de deux coefficients, c'est-à-dire L=2, lorsque W(n) = [wo(n) w1(n)] et W0 = [w0 W1]. Le comportement de convergence des filtres adaptatifs va donc être expliqué en référence aux courbes d'erreur quadratique moyenne représentées sur les figures 2 et 3. Ces courbes sont tracées en établissant, égal à différentes valeurs constantes et en utilisant w0(n) et wl(n) en tant qu'axes. Les courbes sont des ellipses dans le plan wo(n)-wl(n), sur lesquelles les vecteurs propres de R(n) définissent les axes principaux des ellipses et les valeurs propres

définissent la raideur de pente de la surface d'erreur.

Ainsi, la plus grande valeur propre présente l'axe le plus long et les valeurs propres de la matrice R(n)

définissent la longueur des axes.

Puisque le signal vocal n'est pas stationnaire, la forme des courbes d'erreur quadratique moyenne est une ellipse à variation temporelle. Les filtres adaptatifs LMS utilisent le sens de gradient, 11 sur la figure 2 et 13 sur la figure 3, comme sens de mise à jour. Le sens de gradient est le seul sens de mise à jour simple et fiable. Comme on peut le voir, le sens 11 varie considérablement par rapport au sens optimal 12 représenté sur la figure 2 et le sens de mise à jour 13 varie considérablement par rapport au sens optimale 14 représentée sur la figure 3 dans la plupart des cas, y compris les deux exemples de valeurs propres à

variation temporelle de la matrice R(n).

La forme et la taille des courbes d'erreur quadratique moyenne changent avec le temps. En conséquence, les filtres adaptatifs LMS utilisent fréquemment un sens de mise à jour ayant une divergence importante par rapport au sens optimal. Ceci constitue une autre raison pour laquelle les filtres adaptatifs LMS convergent lentement et n'arrivent pas à retirer du signal d'écho plus de 40 dB dans les applications

telles que la suppression d'écho acoustique.

L'architecture du système d'un suppresseur d'écho amélioré 200 est illustrée sur la figure 4. Le suppresseur d'écho 200 peut être mis en oeuvre en utilisant un microprocesseur, un processeur de signaux numérique, un micro-ordinateur, un ordinateur ou tout autre circuit approprié. Le suppresseur d'écho 200 comporte un circuit de prévision linéaire 202 connecté de façon à recevoir le signal vocal distant x(n), un signal d'entrée et des coefficients de prévision linéaire de sortie et un signal résiduel d(n) au niveau de la sortie 203. Le circuit de prévision linéaire peut être mis en oeuvre en utilisant n'importe quel circuit de prévision linéaire. Un filtre d'erreur de prévision linéaire est avantageux puisque de nombreux algorithmes rapides sont disponibles pour estimer leurs coefficients. De préférence, on utilise un algorithme rapide qui est stable et efficace du point de vue des calculs. Le fait de choisir un filtre d'erreur de prévision linéaire ayant ces caractéristiques assure

que le suppresseur d'écho 200 soit stable et efficace.

L'analyse de prévision linéaire peut fournir une estimation très précise des paramètres vocaux. Les système de prévision linéaire sont excités par un train d'impulsions pour les sons voisés ou une séquence de bruits aléatoires pour des sons non voisés. Les paramètres d'un système de prévision linéaire varient lentement dans le temps. La relation qui lie un échantillon vocal s(n) à l'excitation u(n) est représentée par l'équation suivante: P s(n) = -k afn - k) + Gu(n) (10) k-1 o p est l'ordre du filtre numérique à variation temporelle; G est un facteur de gain; et {ak | k = 1, 2,..., p} sont les coefficients du filtre numérique à

variation temporelle.

La prévision linéaire d'un échantillon vocal produit une estimation de l'échantillon vocal actuel à partir d'une combinaison linéaire d'échantillons passés. Lorsque s(n) est une prévision de s(n), s(n) peut être obtenu par une prévision linéaire dont les coefficients de filtre de prévision {ak | k = 1, 2, p} sont les suivants: p s(n) = -L aks(n - k) (11) k-i L'erreur de prévision du dispositif de prévision linéaire de l'équation (11) est donnée par: p en) = s(n) - s(n) = s(n)+ L ak(n - k) (12) ki! A partir de l'équation (12), on peut voir que la séquence d'erreur de prévision correspond à la sortie du filtre d'erreur de prévision linéaire dont la fonction de transfert est: p A =z)=l + 2kzk (13) k-I Les algorithmes rapides récurrents sont connus et certains estiment les coefficients de filtre d'erreur de prévision linéaire {ck | k = 1, 2,..., p}. Les filtres d'erreur de prévision linéaire sont des filtres blanchissants puisqu'ils produisent un signal résiduel ayant les caractéristiques du bruit blanc. L'algorithme récurrent de Levinson-Durbin est particulièrement avantageux dans la présente invention. Ce filtre présente un certain nombre de caractéristiques souhaitables. Il est couramment utilisé pour la prévision vocale de sorte qu'il est bien compris et bien développé. Il est efficace du point de vue des calculs de sorte qu'il peut être mis en oeuvre dans un circuit relativement petit. Une autre propriété importante de cet algorithme est qu'un filtre d'erreur

de prévision linéaire employant ce filtre sera stable.

Le suppresseur d'écho fonctionne sur les

échantillons audio reçus sur une base trame par trame.

Par échantillon audio reçu, on entend les échantillons de signaux provenant à la fois des signaux distants émis par le haut parleur 102 et les signaux proches entrés dans le microphone 101. Les échantillons audio provenant à la fois des signaux distants et proches sont synchronisés. La taille de trame K est normalement comprise entre 50 et 200 échantillons. Une fois qu'une trame de K nouveaux échantillons audio provenant à la fois des signaux proches et des signaux distants sont reçus, le fonctionnement de l'algorithme commence. Les K échantillons vocaux distants reçus sont x(n), x(n-1), x(n+K+1) et les K échantillons de signaux proches reçus sont y(n), y(n-1),... y(n+K+1), o n est l'instant d'échantillonnage du courant. En fonctionnement, l'analyse de prévision linéaire des K échantillons vocaux distants reçus, les échantillons de signaux d'entrée, est d'abord effectué dans le circuit de prévision linéaire 202. Les coefficients de filtre d'erreur de prévision linéaire {ak | k = 1, 2,..., p} peuvent être estimés à travers plusieurs algorithmes, par exemple l'algorithme de Levinson-Durbin. L'ordre p du filtre d'erreur de prévision linéaire utilisé pour le circuit de prévision linéaire 202 peut se trouver par exemple dans l'éventail de 5 à 15. Le filtre d'erreur de prévision linéaire pour le circuit de prévision linéaire 202 présente une fonction de transfert A(z), représentée de la façon suivante: P A(z) I + > Otkzk (14) Les coefficients pour le filtre adaptatif sont mis à jour dans le circuit de génération de coefficients

209 qui est un circuit de mise à jour de coefficients.

La suppression de l'écho adaptatif est effectuée sur les K échantillons audio reçus, les échantillons de signaux d'entrée, en utilisant les coefficients mis à jour dans le filtre adaptatif LMS 110. Un indice temporel i se trouve à l'intérieur de l'éventail

temporel des K nouveaux échantillons audio reçus c'est-

à-dire, n < i < n-K+l. W(i) = [W0(i)Wl(i)... WL_1(i)]T correspondent aux coefficients du suppresseur d'écho adaptatif aux instants i, L et la longueur du

suppresseur d'écho adaptatif et X(i) = [X(i) x(i-1)...

x(i-L+l)]T qui est un vecteur des L échantillons vocaux distants reçus à l'instant i. L peut être supérieur ou inférieur à K. Sur une base d'échantillon par échantillon pour

les K échantillons reçus, c'est-à-dire i = n-K+1, n-

K+2,..., n, le suppresseur d'écho 200 effectue la suppression d'écho. Le suppresseur d'écho 200: à l'instant i = K+1, effectue la suppression d'écho en utilisant les coefficient W(n+K+1), et met à jour les coefficients W(n-K+l) par rapport aux coefficients W(n-K+2); à l'instant i = n+K+2, effectue la suppression d'écho en utilisant les coefficients W(n-K+2) et met à jour les coefficients W(n-K+2) par rapport aux coefficients W(n-K+3); et continue ce fonctionnement à chaque instant d'échantillonnage successif jusqu'à un dernier instant d'échantillonnage i = n auquel les suppressions d'écho sont effectuées en utilisant les coefficients W(n), et les coefficients W(n) sont mis à jour par rapport aux coefficients W(n+1) et attend la trame suivante pour répéter

cette séquence pour cette trame.

A un instant spécifié i, l'erreur d'estimation d'écho du suppresseur d'écho adaptatif correspond à: T e(i) = y(i) - X(i) W(i) (15) o y(i) est l'échantillon audio proche à

l'instant i.

A l'instant i, le sens de mise à jour de coefficient du suppresseur d'écho adaptatif est construit dans le domaine résiduel de prévision linéaire. Les échantillons résiduels de prévision linéaire des échantillons vocaux distants reçus d(i), d(i-1),..., d(i-L+ l) produits par le filtrage des échantillons vocaux distants reçus à l'instant i en utilisant le filtre d'erreur de prévision linéaire A(z): p d(j) = Xj) + > Ekx( - k) j i,i-1,...,i- L+1. (16) k:i Le sens de mise à jour de coefficients du suppresseur d'écho adaptatif dans le domaine résiduel de prévision linéaire est Q(i), dans lequel: Qi) =: ei) i) (17) o D(i) = [d(i), d(i-l),... d(i-L+l]T et Q(i) = [q0(i), ql(i), qLl(i)]T, est la taille de l'étape

d'adaptation et ID<il1 = D(i)T D(i).

Après avoir obtenu le sens de mise à jour de coefficients pour les filtres adaptatifs dans le domaine résiduel de prévision linéaire, dans le circuit de génération de coefficients 204, le sens de mise à jour dans le domaine vocal peut être calculé en fonction de A(z) et Q(i). Le sens de mise à jour de coefficient du suppresseur d'écho adaptatif dans le domaine vocal est G(i) = |[go(i) gl(i)... gLl(1)]T G(i) est calculé pour chaque composant de G(i) grâce à l'équation suivante: p g(i) = qj(i) + cjkq ii) j = 0,1,..., L-1 (18) o gj(i) = 0 pour j = -1, -2,..., -p sont supposés afin d'exécuter l'équation ci-dessus. L'équation (18) et l'équation (16) représentent

des filtres ayant différents sens de fonctionnement.

L'équation (16) effectue le filtrage de prévision linéaire vers l'avant pour convertir les échantillons vocaux proches du domaine vocal au domaine résiduel de prévision linéaire. L'équation (18) effectue la prévision linéaire en arrière pour transformer le sens de mise à jour du domaine résiduel de prévision

linéaire au domaine vocal.

Une fois que G(i) a été obtenu, les coefficients du suppresseur d'écho adaptatif peuvent être mis à jour di:ectement de la façon suivante: W(i+ 1 = W(i) + G(i) (19) o W(i+1) correspond au coefficient mis à jour pour être utilisé dans l'échantillon suivant à

l'instant i+l.

Puisque les coefficients des filtres d'erreur de prévision linéaire pour un signal vocal changent lentement dans le temps, à l'intérieur de chaque trame, les coefficients du filtre d'erreur de prévision linéaire ne changent pas effectivement au cours d'une trame. Ainsi, il peut être considéré comme un filtre FIR ne variant pas dans le temps et linéaire à l'intérieur d'une trame d'échantillons vocaux. Les coefficients d'une trame d'échantillons vocaux sont estimés grâce à l'algorithme de Levinson-Durbin. De plus, le filtre d'erreur de prévision linéaire est un filtre blanchissant, de sorte que les résidus de

prévision linéaire sont effectivement du bruit blanc.

Ainsi, la matrice d'autocorrélation des résidus de

prévision linéaire est celle du bruit blanc.

P(i) = E{D(i)D(i)T} = {pij(n) l i,j=O, 1,..., L-1} correspond à la matrice d'autocorrélation des résidus de prévision linéaire. Si le sens de mise à jour dans le domaine résiduel de prévision linéaire, Q(i) est utilisé dans l'adaptation en tant que sens de mise à jour, l'erreur quadratique moyenne D (i) de l'estimation d'écho LMS à l'instant i est obtenue grâce aux équations 5 à 9: D (i) = Amin + [V(i) - Vo]T P(i)[V(i) - VO] (20) O Omin est la valeur minimum de D (i). Comme cela a été évoqué précédemment, elle est considérée comme une constante du fait de sa faible variation dans le temps. V(i) correspond au coefficient du suppresseur d'écho à l'instant i et à la convolution de W(i) avec (1/A(z)). V0 est la solution optimale des coefficients V(i) définis comme ci-dessus et considérée comme un vecteur constant car elle change lentement dans le temps. V(i) correspond à la convolution de W0 et (1/A(z)). Les courbes d'erreur quadratique moyenne pour le domaine résiduel de prévision linéaire sont représentées sur la figure 5. P(i) présente L valeurs propres identiques et les courbes d'erreur quadratique moyenne sont des cercles. Par conséquent, le sens gradient 51 est le seul sens de mise à jour fiable disponible pour un filtre LMS et le sens gradient 51

est le sens optimal en n'importe quel point du cercle. V(i) va converger vers V0 beaucoup plus vite que W(i) ne converge vers W0.

Il faut remarquer que V(i) n'est pas égal à W(i) et qu'il représente effectivement la convolution de W(i) avec (1/A(z)). Le sens de mise à jour optimal peut être trouvé dans le domaine résiduel

ou la forme Q(i).

Le sens de mise à jour optimal dans le domaine vocal pour W(i) peut être trouvé dans les informations disponibles de Q(i) et A(z). Considérons l'équation suivante pour l'adaptation de V(i): V(i+1) = V(i) + Q(i). (21) Il se produit la même chose que pour le filtre adaptatif LMS de la figure 1 à l'exception du fait qu'on utilise le sens de mise à jour dans le domaine résiduel de prévision linéaire. Après la convergence, les coefficients n'équivalent pas au vrai coefficient W(i), mais à la convolution avec (1/A(z)). Puisque le filtre d'erreur de prévision linéaire A(z) ne varie pas dans le temps à l'intérieur d'une trame des échantillons vocaux distants reçus, W(i) est la convolution de V(i) et A(z). La convolution de l'équation (21) avec A(z) donne: A(z) 0 V(i+1) = A(z) 0 [V(i) + Q(i)] (22) A(z) 0 V(i+1) = (z) 0 V(i) + A(z) 0 Q(i)] W(i+1) = W(i) + Q(i) O A(z)

o 0 représente la convolution des deux filtres.

Par conséquent, l'équation d'adaptation ci-dessus permet de déduire le sens de mise à jour par la convolution du sens de mise à jour dans le domaine résiduel avec A(z), et c'est ce sens de mise à jour transformé qui est utilisé dans le suppresseur d'écho 200. Le sens de mise à jour transformé est toujours le même que le sens optimal dans le domaine vocal, comme le prouve ce qui suit: (1) puisque Q(i) est le sens optimal de l'adaptation de V(i), il existe une grandeur scalaire q telle que V(i) +in Q(i) -V0 = 0; (2) Si A(z) 0 Q(i) n'est pas le sens de mise à jour optimal de W(i), aucune grandeur scalaire n'existe de sorte que W(i)= + a [A(z) GQ(i)] - W 0=; (3) puisque A(z) est un filtre invariable dans le

temps et linéaire et W(i) = A(z) 0 V(i), l'équation ci-

dessus peut être réécrite de la façon suivante, A(z) 0 [V(i) + aQ(i) - VO] = 0; (4) Il est clair qu'il y a au moins une grandeur

scalaire a = n qui soutient l'équation ci-dessus.

Ainsi, la circonvolution de A(z) et Q(i) produit le

sens de mise à jour optimal de W(i).

De la même manière, l'erreur quadratique moyenne de l'estimation d'écho du suppresseur d'écho 200 peut être exprimée, d'après les équations (5) à (9) par: u(n) = y(n) - z(n) = y(n) - X(n)T W(n) (23) o y(n) est le signal distant. W(n) = [wo(n) wl(n) wL_1(n)]T correspondent aux coefficients du suppresseur d'écho 200. X(n) = [x(n-1),..., x(n- L+l)]T

correspond aux échantillons vocaux distants reçus.

L'erreur quadratique moyenne de l'estimation d'écho du nouveau suppresseur d'écho adaptatif est définie par N = E{s2(n)} = E{[y(n) - X(n) W(n)]2} = min + [W(n) - Wo]T R(n) [WVV(n) - WO] T o Amin = E{y(n)2} - S(n) WO est l'erreur quadratique moyenne minimum du suppresseur d'écho 200. Wo = [wo, w1,..., T WL1] correspond aux coefficients optimaux du suppresseur

d'écho 200. R(n) = {X(n)X(n)T} est défini comme ci-

dessus. Les courbes d'erreur quadratique moyenne sont les mêmes que celles du suppresseur d'écho LMS de la figure 1. Toutefois, le sens de mise à jour est

amélioré, tel qu'illustré sur la figure 6.

Les courbes d'erreur quadratique moyenne du nouveau filtre adaptatif sont représentées sur la figure 6 pour le cas de deux coefficients, c'est-à-dire L=2, o W(i) = [w0(i) wl(i)] et W0 = [w0 wl]. Les nouveaux filtres adaptatifs n'emploient pas le sens de gradient 61 en tant que sens de mise à jour, ce qui serait le cas pour le filtre adaptatif LMS de la figure 1. Le circuit de génération de coefficients 204 détermine le sens de mise à jour des coefficients au cours de deux étapes. D'abord, il trouve le sens de mise à jour dans le domaine résiduel de prévision linéaire des paroles distantes. Ensuite, il transforme ce sens de mise à jour dans le domaine vocal de telle

sorte que le sens de mise à jour optimal 62 est obtenu.

Le circuit de génération de coefficients 204 utilise toujours le sens de mise à jour optimal, ce qui permet d'éviter l'effet néfaste des valeurs propres et des vecteurs propres changeants des paroles distantes subi

par les filtres LMS de la technique antérieure.

Le suppresseur d'écho 200 (figure 2) converge beaucoup plus vite que les suppresseurs d'écho adaptatif LMS classiques. De plus, le suppresseur d'écho 200 peut retirer de l'écho acoustique plus de 60 dB, ce qui est particulièrement avantageux lorsqu'on l'utilise pour des applications de suppression d'écho acoustique. Ainsi, on peut voir que le suppresseur d'écho 200 (figure 2) utilise un filtre adaptatif LMS classique 110. Toutefois, un sens de mise à jour amélioré est utilisé par le circuit de génération de coefficients 204. Le sens de mise à jour est déduit de la sortie d'un filtre d'erreur de prévision linéaire, qui calcule, grâce au filtre, les coefficients de prévision linéaire à partir des échantillons de signaux d'entrée, tel qu'indiqué au bloc 700 (figure 7). Les algorithmes permettant de calculer les coefficients de filtre d'erreur de prévision linéaire sont mis en oeuvre facilement, sont rapides et stables. L'algorithme de Levinson-Durbin peut être employé de façon avantageuse puisqu'il est bien connu et efficace du point de vue des calculs, de sorte qu'il peut être mis en oeuvre sans augmenter excessivement la taille du circuit du suppresseur d'écho. D'autres filtres à réponse impulsionnelle finie (FIR) d'ordre peu élevé sont connus et peuvent être utilisés pour calculer les

informations de prévision linéaire.

Le sens de mise à jour dans le domaine résiduel de prévision linéaire est déduit du résidu de prévision linéaire, tel qu'indiqué par le bloc 701. Cela est obtenu une fois que les échantillons vocaux distants sont transformés en résidus de prévision linéaire. Cela implique le filtrage FIR des échantillons de signaux d'entrée. L'ordre du filtre FIR peut être par exemple d'environ 10. Par conséquent, la puissance de calcul requise est faible et la stabilité garantie. Le sens de mise à jour se trouve donc au départ dans le domaine résiduel de prévision linéaire (un signal traité par le filtre de prévision linéaire se trouve dans le domaine

de prévision linéaire).

Le sens de mise à jour est ensuite transformé pour passer du domaine résiduel de prévision linéaire au domaine vocal, tel qu'indiqué au bloc 702. Le domaine vocal correspond à des paroles numérisées. La transformation du domaine peut être obtenue en utilisant un filtre FIR. Le sens de mise à jour dans le domaine vocal est utilisé par le circuit de génération de coefficients 204 pour mettre à jour les coefficients

de filtre adaptatif.

On sait que le suppresseur d'écho LMS est simple, robuste et efficace du point de vue des calculs. Le suppresseur d'écho 200 utilise de préférence un filtre LMS pour tirer profit des caractéristiques du suppresseur d'écho LMS tout en améliorant la vitesse de la convergence d'adaptation en utilisant le sens de mise à jour amélioré. On peut conclure que le suppresseur d'écho amélioré est mis en oeuvre facilement, qu'il est stable, robuste et efficace du point de vue des calculs. Les simulations montrent que le suppresseur d'écho 200 est également robuste dans les environnements bruyants. La transformation du sens de mise à jour fournit une vitesse de convergence beaucoup plus rapide et un degré de suppression d'écho bien supérieur du fait de la plus grande rapidité de convergence. Les spécialistes de la technique reconnaîtront également que les avantages du sens d'adaptation transformé peuvent être employés dans des suppresseurs d'écho non LMS. Ainsi, tel qu'on les utilise ici, le "filtre adaptatif" et "suppresseur d'écho" ne se limitent pas au filtre adaptatif LMS et

au suppresseur d'écho LMS.

Claims

REVENDICATIONS

1. Procédé de génération d'un sens de mise à jour dans un suppresseur d'écho comportant un filtre adaptatif (110), le procédé étant caractérisé en ce qu'il comprend les étapes consistant à: calculer (700) un sens de mise à jour dans un domaine résiduel de prévision linéaire; et transformer (702) le sens de mise à jour à partir du domaine résiduel de prévision linéaire en un domaine vocal pour générer un sens de mise à jour de domaine vocal pouvant être utilisé dans des coefficients de

mise à jour du filtre adaptatif.

2. Procédé selon la revendication 1, caractérisé en outre en ce qu'un algorithme de Levinson-Durbin est utilisé pour générer un signal résiduel de prévision linéaire à partir duquel le sens de mise à jour dans le

domaine résiduel de prévision linéaire est calculé.

3. Procédé selon la revendication 1, caractérisé en outre en ce que l'étape consistant à calculer le sens de mise à jour dans le domaine résiduel de prévision linéaire comporte la déduction d'un signal résiduel de prévision linéaire calculé en utilisant un

coefficient de prévision linéaire.

4. Procédé selon la revendication 3, caractérisé en outre en ce que le signal résiduel de prévision linéaire est généré en utilisant un filtre d'erreur de prévision linéaire (203) ayant une pluralité de

coefficient de prévision linéaire.

5. Procédé selon la revendication 4, caractérisé en outre en ce que le signal résiduel de prévision p linéaire est d(n), et d(n) = x(n)+ t OEkxn - k), o p est un ordre de filtre, xn) et xn-k) sont deski est un ordre de filtre, x(n) et x(n-k) sont des échantillons actuels et passés d'un signal d'entrée respectivement et {ak} est un coefficient de prévision

linéaire du filtre d'erreur de prévision linéaire.

6. Procédé selon la revendication 3, caractérisé en outre en ce que l'étape de transformation comporte le filtrage du sens de mise à jour dans un filtre à réponse impulsionnelle finie pour obtenir le sens de

mise à jour dans le domaine vocal.

7. Procédé selon la revendication 3, caractérisé en outre en ce que l'étape de transformation comporte la transformation du sens de mise à jour dans le domaine vocal en utilisant le coefficient de prévision linéaire.

8. Procédé selon la revendication 5, caractérisé en outre en ce que l'étape de transformation du sens de mise à jour comporte le calcul du sens de mise à jour gn(i) dans le domaine vocal selon: p g(i) = qn(i) + E kq n(i - k) k=l o L est une longueur du filtre adaptatif, p est un ordre du filtre d'erreur de prévision linéaire, Q(i) T = q0(i), ql(i),... qL-l(i)] est le sens de mise à jour dans le domaine résiduel de prévision linéaire, G(i) = go0(i), g1(i),... qL_1(i)]T est les sens de mise à jour du domaine vocal et {ck} est un coefficient du filtre

d'erreur de prévision linéaire.

9. Procédé selon la revendication 1, caractérisé en outre en ce qu'il comporte les étapes consistant à: générer une estimation d'écho (z(n)) en utilisant les coefficients actuels (W(n)) du filtre adaptatif (110) et les échantillons vocaux distants (x(n)); générer des coefficients de filtre de prévision linéaire (d(n)) en fonction des échantillons vocaux distants; générer un signal résiduel de prévision linéaire à partir des coefficients de filtre de prévision linéaire; calculer le sens de mise à jour du suppresseur d'écho dans le domaine résiduel de prévision linéaire à partir du signal résiduel de prévision linéaire; et générer des coefficients de mise à jour pour le filtre adaptatif en fonction des coefficients actuels et du sens de mise à jour du domaine vocal

10. Suppresseur d'écho (200) caractérisé en ce qu'il fonctionne selon le procédé défini dans l'une des

revendications 1 à 9.