FR2739736A1 - Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio - Google Patents
Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio Download PDFInfo
- Publication number
- FR2739736A1 FR2739736A1 FR9511723A FR9511723A FR2739736A1 FR 2739736 A1 FR2739736 A1 FR 2739736A1 FR 9511723 A FR9511723 A FR 9511723A FR 9511723 A FR9511723 A FR 9511723A FR 2739736 A1 FR2739736 A1 FR 2739736A1
- Authority
- FR
- France
- Prior art keywords
- segment
- short
- term
- attenuation factor
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
- H04B3/23—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/02—Analogue recording or reproducing
- G11B20/025—Error detection or correction
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/22—Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing distortions
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
Pour différentes valeurs d'un entier p, on calcule respectivement des transformées de Fourier discrètes à court terme X(p, k) et X tau (p, k) du signal audio (x) décalé de pR échantillons et du signal audio décalé de pR+ tau échantillons, R désignant un entier prédéterminé et tau désignant un décalage temporel entre l'écho et la portion de signal l'ayant engendré, on calcule un signal corrigé dans le domaine fréquentiel par transformation non linéaire de X(p, k) tenant compte, pour les différentes valeurs de l'index fréquentiel k, d'une valeur représentative d'un facteur d'atténuation relatif à l'écho et de X tau (p, k), et on calcule une composante à court terme (y(p, n)) d'un signal corrigé dans le domaine temporel par transformation de Fourier inverse à court terme du signal corrigé dans le domaine fréquentiel. Le signal corrigé dans le domaine temporel est ensuite formé par sommation pondérée de ses composantes à court terme. Application au retraitement numérique d'enregistrements analogiques.
Description
PROCEDE DE REDUCTION DES PRE-ECHOS OU POST-ECHOS
AFFECTANT DES ENREGISTREMENTS AUDIO
L'invention concerne le domaine de la restauration d'enregistrements audio bruités. On s'intéresse aux signaux ayant été enregistrés sur un support quelconque (bande magnétique, disque vinyle, cylindre) puis échantillonnés et
stockés sur un support informatique.
Les pré- et post-échos constituent un défaut
couramment rencontré sur ce type de signal. Les pré- ou post-
échos se rencontrent très fréquemment sur les enregistrements analogiques sur un support magnétique (bande, cassettes) mais aussi sur les disques, lorsqu'un passage o le signal est de faible niveau sonore précède ou suit un passage de fort niveau sonore. On appelle pré- écho la présence, quelques instants avant un signal de fort niveau, d'une copie très atténuée de ce signal, distinctement audible si le signal utile à cet instant est de faible niveau. De même, on appelle post-écho la présence quelques instants après un signal de fort niveau d'une copie très atténuée de ce signal, qui peut être audible si le signal utile est à cet instant de faible niveau. Les pré- et post-échos proviennent dans le cas des bandes magnétiques de l'aimantation, à travers le support de la bande, d'une spire par les spires jointives. Dans le cas des enregistrements sur disque vinyle, le phénomène provient de la modification plastique d'un sillon par la gravure des
sillons adjacents.
Dans toute la suite, le terme "écho" désignera indifféremment un pré-écho ou un post-écho qu'on souhaite
éliminer d'un enregistrement audio.
Dans le contexte des télécommunications, se pose le problème assez voisin de l'annulation d'écho, l'écho étant cette fois dû au temps aller-retour du trajet séparant le locuteur de son correspondant à travers le système de communication. Mais les techniques utilisées dans le contexte des communications ne permettent d'atténuer l'écho que si le canal de transmission peut être identifié en l'absence de signal utile, ce qui n'est pas le cas dans le contexte des enregistrements audio. En effet, pour appliquer les techniques utilisées en communication, il faudrait que l'écho puisse être entendu tout seul, c'est-à-dire en l'absence de tout signal utile. Dans le contexte des enregistrements audio, les échos sont gênants précisément lorsqu'ils sont entendus en présence d'un signal utile qu'il convient de ne
pas altérer.
La présente invention a pour but d'éliminer ou d'atténuer fortement les pré-échos et les post-échos affectant un enregistrement audio, en présence de signal
utile ou non, et cela sans altérer ce dernier.
L'invention propose ainsi un procédé pour éliminer, d'un premier segment d'un signal audio numérisé, une réplique atténuée d'une portion d'un second segment du signal audio numérisé, ladite portion du second segment présentant un décalage temporel par rapport à ladite réplique, ce procédé comprenant les étapes suivantes: - on détermine une valeur représentative d'un facteur d'atténuation entre ladite portion du second segment et ladite réplique pour différentes valeurs d'un index fréquentiel k; - pour différentes valeurs d'un entier p. on calcule respectivement des transformées de Fourier discrètes à court terme X(p,k) et X (p,k) du signal audio décalé de pR échantillons et du signal audio décalé de pR+t échantillons, R désignant un entier prédéterminé au plus égal à la longueur T desdites transformées de Fourier discrètes à court terme, et t désignant ledit décalage temporel exprimé en nombre d'échantillons, on calcule un signal corrigé dans le domaine fréquentiel par transformation non linéaire de la transformée de Fourier à court terme X(p,k) tenant compte, pour les différentes valeurs de l'index fréquentiel k, de la valeur représentative du facteur d'atténuation et de la transformée de Fourier à court terme Xt(p,k), et on calcule une composante à court terme d'un signal corrigé dans le domaine temporel par transformation de Fourier inverse à court terme du signal corrigé dans le domaine fréquentiel; et on forme le signal corrigé dans le domaine temporel
par sommation pondérée de ses composantes à court terme.
La transformation non linéaire utilisée pour calculer le signal corrigé dans le domaine fréquentiel Y(p,k) est par exemple de la forme: Y(p, k) = X(p,k). f (g(k) t(p,k)I (9 J(p, k) g(k) désignant la valeur représentative du facteur d'atténuation pour l'index fréquentiel k, f(.) désignant une fonction réelle décroissante, et I. I représentant le module
d'un nombre complexe.
Ce procédé utilise un modèle simple de production de l'écho: l'écho (préou post-) est simplement une version atténuée et décalée dans le temps du signal dont il est la réplique. La technique d'atténuation non linéaire basée sur l'utilisation de la transformée de Fourier présente notamment les avantages suivants: elle permet d'obtenir de très bons facteurs d'atténuation même en présence d'erreurs sur l'estimation du retard t; elle permet de surestimer le facteur d'atténuation et d'obtenir une diminution de l'écho
plus importante encore; elle n'altère pas le signal utile.
Lorsque le décalage temporel n'est pas connu précisément a priori, sa détermination préalable comporte avantageusement les étapes suivantes: on effectue une transformée de Fourier discrète, de longueur prédéterminée N. du premier segment du signal audio numérisé pour obtenir une première fonction du domaine fréquentiel; - on effectue une transformée de Fourier discrète de longueur N du second segment du signal audio numérisé pour obtenir une seconde fonction du domaine fréquentiel; - on calcule une fonction de corrélation tronquée entre le premier et le second segment par transformée de Fourier discrète inverse de longueur N d'une troisième fonction du domaine fréquentiel prenant la valeur U(m).Vf(m) pour chaque index fréquentiel m pour lequel IU(m) f<gmax. Vf(m) Iet la valeur 0 pour les autres index fréquentiels m, U(m) et Vf(m) désignant respectivement les valeurs pour l'index fréquentiel m des première et seconde fonctions du domaine fréquentiel, gmax désignant un coefficient prédéterminé, et (.)* représentant le complexe conjugué; et - on calcule le décalage temporel à partir de la valeur d'un entier pour lequel le module de ladite fonction
de corrélation tronquée présente un maximum.
On peut ainsi résoudre les problèmes posés par la présence de signal utile lors de l'étape d'estimation du décalage, grâce à une méthode d'estimation par
filtrage/corrélation dans le domaine fréquentiel.
La détermination de la valeur représentative du facteur d'atténuation comporte avantageusement les étapes suivantes: - obtention d'une estimation du facteur d'atténuation; et - accroissement d'une quantité prédéterminée de ladite estimation pour fournir ladite valeur représentative
du facteur d'atténuation.
L'estimation du facteur d'atténuation peut être
dépendante ou indépendante de l'index fréquentiel k.
L'obtention de cette estimation peut comporter les étapes suivantes: pour différentes valeurs d'un entier q, on calcule respectivement des transformées de Fourier discrètes à court terme de longueur T U(q,k) et V(q,k) du signal audio décalé de qR échantillons appartenant au premier segment et du signal audio décalé de qR+T échantillons appartenant au second segment; et - on calcule l'estimation du facteur d'atténuation par: Q-1 S |qO U(q' k) |'vqk * |(X, 1)| g(k) = V (1 Q-i x; IV(q,k)2 q=O ou, si l'estimation g est indépendante de l'index fréquentiel k, par: Q T-1 ?kEo IU(q,k) I. IV(q,k) (2 a = g Q-1 T-1 O k- IV(q,k) 12 q= ^O o Q=l+E[(nf-nd-T)/R] avec nf-nd désignant la longueur du
premier segment, et E[.] représentant la partie entière.
La détermination de l'atténuation prend ainsi en compte la méthode utilisée dans l'étape ultérieure d'élimination de l'écho. Le facteur d'atténuation est estimé par une méthode de minimisation de type moindres-carrés dans
le domaine des fréquences.
D'autres particularités et avantages de la présente
invention apparaîtront dans la description ci-après d'un
exemple de réalisation préféré mais non limitatif, en référence aux dessins annexés, dans lesquels: - les figures 1 et 2 sont des diagrammes temporels de signaux utilisés dans un exemple de mise en oeuvre du procédé selon l'invention, dans le cas d'un pré-écho sur la figure 1 et d'un post-écho sur la figure 2; - les figures 3 à 5 sont respectivement des organigrammes de procédures de détermination du décalage temporel, de détermination de la valeur représentative du facteur d'atténuation et d'élimination de l'écho utilisables pour la mise en oeuvre du procédé; et - la figure 6 est une représentation synoptique d'une partie de la procédure d'élimination de l'écho représentée
sur la figure 5.
Les figures 1 et 2 illustrent une section d'un signal audio x(n) obtenu par échantillonnage et numérisation d'un enregistrement affecté d'échos. La fréquence d'échantil- lonnage Fe est par exemple de 44,1 kHz. Le signal x(n) est disponible sous forme d'un fichier informatique accessible par un ordinateur programmé pour mettre en oeuvre le procédé
selon l'invention.
On suppose qu'un premier segment A contenant un écho Epre, Epost et un second segment B, dont une portion O est l'"original" dont cet écho est une réplique, ont déjà été localisés. Une telle localisation est aisée à effectuer auditivement. L'écho indésirable étant distinctement audible, l'opérateur peut pointer des instants (échantillons nd et nf) encadrant l'écho, qui constitueront le début et la fin du segment A. Ayant distingué l'écho, l'opérateur peut reconnaître et localiser l'original O de la même manière. On peut également effectuer une localisation automatique des segments o sont susceptibles de se trouver des échos et leurs originaux, par exemple en analysant les niveaux énergétiques du signal pour repérer les passages piano précédés ou suivis par des passages forte. La localisation des segments n'a pas besoin d'être précise pour que le
procédé selon l'invention fonctionne.
La localisation des segments A et B permet de disposer des données de départ suivantes: échantillons de début et de fin nd, nf du premier segment A, valeurs minimale et maximale tmint tmax du décalage temporel entre l'écho et
l'original, exprimées en nombre d'échantillons. Les échan-
tillons de début et de fin du second segment B correspondent à nd+tmin et nf+tmax. Le décalage effectif t est alors tel que 0<Tmin<t<tmax dans le cas d'un pré-écho (figure 1), et
Tmin<T<tmax<0 dans le cas d'un post-écho (figure 2).
Lorsque le décalage T n'est pas connu a priori (cas d'un enregistrement sur bande magnétique par exemple), la première phase du procédé selon l'invention consiste à le déterminer. La figure 3 montre une procédure utilisable à cette fin. Les deux premières étapes 10, 11 consistent à transporter les signaux des premier et second segments A, B dans une fenêtre temporelle de longueur N échantillons sur laquelle leurs transformées de Fourier discrètes seront calculées à l'étape 12. Pour une implémentation optimale par transformée de Fourier rapide (TFR), il est commode de prendre la longueur N sous forme d'une puissance de 2, par exemple N=2a, avec a=l+E[log2(nf-nd+Tmax-Zmin)] o E[.] désigne la partie entière, de façon que N soit supérieure ou égale aux longueurs nf- nd et nf-nd+Tmax- min des segments A et B. On définit ainsi aux étapes 10 et 11 les signaux u et vf illustrés sur les figures 1 et 2: u(n)=x(n+nd) si 0On<nf-nd u(n)=0 si nf-nd!n<N Vf(n)=x(n+nd+Tmin) si On<nf-nd+tmax-tmin vf(n)=0 si nf-nd+Tmax-tminen<N A l'étape 12, un algorithme conventionnel de TFR est utilisé pour calculer les transformées de Fourier discrètes de longueur N U(m) et Vf(m) des premier et second segments A, B, c'est-àdire, pour 0 m<N: N-1 U(m) = u(n). exp(-2jmn/N) n=O N-1 Vf (m) = E v (n). exp(-2jxmn/N) n=0 L'étape suivante 13 est une opération de seuillage dans le domaine fréquentiel. Dans les zones de fréquence o JU(m) | est relativement élevé (c'est-à-dire supérieur au niveau maximal auquel on s'attendrait à le trouver compte tenu d'une atténuation maximale prévisible et du niveau du signal IVf(m)[ ayant engendré l'écho), on considère que le
signal utile est d'énergie supérieure à celle de l'écho.
Cette zone de fréquence n'est donc pas à prendre en compte pour l'estimation du décalage temporel puisqu'elle n'est pas nécessairement représentative du signal d'écho. L'opération réalisée à l'étape 13, qui est comparable à un filtrage temporel séparant l'écho du signal utile, est alors, pour O0m<N: W(m)=U(m)*.Vf(m) si IU(m)|<gmaxlVf(m)I W(m)=O si [U(m)l[gmaxlVf(m)l o gmax représente un coefficient prédéterminé égal à un facteur d'atténuation maximal attendu. Un ordre de grandeur S15 typique pour le choix de gmax correspond à une atténuation
de l'ordre de -30 dB.
A l'étape 14, on effectue la transformée de Fourier discrète inverse de la fonction W(m) du domaine fréquentiel pour obtenir une fonction de corrélation tronquée c(n) entre le premier et le second segment A, B. Cette fonction de corrélation est tronquée en ce sens que la fonction W(m) a été mise à zéro à l'étape 13 pour les zones de fréquences o l'on considère que le signal du premier segment est trop énergétique par rapport à celui du second segment pour être représentatif d'un écho. La transformée de Fourier discrète inverse de longueur N peut également être effectuée à l'étape 14 par un algorithme de TFR, de façon à obtenir, pour 0On<N: N-1 c(n) = - E W(m).exp(2jxmn/N) N m=O A l'étape 15, on recherche l'entier n1 pour lequel le module de la fonction de corrélation tronquée c(n) est maximal dans l'intervalle O0n<tmax-"min. La fonction c(n) est généralement réelle, et le maximum de son module correspond généralement à un réel positif, de sorte qu'il est possible de se dispenser du calcul des modules Ic(n) I. Le décalage temporel effectif t est alors obtenu à l'étape 16 à partir de la valeur de l'entier n1 obtenue à l'étape 15. Avec les conventions adoptées dans l'exemple de réalisation décrit,
le décalage X est simplement obtenu par t=nl+tmin.
Ce mode d'estimation du décalage temporel t au moyen d'un calcul de corrélation faisant intervenir un filtrage dans le domaine fréquentiel permet une estimation fiable grâce à une utilisation de l'information disponible a priori
sur la valeur maximale gmax du facteur d'atténuation.
Lorsque le décalage temporel t est connu a priori, on peut se dispenser de la procédure d'estimation illustrée par la figure 3. C'est le cas par exemple pour un signal audiofréquence provenant d'un enregistrement sur disque vinyle à V tours par minute: le décalage t peut alors être
obtenu de façon élémentaire par Z=E[Fe/(V/60)].
La seconde phase du procédé selon l'invention consiste à déterminer une valeur g représentative du facteur
d'atténuation entre l'original O et son écho Epre ou Epost.
On considère ci-après, en référence à la figure 4, le cas o l'on fait appel à une seule valeur g indépendante de la
fréquence pour représenter le facteur d'atténuation.
L'obtention de la valeur g comporte d'abord un calcul d'une estimation g du facteur d'atténuation (étapes 20 à 22), puis une étape 23 de surestimation du facteur d'atténuation estimé. A cette étape 23, on peut ainsi prendre g=g.g, le coefficient prédéterminé g correspondant par exemple à un
gain de 3 ou 5 dB.
Pour l'estimation 20-22 du facteur d'atténuation g, on utilise des transformées de Fourier à court terme de longueur T échantillons. On définit une fenêtre d'analyse de longueur L échantillons correspondant par exemple à une durée de l'ordre de 40 ms: L=Fex0,04. Cette durée peut être réglée selon le type de signal audio traité. La fenêtre d'analyse est classiquement associée à une fonction de fenêtrage h(n), par exemple une fonction rectangulaire ou encore une fonction de Hamming telle que: h(n)=[l-cos(2nn/L)]/2 pour 0On<L h(n)=0 pour n<0 et niL La longueur T de la transformée de Fourier à court terme peut être prise égale à la longueur L de la fenêtre d'analyse. Pour une implémentation optimale par un algorithme de TFR, il est commode de prendre T sous forme d'une puissance de 2: T=2b avec b=l+ E[log2L]. A partir de la valeur de T, on définit un facteur d'incrément R au plus égal
à T, par exemple R=T/4.
La première étape 20 de l'estimation de l'atténuation consiste à aligner temporellement le premier segment A contenant l'écho Epre, Epost avec la portion correspondante du second segment B contenant l'original O. On définit ainsi un signal décalé v(n) par: v(n)=x(n+nd+t) pour 0On<nf-nd T étant la valeur du décalage temporel précédemment
déterminée (t<O pour un pré-écho et t>0 pour un post-écho).
On peut voir sur les figures 1 et 2 que, dans les signaux u(n) et v(n), l'écho et son original sont alignés temporellement. Les transformées de Fourier à court terme sont calculées à l'étape 21. Plus précisément, on calcule Q paires de transformées de Fourier à court terme, Q étant l'entier défini par Q=l+E[(nf-nd-T)/R]. Ainsi, pour chaque entier q tel que 0q<Q, l'algorithme de TFR permet d'obtenir deux fonctions U(q,k) et V(q,k) du domaine fréquentiel (0ek<T): T-1 U(q,k)= = h(n).u(n+qR).exp(-2jxckn/T n=O T-1 V(q,k)= E h(n).v(n+qR).exp(-2jikn/l) n=O L'estimation g est alors calculée à l'étape 22 en appliquant la formule (2). On note que cette formule tient compte uniquement des modules des transformées de Fourier à
court terme U(q,k) et V(q,k).
Lorsqu'on choisit de modéliser l'écho par un facteur d'atténuation dépendant de la fréquence, l'organigramme de la figure 4 peut être simplement modifié en ce qui concerne les étapes 22 et 23. A l'étape 22 modifiée, on calcule selon la formule (1) T estimations du facteur d'atténuation g(k) dépendant de l'index fréquentiel k (0Ok<T); et à l'étape 23 modifiée, on prend g(k)=g.g(k) pour 0sk<T (il serait également possible de prendre un facteur de surestimation
dépendant de la fréquence).
La dernière phase du procédé consiste en l'élimination proprement dite de l'écho, par exemple selon la procédure de soustraction spectrale non linéaire illustrée
sur la figure 5.
On définit d'abord la zone à traiter, qui peut être comme précédemment l'intervalle temporel ndSn<nf, mais qui peut aussi être plus longue (éventuellement tout l'enregistrement si on considère que le facteur d'atténuation
et le décalage temporel ne changent pas au cours du temps).
Cette zone est délimitée par les échantillons numérotés ns
et ne. L'entier P est alors défini par P=l+E[(ne-ns-T)/R].
A l'étape 30, on calcule P paires de transformées de Fourier à court terme X(p,k), X,(p,k), de longueur T. Pour chaque entier p tel que 0Op<T, un algorithme de TFR permet d'obtenir les deux fonctions de l'index fréquentiel k (0Ok<T): T-1 X(p,k)= E h(n).x(n+n +pR).exp(- 2jckn/T) n=O T-1 X (p,k)= E h(n). x(n+n +pR+r).exp(-2jickn/T) n=O A l'étape 31, on applique une transformation non linéaire à la transformée de Fourier à court terme X(p,k) pour obtenir un signal corrigé dans le domaine fréquentiel Y(p,k), et ce pour chaque entier p tel que 0p<P. Cette
transformation non linéaire tient compte, pour les diffé-
rentes valeurs de l'index fréquentiel k, de la valeur g(k) ou g représentative du facteur d'atténuation et de la
transformée de Fourier à court terme X (p,k). Plus préci-
sément, le signal corrigé Y(p,k) s'exprime sous la forme: Y(p, k) =X(p, k) f(g). IX (p, k)) -I x(p, k) f étant une fonction réelle, positive et décroissante, introduisant la non-linéarité. Une telle transformation affecte le module mais non l'argument de X(p,k). L'étape 31 représentée sur la figure 5 correspond au cas o le facteur d'atténuation est choisi indépendant de la fréquence (g(k)=g=Cte) et au choix f(z)=max{0,1-z). On notera que diverses autres formes pourraient être retenues pour la
fonction f. par exemple f(z)=(max(0,1-z2})1/2.
A l'étape 32, on forme P composantes à court terme y(p,n) d'un signal corrigé dans le domaine temporel, par transformée de Fourier discrète inverse à court terme des signaux corrigés Y(p,k) dans le domaine fréquentiel. Pour 0p<P, l'algorithme de TFR permet ainsi d'obtenir le signal y(p,n) de l'index temporel n (0Sn<T): T-1 y(pn)= T Y(p,k).exp(2jxkn/T) k=O On note que les étapes 30 à 32, représentées séparément sur la figure 5, peuvent être exécutées au sein d'une même boucle sur l'entier p allant de 0 à P-1. Les opérations correspondant à une itération dans cette boucle sont illustrées sous forme synoptique sur la figure 6. Les blocs 41 et 42 représentent les transformées de Fourier à court terme (TFCT) du signal x(n+pR) et du même signal décalé de t échantillons en 40 (étape 30 de la figure 5 pour une valeur de p). Le bloc multiplieur 43 applique le facteur g au module de XI(p,k), et le résultat est soustrait du module de X(p,k) par le bloc soustracteur 44. Le bloc 46 représente la transformée de Fourier inverse à court terme (TFICT) appliquée au signal complexe corrigé Y(p,k) dont l'argument est le même que celui de X(p,k) et dont le module est le maximum, délivré par le bloc 45, entre O et la sortie du bloc soustracteur 46. Les blocs 43 à 45 correspondent à l'étape 31 de la figure 5 pour une valeur de p. et le bloc 46 à
l'étape 32.
A la dernière étape 33, on forme le signal corrigé dans le domaine temporel y(n) par sommation pondérée de ses composantes à court terme y(p,n). Il s'agit d'une somme à recouvrement (overlap-add) qui peut s'exprimer, pour T/2 n<ne-ns-T/2, par: P-1 E w(n-pR). y(p, n-pR) y(n+n)= p=O s P-1 E h (n-pR). w(n-pR) p=0 Dans cette expression, w(n) désigne une fonction de fenétrage de synthèse de longueur L (c'est-à-dire nulle en dehors de l'intervalle 0On<L), telle qu'une fonction
rectangulaire ou de Hamming.
Le signal y(n+ns) est la version restaurée du signal x(n+ns), dans laquelle l'écho a été éliminé ou du moins
sensiblement atténué.
Cette procédure d'atténuation de l'écho par une technique de soustraction spectrale à court terme non linaire présente l'avantage de fonctionner même si le décalage X n'est estimé qu'approximativement, et même si le facteur d'atténuation est surestimé. Surestimer g (étape 23) permet
d'améliorer encore l'atténuation.
Dans certains cas rares, on peut observer des pré-
échos ou post-échos multiples. C'est le cas par exemple si une spire de bande magnétique corrompt plusieurs spires voisines. Une telle situation peut être traitée en exécutant plusieurs fois de suite le processus correspondant aux figures 4 et 5, une fois pour chaque décalage individuel. Il est également possible de traiter une telle situation en une seule itération. Dans l'exemple o il y a deux décalages t et 2T, on peut obtenir deux valeurs (ou deux jeux de valeurs) gT et g2% aux étapes 22, 23, pourvu que les transformées de Fourier à court terme V' (q,k) du signal doublement décalé v' (n)=x(n+nd+2T) aient été calculées à l'issue des étapes 20 et 21. Le signal corrigé dans le domaine fréquentiel Y(p,k) est alors obtenu, à l'étape 31 modifiée, selon Y(p, k) =X(p, k) f' (gt IXz (p' k) | ' gr2 JX(p, k)) ix(p,k) Ir JX(p, k) I) avec T-1 X2 (pk) = E h(n).x(n+n.pR+2r).exp (-2jukn/ T) n=O obtenu à l'étape 30 modifiée, et, par exemple, f'(z, z')=max{0,1-z-z}. Dans le cas o le décalage temporel est constant (par exemple pour un disque 33 tours, mais pas pour une bande magnétique), et o le facteur d'atténuation est également considéré comme constant dans le temps, la totalité du signal
peut être traitée sans dégradation du signal utile, c'est-à-
dire que ns et ne peuvent correspondre au début et à la fin
de l'enregistrement complet.
Claims (9)
1. Procédé pour éliminer, d'un premier segment (A) d'un signal audio numérisé, une réplique atténuée (Epre, Epost) d'une portion (O) d'un second segment (B) du signal audio numérisé, ladite portion du second segment présentant un décalage temporel (T) par rapport à ladite réplique, caractérisé en ce qu'il comprend les étapes suivantes: - on détermine une valeur (g(k)) représentative d'un facteur d'atténuation entre ladite portion du second segment et ladite réplique pour différentes valeurs d'un index fréquentiel k; - pour différentes valeurs d'un entier p. on calcule respectivement des transformées de Fourier discrètes à court terme X(p,k) et Xt(p,k) du signal audio décalé de pR échantillons et du signal audio décalé de pR+T échantillons, R désignant un entier prédéterminé au plus égal à la longueur T desdites transformées de Fourier discrètes à court terme, et T désignant ledit décalage temporel exprimé en nombre d'échantillons, on calcule un signal corrigé dans le domaine fréquentiel (Y(p,k)) par transformation non linéaire de la transformée de Fourier à court terme X(p,k) tenant compte, pour les différentes valeurs de l'index fréquentiel k, de la valeur (g(k)) représentative du facteur d'atténuation et de la transformée de Fourier à court terme XT(p,k), et on calcule une composante à court terme (y(p,n)) d'un signal corrigé dans le domaine temporel par transformation de Fourier inverse à court terme du signal corrigé dans le domaine fréquentiel; et - on forme le signal corrigé dans le domaine temporel
par sommation pondérée de ses composantes à court terme.
2. Procédé selon la revendication 1, caractérisé en ce que ladite transformation non linéaire affecte essentiellement le module mais non l'argument de la
transformée de Fourier à court terme X(p,k).
3. Procédé selon la revendication 2, caractérisé en ce que, pour chaque valeur de l'entier p. le signal corrigé dans le domaine fréquentiel Y(p, k) est calculé selon Y(p, k) = X(p, k). f (g(k) Kt (p, k) 1 (9 JX(p, k) g(k) désignant la valeur représentative du facteur d'atténuation pour l'index fréquentiel k, et f(.) désignant
une fonction réelle décroissante.
4. Procédé selon l'une quelconque des revendications
1 à 3, caractérisé en ce qu'il comporte une étape préalable de détermination du décalage temporel (T), au cours de laquelle: - on effectue une transformée de Fourier discrète, de longueur prédéterminée N. du premier segment (A) du signal audio numérisé pour obtenir une première fonction du domaine fréquentiel (U(m)); - on effectue une transformée de Fourier discrète de longueur N du second segment (B) du signal audio numérisé pour obtenir une seconde fonction du domaine fréquentiel (Vf(m)); - on calcule une fonction de corrélation tronquée (c(n)) entre le premier et le second segment par transformée de Fourier discrète inverse de longueur N d'une troisième fonction du domaine fréquentiel (W(m)) prenant la valeur U(m). Vf(m) pour chaque index fréquentiel m pour lequel IU(m) I<gmax. IVf(m) et la valeur 0 pour les autres index fréquentiels m, U(m) et Vf(m) désignant respectivement les valeurs pour l'index fréquentiel m des première et seconde fonctions du domaine fréquentiel, et gmax désignant un coefficient prédéterminé; et - on calcule le décalage temporel (T) à partir de la valeur d'un entier (n1) pour lequel le module de ladite
fonction de corrélation tronquée (c(n)) présente un maximum.
5. Procédé selon l'une quelconque des revendications
1 à 4, caractérisé en ce que la détermination de la valeur (g(k)) représentative du facteur d'atténuation pour un index fréquentiel k comporte les étapes suivantes: - obtention d'une estimation (g(k)) du facteur d'atténuation; et - accroissement d'une quantité prédéterminée de A ladite estimation (g(k)) pour fournir ladite valeur
représentative (g(k)) du facteur d'atténuation.
6. Procédé selon la revendication 5, caractérisé en ce que l'obtention des estimations (g(k)) du facteur d'atténuation pour les différentes valeurs de l'index fréquentiel k comporte les étapes suivantes: - pour différentes valeurs d'un entier q. on calcule respectivement des transformées de Fourier discrètes à court terme de longueur T U(q,k) et V(q,k) du signal audio décalé de qR échantillons appartenant au premier segment et du signal audio décalé de qR+T échantillons appartenant au second segment; et - on calcule l'estimation g(k) du facteur d'atténuation pour chaque index fréquentiel k par:
Q-1
I U(q,k) IV(q,k) I g(k) = Q Q-i IV(q,k) 2 o Q=l+E[(nf-nd-T)/R] avec nf-nd désignant la longueur du
premier segment et E[.] représentant la partie entière.
7. Procédé selon l'une quelconque des revendications
1 à 4, caractérisé en ce qu'on adopte une même valeur (g) représentative du facteur d'atténuation pour chacune des
valeurs de l'index fréquentiel k.
8. Procédé selon la revendication 7, caractérisé en ce que la détermination de la valeur (g) représentative du facteur d'atténuation comporte les étapes suivantes: - obtention d'une estimation (g) du facteur d'atténuation; et - accroissement d'une quantité prédéterminée de ladite estimation (g) pour fournir ladite valeur
représentative (g) du facteur d'atténuation.
9. Procédé selon la revendication 8, caractérisé en ce que l'obtention de l'estimation (g) du facteur d'atténuation comporte les étapes suivantes: pour différentes valeurs d'un entier q. on calcule respectivement des transformées de Fourier discrètes à court terme de longueur T U(q,k) et V(q,k) du signal audio décalé de qR échantillons appartenant au premier segment et du signal audio décalé de qR+T échantillons appartenant au second segment; et - on calcule l'estimation g du facteur d'atténuation par: Qu1 T-1 4 1 IU(q,k) IV(<q, k) I * q=Ok g= Q T-1 cI k IV(q,k)j o Q=l+E[(nf-nd-T)]/R avec nf- nd désignant la longueur du
premier segment et E[.] représentant la partie entière.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9511723A FR2739736B1 (fr) | 1995-10-05 | 1995-10-05 | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
EP96402111A EP0767462B1 (fr) | 1995-10-05 | 1996-10-03 | Procédé de réduction des pré-échos ou post-échos affectant des enregistrements audio |
DE69611421T DE69611421T2 (de) | 1995-10-05 | 1996-10-03 | Verfahren zur Reduzierung von Audioaufzeichnung beeinflussenden Vor- und Nachechos |
US08/726,469 US5717768A (en) | 1995-10-05 | 1996-10-04 | Process for reducing the pre-echoes or post-echoes affecting audio recordings |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9511723A FR2739736B1 (fr) | 1995-10-05 | 1995-10-05 | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2739736A1 true FR2739736A1 (fr) | 1997-04-11 |
FR2739736B1 FR2739736B1 (fr) | 1997-12-05 |
Family
ID=9483276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR9511723A Expired - Fee Related FR2739736B1 (fr) | 1995-10-05 | 1995-10-05 | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
Country Status (4)
Country | Link |
---|---|
US (1) | US5717768A (fr) |
EP (1) | EP0767462B1 (fr) |
DE (1) | DE69611421T2 (fr) |
FR (1) | FR2739736B1 (fr) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6278744B1 (en) | 1996-11-15 | 2001-08-21 | Conexant Systems, Inc. | System for controlling and shaping the spectrum and redundancy of signal-point limited transmission |
US6192087B1 (en) | 1996-11-15 | 2001-02-20 | Conexant Systems, Inc. | Method and apparatus for spectral shaping in signal-point limited transmission systems |
FR2768547B1 (fr) * | 1997-09-18 | 1999-11-19 | Matra Communication | Procede de debruitage d'un signal de parole numerique |
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
AU2002307533B2 (en) * | 2001-05-10 | 2008-01-31 | Dolby Laboratories Licensing Corporation | Improving transient performance of low bit rate audio coding systems by reducing pre-noise |
EP1927981B1 (fr) * | 2006-12-01 | 2013-02-20 | Nuance Communications, Inc. | Affinement spectral de signaux audio |
EP2562751B1 (fr) | 2011-08-22 | 2014-06-11 | Svox AG | Interpolation temporelle de spectres adjacents |
FR3025923A1 (fr) * | 2014-09-12 | 2016-03-18 | Orange | Discrimination et attenuation de pre-echos dans un signal audionumerique |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9826306B2 (en) | 2016-02-22 | 2017-11-21 | Sonos, Inc. | Default playback device designation |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) * | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2052128A (en) * | 1979-06-29 | 1981-01-21 | Univ Glasgow | Improvements in or relating to tape recording and playback systems |
EP0065210A2 (fr) * | 1981-05-09 | 1982-11-24 | Felten & Guilleaume Fernmeldeanlagen GmbH | Méthode de traitement de signaux électriques avec un dispositif de filtrage numérique |
JPH0563609A (ja) * | 1991-09-05 | 1993-03-12 | Fujitsu Ltd | エコーキヤンセラ方式 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3786188A (en) * | 1972-12-07 | 1974-01-15 | Bell Telephone Labor Inc | Synthesis of pure speech from a reverberant signal |
AU601104B2 (en) * | 1988-03-17 | 1990-08-30 | Fujitsu Limited | Echo canceller |
JPH084243B2 (ja) * | 1993-05-31 | 1996-01-17 | 日本電気株式会社 | 多チャンネルエコー除去方法および装置 |
-
1995
- 1995-10-05 FR FR9511723A patent/FR2739736B1/fr not_active Expired - Fee Related
-
1996
- 1996-10-03 DE DE69611421T patent/DE69611421T2/de not_active Expired - Lifetime
- 1996-10-03 EP EP96402111A patent/EP0767462B1/fr not_active Expired - Lifetime
- 1996-10-04 US US08/726,469 patent/US5717768A/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2052128A (en) * | 1979-06-29 | 1981-01-21 | Univ Glasgow | Improvements in or relating to tape recording and playback systems |
EP0065210A2 (fr) * | 1981-05-09 | 1982-11-24 | Felten & Guilleaume Fernmeldeanlagen GmbH | Méthode de traitement de signaux électriques avec un dispositif de filtrage numérique |
JPH0563609A (ja) * | 1991-09-05 | 1993-03-12 | Fujitsu Ltd | エコーキヤンセラ方式 |
Non-Patent Citations (6)
Title |
---|
MURANO K ET AL: "ECHO CANCELLATION AND APPLICATIONS", IEEE COMMUNICATIONS MAGAZINE, vol. 28, no. 1, 1 January 1990 (1990-01-01), pages 49 - 55, XP000100687 * |
O. A. AMRANE ET AL.: "Low-delay frequency domain LMS algorithm", IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, vol. 4, 23 March 1992 (1992-03-23) - 26 March 1992 (1992-03-26), SAN FRANCISCO, pages 9 - 12, XP002009010 * |
O. CAPPE , J. LAROCHE: "Evaluation of short-time spectral attenuation techniques for the restoration of musical recordings", IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, vol. 3, no. 1, January 1995 (1995-01-01), pages 84 - 93, XP000575276 * |
O. STEPHANI: "On disk-record echo phenomena", JOURNAL OF THE AUDIO ENGINEERING SOCIETY, vol. 30, no. 4, April 1982 (1982-04-01), pages 217 - 224, XP002009009 * |
PATENT ABSTRACTS OF JAPAN vol. 017, no. 378 (E - 1398) 15 July 1993 (1993-07-15) * |
VASEGHI S V ET AL: "RESTORATION OF OLD GRAMOPHONE RECORDINGS", JOURNAL OF THE AUDIO ENGINEERING SOCIETY, vol. 40, no. 10, 1 October 1992 (1992-10-01), pages 791 - 801, XP000323726 * |
Also Published As
Publication number | Publication date |
---|---|
DE69611421T2 (de) | 2001-07-26 |
FR2739736B1 (fr) | 1997-12-05 |
US5717768A (en) | 1998-02-10 |
EP0767462A2 (fr) | 1997-04-09 |
DE69611421D1 (de) | 2001-02-08 |
EP0767462B1 (fr) | 2001-01-03 |
EP0767462A3 (fr) | 1997-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR2739736A1 (fr) | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio | |
EP2002428B1 (fr) | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant | |
EP1016072B1 (fr) | Procede et dispositif de debruitage d'un signal de parole numerique | |
EP2868073B1 (fr) | Réduction d'écho par l'intermédiaire de signaux audio cachés | |
EP0130263B1 (fr) | Procédé d'initialisation d'un filtre annuleur d'écho et système de communication utilisant ledit procédé | |
EP0002998A1 (fr) | Procédé de compression de données relatives au signal vocal et dispositif mettant en oeuvre ledit procédé | |
FR2741217A1 (fr) | Procede et dispositif permettant d'eliminer les bruits parasites dans un systeme de communication | |
EP1789956A1 (fr) | Procede de traitement d'un signal sonore bruite et dispositif pour la mise en ceuvre du procede | |
FR2706053A1 (fr) | Procédé pour réduire la redondance des données. | |
EP0506535B1 (fr) | Procédé et système de traitement des pré-échos d'un signal audio-numérique codé par transformée fréquentielle | |
CA1225745A (fr) | Procede et installation d'analyse et de restitution de signal a echantillonnage et interpolation | |
CA2304012A1 (fr) | Procede de detection d'activite vocale | |
EP3192073B1 (fr) | Discrimination et atténuation de pré-échos dans un signal audionumérique | |
FR2984580A1 (fr) | Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant | |
EP0574288B1 (fr) | Procédé et dispositif de dissimulation d'erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle | |
EP1021805B1 (fr) | Procede et disposition de conditionnement d'un signal de parole numerique | |
EP2515300B1 (fr) | Procédé et système de réduction du bruit | |
FR2768546A1 (fr) | Procede de debruitage d'un signal de parole numerique | |
EP1895433A1 (fr) | Procédé d'estimation de phase pour la modélisation sinusoidale d'un signal numérique | |
EP0585434B1 (fr) | Procede et dispositif de filtrage pour la reduction des preechos d'un signal audio-numerique | |
WO2007006958A2 (fr) | Procédé et dispositif d'atténuation des échos d'un signal audionumérioue issu d'un codeur multicouches | |
FR3051958A1 (fr) | Procede et dispositif pour estimer un signal dereverbere | |
EP3462626A1 (fr) | Système de communication cdma, produit programme d'ordinateur et procédé de communication associés | |
FR3071984A1 (fr) | Module de correction d'une fonction de transfert d'un canal de transmission d'un systeme de communication cdma, recepteur et procede associes | |
CA2389785A1 (fr) | Procede et systeme de pre et de post-traitement d'un signal audio pour la transmission sur un canal fortement perturbe |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
CJ | Change in legal form | ||
TP | Transmission of property | ||
ST | Notification of lapse |
Effective date: 20140630 |