FR2739736A1 - Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio - Google Patents

Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio Download PDF

Info

Publication number
FR2739736A1
FR2739736A1 FR9511723A FR9511723A FR2739736A1 FR 2739736 A1 FR2739736 A1 FR 2739736A1 FR 9511723 A FR9511723 A FR 9511723A FR 9511723 A FR9511723 A FR 9511723A FR 2739736 A1 FR2739736 A1 FR 2739736A1
Authority
FR
France
Prior art keywords
segment
short
term
attenuation factor
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9511723A
Other languages
English (en)
Other versions
FR2739736B1 (fr
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to FR9511723A priority Critical patent/FR2739736B1/fr
Priority to EP96402111A priority patent/EP0767462B1/fr
Priority to DE69611421T priority patent/DE69611421T2/de
Priority to US08/726,469 priority patent/US5717768A/en
Publication of FR2739736A1 publication Critical patent/FR2739736A1/fr
Application granted granted Critical
Publication of FR2739736B1 publication Critical patent/FR2739736B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/02Analogue recording or reproducing
    • G11B20/025Error detection or correction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/22Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing distortions

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

Pour différentes valeurs d'un entier p, on calcule respectivement des transformées de Fourier discrètes à court terme X(p, k) et X tau (p, k) du signal audio (x) décalé de pR échantillons et du signal audio décalé de pR+ tau échantillons, R désignant un entier prédéterminé et tau désignant un décalage temporel entre l'écho et la portion de signal l'ayant engendré, on calcule un signal corrigé dans le domaine fréquentiel par transformation non linéaire de X(p, k) tenant compte, pour les différentes valeurs de l'index fréquentiel k, d'une valeur représentative d'un facteur d'atténuation relatif à l'écho et de X tau (p, k), et on calcule une composante à court terme (y(p, n)) d'un signal corrigé dans le domaine temporel par transformation de Fourier inverse à court terme du signal corrigé dans le domaine fréquentiel. Le signal corrigé dans le domaine temporel est ensuite formé par sommation pondérée de ses composantes à court terme. Application au retraitement numérique d'enregistrements analogiques.

Description

PROCEDE DE REDUCTION DES PRE-ECHOS OU POST-ECHOS
AFFECTANT DES ENREGISTREMENTS AUDIO
L'invention concerne le domaine de la restauration d'enregistrements audio bruités. On s'intéresse aux signaux ayant été enregistrés sur un support quelconque (bande magnétique, disque vinyle, cylindre) puis échantillonnés et
stockés sur un support informatique.
Les pré- et post-échos constituent un défaut
couramment rencontré sur ce type de signal. Les pré- ou post-
échos se rencontrent très fréquemment sur les enregistrements analogiques sur un support magnétique (bande, cassettes) mais aussi sur les disques, lorsqu'un passage o le signal est de faible niveau sonore précède ou suit un passage de fort niveau sonore. On appelle pré- écho la présence, quelques instants avant un signal de fort niveau, d'une copie très atténuée de ce signal, distinctement audible si le signal utile à cet instant est de faible niveau. De même, on appelle post-écho la présence quelques instants après un signal de fort niveau d'une copie très atténuée de ce signal, qui peut être audible si le signal utile est à cet instant de faible niveau. Les pré- et post-échos proviennent dans le cas des bandes magnétiques de l'aimantation, à travers le support de la bande, d'une spire par les spires jointives. Dans le cas des enregistrements sur disque vinyle, le phénomène provient de la modification plastique d'un sillon par la gravure des
sillons adjacents.
Dans toute la suite, le terme "écho" désignera indifféremment un pré-écho ou un post-écho qu'on souhaite
éliminer d'un enregistrement audio.
Dans le contexte des télécommunications, se pose le problème assez voisin de l'annulation d'écho, l'écho étant cette fois dû au temps aller-retour du trajet séparant le locuteur de son correspondant à travers le système de communication. Mais les techniques utilisées dans le contexte des communications ne permettent d'atténuer l'écho que si le canal de transmission peut être identifié en l'absence de signal utile, ce qui n'est pas le cas dans le contexte des enregistrements audio. En effet, pour appliquer les techniques utilisées en communication, il faudrait que l'écho puisse être entendu tout seul, c'est-à-dire en l'absence de tout signal utile. Dans le contexte des enregistrements audio, les échos sont gênants précisément lorsqu'ils sont entendus en présence d'un signal utile qu'il convient de ne
pas altérer.
La présente invention a pour but d'éliminer ou d'atténuer fortement les pré-échos et les post-échos affectant un enregistrement audio, en présence de signal
utile ou non, et cela sans altérer ce dernier.
L'invention propose ainsi un procédé pour éliminer, d'un premier segment d'un signal audio numérisé, une réplique atténuée d'une portion d'un second segment du signal audio numérisé, ladite portion du second segment présentant un décalage temporel par rapport à ladite réplique, ce procédé comprenant les étapes suivantes: - on détermine une valeur représentative d'un facteur d'atténuation entre ladite portion du second segment et ladite réplique pour différentes valeurs d'un index fréquentiel k; - pour différentes valeurs d'un entier p. on calcule respectivement des transformées de Fourier discrètes à court terme X(p,k) et X (p,k) du signal audio décalé de pR échantillons et du signal audio décalé de pR+t échantillons, R désignant un entier prédéterminé au plus égal à la longueur T desdites transformées de Fourier discrètes à court terme, et t désignant ledit décalage temporel exprimé en nombre d'échantillons, on calcule un signal corrigé dans le domaine fréquentiel par transformation non linéaire de la transformée de Fourier à court terme X(p,k) tenant compte, pour les différentes valeurs de l'index fréquentiel k, de la valeur représentative du facteur d'atténuation et de la transformée de Fourier à court terme Xt(p,k), et on calcule une composante à court terme d'un signal corrigé dans le domaine temporel par transformation de Fourier inverse à court terme du signal corrigé dans le domaine fréquentiel; et on forme le signal corrigé dans le domaine temporel
par sommation pondérée de ses composantes à court terme.
La transformation non linéaire utilisée pour calculer le signal corrigé dans le domaine fréquentiel Y(p,k) est par exemple de la forme: Y(p, k) = X(p,k). f (g(k) t(p,k)I (9 J(p, k) g(k) désignant la valeur représentative du facteur d'atténuation pour l'index fréquentiel k, f(.) désignant une fonction réelle décroissante, et I. I représentant le module
d'un nombre complexe.
Ce procédé utilise un modèle simple de production de l'écho: l'écho (préou post-) est simplement une version atténuée et décalée dans le temps du signal dont il est la réplique. La technique d'atténuation non linéaire basée sur l'utilisation de la transformée de Fourier présente notamment les avantages suivants: elle permet d'obtenir de très bons facteurs d'atténuation même en présence d'erreurs sur l'estimation du retard t; elle permet de surestimer le facteur d'atténuation et d'obtenir une diminution de l'écho
plus importante encore; elle n'altère pas le signal utile.
Lorsque le décalage temporel n'est pas connu précisément a priori, sa détermination préalable comporte avantageusement les étapes suivantes: on effectue une transformée de Fourier discrète, de longueur prédéterminée N. du premier segment du signal audio numérisé pour obtenir une première fonction du domaine fréquentiel; - on effectue une transformée de Fourier discrète de longueur N du second segment du signal audio numérisé pour obtenir une seconde fonction du domaine fréquentiel; - on calcule une fonction de corrélation tronquée entre le premier et le second segment par transformée de Fourier discrète inverse de longueur N d'une troisième fonction du domaine fréquentiel prenant la valeur U(m).Vf(m) pour chaque index fréquentiel m pour lequel IU(m) f<gmax. Vf(m) Iet la valeur 0 pour les autres index fréquentiels m, U(m) et Vf(m) désignant respectivement les valeurs pour l'index fréquentiel m des première et seconde fonctions du domaine fréquentiel, gmax désignant un coefficient prédéterminé, et (.)* représentant le complexe conjugué; et - on calcule le décalage temporel à partir de la valeur d'un entier pour lequel le module de ladite fonction
de corrélation tronquée présente un maximum.
On peut ainsi résoudre les problèmes posés par la présence de signal utile lors de l'étape d'estimation du décalage, grâce à une méthode d'estimation par
filtrage/corrélation dans le domaine fréquentiel.
La détermination de la valeur représentative du facteur d'atténuation comporte avantageusement les étapes suivantes: - obtention d'une estimation du facteur d'atténuation; et - accroissement d'une quantité prédéterminée de ladite estimation pour fournir ladite valeur représentative
du facteur d'atténuation.
L'estimation du facteur d'atténuation peut être
dépendante ou indépendante de l'index fréquentiel k.
L'obtention de cette estimation peut comporter les étapes suivantes: pour différentes valeurs d'un entier q, on calcule respectivement des transformées de Fourier discrètes à court terme de longueur T U(q,k) et V(q,k) du signal audio décalé de qR échantillons appartenant au premier segment et du signal audio décalé de qR+T échantillons appartenant au second segment; et - on calcule l'estimation du facteur d'atténuation par: Q-1 S |qO U(q' k) |'vqk * |(X, 1)| g(k) = V (1 Q-i x; IV(q,k)2 q=O ou, si l'estimation g est indépendante de l'index fréquentiel k, par: Q T-1 ?kEo IU(q,k) I. IV(q,k) (2 a = g Q-1 T-1 O k- IV(q,k) 12 q= ^O o Q=l+E[(nf-nd-T)/R] avec nf-nd désignant la longueur du
premier segment, et E[.] représentant la partie entière.
La détermination de l'atténuation prend ainsi en compte la méthode utilisée dans l'étape ultérieure d'élimination de l'écho. Le facteur d'atténuation est estimé par une méthode de minimisation de type moindres-carrés dans
le domaine des fréquences.
D'autres particularités et avantages de la présente
invention apparaîtront dans la description ci-après d'un
exemple de réalisation préféré mais non limitatif, en référence aux dessins annexés, dans lesquels: - les figures 1 et 2 sont des diagrammes temporels de signaux utilisés dans un exemple de mise en oeuvre du procédé selon l'invention, dans le cas d'un pré-écho sur la figure 1 et d'un post-écho sur la figure 2; - les figures 3 à 5 sont respectivement des organigrammes de procédures de détermination du décalage temporel, de détermination de la valeur représentative du facteur d'atténuation et d'élimination de l'écho utilisables pour la mise en oeuvre du procédé; et - la figure 6 est une représentation synoptique d'une partie de la procédure d'élimination de l'écho représentée
sur la figure 5.
Les figures 1 et 2 illustrent une section d'un signal audio x(n) obtenu par échantillonnage et numérisation d'un enregistrement affecté d'échos. La fréquence d'échantil- lonnage Fe est par exemple de 44,1 kHz. Le signal x(n) est disponible sous forme d'un fichier informatique accessible par un ordinateur programmé pour mettre en oeuvre le procédé
selon l'invention.
On suppose qu'un premier segment A contenant un écho Epre, Epost et un second segment B, dont une portion O est l'"original" dont cet écho est une réplique, ont déjà été localisés. Une telle localisation est aisée à effectuer auditivement. L'écho indésirable étant distinctement audible, l'opérateur peut pointer des instants (échantillons nd et nf) encadrant l'écho, qui constitueront le début et la fin du segment A. Ayant distingué l'écho, l'opérateur peut reconnaître et localiser l'original O de la même manière. On peut également effectuer une localisation automatique des segments o sont susceptibles de se trouver des échos et leurs originaux, par exemple en analysant les niveaux énergétiques du signal pour repérer les passages piano précédés ou suivis par des passages forte. La localisation des segments n'a pas besoin d'être précise pour que le
procédé selon l'invention fonctionne.
La localisation des segments A et B permet de disposer des données de départ suivantes: échantillons de début et de fin nd, nf du premier segment A, valeurs minimale et maximale tmint tmax du décalage temporel entre l'écho et
l'original, exprimées en nombre d'échantillons. Les échan-
tillons de début et de fin du second segment B correspondent à nd+tmin et nf+tmax. Le décalage effectif t est alors tel que 0<Tmin<t<tmax dans le cas d'un pré-écho (figure 1), et
Tmin<T<tmax<0 dans le cas d'un post-écho (figure 2).
Lorsque le décalage T n'est pas connu a priori (cas d'un enregistrement sur bande magnétique par exemple), la première phase du procédé selon l'invention consiste à le déterminer. La figure 3 montre une procédure utilisable à cette fin. Les deux premières étapes 10, 11 consistent à transporter les signaux des premier et second segments A, B dans une fenêtre temporelle de longueur N échantillons sur laquelle leurs transformées de Fourier discrètes seront calculées à l'étape 12. Pour une implémentation optimale par transformée de Fourier rapide (TFR), il est commode de prendre la longueur N sous forme d'une puissance de 2, par exemple N=2a, avec a=l+E[log2(nf-nd+Tmax-Zmin)] o E[.] désigne la partie entière, de façon que N soit supérieure ou égale aux longueurs nf- nd et nf-nd+Tmax- min des segments A et B. On définit ainsi aux étapes 10 et 11 les signaux u et vf illustrés sur les figures 1 et 2: u(n)=x(n+nd) si 0On<nf-nd u(n)=0 si nf-nd!n<N Vf(n)=x(n+nd+Tmin) si On<nf-nd+tmax-tmin vf(n)=0 si nf-nd+Tmax-tminen<N A l'étape 12, un algorithme conventionnel de TFR est utilisé pour calculer les transformées de Fourier discrètes de longueur N U(m) et Vf(m) des premier et second segments A, B, c'est-àdire, pour 0 m<N: N-1 U(m) = u(n). exp(-2jmn/N) n=O N-1 Vf (m) = E v (n). exp(-2jxmn/N) n=0 L'étape suivante 13 est une opération de seuillage dans le domaine fréquentiel. Dans les zones de fréquence o JU(m) | est relativement élevé (c'est-à-dire supérieur au niveau maximal auquel on s'attendrait à le trouver compte tenu d'une atténuation maximale prévisible et du niveau du signal IVf(m)[ ayant engendré l'écho), on considère que le
signal utile est d'énergie supérieure à celle de l'écho.
Cette zone de fréquence n'est donc pas à prendre en compte pour l'estimation du décalage temporel puisqu'elle n'est pas nécessairement représentative du signal d'écho. L'opération réalisée à l'étape 13, qui est comparable à un filtrage temporel séparant l'écho du signal utile, est alors, pour O0m<N: W(m)=U(m)*.Vf(m) si IU(m)|<gmaxlVf(m)I W(m)=O si [U(m)l[gmaxlVf(m)l o gmax représente un coefficient prédéterminé égal à un facteur d'atténuation maximal attendu. Un ordre de grandeur S15 typique pour le choix de gmax correspond à une atténuation
de l'ordre de -30 dB.
A l'étape 14, on effectue la transformée de Fourier discrète inverse de la fonction W(m) du domaine fréquentiel pour obtenir une fonction de corrélation tronquée c(n) entre le premier et le second segment A, B. Cette fonction de corrélation est tronquée en ce sens que la fonction W(m) a été mise à zéro à l'étape 13 pour les zones de fréquences o l'on considère que le signal du premier segment est trop énergétique par rapport à celui du second segment pour être représentatif d'un écho. La transformée de Fourier discrète inverse de longueur N peut également être effectuée à l'étape 14 par un algorithme de TFR, de façon à obtenir, pour 0On<N: N-1 c(n) = - E W(m).exp(2jxmn/N) N m=O A l'étape 15, on recherche l'entier n1 pour lequel le module de la fonction de corrélation tronquée c(n) est maximal dans l'intervalle O0n<tmax-"min. La fonction c(n) est généralement réelle, et le maximum de son module correspond généralement à un réel positif, de sorte qu'il est possible de se dispenser du calcul des modules Ic(n) I. Le décalage temporel effectif t est alors obtenu à l'étape 16 à partir de la valeur de l'entier n1 obtenue à l'étape 15. Avec les conventions adoptées dans l'exemple de réalisation décrit,
le décalage X est simplement obtenu par t=nl+tmin.
Ce mode d'estimation du décalage temporel t au moyen d'un calcul de corrélation faisant intervenir un filtrage dans le domaine fréquentiel permet une estimation fiable grâce à une utilisation de l'information disponible a priori
sur la valeur maximale gmax du facteur d'atténuation.
Lorsque le décalage temporel t est connu a priori, on peut se dispenser de la procédure d'estimation illustrée par la figure 3. C'est le cas par exemple pour un signal audiofréquence provenant d'un enregistrement sur disque vinyle à V tours par minute: le décalage t peut alors être
obtenu de façon élémentaire par Z=E[Fe/(V/60)].
La seconde phase du procédé selon l'invention consiste à déterminer une valeur g représentative du facteur
d'atténuation entre l'original O et son écho Epre ou Epost.
On considère ci-après, en référence à la figure 4, le cas o l'on fait appel à une seule valeur g indépendante de la
fréquence pour représenter le facteur d'atténuation.
L'obtention de la valeur g comporte d'abord un calcul d'une estimation g du facteur d'atténuation (étapes 20 à 22), puis une étape 23 de surestimation du facteur d'atténuation estimé. A cette étape 23, on peut ainsi prendre g=g.g, le coefficient prédéterminé g correspondant par exemple à un
gain de 3 ou 5 dB.
Pour l'estimation 20-22 du facteur d'atténuation g, on utilise des transformées de Fourier à court terme de longueur T échantillons. On définit une fenêtre d'analyse de longueur L échantillons correspondant par exemple à une durée de l'ordre de 40 ms: L=Fex0,04. Cette durée peut être réglée selon le type de signal audio traité. La fenêtre d'analyse est classiquement associée à une fonction de fenêtrage h(n), par exemple une fonction rectangulaire ou encore une fonction de Hamming telle que: h(n)=[l-cos(2nn/L)]/2 pour 0On<L h(n)=0 pour n<0 et niL La longueur T de la transformée de Fourier à court terme peut être prise égale à la longueur L de la fenêtre d'analyse. Pour une implémentation optimale par un algorithme de TFR, il est commode de prendre T sous forme d'une puissance de 2: T=2b avec b=l+ E[log2L]. A partir de la valeur de T, on définit un facteur d'incrément R au plus égal
à T, par exemple R=T/4.
La première étape 20 de l'estimation de l'atténuation consiste à aligner temporellement le premier segment A contenant l'écho Epre, Epost avec la portion correspondante du second segment B contenant l'original O. On définit ainsi un signal décalé v(n) par: v(n)=x(n+nd+t) pour 0On<nf-nd T étant la valeur du décalage temporel précédemment
déterminée (t<O pour un pré-écho et t>0 pour un post-écho).
On peut voir sur les figures 1 et 2 que, dans les signaux u(n) et v(n), l'écho et son original sont alignés temporellement. Les transformées de Fourier à court terme sont calculées à l'étape 21. Plus précisément, on calcule Q paires de transformées de Fourier à court terme, Q étant l'entier défini par Q=l+E[(nf-nd-T)/R]. Ainsi, pour chaque entier q tel que 0q<Q, l'algorithme de TFR permet d'obtenir deux fonctions U(q,k) et V(q,k) du domaine fréquentiel (0ek<T): T-1 U(q,k)= = h(n).u(n+qR).exp(-2jxckn/T n=O T-1 V(q,k)= E h(n).v(n+qR).exp(-2jikn/l) n=O L'estimation g est alors calculée à l'étape 22 en appliquant la formule (2). On note que cette formule tient compte uniquement des modules des transformées de Fourier à
court terme U(q,k) et V(q,k).
Lorsqu'on choisit de modéliser l'écho par un facteur d'atténuation dépendant de la fréquence, l'organigramme de la figure 4 peut être simplement modifié en ce qui concerne les étapes 22 et 23. A l'étape 22 modifiée, on calcule selon la formule (1) T estimations du facteur d'atténuation g(k) dépendant de l'index fréquentiel k (0Ok<T); et à l'étape 23 modifiée, on prend g(k)=g.g(k) pour 0sk<T (il serait également possible de prendre un facteur de surestimation
dépendant de la fréquence).
La dernière phase du procédé consiste en l'élimination proprement dite de l'écho, par exemple selon la procédure de soustraction spectrale non linéaire illustrée
sur la figure 5.
On définit d'abord la zone à traiter, qui peut être comme précédemment l'intervalle temporel ndSn<nf, mais qui peut aussi être plus longue (éventuellement tout l'enregistrement si on considère que le facteur d'atténuation
et le décalage temporel ne changent pas au cours du temps).
Cette zone est délimitée par les échantillons numérotés ns
et ne. L'entier P est alors défini par P=l+E[(ne-ns-T)/R].
A l'étape 30, on calcule P paires de transformées de Fourier à court terme X(p,k), X,(p,k), de longueur T. Pour chaque entier p tel que 0Op<T, un algorithme de TFR permet d'obtenir les deux fonctions de l'index fréquentiel k (0Ok<T): T-1 X(p,k)= E h(n).x(n+n +pR).exp(- 2jckn/T) n=O T-1 X (p,k)= E h(n). x(n+n +pR+r).exp(-2jickn/T) n=O A l'étape 31, on applique une transformation non linéaire à la transformée de Fourier à court terme X(p,k) pour obtenir un signal corrigé dans le domaine fréquentiel Y(p,k), et ce pour chaque entier p tel que 0p<P. Cette
transformation non linéaire tient compte, pour les diffé-
rentes valeurs de l'index fréquentiel k, de la valeur g(k) ou g représentative du facteur d'atténuation et de la
transformée de Fourier à court terme X (p,k). Plus préci-
sément, le signal corrigé Y(p,k) s'exprime sous la forme: Y(p, k) =X(p, k) f(g). IX (p, k)) -I x(p, k) f étant une fonction réelle, positive et décroissante, introduisant la non-linéarité. Une telle transformation affecte le module mais non l'argument de X(p,k). L'étape 31 représentée sur la figure 5 correspond au cas o le facteur d'atténuation est choisi indépendant de la fréquence (g(k)=g=Cte) et au choix f(z)=max{0,1-z). On notera que diverses autres formes pourraient être retenues pour la
fonction f. par exemple f(z)=(max(0,1-z2})1/2.
A l'étape 32, on forme P composantes à court terme y(p,n) d'un signal corrigé dans le domaine temporel, par transformée de Fourier discrète inverse à court terme des signaux corrigés Y(p,k) dans le domaine fréquentiel. Pour 0p<P, l'algorithme de TFR permet ainsi d'obtenir le signal y(p,n) de l'index temporel n (0Sn<T): T-1 y(pn)= T Y(p,k).exp(2jxkn/T) k=O On note que les étapes 30 à 32, représentées séparément sur la figure 5, peuvent être exécutées au sein d'une même boucle sur l'entier p allant de 0 à P-1. Les opérations correspondant à une itération dans cette boucle sont illustrées sous forme synoptique sur la figure 6. Les blocs 41 et 42 représentent les transformées de Fourier à court terme (TFCT) du signal x(n+pR) et du même signal décalé de t échantillons en 40 (étape 30 de la figure 5 pour une valeur de p). Le bloc multiplieur 43 applique le facteur g au module de XI(p,k), et le résultat est soustrait du module de X(p,k) par le bloc soustracteur 44. Le bloc 46 représente la transformée de Fourier inverse à court terme (TFICT) appliquée au signal complexe corrigé Y(p,k) dont l'argument est le même que celui de X(p,k) et dont le module est le maximum, délivré par le bloc 45, entre O et la sortie du bloc soustracteur 46. Les blocs 43 à 45 correspondent à l'étape 31 de la figure 5 pour une valeur de p. et le bloc 46 à
l'étape 32.
A la dernière étape 33, on forme le signal corrigé dans le domaine temporel y(n) par sommation pondérée de ses composantes à court terme y(p,n). Il s'agit d'une somme à recouvrement (overlap-add) qui peut s'exprimer, pour T/2 n<ne-ns-T/2, par: P-1 E w(n-pR). y(p, n-pR) y(n+n)= p=O s P-1 E h (n-pR). w(n-pR) p=0 Dans cette expression, w(n) désigne une fonction de fenétrage de synthèse de longueur L (c'est-à-dire nulle en dehors de l'intervalle 0On<L), telle qu'une fonction
rectangulaire ou de Hamming.
Le signal y(n+ns) est la version restaurée du signal x(n+ns), dans laquelle l'écho a été éliminé ou du moins
sensiblement atténué.
Cette procédure d'atténuation de l'écho par une technique de soustraction spectrale à court terme non linaire présente l'avantage de fonctionner même si le décalage X n'est estimé qu'approximativement, et même si le facteur d'atténuation est surestimé. Surestimer g (étape 23) permet
d'améliorer encore l'atténuation.
Dans certains cas rares, on peut observer des pré-
échos ou post-échos multiples. C'est le cas par exemple si une spire de bande magnétique corrompt plusieurs spires voisines. Une telle situation peut être traitée en exécutant plusieurs fois de suite le processus correspondant aux figures 4 et 5, une fois pour chaque décalage individuel. Il est également possible de traiter une telle situation en une seule itération. Dans l'exemple o il y a deux décalages t et 2T, on peut obtenir deux valeurs (ou deux jeux de valeurs) gT et g2% aux étapes 22, 23, pourvu que les transformées de Fourier à court terme V' (q,k) du signal doublement décalé v' (n)=x(n+nd+2T) aient été calculées à l'issue des étapes 20 et 21. Le signal corrigé dans le domaine fréquentiel Y(p,k) est alors obtenu, à l'étape 31 modifiée, selon Y(p, k) =X(p, k) f' (gt IXz (p' k) | ' gr2 JX(p, k)) ix(p,k) Ir JX(p, k) I) avec T-1 X2 (pk) = E h(n).x(n+n.pR+2r).exp (-2jukn/ T) n=O obtenu à l'étape 30 modifiée, et, par exemple, f'(z, z')=max{0,1-z-z}. Dans le cas o le décalage temporel est constant (par exemple pour un disque 33 tours, mais pas pour une bande magnétique), et o le facteur d'atténuation est également considéré comme constant dans le temps, la totalité du signal
peut être traitée sans dégradation du signal utile, c'est-à-
dire que ns et ne peuvent correspondre au début et à la fin
de l'enregistrement complet.

Claims (9)

REVENDICATIONS
1. Procédé pour éliminer, d'un premier segment (A) d'un signal audio numérisé, une réplique atténuée (Epre, Epost) d'une portion (O) d'un second segment (B) du signal audio numérisé, ladite portion du second segment présentant un décalage temporel (T) par rapport à ladite réplique, caractérisé en ce qu'il comprend les étapes suivantes: - on détermine une valeur (g(k)) représentative d'un facteur d'atténuation entre ladite portion du second segment et ladite réplique pour différentes valeurs d'un index fréquentiel k; - pour différentes valeurs d'un entier p. on calcule respectivement des transformées de Fourier discrètes à court terme X(p,k) et Xt(p,k) du signal audio décalé de pR échantillons et du signal audio décalé de pR+T échantillons, R désignant un entier prédéterminé au plus égal à la longueur T desdites transformées de Fourier discrètes à court terme, et T désignant ledit décalage temporel exprimé en nombre d'échantillons, on calcule un signal corrigé dans le domaine fréquentiel (Y(p,k)) par transformation non linéaire de la transformée de Fourier à court terme X(p,k) tenant compte, pour les différentes valeurs de l'index fréquentiel k, de la valeur (g(k)) représentative du facteur d'atténuation et de la transformée de Fourier à court terme XT(p,k), et on calcule une composante à court terme (y(p,n)) d'un signal corrigé dans le domaine temporel par transformation de Fourier inverse à court terme du signal corrigé dans le domaine fréquentiel; et - on forme le signal corrigé dans le domaine temporel
par sommation pondérée de ses composantes à court terme.
2. Procédé selon la revendication 1, caractérisé en ce que ladite transformation non linéaire affecte essentiellement le module mais non l'argument de la
transformée de Fourier à court terme X(p,k).
3. Procédé selon la revendication 2, caractérisé en ce que, pour chaque valeur de l'entier p. le signal corrigé dans le domaine fréquentiel Y(p, k) est calculé selon Y(p, k) = X(p, k). f (g(k) Kt (p, k) 1 (9 JX(p, k) g(k) désignant la valeur représentative du facteur d'atténuation pour l'index fréquentiel k, et f(.) désignant
une fonction réelle décroissante.
4. Procédé selon l'une quelconque des revendications
1 à 3, caractérisé en ce qu'il comporte une étape préalable de détermination du décalage temporel (T), au cours de laquelle: - on effectue une transformée de Fourier discrète, de longueur prédéterminée N. du premier segment (A) du signal audio numérisé pour obtenir une première fonction du domaine fréquentiel (U(m)); - on effectue une transformée de Fourier discrète de longueur N du second segment (B) du signal audio numérisé pour obtenir une seconde fonction du domaine fréquentiel (Vf(m)); - on calcule une fonction de corrélation tronquée (c(n)) entre le premier et le second segment par transformée de Fourier discrète inverse de longueur N d'une troisième fonction du domaine fréquentiel (W(m)) prenant la valeur U(m). Vf(m) pour chaque index fréquentiel m pour lequel IU(m) I<gmax. IVf(m) et la valeur 0 pour les autres index fréquentiels m, U(m) et Vf(m) désignant respectivement les valeurs pour l'index fréquentiel m des première et seconde fonctions du domaine fréquentiel, et gmax désignant un coefficient prédéterminé; et - on calcule le décalage temporel (T) à partir de la valeur d'un entier (n1) pour lequel le module de ladite
fonction de corrélation tronquée (c(n)) présente un maximum.
5. Procédé selon l'une quelconque des revendications
1 à 4, caractérisé en ce que la détermination de la valeur (g(k)) représentative du facteur d'atténuation pour un index fréquentiel k comporte les étapes suivantes: - obtention d'une estimation (g(k)) du facteur d'atténuation; et - accroissement d'une quantité prédéterminée de A ladite estimation (g(k)) pour fournir ladite valeur
représentative (g(k)) du facteur d'atténuation.
6. Procédé selon la revendication 5, caractérisé en ce que l'obtention des estimations (g(k)) du facteur d'atténuation pour les différentes valeurs de l'index fréquentiel k comporte les étapes suivantes: - pour différentes valeurs d'un entier q. on calcule respectivement des transformées de Fourier discrètes à court terme de longueur T U(q,k) et V(q,k) du signal audio décalé de qR échantillons appartenant au premier segment et du signal audio décalé de qR+T échantillons appartenant au second segment; et - on calcule l'estimation g(k) du facteur d'atténuation pour chaque index fréquentiel k par:
Q-1
I U(q,k) IV(q,k) I g(k) = Q Q-i IV(q,k) 2 o Q=l+E[(nf-nd-T)/R] avec nf-nd désignant la longueur du
premier segment et E[.] représentant la partie entière.
7. Procédé selon l'une quelconque des revendications
1 à 4, caractérisé en ce qu'on adopte une même valeur (g) représentative du facteur d'atténuation pour chacune des
valeurs de l'index fréquentiel k.
8. Procédé selon la revendication 7, caractérisé en ce que la détermination de la valeur (g) représentative du facteur d'atténuation comporte les étapes suivantes: - obtention d'une estimation (g) du facteur d'atténuation; et - accroissement d'une quantité prédéterminée de ladite estimation (g) pour fournir ladite valeur
représentative (g) du facteur d'atténuation.
9. Procédé selon la revendication 8, caractérisé en ce que l'obtention de l'estimation (g) du facteur d'atténuation comporte les étapes suivantes: pour différentes valeurs d'un entier q. on calcule respectivement des transformées de Fourier discrètes à court terme de longueur T U(q,k) et V(q,k) du signal audio décalé de qR échantillons appartenant au premier segment et du signal audio décalé de qR+T échantillons appartenant au second segment; et - on calcule l'estimation g du facteur d'atténuation par: Qu1 T-1 4 1 IU(q,k) IV(<q, k) I * q=Ok g= Q T-1 cI k IV(q,k)j o Q=l+E[(nf-nd-T)]/R avec nf- nd désignant la longueur du
premier segment et E[.] représentant la partie entière.
FR9511723A 1995-10-05 1995-10-05 Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio Expired - Fee Related FR2739736B1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
FR9511723A FR2739736B1 (fr) 1995-10-05 1995-10-05 Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio
EP96402111A EP0767462B1 (fr) 1995-10-05 1996-10-03 Procédé de réduction des pré-échos ou post-échos affectant des enregistrements audio
DE69611421T DE69611421T2 (de) 1995-10-05 1996-10-03 Verfahren zur Reduzierung von Audioaufzeichnung beeinflussenden Vor- und Nachechos
US08/726,469 US5717768A (en) 1995-10-05 1996-10-04 Process for reducing the pre-echoes or post-echoes affecting audio recordings

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9511723A FR2739736B1 (fr) 1995-10-05 1995-10-05 Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio

Publications (2)

Publication Number Publication Date
FR2739736A1 true FR2739736A1 (fr) 1997-04-11
FR2739736B1 FR2739736B1 (fr) 1997-12-05

Family

ID=9483276

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9511723A Expired - Fee Related FR2739736B1 (fr) 1995-10-05 1995-10-05 Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio

Country Status (4)

Country Link
US (1) US5717768A (fr)
EP (1) EP0767462B1 (fr)
DE (1) DE69611421T2 (fr)
FR (1) FR2739736B1 (fr)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6278744B1 (en) 1996-11-15 2001-08-21 Conexant Systems, Inc. System for controlling and shaping the spectrum and redundancy of signal-point limited transmission
US6192087B1 (en) 1996-11-15 2001-02-20 Conexant Systems, Inc. Method and apparatus for spectral shaping in signal-point limited transmission systems
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
AU2002307533B2 (en) * 2001-05-10 2008-01-31 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
EP1927981B1 (fr) * 2006-12-01 2013-02-20 Nuance Communications, Inc. Affinement spectral de signaux audio
EP2562751B1 (fr) 2011-08-22 2014-06-11 Svox AG Interpolation temporelle de spectres adjacents
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9826306B2 (en) 2016-02-22 2017-11-21 Sonos, Inc. Default playback device designation
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) * 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2052128A (en) * 1979-06-29 1981-01-21 Univ Glasgow Improvements in or relating to tape recording and playback systems
EP0065210A2 (fr) * 1981-05-09 1982-11-24 Felten & Guilleaume Fernmeldeanlagen GmbH Méthode de traitement de signaux électriques avec un dispositif de filtrage numérique
JPH0563609A (ja) * 1991-09-05 1993-03-12 Fujitsu Ltd エコーキヤンセラ方式

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3786188A (en) * 1972-12-07 1974-01-15 Bell Telephone Labor Inc Synthesis of pure speech from a reverberant signal
AU601104B2 (en) * 1988-03-17 1990-08-30 Fujitsu Limited Echo canceller
JPH084243B2 (ja) * 1993-05-31 1996-01-17 日本電気株式会社 多チャンネルエコー除去方法および装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2052128A (en) * 1979-06-29 1981-01-21 Univ Glasgow Improvements in or relating to tape recording and playback systems
EP0065210A2 (fr) * 1981-05-09 1982-11-24 Felten & Guilleaume Fernmeldeanlagen GmbH Méthode de traitement de signaux électriques avec un dispositif de filtrage numérique
JPH0563609A (ja) * 1991-09-05 1993-03-12 Fujitsu Ltd エコーキヤンセラ方式

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
MURANO K ET AL: "ECHO CANCELLATION AND APPLICATIONS", IEEE COMMUNICATIONS MAGAZINE, vol. 28, no. 1, 1 January 1990 (1990-01-01), pages 49 - 55, XP000100687 *
O. A. AMRANE ET AL.: "Low-delay frequency domain LMS algorithm", IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, vol. 4, 23 March 1992 (1992-03-23) - 26 March 1992 (1992-03-26), SAN FRANCISCO, pages 9 - 12, XP002009010 *
O. CAPPE , J. LAROCHE: "Evaluation of short-time spectral attenuation techniques for the restoration of musical recordings", IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, vol. 3, no. 1, January 1995 (1995-01-01), pages 84 - 93, XP000575276 *
O. STEPHANI: "On disk-record echo phenomena", JOURNAL OF THE AUDIO ENGINEERING SOCIETY, vol. 30, no. 4, April 1982 (1982-04-01), pages 217 - 224, XP002009009 *
PATENT ABSTRACTS OF JAPAN vol. 017, no. 378 (E - 1398) 15 July 1993 (1993-07-15) *
VASEGHI S V ET AL: "RESTORATION OF OLD GRAMOPHONE RECORDINGS", JOURNAL OF THE AUDIO ENGINEERING SOCIETY, vol. 40, no. 10, 1 October 1992 (1992-10-01), pages 791 - 801, XP000323726 *

Also Published As

Publication number Publication date
DE69611421T2 (de) 2001-07-26
FR2739736B1 (fr) 1997-12-05
US5717768A (en) 1998-02-10
EP0767462A2 (fr) 1997-04-09
DE69611421D1 (de) 2001-02-08
EP0767462B1 (fr) 2001-01-03
EP0767462A3 (fr) 1997-08-06

Similar Documents

Publication Publication Date Title
FR2739736A1 (fr) Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio
EP2002428B1 (fr) Procede de discrimination et d&#39;attenuation fiabilisees des echos d&#39;un signal numerique dans un decodeur et dispositif correspondant
EP1016072B1 (fr) Procede et dispositif de debruitage d&#39;un signal de parole numerique
EP2868073B1 (fr) Réduction d&#39;écho par l&#39;intermédiaire de signaux audio cachés
EP0130263B1 (fr) Procédé d&#39;initialisation d&#39;un filtre annuleur d&#39;écho et système de communication utilisant ledit procédé
EP0002998A1 (fr) Procédé de compression de données relatives au signal vocal et dispositif mettant en oeuvre ledit procédé
FR2741217A1 (fr) Procede et dispositif permettant d&#39;eliminer les bruits parasites dans un systeme de communication
EP1789956A1 (fr) Procede de traitement d&#39;un signal sonore bruite et dispositif pour la mise en ceuvre du procede
FR2706053A1 (fr) Procédé pour réduire la redondance des données.
EP0506535B1 (fr) Procédé et système de traitement des pré-échos d&#39;un signal audio-numérique codé par transformée fréquentielle
CA1225745A (fr) Procede et installation d&#39;analyse et de restitution de signal a echantillonnage et interpolation
CA2304012A1 (fr) Procede de detection d&#39;activite vocale
EP3192073B1 (fr) Discrimination et atténuation de pré-échos dans un signal audionumérique
FR2984580A1 (fr) Procede de detection d&#39;une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d&#39;ordinateur correspondant
EP0574288B1 (fr) Procédé et dispositif de dissimulation d&#39;erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle
EP1021805B1 (fr) Procede et disposition de conditionnement d&#39;un signal de parole numerique
EP2515300B1 (fr) Procédé et système de réduction du bruit
FR2768546A1 (fr) Procede de debruitage d&#39;un signal de parole numerique
EP1895433A1 (fr) Procédé d&#39;estimation de phase pour la modélisation sinusoidale d&#39;un signal numérique
EP0585434B1 (fr) Procede et dispositif de filtrage pour la reduction des preechos d&#39;un signal audio-numerique
WO2007006958A2 (fr) Procédé et dispositif d&#39;atténuation des échos d&#39;un signal audionumérioue issu d&#39;un codeur multicouches
FR3051958A1 (fr) Procede et dispositif pour estimer un signal dereverbere
EP3462626A1 (fr) Système de communication cdma, produit programme d&#39;ordinateur et procédé de communication associés
FR3071984A1 (fr) Module de correction d&#39;une fonction de transfert d&#39;un canal de transmission d&#39;un systeme de communication cdma, recepteur et procede associes
CA2389785A1 (fr) Procede et systeme de pre et de post-traitement d&#39;un signal audio pour la transmission sur un canal fortement perturbe

Legal Events

Date Code Title Description
CJ Change in legal form
TP Transmission of property
ST Notification of lapse

Effective date: 20140630