EP2494772A1 - Procede et dispositif d'annulation d'echo acoustique par tatouage audio - Google Patents
Procede et dispositif d'annulation d'echo acoustique par tatouage audioInfo
- Publication number
- EP2494772A1 EP2494772A1 EP10788106A EP10788106A EP2494772A1 EP 2494772 A1 EP2494772 A1 EP 2494772A1 EP 10788106 A EP10788106 A EP 10788106A EP 10788106 A EP10788106 A EP 10788106A EP 2494772 A1 EP2494772 A1 EP 2494772A1
- Authority
- EP
- European Patent Office
- Prior art keywords
- signal
- echo
- pseudo
- characterization
- acoustic channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012512 characterization method Methods 0.000 claims abstract description 27
- 230000003044 adaptive effect Effects 0.000 claims description 25
- 238000001914 filtration Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 238000007493 shaping process Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 12
- 230000006978 adaptation Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Definitions
- the present invention relates to the processing of audio signals.
- a first terminal transmits a speech signal to a second terminal.
- a speaker of the second terminal then transmits the signal.
- the transmitted signal then follows one or more echo paths.
- a microphone of the second terminal then picks up an audible signal including the echo of the transmitted signal (and corresponding to the transmitted signal).
- the echo is reduced by a system called acoustic echo cancellation (AEC).
- AEC acoustic echo cancellation
- the acoustic channel between the rendering system and the sound pickup system, comprising one or more echo paths is determined by estimating the impulse response of this acoustic channel.
- the estimate of the impulse response of the acoustic channel is most often in real time and adaptively with the second terminal.
- the digital filter used for the adaptation is controlled by the speech signal transmitted by the first terminal.
- the statistical characteristics of the audio signal for example its high correlation and its non-stationary character, and - the context of the double talk, in the case where the second terminal picks up a local speech signal which is added to the echo and the ambient noise. Indeed, the presence of a local speech adding to the ambient noise hinders the convergence of the AEC.
- an echo cancellation system (AEC) according to the prior art, implemented in a sound communication system (for example a hands-free phone).
- a first interlocutor sends, from a first terminal, a signal x (n) which is then broadcast by the loudspeaker HP of a second terminal.
- the signal emitted by the loudspeaker is then reflected by the environment (the walls for example) in which the loudspeaker is located.
- the reflection, as well as the direct echo induced by the direct passage of sound between the loudspeaker and the MIC microphone of the second terminal, thus induce an echo signal z (n).
- the echo signal, an ambient noise signal n (n) and the speech of a second interlocutor s (n) are picked up by the microphone MIC, present to pick up the speech of the second party, then transmitted to the terminal .
- An echo cancellation system is arranged between the signal transmission lines x (n) and y (n), for example at the second terminal.
- This echo cancellation system is responsible for estimating and simulating, by means of a filter RI F h, the acoustic channel f, so as to deduct from the mixture b (n) + f * x (n) an estimate of f * x (n), given by h (n) * x (n).
- h (n + 1) h (n) + j ue (n) ⁇
- ⁇ a generally fixed adaptation step
- e (n) the estimation error that controls the adaptation of the filter h (n)
- ⁇ is a small, strictly positive value to avoid cancellation the denominator of the fraction during periods of silence.
- the AEC attenuates the echo too weakly and remains sensitive to the statistics of the tattooed speech signal
- the present invention improves the situation.
- a method of acoustic echo cancellation in a first signal comprising an echo signal of a second signal.
- the method comprises: inaudibly inserting in the second signal a pseudo-random sequence whose circular autocorrelation comprises a unit pulse and a continuous component,
- the inserted pseudo-random sequence is independent of the local speech signal which improves the characterization (or identification) of the echo channel (or path).
- the quality of characterization is constant and little dependent on the statistical variations of the signals implemented in the echo cancellation.
- the quality of characterization is better, even in double-talk context.
- the present invention makes it possible to provide a satisfactory quality of telephone conversation or videoconferencing, even in the presence of statistical variations of the speech transmitted and the local speech.
- the echo cancellation is faster and more accurate than in the prior art.
- the characterization of the acoustic channel is done by intercorrelation of the first signal with the pseudo-random sequence.
- the characterization of the acoustic channel comprises an adaptive filtering of the second signal.
- the characterization may also comprise a block filtering of the second signal.
- the use of the pseudo-random sequence makes it possible to reduce the disturbance of the signal in the presence of double speech.
- the characterization of the acoustic channel comprises the steps:
- the filtering makes it possible to eliminate the influence of the second signal before intercorrelation, thus increasing the quality of the latter. For example, it is possible to decrease the power of the second signal with respect to the power of the pseudo random sequence.
- the method further comprises:
- the shaping filter is used to ensure the inaudibility of the pseudo random sequence, based on psychoacoustic models.
- the filter can be formed to provide an inaudible sequence with maximum power to optimize its use in echo cancellation.
- a step of processing the first signal before correlation with the pseudo-random sequence can be further provided.
- This processing may comprise the subtraction of the result of the filtering of the second signal to the first signal.
- the quality of the result of the correlation can be improved.
- the processing may also include the application of a filter for canceling the effects of the shaping filter on the pseudo random sequence.
- a computer program comprising instructions for implementing the method according to the invention when the program is executed by a processor, for example the processor of an echo cancellation system; - a support readable by a computer on which is recorded such a computer program;
- FIG. 2 is a block diagram illustrating a method according to a first embodiment of the invention
- FIG. 3 is a block diagram illustrating a method according to a second embodiment of the invention.
- FIG. 4 is a general flowchart of the method according to embodiments of the invention.
- FIG. 5 illustrates an echo cancellation system according to one embodiment of the invention.
- FIGS. 6 to 9 illustrate test results showing some advantages provided by the invention.
- the echo cancellation is done by inserting a digital sequence (also known as a "digital tattoo"), then by intercorrelation of the inserted sequence with the signal comprising the echo signal for the characterization (or identification) of the acoustic channel (or echo path).
- the final cancellation of the echo is done by subtracting, in the echo signal, an estimate of the echo based on the identification of the acoustic channel.
- This embodiment fits for example in the context of a communication between a first communication terminal such as a mobile phone, and a second terminal in hands-free mode.
- the echo proposed to be processed originates from the second terminal, and is processed at this second terminal.
- the speech signal x initially transmitted by a user of the first terminal is supplied to an insertion block INS, for the insertion of a digital sequence which will be described in more detail below.
- the inserted signal t comes from an initial signal w shaped by a FORM formatting block. This formatting makes it possible to adapt the spectrum of the signal w to render it inaudible, once inserted in the signal x.
- the signal xt obtained at the output of the INS block is then transmitted and follows a set of transformations modeled by the ECHO block. These transformations correspond, for example, to its transmission and reflection.
- a noise signal b is also added to form the signal y.
- the signal contains the echo of the signal x.
- the signal is then supplied to a DEFORM signal conditioning unit which performs on the signal a transformation inverse to that effected by the FORM block.
- a signal yf is obtained which is then supplied to an INTERCOR intercorrelation block in order to carry out the correlation of the signal yf with the signal w.
- the INTERCOR block then provides a characterization / acoustic channel schematized by the ECHO block. This characterization is then provided to an ESTIM block which also receives the signal xt as input, to obtain an output of the signal z.
- the signal y and the estimate of the signal z are then supplied to a block ANNUL to subtract the echo from the signal y.
- adaptive filtering is performed on the tattooed signal to perform a first identification of the acoustic channel, prior to intercorrelation.
- the output of the second DEFORM block is coupled to the input of an adaptive filter block ADAPT1.
- the signal w is furthermore provided to a second block ADAPT2, which is a copy of the first block ADAPT1.
- the output of the first DEFORM block is supplied to a subtraction block for effecting the subtraction between the signal yf and the output of the first block ADAPT1.
- the result of this subtraction is delivered to the ADAPT1 block to control the filtering.
- the output of the second block ADAPT2 is then added with the output of the subtraction block, and the sum is supplied to the INTERCOR block.
- block filtering is used alternately with or in combination with the adaptive filtering.
- the adaptive filtering we implement a Wiener filter.
- a first step S40 the signal transmitted by the user of the first terminal is received by the second terminal and is then tattooed by the AEC by insertion of the digital sequence. Then, the tattooed signal is broadcast by the speaker of the second terminal during step S41.
- step S42 the microphone of the second terminal receives a signal comprising an echo signal of the previously transmitted signal.
- a characterization of the acoustic channel is then carried out using the sequence inserted during the tattooing.
- step S44 the echo is canceled in the signal received by the microphone, by means of the characterization obtained.
- a computer program comprising instructions for implementing the method according to the invention can be produced according to a general algorithm deduced from the general flowchart of FIG. 4, and from the present detailed description.
- An echo cancellation system according to one embodiment of the invention is described with reference to FIG. 5.
- This echo cancellation system AEC comprises an input E2 for receiving a signal to be retransmitted, an output S2 for retransmitting the signal received and tattooed. It also comprises an input E1 for receiving a signal comprising an echo of the transmitted signal, and an output S1 for sending the signal with the echo canceled.
- the AEC system also includes a MEM memory for storing calculation data.
- the memory MEM can also store a computer program according to the present invention.
- the system also includes a PROC processor for controlling an echo cancellation circuit.
- the processor executes a computer program stored in the memory MEM.
- the CIRC circuit includes an INS digital sequence insertion unit, a CARACT acoustic channel characterization unit, an ESTIM echo signal estimating unit, and an ANNUL echo cancellation unit.
- the echo cancellation system may be part of a communication terminal.
- it can be part of a communication terminal implementing a hands-free communication.
- the nascent echo from this terminal can be directly canceled before retransmitting the captured speech signal.
- the system can be part of a communication terminal that does not implement a hands-free communication, but is in communication with a terminal implementing such communication.
- the terminal can eliminate the echo in a received signal.
- the echo cancellation system is implemented in a communication server.
- an operator of a telecommunications network implementing the server can provide its subscribers an echo cancellation service.
- the inserted signal w (n) is a pseudo-random sequence of +1 and -1 of length L, called the maximum length sequence (MLS), periodized. Its main property is to give an L-periodised unit pulse plus a DC component 1 / L when carrying out its circular autocorrelation:
- the temporal insertion of the tattoo signal into the audio signals is inaudible using psychoacoustic models.
- the masking threshold in the case of speech, is approximated by the Spectral Power Density (DSP) of the signal over a 20ms frame, attenuated by a factor ⁇ ⁇ 1.
- DSP Spectral Power Density
- an inaudible tattoo obtained by the filtering of a white noise w (n) can be added by the transfer function filter ⁇ ⁇ ⁇ ⁇ ) .
- This filter is updated every L samples.
- the tattoo signal obtained is added temporally to the speech signal as illustrated in FIG. 2.
- the tattooed signal xt (n) obtained is then transmitted to the acoustic channel f to be identified.
- xf (n) and bf (n) are respectively the signals x (n) and b (n) filtered by the filter g 1 .
- the estimation of the channel is done by calculation of block intercorrelation of L samples between the filtered echo signal and the original MLS sequence w (n):
- the intercorrelation ⁇ is not perfectly zero and consequently the term f * f ( n q U i is a little weaker than that of ⁇ ⁇ , can not be totally neglected.
- v (n) f-h (n) is the deviation vector that represents the estimation error of the channel.
- the power of the error converges to that of the filtered noise bf (n).
- the estimation of the channel is done by calculating the intercorrelation:
- the adaptation time is faster and a more stationary estimate of the echo is achieved.
- the conventional AEC in question is an NLMS-type adaptive AEC whose input is the input signal x (n) itself driving the acoustic channel to be estimated.
- FIG. 6 illustrates the evolution of the quadratic mean deviation (DQM), for a method according to the invention (curve AECJNV) and for a method according to the prior art (curve AEC_CLASS).
- the DQM represents the relative estimation error of f, and is expressed as: DQM dB (n)
- the DQM is calculated in the absence of local speech and in the presence of ambient noise with a signal-to-noise ratio of 20dB.
- the signal-to-noise ratio is expressed according to:
- RSBL lOLog with Px the power of the input signal x (n) and Pn that of the ambient noise n (n).
- the method according to the present invention is therefore faster and more accurate.
- ERLE echo return loss enhancement
- ERLE is defined by:
- FIGS. 7 and 8 illustrate, for an initially transmitted GIS speech signal giving rise to an echo signal, the evolution of the ERLE respectively for the proposed structure (AECJNV curve) and for a conventional AEC (for example type NLMS, curve AEC_CLASS) also in the absence of local speech and in the presence of ambient noise and for the proposed structure and the WAEC (WAEC curve) also under the same conditions.
- FIG. 9 illustrates, for an initially transmitted GIS speech signal giving rise to an echo signal, the evolution of the ERLE in the presence of ambient noise and of local speech SIG_LOC, in the case of the present invention and of a classical AEC.
- the power of the local speech is generally related to that of the echo by the ratio:
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
Procédé d'annulation d'écho acoustique dans un premier signal comportant un signal d'écho d'un deuxième signal, comportant; insérer, de manière inaudible, dans le deuxième signal une séquence pseudo aléatoire dont l'autocorrélation circulaire comporte une impulsion unité et une composante continue, caractériser, dans le premier signal, au moyen de la séquence insérée, un canal acoustique suivi par le signal d'écho, estimer le signal d'écho dans le premier signal au moyen de la caractérisation du canal acoustique, et annuler le signal d'écho au moyen de l'estimation obtenue.
Description
Procédé et dispositif d'annulation d'écho acoustique par tatouage audio
Domaine technique
La présente invention concerne le traitement de signaux audio.
Plus particulièrement, elle vise l'annulation de l'écho acoustique dans les systèmes de prise et de restitution du son, notamment utilisés dans des systèmes de communication.
Arrière-plan technologique
Dans les systèmes de prise et de restitution du son de type « mains libres » (comme par exemple les dispositifs de visioconférence), un premier terminal transmet un signal de parole vers un deuxième terminal. Un haut parleur du deuxième terminal émet alors le signal. Le signal émis suit alors un ou plusieurs trajets d'écho. Un microphone du deuxième terminal capte ensuite un signal sonore comportant l'écho du signal émis (et correspondant au signal transmis).
L'écho est réduit par un système dit d'annulation d'écho acoustique (AEC). Dans ces systèmes, le canal acoustique entre le système de restitution et le système de prise de son, comportant un ou plusieurs trajets d'écho, est déterminé par estimation de la réponse impulsionnelle de ce canal acoustique. L'estimation de la réponse impulsionnelle du canal acoustique se fait le plus souvent en temps réel et de manière adaptative auprès du deuxième terminal. Le filtre numérique utilisé pour l'adaptation est piloté par le signal de parole transmis par le premier terminal.
Les performances de tels systèmes sont dégradées par plusieurs facteurs, notamment :
- les caractéristiques statistiques du signal audio (par exemple sa forte corrélation et son caractère non stationnaire, et
- le contexte de la double parole, dans le cas où le deuxième terminal capte un signal de parole locale qui s'ajoute à l'écho et au bruit ambiant. En effet, la présence d'une parole locale s'ajoutant au bruit ambiant gêne la convergence de l'AEC.
Dans les systèmes existants d'annulation d'écho acoustique, qui se fondent sur des méthodes adaptatives, le problème d'existence d'une parole locale se pose du fait que le filtre adaptatif ne peut plus suivre les variations du canal acoustique et suit alors celles de la parole locale. Dans ce cas, l'algorithme converge vers une fausse solution.
Pour remédier à ce problème, l'art antérieur propose de geler l'adaptation en présence de double parole. Cependant, cette solution empêche d'estimer correctement l'écho.
En référence à la Figure 1 , on décrit un système d'annulation d'écho (AEC) selon l'art antérieur, mis en œuvre dans un système de communication sonore (par exemple un téléphone en mode « mains libres »).
Un premier interlocuteur envoie, à partir d'un premier terminal, un signal x(n) qui est ensuite diffusé par le haut-parleur HP d'un deuxième terminal. Le signal émis par le haut-parleur est ensuite réfléchi par l'environnement (les murs par exemple) dans lequel le haut-parleur se trouve. La réflexion, ainsi que l'écho direct induit par le passage direct du son entre le haut-parleur et le microphone MIC du deuxième terminal, induisent ainsi un signal d'écho z(n).
Le signal d'écho, un signal de bruit ambiant n(n), ainsi que la parole d'un deuxième interlocuteur s(n) sont captés par le microphone MIC, présent pour capter la parole du deuxième interlocuteur, puis transmis vers le terminal.
Le signal reçu par le premier haut parleur est alors un mélange de la parole du deuxième interlocuteur et de la parole du premier interlocuteur x(n) filtrée par le canal acoustique f entre le haut-parleur et le micro (z(n)=f*x(n), où * désigne la convolution).
Le signal capté par le microphone est alors: y(n)=z(n)+b(n)=( f *x(n))+b(n), où x(n) et f sont respectivement le signal reçu par le haut parleur de réception et la réponse impulsionnelle du couplage, supposée de nature linéaire, entre le haut-
parleur et le microphone, et b(n)=n(n)+s(n) est un mélange du bruit ambiant n(n) et de la parole locale s(n).
Un système d'annulation d'écho est disposé entre les lignes de transmission des signaux x(n) et y(n), par exemple auprès du deuxième terminal.
Ce système d'annulation d'écho est chargé d'estimer et de simuler au moyen d'un filtre RI F h le canal acoustique f, de manière à retrancher au mélange b(n)+f*x(n) une estimation de f*x(n), donnée par h(n)*x(n).
Le canal de propagation acoustique étant amené à varier dans le temps, des algorithmes adaptatifs sont utilisés.
Leur rôle est "d'apprendre" dans un premier temps puis de mettre continuellement à jour les coefficients du filtre RI F h(n) pour conserver une bonne compensation de l'écho malgré ces variations.
Cependant ces algorithmes adaptatifs souffrent de problèmes de robustesse dus aux variations temporelles des caractéristiques statistiques du signal sonore émis x(n) et pilotant l'AEC (corrélation, non stationnarité,...).
Les coefficients du filtre h(n) = [h0(n), hi(n) ... hP-i(n)]T sont par exemple adaptés selon un algorithme normalisé du type NLMS (« Normalized Least Mean Square »).
Cet algorithme minimise l'erreur quadratique moyenne entre la sortie du filtre h(n) et l'écho. L'adaptation de h(n) se fait alors comme suit :
h(n + 1) = h(n) + jue(n) ^
Χ(η)τ Χ(η) + ε où μ est un pas d'adaptation généralement fixe, e(n) est l'erreur d'estimation qui contrôle l'adaptation du filtre h(n) et X(n)=[x(n),x(n-1 ),..., x(n-P+1)]T est le vecteur d'entrée de longueur P, et ε est une faible valeur strictement positive pour éviter l'annulation du dénominateur de la fraction durant les périodes de silence.
Il a été proposé d'insérer dans le signal incident x(n) un tatouage additif afin de modifier les propriétés statistiques du signal (S. Larbi and M. Jaïdane, "Audio
watermarking: a way to modify audio statistics", IEEE Trans. on Signal Processing, vol. 53(2), 2005).
Néanmoins, cette méthode présente au moins deux inconvénients :
- l'AEC atténue trop faiblement l'écho et reste sensible aux statistiques du signal de parole tatoué, et
- le problème de la double parole n'est pas résolu.
Il a également été proposé par les inventeurs (Marrakchi et al. « Speech processing in the watermarked domain : application in adaptative acoustic echo cancellation », European Signal Processing Conférence, Italy, 2006) un système d'annulation d'écho dit « WAEC » qui est fondé sur l'insertion d'un bruit blanc par tatouage audio dans le signal de parole source de manière à estimer le canal acoustique par un signal ayant de meilleures propriétés que le signal de parole source.
Dans ce système, deux filtres adaptatifs fonctionnent en parallèle.
La nette supériorité du WAEC par rapport à un AEC classique est due au fait que les signaux impliqués dans le fonctionnement du WAEC sont très peu corrélés et beaucoup plus stationnaires. Avec ce système les inventeurs ont obtenu un gain important dans l'atténuation de l'écho.
Toutefois, cette structure peut être améliorée, notamment en présence de double parole.
Résumé de l'invention
Il existe donc un besoin pour un système d'annulation d'écho acoustique offrant une qualité d'annulation d'écho satisfaisante et qui soit peu sensible aux caractéristiques du signal de parole et au contexte de la double parole.
La présente invention vient améliorer la situation.
A cet effet, selon un premier aspect de l'invention, on propose un procédé d'annulation d'écho acoustique dans un premier signal comportant un signal d'écho d'un deuxième signal. Le procédé comporte :
- insérer, de manière inaudible, dans le deuxième signal une séquence pseudo aléatoire dont l'auto corrélation circulaire comporte une impulsion unité et une composante continue,
- caractériser, dans le premier signal, au moyen de la séquence insérée, un canal acoustique suivi par le signal d'écho,
- estimer le signal d'écho dans le premier signal au moyen de la caractérisation du canal acoustique, et
- annuler le signal d'écho au moyen de l'estimation obtenue.
La séquence pseudo aléatoire insérée est indépendante du signal de parole locale ce qui améliore la caractérisation (ou identification) du canal (ou chemin) d'écho.
Ainsi, la qualité de caractérisation est constante et peu dépendante des variations statistiques des signaux mis en œuvre dans l'annulation d'écho.
Avec le procédé selon la présente invention, la qualité de caractérisation est meilleure, même en contexte de double parole.
La présente invention permet de fournir une qualité satisfaisante de conversation téléphonique ou en visioconférence, même en présence des variations statistiques de la parole émise et de la parole locale.
En outre, avec le procédé selon la présente invention, l'annulation d'écho est plus rapide et plus précise que dans l'art antérieur.
Par exemple, la caractérisation du canal acoustique (ou chemin d'écho) se fait par intercorrélation du premier signal avec la séquence pseudo aléatoire.
Cela permet de minimiser l'effet de l'existence d'une parole locale au cours de l'identification à cause de l'indépendance statistique de la séquence pseudo aléatoire et de la parole locale.
Par exemple encore, la caractérisation du canal acoustique comporte un filtrage adaptatif du deuxième signal.
La caractérisation peut également comporter un filtrage par bloc du deuxième signal.
L'utilisation de la séquence pseudo aléatoire permet de réduire la perturbation du signal en présence de double parole.
Dans des modes de réalisation, la caractérisation du canal acoustique comporte les étapes :
- effectuer un filtrage adaptatif et/ou par bloc du deuxième signal, et
- effectuer une intercorrélation du premier signal avec la séquence pseudo aléatoire.
Le filtrage permet d'éliminer l'influence du deuxième signal avant l'intercorrélation, augmentant ainsi la qualité de cette dernière. Par exemple, il est possible de diminuer la puissance du deuxième signal par rapport à la puissance de la séquence pseudo aléatoire.
Dans des modes de réalisation, le procédé comporte en outre :
- appliquer un filtre de mise en forme à la séquence pseudo aléatoire avant son insertion dans le deuxième signal.
Par exemple, le filtre de mise en forme est utilisé pour assurer l'inaudibilité de la séquence pseudo aléatoire, en se fondant sur des modèles psychoacoustiques.
Dans ce cas, on peut former le filtre à fournir une séquence inaudible avec une puissance maximale, pour optimiser son utilisation dans l'annulation d'écho.
Dans des modes de réalisation, on peut prévoir en outre une étape de traitement du premier signal avant la corrélation avec la séquence pseudo aléatoire. Ce traitement peut comporter la soustraction du résultat du filtrage du deuxième signal au premier signal. Ainsi, la qualité du résultat de la corrélation peut être améliorée.
Par exemple, le traitement peut aussi comporter l'application d' un filtre permettant d'annuler les effets du filtre de mise en forme sur la séquence pseudo aléatoire.
Selon d'autres aspects de l'invention, il est prévu :
- un programme informatique comportant des instructions pour la mise en œuvre du procédé selon l'invention lorsque le programme est exécuté par un processeur, par exemple, le processeur d'un système d'annulation d'écho ;
- un support lisible par un ordinateur sur lequel est enregistré un tel programme d'ordinateur ;
- un circuit configuré pour la mise en œuvre du procédé selon l'invention ; et
- un système d'annulation d'écho adapté pour la mise en œuvre du procédé selon l'invention.
Les avantages procurés par le programme informatique, le support lisible par ordinateur, le circuit, et le système, tels que succinctement exposés ci-dessus, sont au moins identiques à ceux mentionnés plus haut en liaison avec le procédé de d'annulation d'écho selon l'invention.
Brève description des dessins
D'autres caractéristiques et avantages de l'invention apparaîtront encore à la lecture de la description qui va suivre. Celle-ci est purement illustrative et doit être lue en regard des dessins annexés sur lesquels, en outre la Figure 1 :
- la figure 2 est un schéma bloc illustrant un procédé selon un premier mode de réalisation de l'invention ;
- la figure 3 est un schéma bloc illustrant un procédé selon un deuxième mode de réalisation de l'invention ;
- la figure 4 est un organigramme général du procédé selon des modes de réalisation de l'invention ;
- la figure 5 illustre un système d'annulation d'écho selon un mode de réalisation de l'invention ; et
- les figures 6 à 9 illustrent des résultats de tests montrant quelques avantages apportés par l'invention.
Description détaillée de modes de réalisation
En référence à la Figure 2, on décrit schématiquement la mise en œuvre d'un procédé selon un premier mode de réalisation.
Dans ce mode de réalisation, l'annulation d'écho se fait par insertion d'une séquence numérique (procédé également appelé « tatouage numérique »), puis par
intercorrélation de la séquence insérée avec le signal comportant le signal d'écho pour la caractérisation (ou identification) du canal acoustique (ou chemin d'écho). L'annulation finale de l'écho se fait par soustraction, dans le signal comportant l'écho, d'une estimation de l'écho fondée sur l'identification du canal acoustique.
Dans un premier temps, on décrit de manière générale les étapes mises en oeuvre. Dans un second temps, chacune des étapes sera détaillée.
Ce mode de réalisation s'inscrit par exemple dans le cadre d'une communication entre un premier terminal de communication tel qu'un téléphone mobile, et un deuxième terminal en mode mains libres.
L'écho que l'on se propose de traiter prend naissance auprès du deuxième terminal, et est traité auprès de ce deuxième terminal.
On peut envisager d'autres modes de réalisation dans lesquels l'écho est traité auprès du premier terminal, ou encore dans lesquels l'écho est traité dans un réseau de télécommunications.
Le signal de parole x initialement émis par un utilisateur du premier terminal est fourni à un bloc d'insertion INS, pour l'insertion d'une séquence numérique qui sera décrite plus en détails dans la suite.
Le signal inséré t provient d'un signal initial w mis en forme par un bloc de mise en forme FORM. Cette mise en forme permet d'adapter le spectre du signal w afin de le rendre inaudible, une fois inséré dans le signal x.
Le signal xt obtenu à la sortie du bloc INS est ensuite transmis et suit un ensemble de transformations modélisé par le bloc ECHO. Ces transformations correspondent par exemple à sa transmission et à sa réflexion.
A la sortie du bloc ECHO on obtient un signal z, comme celui décrit précédemment en référence à la Figure 1.
A ce signal z, un signal de bruit b vient également s'ajouter, pour former le signal y. Le signal y contient l'écho du signal x.
Le signal y est ensuite fourni à une unité de mise en forme du signal DEFORM qui effectue sur le signal une transformation inverse de celle effectuée par le bloc FORM.
En sortie du bloc DEFORM on obtient un signal yf qui est ensuite fourni à un bloc d'intercorrélation INTERCOR afin de réaliser Pintercorrélation du signal yf avec le signal w.
Le bloc INTERCOR fournit alors une caractérisation / du canal acoustique schématisé par le bloc ECHO. Cette caractérisation est ensuite fournie à un bloc ESTIM qui reçoit également en entrée le signal xt, pour obtenir en sortie une estimation du signal z.
Le signal y et l'estimation du signal z sont ensuite fournis à un bloc ANNUL pour soustraire l'écho du signal y.
Dans un deuxième mode de réalisation, décrit en référence à la Figure 3, un filtrage adaptatif est effectué sur le signal tatoué pour réaliser une première identification du canal acoustique, avant Pintercorrélation.
Dans ce mode de réalisation, on retrouve les blocs FORM, INS, ECHO, ANNUL, INTERCOR, et ESTIM du premier mode de réalisation.
En outre, on trouve un deuxième bloc DEFORM identique au premier, et alimenté par le signal xt, la sortie de ce deuxième bloc DEFORM est couplée à l'entrée d'un bloc ADAPT1 de filtrage adaptatif.
Le signal w est par ailleurs fourni à un deuxième bloc ADAPT2, qui est une copie du premier bloc ADAPT1.
Dans ce deuxième mode de réalisation, la sortie du premier bloc DEFORM est fournie à un bloc de soustraction pour effectuer la soustraction entre le signal yf et la sortie du premier bloc ADAPT1. Le résultat de cette soustraction est délivré au bloc ADAPT1 pour piloter le filtrage.
La sortie du deuxième bloc ADAPT2 est ensuite additionnée avec la sortie du bloc de soustraction, et la somme est fournie au bloc INTERCOR.
Dans une variante du deuxième mode de réalisation (non représentée), on utilise un filtrage par bloc alternativement au, ou en combinaison avec le, filtrage adaptatif. Par exemple, on implémente un filtre de Wiener.
Les étapes du procédé selon les modes de réalisation décrits, sont résumées dans l'organigramme général de la Figure 4.
Dans une première étape S40, le signal transmis par l'utilisateur du premier terminal est reçu par le deuxième terminal puis est tatoué par l'AEC par insertion de la séquence numérique. Ensuite, le signal tatoué est diffusé par le haut parleur du deuxième terminal lors de l'étape S41.
Lors de l'étape S42, le microphone du deuxième terminal reçoit un signal comportant un signal d'écho du signal précédemment transmis.
On réalise alors lors de l'étape S43 une caractérisation du canal acoustique au moyen de la séquence insérée lors du tatouage.
Enfin, lors de l'étape S44 l'écho est annulé dans le signal reçu par le microphone, au moyen de la caractérisation obtenue.
Un programme d'ordinateur comportant des instructions pour la mise en œuvre du procédé selon l'invention peut être réalisé selon un algorithme général déduit de l'organigramme général de la Figure 4, et de la présente description détaillée.
Un système d'annulation d'écho selon un mode de réalisation de l'invention est décrit en référence à la Figure 5.
Ce système d'annulation d'écho AEC comporte une entrée E2 pour recevoir un signal à retransmettre, une sortie S2 pour retransmettre le signal reçu et tatoué. Il comporte également une entrée E1 pour recevoir un signal comportant un écho du signal transmis, et une sortie S1 pour envoyer le signal avec l'écho annulé.
Le système AEC comporte également une mémoire MEM pour stocker des données de calcul. Dans des modes de réalisation, la mémoire MEM peut également stocker un programme d'ordinateur selon la présente invention.
Le système comporte également un processeur PROC pour contrôler un circuit d'annulation d'écho. Par exemple, le processeur exécute un programme d'ordinateur stocké dans la mémoire MEM.
Le circuit CIRC comporte une unité d'insertion de séquence numérique INS, une unité de caractérisation de canal acoustique CARACT, une unité d'estimation du signal d'écho ESTIM et une unité d'annulation d'écho ANNUL.
Tous ces éléments sont disposés en sorte à fonctionner selon le procédé d'annulation d'écho selon l'invention.
Le système d'annulation d'écho peut faire partie d'un terminal de communication. Par exemple, il peut faire partie d'un terminal de communication mettant en œuvre une communication en mode mains libres. Ainsi, l'écho naissant auprès de ce terminal peut être directement annulé avant de retransmettre le signal de parole capté. Par exemple encore, le système peut faire partie d'un terminal de communication qui ne met pas en œuvre une communication en mode mains libres, mais qui est en communication avec un terminal mettant en œuvre une telle communication. Ainsi, le terminal peut éliminer l'écho dans un signal reçu.
Par exemple encore, le système d'annulation d'écho est mis en œuvre dans un serveur de communication. Ainsi, un opérateur d'un réseau de télécommunications mettant en œuvre le serveur peut fournir à ses abonnés un service d'annulation d'écho.
L'intégration d'un système selon l'invention dans un terminal ou un serveur, tels que succinctement décrits, peut être réalisée selon des techniques connues de la personne du métier.
Dans la suite, on décrit plus en détails les différentes opérations évoquées ci- avant : le tatouage numérique, la caractérisation du canal acoustique, l'annulation d'écho, et le filtrage adaptatif ou par bloc.
Enfin, on présente des résultats de tests effectués pour montrer certains avantages apportés par la présente invention.
Tatouage numérique
Le signal w(n) inséré est une séquence pseudo aléatoire de +1 et -1 de longueur L, appelée séquence à longueur maximale (MLS), périodisée. Elle a comme principale propriété de donner une impulsion unité L-périodisée plus une composante continue 1/L lorsque l'on effectue son auto-corrélation circulaire :
1 si n = OmodL
-— si n≠ 0
L où l'auto-corrélation circulaire est définie par :
1 L-l
(Ό = y∑ w{k)w{{n + k) modL)
k=0
L'insertion temporelle du signal de tatouage dans les signaux audio se fait de manière inaudible en utilisant des modèles psychoacoustiques.
Le seuil de masquage, dans le cas de la parole, est approché par la Densité Spectrale de Puissance (DSP) du signal sur une trame de 20ms, atténuée d'un facteur λ<1. Comme la parole est modélisable par la filtrée du bruit blanc de variance
2
ex par un filtre tout-pôles de fonction de transfert 1/A(z), on peut ajouter un tatouage inaudible obtenu par le filtrage d'un bruit blanc w(n) par le filtre de fonction de transfert Λ{^ζ) . Ce filtre est actualisé tous les L échantillons.
Caractérisation du canal par intercorrélation
Il s'agit d'exciter le canal par une séquence MLS w(n) de longueur L périodisée. Le signal y(n) obtenu à la sortie du canal est :
P-l
y(n) = f * w(n) =∑f(j)w(n - j)
j=0
où P est la longueur de la réponse impulsionnelle f à estimer.
La corrélation entre la sortie y(n) et l'entrée w(n) vaut :
P-l j=
Ou encore
<Pm, (n) = f(n) = f(n) + Pl (n) + P2 (Ό avec
[PI L\
Px (n) = ∑f(n + jL)
J=i est la perturbation due à l'effet de sous-modélisation lorsque L<P. (») = -y ∑fV)
j=l-j≠»+kL est la perturbation due à l'effet de la « «fausse impulsion unité».
La situation idéale est réalisée dans le cas de modélisation exacte (P<L) où
" 0.
Annulation d'écho
Le signal de tatouage obtenu est ajouté temporellement au signal de parole comme illustré par la Figure 2. Le signal tatoué xt(n) obtenu est ensuite transmis vers le canal acoustique f à identifier. L'écho obtenu est donné par : y(n) = f * xt(n) + b(n)
= f * x(n) + f * t(n) + b(n)
= f * x(n) + f * g * w(n) + b{n)
En appliquant au signal d'écho l'inverse du filtre de mise en forme g du bloc FORM, on obtient : yf(n) = g~] * y(n)
= f * w(n) + f * xf(n) + bf(n) où xf(n) et bf(n) sont respectivement les signaux x(n) et b(n) filtrés par le filtre g 1.
L'estimation du canal se fait par calcul d'intercorrélation par bloc de L échantillons entre le signal d'écho filtré et la séquence MLS originale w(n) :
(n) = /(η) + / * φ^ {η) + <Pwbf + Px (n) + P2 (n), n = 0 : L - 1 L'écho résiduel est donc :
e(n) = y{n) - φ . (n) * xt(n)
La qualité de l'estimation est indépendante de la corrélation et de la non stationnarité du signal de parole émis.
Identification adaptative ou par bloc complémentaire
Afin d'assurer la rapidité de la caractérisation du canal acoustique, la valeur de L doit être limitée.
Dans ce cas, l'intercorrélation ^ n'est pas parfaitement nulle et par conséquent le terme f * ™f (n qUi est de puissance un peu plus faible que celle de^ ^ , ne peut être totalement négligé.
Afin de pallier ce problème, on peut prévoir l'annulation de l'effet de ce terme par l'ajout d'une étape de filtrage adaptatif.
Ainsi, on obtient une première estimation du canal acoustique f comme illustré par la Figure 3.
L'étage de filtrage adaptatif ADAPT (filtre adaptatif h(n) de longueur P) est piloté par le signal tatoué filtré xtf^ = s 1 * xt(n) et contrôlé par l'erreur d'estimation adaptative :
er(n) = yf(n) - h(n) * [xf(n) + w(n)]
= f * w(n) + - h(n) * w(n)
où v(n)=f-h(n) est le vecteur déviation qui représente l'erreur d'estimation du canal.
Soit le signal à l'entrée du corrélateur INTERCOR :
e(n) = er(n) + h(n) * w(n)
A la convergence du filtre adaptatif h(n), la puissance de l'erreur converge vers celle du bruit filtré bf(n).
L'estimation du canal se fait par calcul de l'intercorrélation :
≠^ (η) = f(n) +≠wS(n), n = 0 : L - l
Dans le cas où le filtre h(n) converge, le second terme de l'équation devient négligeable et on obtient une qualité d'estimation quasiment constante.
Selon une variante de réalisation, on peut utiliser un filtrage par bloc. Par exemple, il s'agit d'utiliser un filtre de Wiener. Comme il apparaîtra à la personne du métier, l'utilisation d'un tel filtre peut nécessiter d'inverser une matrice de corrélation du signal audio.
Résultats
Différents signaux de parole et différents canaux acoustiques ont été utilisés pour tester le procédé selon l'invention.
Les tests ont montré que la qualité de la parole à la réception est nettement meilleure avec la méthode proposée qu'avec celles utilisant les méthodes adaptatives classiques dans lesquelles l'AEC est piloté par le signal de parole reçu directement.
Avec le procédé selon la présente invention, le temps d'adaptation est plus rapide et une estimation plus stationnaire de l'écho est réalisée.
Pour avoir des résultats comparables, les performances de la méthode proposée, dont l'étage adaptatif est de type NLMS, ont été comparées à celle d'un AEC classique.
L'AEC classique en question est un AEC adaptatif type NLMS dont l'entrée est le signal d'entrée x(n) lui-même pilotant le canal acoustique à estimer.
Le même pas d'adaptation μ a été utilisé pour les deux AEC (AEC classique et AEC selon la présente invention).
Les paramètres de simulation utilisés ont été les suivants : L=511 , P=200, en absence de parole locale.
La Figure 6 illustre l'évolution de la déviation quadratique moyenne (DQM), pour un procédé selon l'invention (courbe AECJNV) et pour un procédé selon l'art antérieur (courbe AEC_CLASS). La DQM représente l'erreur relative d'estimation de f, et s'exprime selon :
DQMdB (n)
La DQM est calculée en l'absence de parole locale et en présence de bruit ambiant avec un rapport signal à bruit de 20dB. Le rapport signal à bruit s'exprime selon:
RSBl = lOLog avec Px la puissance du signal d'entrée x(n) et Pn celle du bruit ambiant n(n).
Comme on peut le constater sur la Figure 6, la vitesse de convergence réalisée par la méthode proposée est nettement supérieure à celle d'un AEC classique.
En outre, la déviation finale est plus faible avec la présente invention.
Le procédé selon la présente invention est donc plus rapide et plus précis.
Afin d'évaluer les performances de l'AEC en régime permanent, on a calculé l'ERLE (« echo return loss enhancement »).
L'ERLE est défini par :
avec y(n) l'écho bruité à estimer et e(n) est l'erreur d'estimation.
Les Figures 7 et 8 illustrent, pour un signal de parole SIG initialement émis et donnant naissance à un signal d'écho, l'évolution de l'ERLE respectivement pour la structure proposée (courbe AECJNV) et pour un AEC classique (par exemple type NLMS, courbe AEC_CLASS) également en absence de parole locale et en présence de bruit ambiant et pour la structure proposée et le WAEC (courbe WAEC) également dans les mêmes conditions.
Cette comparaison en régime permanent montre que la structure proposée garantit une qualité d'estimation meilleure et plus stable que celle offerte par un AEC classique et par le WAEC.
La figure 9 illustre, pour un signal de parole SIG initialement émis et donnant naissance à un signal d'écho, l'évolution de l'ERLE en présence de bruit ambiant et de parole locale SIG_LOC, dans le cas de la présente invention et d'un AEC classique. La puissance de la parole locale est généralement liée à celle de l'écho par le rapport :
RSB2 = lOLog ■ho
Dans le présent cas, RSB2= -20 dB. Les résultats montrent que la structure proposée donne de meilleures performances même en présence de parole locale.
La présente invention a été décrite et illustrée dans la présente description détaillée et dans les Figures. La présente invention ne se limite pas aux formes de réalisation présentées. D'autres variantes et modes de réalisation peuvent être déduits et mis en œuvre par la personne du métier à la lecture de la présente description et des Figures annexées.
Dans les revendications, le terme "comporter" n'exclut pas d'autres éléments ou d'autres étapes. L'article indéfini « un » n'exclut pas le pluriel. Un seul processeur ou plusieurs autres unités peuvent être utilisées pour mettre en œuvre l'invention. Les différentes caractéristiques présentées et/ou revendiquées peuvent être avantageusement combinées. Leur présence dans la description ou dans des revendications dépendantes différentes, n'excluent pas cette possibilité. Les signes de référence ne sauraient être compris comme limitant la portée de l'invention.
Claims
1. Procédé d'annulation d'écho acoustique dans un premier signal (y) comportant un signal d'écho d'un deuxième signal (x), caractérisé en ce qu'il comporte :
- insérer (S40), de manière inaudible, dans le deuxième signal une séquence pseudo aléatoire (w) dont l'autocorrélation circulaire comporte une impulsion unité et une composante continue,
- caractériser (S43), dans le premier signal, au moyen de la séquence insérée, un canal acoustique suivi par le signal d'écho,
- estimer (ESTIM) le signal d'écho dans le premier signal au moyen de la caractérisation du canal acoustique, et
- annuler (S44) le signal d'écho au moyen de l'estimation obtenue.
2. Procédé selon la revendication 1 , dans lequel la caractérisation du canal acoustique se fait par intercorrélation (INTERCOR) du premier signal avec la séquence pseudo aléatoire.
3. Procédé selon la revendication 1 , dans lequel la caractérisation du canal acoustique comporte au moins l'un d'un filtrage adaptatif (ADAPT) du deuxième signal et d'un filtrage par bloc du deuxième signal.
4. Procédé selon la revendication 1 , dans lequel la caractérisation du canal acoustique comporte les étapes :
- effectuer un filtrage adaptatif et/ou par bloc du deuxième signal, et
- effectuer une intercorrélation du premier signal avec la séquence pseudo aléatoire.
5. Procédé selon l'une des revendications précédentes, comportant en outre :
- appliquer un filtre de mise en forme (FORM) à la séquence pseudo aléatoire avant son insertion dans le deuxième signal.
6. Procédé selon l'une des revendications 3 à 5, comportant en outre une étape de traitement du premier signal avant l'intercorrélation avec la séquence pseudo aléatoire, ledit traitement comportant une soustraction d'un résultat du filtrage du deuxième signal au premier signal.
7. Programme d'ordinateur comportant des instructions pour la mise en œuvre d'un procédé selon l'une des revendications précédentes lorsqu'il est exécuté par un processeur.
8. Circuit configuré pour la mise en œuvre d'un procédé selon l'une des revendications 1 à 6.
9. Système d'annulation d'écho (AEC) dans un premier signal (y) comportant un signal d'écho d'un deuxième signal (x), le système comportant :
- une unité d'insertion (INS), de manière inaudible, dans le deuxième signal d'une séquence pseudo aléatoire dont l'autocorrélation circulaire comporte une impulsion unité et une composante continue,
- une unité de caractérisation (CARACT), dans le premier signal, au moyen de la séquence insérée, d'un canal acoustique suivi par le signal d'écho,
- une unité d'estimation (ESTIM) du signal d'écho dans le premier signal au moyen de la caractérisation du canal acoustique, et
- une unité d'annulation (ANNUL) du signal d'écho au moyen de l'estimation obtenue.
10. Système selon la revendication 9, dans lequel l'unité de caractérisation du canal acoustique comporte une unité d'intercorrélation du premier signal avec la séquence pseudo aléatoire.
11. Système selon la revendication 9, dans lequel l'unité de caractérisation du canal acoustique comporte au moins l'un d'un filtre adaptatif du deuxième signal, et d' un filtre par bloc du deuxième signal.
12. Système selon la revendication 9, dans lequel l'unité de caractérisation du canal acoustique comporte :
- un filtre adaptatif et/ou par bloc du deuxième signal, et
- une unité d'intercorrélation du premier signal avec la séquence pseudo aléatoire.
13. Système selon l'une des revendications 9 à 12, comportant en outre :
- un filtre de mise en forme de la séquence pseudo aléatoire avant son insertion dans le deuxième signal.
14. Système selon l'une des revendications 1 1 à 13, comportant en outre une unité de traitement du premier signal avant l'intercorrelation avec la séquence pseudo aléatoire, ledit traitement comportant une soustraction d'un résultat du filtrage du deuxième signal au premier signal.
15. Système selon l'une des revendications 9 à 14, comportant en outre :
- une première entrée (E1 ) pour recevoir le premier signal,
- une première sortie (S1 ) pour envoyer le premier signal avec le signal d'écho annulé,
- une deuxième entrée (E2) pour recevoir le deuxième signal, et
- une deuxième sortie (S2) pour envoyer le deuxième signal avec la séquence insérée.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0957636A FR2952263B1 (fr) | 2009-10-29 | 2009-10-29 | Procede et dispositif d'annulation d'echo acoustique par tatouage audio |
PCT/FR2010/052309 WO2011051625A1 (fr) | 2009-10-29 | 2010-10-27 | Procede et dispositif d'annulation d'echo acoustique par tatouage audio |
Publications (1)
Publication Number | Publication Date |
---|---|
EP2494772A1 true EP2494772A1 (fr) | 2012-09-05 |
Family
ID=42106007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP10788106A Withdrawn EP2494772A1 (fr) | 2009-10-29 | 2010-10-27 | Procede et dispositif d'annulation d'echo acoustique par tatouage audio |
Country Status (7)
Country | Link |
---|---|
US (1) | US20120213380A1 (fr) |
EP (1) | EP2494772A1 (fr) |
JP (1) | JP5749275B2 (fr) |
CA (1) | CA2779157A1 (fr) |
FR (1) | FR2952263B1 (fr) |
TN (1) | TN2012000193A1 (fr) |
WO (1) | WO2011051625A1 (fr) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018517937A (ja) * | 2015-06-01 | 2018-07-05 | フェムトニクス ケイエフティー.Femtonics Kft. | 層状構造を有する音響光学偏向器およびその偏向器を用いて光ビームを偏向させる方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103179296B (zh) * | 2011-12-26 | 2017-02-15 | 中兴通讯股份有限公司 | 一种回波抵消器及回波抵消方法 |
CN103516921A (zh) | 2012-06-28 | 2014-01-15 | 杜比实验室特许公司 | 通过隐藏音频信号的回声控制 |
US9210270B2 (en) * | 2012-11-15 | 2015-12-08 | Qualcomm Incorporated | Echo cancellation for ultrasound |
US9065971B2 (en) * | 2012-12-19 | 2015-06-23 | Microsoft Technology Licensing, Llc | Video and audio tagging for active speaker detection |
CN105122351B (zh) * | 2013-01-18 | 2018-11-13 | 株式会社东芝 | 声音合成装置及声音合成方法 |
WO2015108535A1 (fr) * | 2014-01-17 | 2015-07-23 | Intel Corporation | Mécanisme permettant de faciliter la gestion, à base de filigranage, d'échos pour une transmission de contenu sur des dispositifs de communication |
US20160171988A1 (en) * | 2014-12-15 | 2016-06-16 | Wire Swiss Gmbh | Delay estimation for echo cancellation using ultrasonic markers |
US10122863B2 (en) * | 2016-09-13 | 2018-11-06 | Microsemi Semiconductor (U.S.) Inc. | Full duplex voice communication system and method |
TWI790718B (zh) * | 2021-08-19 | 2023-01-21 | 宏碁股份有限公司 | 會議終端及用於會議的回音消除方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080198779A1 (en) * | 2007-02-15 | 2008-08-21 | Infineon Technologies Agst. | Multi-channel communication device and methods for reducing echoes by inserting a training sequence under a spectral mask |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3212796B2 (ja) * | 1994-05-07 | 2001-09-25 | 株式会社エヌ・ティ・ティ・ドコモ | エコーキャンセラ |
KR100449354B1 (ko) * | 1996-07-16 | 2005-08-17 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 정보신호내에삽입된워터마크검출방법및장치 |
US6888945B2 (en) * | 1998-03-11 | 2005-05-03 | Acentech, Inc. | Personal sound masking system |
US7062039B1 (en) * | 1999-05-27 | 2006-06-13 | Telefonaktiebolaget Lm Ericsson | Methods and apparatus for improving adaptive filter performance by inclusion of inaudible information |
US6301364B1 (en) * | 1999-10-06 | 2001-10-09 | Acoustic Technologies, Inc. | Tagging echoes with low frequency noise |
US6771769B2 (en) * | 2000-12-28 | 2004-08-03 | Richard Henry Erving | Method and apparatus for active reduction of speakerphone singing |
JP4348924B2 (ja) * | 2002-10-02 | 2009-10-21 | 日本電気株式会社 | エコーキャンセラ装置及びそれに用いるエコーキャンセラ方法 |
-
2009
- 2009-10-29 FR FR0957636A patent/FR2952263B1/fr not_active Expired - Fee Related
-
2010
- 2010-10-27 EP EP10788106A patent/EP2494772A1/fr not_active Withdrawn
- 2010-10-27 US US13/503,607 patent/US20120213380A1/en not_active Abandoned
- 2010-10-27 JP JP2012535905A patent/JP5749275B2/ja not_active Expired - Fee Related
- 2010-10-27 WO PCT/FR2010/052309 patent/WO2011051625A1/fr active Application Filing
- 2010-10-27 CA CA2779157A patent/CA2779157A1/fr not_active Abandoned
-
2012
- 2012-04-25 TN TNP2012000193A patent/TN2012000193A1/fr unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080198779A1 (en) * | 2007-02-15 | 2008-08-21 | Infineon Technologies Agst. | Multi-channel communication device and methods for reducing echoes by inserting a training sequence under a spectral mask |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018517937A (ja) * | 2015-06-01 | 2018-07-05 | フェムトニクス ケイエフティー.Femtonics Kft. | 層状構造を有する音響光学偏向器およびその偏向器を用いて光ビームを偏向させる方法 |
Also Published As
Publication number | Publication date |
---|---|
FR2952263B1 (fr) | 2012-01-06 |
FR2952263A1 (fr) | 2011-05-06 |
TN2012000193A1 (fr) | 2013-12-12 |
US20120213380A1 (en) | 2012-08-23 |
JP5749275B2 (ja) | 2015-07-15 |
JP2013509774A (ja) | 2013-03-14 |
WO2011051625A1 (fr) | 2011-05-05 |
CA2779157A1 (fr) | 2011-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2011051625A1 (fr) | Procede et dispositif d'annulation d'echo acoustique par tatouage audio | |
EP2057835B1 (fr) | Procédé de réduction de l'écho acoustique résiduel après suppression d'écho dans un dispositif "mains libres" | |
FR2770361A1 (fr) | Processeur non lineaire pour suppresseur d'echo acoustique | |
EP0767569B1 (fr) | Procédé et dispositif d'identification adaptative et annuleur d'écho adaptatif s'y rapportant | |
FR2651077A1 (fr) | Dispositif de traitement d'echo notamment acoustique dans une ligne telephonique | |
WO2007099222A1 (fr) | Procede de debruitage d'un signal audio | |
EP2057834A1 (fr) | Circuit de réduction de l'écho acoustique pour un dispositif "mains libres" utilisable avec un téléphone portable | |
CN104427068B (zh) | 一种语音通话方法及装置 | |
JP3507020B2 (ja) | 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体 | |
EP2262216B1 (fr) | Procédé de détection d'une situation de double parole pour dispositif téléphonique "mains libres" | |
EP1518394A1 (fr) | Dispositifs de traitement d echo pour systemes de communicat ion de type monovoie ou multivoies | |
WO2006096231A2 (fr) | Reconvergence rapide d'annuleurs d'echo apres sauts tdm et changements de niveau sonore des echos | |
EP1655857B1 (fr) | Dispositif et procédé de détection d'une divergence d'un filtre adaptatif | |
US7856098B1 (en) | Echo cancellation and control in discrete cosine transform domain | |
CN111210799A (zh) | 一种回声消除方法及装置 | |
EP2084893B1 (fr) | Circuit de réduction de l'écho acoustique pour un dispositif "mains libres" utilisable avec un téléphone portable | |
FR2824982A1 (fr) | Procede de controle adaptatif de systeme d'annulation d'echo multivoies et dispositif pour mettre en oeuvre le procede | |
FR2515453A1 (fr) | Annuleur de brouillage | |
WO2001043413A1 (fr) | Annuleur d'echo dans un systeme de communication au niveau d'un terminal | |
CN109361827B (zh) | 一种通信终端的回音二次抑制方法 | |
EP2078301A1 (fr) | Reduction de bruit et de distorsion dans une structure de type forward | |
WO2006077005A2 (fr) | Dispositif d'annulation d'echo acoustique, procede et programme d'ordinateur correspondants | |
WO2007003579A1 (fr) | Dispositif d'annulation d'un écho électrique ou acoustique, procédé et programme d'ordinateur correspondants | |
FR3115390A1 (fr) | Procédé et dispositif pour une annulation d’écho à pas variable | |
EP1902579A1 (fr) | Procede et dispositif de traitement d'echos forts, notamment dans des terminaux telephoniques en "mains libres" |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20120419 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
DAX | Request for extension of the european patent (deleted) | ||
17Q | First examination report despatched |
Effective date: 20151027 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: EXAMINATION IS IN PROGRESS |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN |
|
18D | Application deemed to be withdrawn |
Effective date: 20180501 |