EP2078301A1 - Noise and distortion reduction in a forward-type structure - Google Patents

Noise and distortion reduction in a forward-type structure

Info

Publication number
EP2078301A1
EP2078301A1 EP07823855A EP07823855A EP2078301A1 EP 2078301 A1 EP2078301 A1 EP 2078301A1 EP 07823855 A EP07823855 A EP 07823855A EP 07823855 A EP07823855 A EP 07823855A EP 2078301 A1 EP2078301 A1 EP 2078301A1
Authority
EP
European Patent Office
Prior art keywords
signal
noise
filter
post
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP07823855A
Other languages
German (de)
French (fr)
Inventor
André Gilloire
Mohamed Djendi
Pascal Scalart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of EP2078301A1 publication Critical patent/EP2078301A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Definitions

  • the present invention relates to a signal processing, in particular a speech signal in telephony.
  • the boom in telecommunications has enabled the general public to benefit from mobile communication tools. It has now become possible and common to telephone from anywhere (of course in the extent of network coverage areas) in environments such as a street, a train station or a vehicle. Nevertheless, such places do not enjoy the calm of a home and the comfort of communication that still offers fixed telephony.
  • the annoyance due to the disturbance described as "noise” is generally a source of discomfort and is further accentuated by the dematerialisation of sound recording (the so-called "hands-free” system) which still encourages the emergence of noise due to increasing the distance between the mouth of the speaker and the microphone.
  • ANC adaptive noise cancellation
  • An input signal x constitutes a useful component and to which is naturally added a noise component, and a noise reference b 2 correlated to the noise component added to the useful signal x, are propagated up to a treatment stage (right part of Figure 1).
  • the treatment can be described as follows.
  • adaptive Noise Canceller for "Adaptive Noise Canceller" is the filtering of the reference b 2 ( ”) adequately in order to obtain the best estimate of b j (n) (as defined in minimum mean squared error), which brings a reduction in output noise.
  • V ⁇ (z) and V2 ⁇ z / respectively represent the Z transforms of vj ( «)
  • Equation (3) In the absence of information on the second-order statistics of observations, an alternative to the solution of equation (3) is to perform an adaptive estimation of H. We then choose a parametric model of W in the form, for example, of a finite impulse response (FIR) filter whose coefficients are estimated
  • multi-sensor system (called “multidirectional") a priori allows better noise reduction performance than a traditional sound pickup from a single sensor.
  • the reference noise b 2 is often mixed with a component from the wanted signal. This is particularly the case when the sensors are spatially close.
  • the model of the mixture is now based on two filters h ⁇ iz) and h, 2 ⁇ ⁇ z) which represent the physical (for example acoustic) coupling paths between the source signals and the sensors, as illustrated in Figure 2, representing a mixing model of the input signals X 1 (n) and x 2 (n), coming for example from two respective microphones of a sound acquisition module.
  • the signals picked up by the microphones contain mixtures of speech and noise.
  • Second-order source separation techniques (without the use of higher-order statistics) make it possible under certain conditions to extract speech from noise with a minimum of damage.
  • FIG. 3 illustrates a symmetrical structure of the "backward” type, of denoising in the sense of the reference “Al-Kindi and Dunlop", mentioned above.
  • Figure 4 illustrates a symmetrical structure "forward” denoising within the meaning of the reference “Van Gerven and Van Compernolle”, supra.
  • the forward source separation structure in particular, has a convergence advantage provided towards the solution but which requires the use of a post-filter causing problems in extracting the output signals. This structure is detailed below.
  • FIG. 2 as in FIG. 5, which illustrates the signal mixing model, the filters h xx and / 1 22 are assumed to be "identity" filters, which does not affect the practical use of the model since User speaker of a multi-sensor terminal is expected to stay close to the microphones.
  • This hypothesis also reflects the fact that we generally do not have information a priori on the location of source of noise (supposedly point). Note that / ⁇ 12 and / ⁇ 21 are generally non-stationary.
  • the forward separation structure of FIG. 6 can be used.
  • the present invention improves the situation.
  • a device for reducing noise in at least one signal comprising: a structure of the forward type with at least two adaptive filtering channels with noise reduction on two input signals, for delivering two filtered and noise-reduced signals, and at least one post-filter at the output of a channel chosen from among both channels, to reduce distortion on the filtered signal of said selected channel.
  • this post-filter comprises an adaptation means according to a comparison involving the input signal of said chosen channel.
  • This adaptation means can be constituted by an open loop path or an adaptation feedback.
  • the post-filter includes adaptive adaptive filtering feedback, based on a recursive comparison based on the difference between the output signal and the input signal of said selected channel.
  • the post-filter comprises an open loop frequency equalizing filter matching means, according to a comparison based on a ratio of power spectral densities, respectively between the filtered signal and the input signal. said chosen channel, brought back to the frequency domain.
  • the post-filter comprises adaptive adaptive filter adaptive feedback, according to a recursive comparison based on the difference between the output signal and the input signal, brought back into the frequency domain.
  • FIG. 8 illustrates a noise reduction device comprising a two-stage forward structure with post-filtering implementing a means of adataption in the sense of the invention, by open loop frequency equalizer filtering according to the second embodiment. supra,
  • FIG. 9 illustrates a noise reduction device comprising a two-stage forward structure with post-filtering implementing adataption feedback within the meaning of the invention, by adaptive frequency matching filtering according to the third embodiment mentioned above,
  • FIG. 10 schematically illustrates telecommunication equipment, such as a telephony terminal, comprising a sound acquisition module including two microphones connected to a noise reduction device in the sense of the invention
  • FIG. 11 illustrates schematically the steps of a method in the sense of the invention, for the implementation of a treatment according to one of the second or third embodiments mentioned above.
  • the noise reduction structure of the forward structure type, comprising: a first input for receiving a first original signal pi (n) , and at least one second input for receiving a second original signal p 2 (n).
  • the first and second signals have two respective substantially correlated noise versions.
  • the structure further comprises:
  • a first subtracter Ss 1 between the first signal and the second filtered signal for delivering a third signal ui (n), the third signal being of reduced noise and corresponding to the first signal to which the second filtered signal is subtracted,
  • the forward structure further comprises, in the example shown in FIGS. 7 to 9:
  • the aforementioned first post-filter at least, comprises an adaptation means according to a comparison involving the first signal pi (n) and: the fifth signal si (n) in the first signal (FIG. 7) and third (FIG. 9) embodiments, or the third signal U 1 (n) in the second embodiment (FIG. 8), as will be seen below.
  • Two possible approaches, within the meaning of the invention, are presented below for the implementation of the post-filter of the signal path p ⁇ (").
  • the first possible approach is based on a direct calculation of gain in the time domain, corresponding to a convergent theoretical post-filter.
  • a frequency domain calculation is preferred.
  • the filter w ft acts as a time equalizer, at each iteration n, of the result of the processing of the stage which precedes it, that is to say of the original forward source separation structure.
  • the filter vt> 2 i is updated only during the phases of non-vocal activity and the equalizer filter w ft is updated only during periods of voice activity.
  • Such an embodiment therefore ensures equalization in amplitude of the acoustic channel while preserving the same phase as the original signal.
  • a voice activity detection module DAV (FIG. 11) is advantageously used to estimate a representative quantity of the noise during the non-activity phases and a representative quantity of the useful signal during the activity phases.
  • a device of the state of the art such as a threshold detector.
  • the adaptive filter w p must be long, and its convergence is disturbed by the presence of noise superimposed on the speech in the signal p ⁇ (n). It is therefore considered that, in practice, this temporal computation approach gives insufficient performance, contrary to the approach based on the frequency calculation described hereinafter.
  • the second approach in the sense of the invention is based on a gain calculation in the frequency domain.
  • the second embodiment of the invention is directed to the direct gain calculation in the frequency domain, corresponding to a theoretical post-filter.
  • a frequency adaptive algorithm is advantageously used, for example of the FLMS type (for "Frequency-domain Least Mean Squares") for calculating the post-filter.
  • An algorithm of this type is described in particular in:
  • FIG. 8 shows a forward structure with calculation of the open loop frequency equalizer filter post-filter for the implementation of the invention according to the second aforementioned embodiment.
  • the frequency gain G ( ⁇ , k) is calculated which is used to equalize in amplitude (and not in phase) the output signal of the separation structure W 1 (n). This gain is calculated from the unbalanced output signal and the mixing signal. It aims to restore, for each spectral component of the output signal, the same amplitude as the corresponding amplitude of the component of the speech signal present in the mixing signal p ⁇ (n).
  • the power spectral densities of the signals W 1 (n) and p ⁇ (n) are estimated here by means of a recursive calculation formula of the first order from the calculation of their fast Fourier transforms (or "FFT").
  • the calculation of the frequency gain is realized by the following formula:
  • the two quantities DSP _signal and DSP _hw represent the power spectral densities estimated from the noisy original signal p ⁇ (n) and, respectively, from the noise-free filtered signal W 1 Oi) on a window of several samples (or " frame "k).
  • the power spectral density of the original signal is calculated during the periods of speech activity by subtracting the power spectral density of the noise, which is estimated during periods of non-speech activity, with the spectral power density of the signal. mixing mixture W 1 (n). The property of the intermittency of the speech signal is therefore exploited to estimate the different power densities of the structure.
  • the speech signal at the output of this structure is recovered after the modification of each frequency component of the signal W 1 U) by the frequency gain G ( ⁇ , k).
  • This signal is finally restored in the time domain following an inverse Fourier transform and a conventional reconstruction, for example of the "overlap-save” type described in particular in the reference Ferrara (1980) given previously.
  • the good estimate of the signal at the output of this structure is based on the good estimation of the speech signal (calculation of its power spectral density).
  • the mixing signal can advantageously be delayed by a delay D (module z ⁇ D of Figures 8 and 9). It is therefore preferable to ensure the correct setting of the delay parameter D for the proper functioning of this structure within the meaning of the invention.
  • this parameter D can be set to half the size of the impulse response of the post-filter.
  • the third embodiment is described below with reference to FIG. 9, presenting a forward structure with calculation of the post-filter, by adaptive frequency filtering.
  • This embodiment is based on the use of an adaptive algorithm for updating the coefficients of gain G ⁇ , k), calculated in the frequency domain.
  • the signals being sampled in successive frames, for each signal frame k, an equation of the following type is provided:
  • G ( ⁇ , k) G ( ⁇ , k-1) + ⁇ ( ⁇ , k) E ( ⁇ , k) U ⁇ ( ⁇ , k), where:
  • G ( ⁇ , k-1) is the calculated gain for a frame k-1, preceding the current frame k,
  • the calculation of the adaptation step ⁇ ( ⁇ , fc), at each frame, is typically performed according to a function which follows the rules and conventional principles of noise reduction. It can be a ratio estimate of respective power spectral densities of useful signal and noise. More particularly, this function is based on the calculation of the signal-to-noise ratio components of each frequency line.
  • the Wiener function is used for calculating the pitch ⁇ ( ⁇ , k) as follows:
  • RSB io ( ⁇ , k) 'k) ⁇ + RSB pn MkY (10)
  • a priori which is defined by the ratio between the estimate of the spectral density of power of the noise-cleaned speech signal and the estimated power spectral density of the noise. This signal-to-noise ratio is therefore given by a formula of the type:
  • DSP_noise ( ⁇ , k) ⁇ DSP_noise ( ⁇ , k) ⁇
  • a variable adaptation step as a function of the signal-to-noise ratio as defined in equation (10) is advantageous because it allows a robust convergence of the adaptive frequency filter and also enables it to correct the signal distortion. of speech.
  • the third embodiment proved to be the most robust to inaccuracies in the calculations of the spectral power densities of all the signals involved in the calculation of the filter.
  • this third embodiment makes it possible to recover a signal close to the initial signal, which has moreover been confirmed by subjective listening.
  • the invention aimed at denoising the speech signal using the forward source separation structure, allows the calculation of the theoretical post-filter regardless of the nature of the post-filter.
  • the embodiments presented above make it possible to correct the disadvantages of the forward structure which produces a distortion of the output speech signal if it is not followed by the post-filter.
  • the present invention also aims at a sound acquisition module, in particular for a telecommunication equipment (for example a fixed or mobile telephony apparatus) as represented in FIG. 10.
  • the sound acquisition module comprises at least:
  • a microphone MIC1 for acquiring a signal comprising a useful component and a noise component
  • a microphone MIC2 for acquiring a noise reference substantially correlated with the noise component of the input signal
  • a FW noise reduction device for supplying a useful signal s u, free from noise and distortion.
  • the signal comprising the useful component is applied as an input signal of the channel comprising adaptive post-filtering within the meaning of the invention, and the noise reference is applied as an input signal in the other channel. of the forward structure of the noise reduction device.
  • the two signals thus acquired (that including the aforementioned noise component and that corresponding to the noise reference) comprise respective substantially correlated versions of noise.
  • the present invention also aims at a noise reduction method in at least one signal, in which a forward structure is provided at least two adaptive noise reduction filter channels W 12 (z), W 21 (z) on two input signals
  • a post-filtering is applied with an adaptation means according to a comparison involving the input signal p ⁇ (n) of said chosen channel, to reduce a distortion on the filtered signal M 1 ⁇ n) of this chosen channel.
  • FIG. 11 shows the process steps for the second and for the third embodiments described above.
  • the DSP power spectral densities (step S101) for evaluating the signal-to-noise ratio (step S102) are calculated and hence the gain G ( ⁇ , k) (step S103).
  • a frequency gain G ( ⁇ , k) (step S103) is calculated by exploiting the aforementioned signal-to-noise ratio and, more particularly, the ratio of the spectral densities of DSP powers. respectively.
  • step SlOl for calculating the spectral densities of DSP powers, the original input signal p ⁇ (n) and the filtered signal W 1 (W) are brought back to the frequency domain.
  • a delay D is applied to the original input signal p ⁇ (n) (step S104), and then the delayed signal is returned to the frequency domain by applying an FFT (step S 105).
  • the filtered, noise-free signal W 1 (z) is also returned to the frequency domain by applying an FFT (step S106).
  • a processor of a noise reduction device can implement the steps of the method.
  • the present invention also provides a computer program, intended to be executed by such a processor, and including instructions for the implementation of the method.
  • Figure 11 can illustrate the flowchart of such a computer program.
  • the present invention is not limited to the embodiment described above by way of example; it extends to other variants.
  • the forward structures of FIGS. 7 to 9 it will be understood that it is possible to provide a forward structure comprising more than two channels and / or more than one adaptive post-filtering in the sense of the invention.
  • the post-filtering w P 2 (z) on the noise reference channel of FIGS. 7 to 9 is not necessary for the implementation of the invention and could be omitted.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

The invention relates to a noise reduction structure of the forward type comprising at least two adaptive filtration channels with noise reduction (w <SUB>12</SUB>

Description

Réduction de bruit et de distorsion dans une structure de type forward Noise and distortion reduction in a forward type structure
La présente invention concerne un traitement de signal, notamment un signal de parole en téléphonie.The present invention relates to a signal processing, in particular a speech signal in telephony.
L'essor des télécommunications a permis au grand public de bénéficier d'outils de communication mobiles. Il est désormais devenu possible et courant de téléphoner de partout (bien entendu dans l'étendue des zones de couverture de réseaux) dans des environnements tels qu'une rue, une gare ou encore un véhicule. Néanmoins, de tels lieux ne bénéficient pas du calme d'un habitat et du confort de communication qu'y offre encore la téléphonie fixe. La gêne due à la perturbation qualifiée de "bruit" est généralement source d' inconfort et s'accentue encore par la dématérialisation de la prise de son (système dit "mains-libres") qui favorise encore l'émergence de bruit du fait de l'augmentation de la distance entre la bouche du locuteur et le microphone.The boom in telecommunications has enabled the general public to benefit from mobile communication tools. It has now become possible and common to telephone from anywhere (of course in the extent of network coverage areas) in environments such as a street, a train station or a vehicle. Nevertheless, such places do not enjoy the calm of a home and the comfort of communication that still offers fixed telephony. The annoyance due to the disturbance described as "noise" is generally a source of discomfort and is further accentuated by the dematerialisation of sound recording (the so-called "hands-free" system) which still encourages the emergence of noise due to increasing the distance between the mouth of the speaker and the microphone.
Dans ces conditions, il se ressent le besoin d'un traitement capable de réduire la gêne qu'occasionnent les bruits additionnels à un signal de parole et d'extraire en particulier l'information utile d'un signal d'observation bruité. Outre cette application de "débruitage", un tel traitement trouverait une mise en œuvre avantageuse en reconnaissance vocale, dont les performances sont fortement altérées lorsque l'utilisateur est plongé dans un environnement bruyant.Under these conditions, there is the need for a treatment capable of reducing the annoyance caused by the additional noises to a speech signal and in particular extracting useful information from a noisy observation signal. In addition to this "denoising" application, such processing would find an advantageous implementation in voice recognition, the performance of which is strongly altered when the user is immersed in a noisy environment.
Des approches successives dans l'état de l'art pour remédier à un tel problème sont exposées ci-après. Ces approches sont basées sur le traitement de signaux issus d'au moins deux capteurs.Successive approaches in the state of the art to remedy such a problem are described below. These approaches are based on the processing of signals from at least two sensors.
Le principe de l'annulation adaptative de bruit (ANC), utilisant typiquement un algorithme de gradient stochastique ou LMS (pour "Least Mean Squares"), est illustré schématiquement en figure 1. Un signal d'entrée x constituant une composante utile et auquel est ajoutée naturellement une composante de bruit, ainsi qu'une référence de bruit b2 corrélée à la composante de bruit ajoutée au signal utile x, se propagent jusqu'à un étage de traitement (partie droite de la figure 1). Le traitement peut être décrit comme suit.The principle of adaptive noise cancellation (ANC), typically using a stochastic gradient (Least Mean Squares) algorithm, is illustrated schematically in Figure 1. An input signal x constitutes a useful component and to which is naturally added a noise component, and a noise reference b 2 correlated to the noise component added to the useful signal x, are propagated up to a treatment stage (right part of Figure 1). The treatment can be described as follows.
On considère une observation bruitée y\ (n) du signal x(n) comportant la composante utile, avec yι {n)=x{n)+b\ {n) , où b\ (n) est une contribution de bruit décorrélée du signal utile x(n). On suppose que l'on dispose, au niveau d'un deuxième capteur, d'une référence de bruit b2 («) > corrélée à b\ (n) mais décorrélée de x(n) . La relation entre b\ {n) et ^ W est supposée linéaire, avec : b\ {n)=H* Z^ W ou Ie signe "*" représente le produit de convolution et H un filtre inconnu, à déterminer.We consider a noisy observation y \ (n) of the signal x (n) including the useful component, with yι {n) = x {n) + b \ {n), where b \ (n) is a decorrelated noise contribution the useful signal x (n). It is assumed that it has, at a second sensor, a noise reference b 2 ( ")> correlated with b \ (n) but uncorrelated with x (n). The relation between b \ {n) and ^ W is assumed to be linear, with: b \ {n) = H * Z ^ W where I e sign "*" represents the convolution product and H an unknown filter, to be determined.
Le principe de l'annulation adaptative de bruit ANC (pour "Adaptive Noise Canceller") vise le filtrage de la référence b2 (") de manière adéquate afin d'obtenir la meilleure estimation de bj (n) (au sens de l'erreur quadratique moyenne minimale), ce qui apporte une réduction du bruit en sortie.The principle of adaptive cancellation ANC noise (for "Adaptive Noise Canceller") is the filtering of the reference b 2 ( ") adequately in order to obtain the best estimate of b j (n) (as defined in minimum mean squared error), which brings a reduction in output noise.
En tenant compte de la relation linéaire entre les bruits dans les deux observations, le signal de sortie S peut s'écrire alors sous la forme :Taking into account the linear relation between the noises in the two observations, the output signal S can be written in the form:
S(n) = x(n) + (H - W)* b2 (n) (1)S (n) = x (n) + (H - W) * b 2 (n) (1)
La solution d'un débruitage idéal donnée par s(n) = x(n) revient à trouver un filtre d'annulation idéal Wopt tel que Wopt = H . Une manière de déterminer le filtre Wopt sans connaissance ni du signal x(n) ni du filtre H consiste à considérer la solution résultant de la minimisation de l'énergie du signal estimé s(n) . En effet, compte tenu de la décorrélation entre bi(n) et x(n), on a d'après la relation (1) : E[S2 GI)] = E[X2 GI)]+ E[{(H -W)* b2 (n))2 ] (2) La valeur minimale de E[s (n)\ est alors atteinte lorsque le second terme de droite de l'équation (2) est minimal (idéalement pour Wopt = H ). La solution de ce problème correspond au filtre de Wiener défini par :The solution of an ideal denoising given by s (n) = x (n) amounts to finding an ideal cancellation filter W opt such that W opt = H. One way of determining the filter W opt without knowledge either of the signal x (n) or of the filter H consists in considering the solution resulting from the minimization of the energy of the estimated signal s (n). Indeed, considering the decorrelation between bi (n) and x (n), we have from relation (1): E [S 2 GI)] = E [X 2 GI]] + E [{( H -W) * b 2 (n)) 2 ] (2) The minimum value of E [s (n) \ is then reached when the second right term of equation (2) is minimal (ideally for W opt = H). The solution of this problem corresponds to the Wiener filter defined by:
W t {z) = i 2 M (3) yb2b2 UJ où la fonction γVlV2 désigne la densité d' intercorrélation spectrale entre les signaux V1 et V2 définie par : W t {z) = i 2 M (3) yb 2 b 2 UJ where the function γ VlV2 denotes the spectral intercorrelation density between the signals V 1 and V 2 defined by:
où V\(z) et V2 \z / représentent respectivement les transformées en Z de vj («) etwhere V \ (z) and V2 \ z / respectively represent the Z transforms of vj («) and
V2 \- n) - V 2 \ - n) -
En absence d'informations sur les statistiques de second ordre des observations, une alternative à la solution de l'équation (3) consiste à effectuer une estimation adaptative de H. On choisit alors une modélisation paramétrique de W sous forme, par exemple, d'un filtre à réponse impulsionnelle finie (RIF) dont on estime les coefficientsIn the absence of information on the second-order statistics of observations, an alternative to the solution of equation (3) is to perform an adaptive estimation of H. We then choose a parametric model of W in the form, for example, of a finite impulse response (FIR) filter whose coefficients are estimated
( (w(k))k >=Q ) suivant un algorithme adaptatif. Ainsi, l'utilisation d'une règle LMS conduit au schéma stochastique : w(n + l, k) = w(n, k) + μs{np2 (n - Jc), pour k ≥ 0 (5) où w(n,k) désigne la valeur du coefficient w(k) d'ordre k de W(z) à la n-ième itération.((w (k)) k> = Q ) according to an adaptive algorithm. Thus, the use of an LMS rule leads to the stochastic scheme: w (n + 1, k) = w (n, k) + μs {np 2 (n - Jc), for k ≥ 0 (5) where w (n, k) denotes the value of the coefficient w (k) of order k of W (z) at the nth iteration.
L'algorithme LMS au sens de l'équation (5) ne converge que vers une approximation de la solution de Wiener, car : • on réalise en fait une approximation d'un filtre de Wiener (a priori à mémoire infinie et non-nécessairement causal) par une structure causale à mémoire finie, et • les algorithmes adaptatifs au sens de l'équation (5) introduisent des désajustements dus à l'utilisation d'un pas d'adaptation non asymptotiquement nul. Il est bien sûr possible de choisir un pas d'adaptation lui-même adaptatif pour atténuer les désajustements, mais sans pour autant les éliminer.The LMS algorithm in the sense of equation (5) only converges to an approximation of the Wiener solution, because: • an approximation of a Wiener filter (a priori with infinite memory and not necessarily causal) by a causal structure with finite memory, and The adaptive algorithms in the sense of equation (5) introduce misalignments due to the use of a non-asymptotically zero adaptation step. It is of course possible to choose an adaptation step itself adaptive to mitigate the misalignments, but without eliminating them.
Ainsi, la prise de son par un système à plusieurs capteurs (dite "multidirectionnelle") permet a priori de meilleures performances de débruitage qu'une prise de son traditionnelle à partir d'un seul capteur.Thus, the sound taken by a multi-sensor system (called "multidirectional") a priori allows better noise reduction performance than a traditional sound pickup from a single sensor.
Toutefois, en pratique, le bruit de référence b2 est souvent mélangé avec une composante provenant du signal utile. C'est notamment le cas lorsque les capteurs sont spatialement proches. Le modèle du mélange est basé maintenant sur deux filtres h^ iz) et h,2\ {z) qui représentent les chemins de couplage physique (par exemple acoustique) entre les signaux sources et les capteurs, comme illustré sur la figure 2, représentant un modèle de mélange des signaux d'entrée X1 (n) et x2(n), provenant par exemple de deux microphones respectifs d'un module d'acquisition sonore.However, in practice, the reference noise b 2 is often mixed with a component from the wanted signal. This is particularly the case when the sensors are spatially close. The model of the mixture is now based on two filters h ^ iz) and h, 2 \ {z) which represent the physical (for example acoustic) coupling paths between the source signals and the sensors, as illustrated in Figure 2, representing a mixing model of the input signals X 1 (n) and x 2 (n), coming for example from two respective microphones of a sound acquisition module.
Ainsi, dans le cas de terminaux compacts, dans lesquels les capteurs sont proches les uns des autres, les signaux captés par les microphones contiennent des mélanges de parole et de bruit. Les techniques de séparation de sources au second ordre (sans utilisation de statistiques d'ordres supérieurs) permettent dans certaines conditions d'extraire la parole du bruit avec un minimum de dégradations.Thus, in the case of compact terminals, in which the sensors are close to each other, the signals picked up by the microphones contain mixtures of speech and noise. Second-order source separation techniques (without the use of higher-order statistics) make it possible under certain conditions to extract speech from noise with a minimum of damage.
Dans l'état de l'art, deux structures conceptuellement simples ont été proposées pour réaliser la réduction de bruit par séparation de sources. Elles sont classiquement dénommées respectivement : - "structure backward" , décrite notamment dans :In the state of the art, two conceptually simple structures have been proposed to achieve noise reduction by source separation. They are classically referred to respectively: - "backward structure", described in particular in:
"Improved adaptive noise cancellation in the présence of signal leakage on the noise référence channel", MJ. Al-Kindi et J. Dunlop, Signal Processing, vol.17, no.3, p.241-250, Juillet 1989 ; et - " structure forward", décrite notamment dans :"Improved adaptive noise cancellation in the presence of signal leakage on the noise reference channel", MJ. Al-Kindi and J. Dunlop, Signal Processing, vol.17, no.3, p.241-250, July 1989; and - "structure forward", described in particular in:
"Signal séparation by symmetric adaptive decorrelation: stability, convergence, and uniqueness" , S. Van Gerven et D.Van Compernolle, IEEE Trans. Signal Processing, vol. 43 No.7, p.1602-1612, Juillet 1995."Signal separation by symmetric adaptive decorrelation: stability, convergence, and uniqueness", S. Van Gerven and D.Van Compernolle, IEEE Trans. Signal Processing, Vol. 43 No.7, p.1602-1612, July 1995.
La structure forward peut être considérée comme une extension de la structure de base de l'annulation adaptative d'écho ANC. Elle résout le problème de la présence du signal utile dans la voie de référence en symétrisant le modèle d'annulation du bruit. Cette structure de séparation de sources présente toutefois l'inconvénient de distordre les signaux de sortie, même s'il a été montré théoriquement que la correction des distorsions serait possible grâce à un traitement des signaux de sortie par post- filtrage, dans Van Gerven et al (équation (12) page 1604). Il semble qu'aucune solution satisfaisante en pratique n'ait été proposée pour mettre en œuvre ce post-filtrage.The forward structure can be considered as an extension of the basic structure of adaptive echo cancellation ANC. It solves the problem of the presence of the useful signal in the reference channel by symmetrizing the noise cancellation model. This source separation structure, however, has the disadvantage of distorting the output signals, even if it has theoretically been shown that the correction of the distortions would be possible thanks to a processing of the output signals by post-filtering, in Van Gerven and al (equation (12) page 1604). It seems that no satisfactory solution in practice has been proposed to implement this post-filtering.
Ainsi, ces deux structures de séparation de sources, backward et forward, ont été proposées dans l'état de l'art afin de séparer les composantes des mélanges issus du modèle illustré sur la figure 2. Ces deux structures sont représentées respectivement par les figures 3 et 4 et résolvent théoriquement le problème dû à la présence du signal utile dans la voie de référence, en symétrisant le modèle d'annulation du bruit.Thus, these two source separation structures, backward and forward, have been proposed in the state of the art in order to separate the components of the mixtures resulting from the model illustrated in FIG. 2. These two structures are respectively represented by the figures. 3 and 4 and theoretically solve the problem due to the presence of the useful signal in the reference channel, by symmetrizing the noise cancellation model.
Les traitements du type représenté sur les figures 3 et 4 ont été initialement proposés pour le débruitage en présence de deux signaux de parole, mais leur utilisation pour d'autres types de signaux est envisageable à condition notamment de satisfaire le modèle de mélange de la figure 2. Ces traitements sont aussi généralisables à un nombre quelconque de composantes en entrée et en sortie en nombre égal.Treatments of the type shown in FIGS. 3 and 4 have initially been proposed for denoising in the presence of two speech signals, but their use for other types of signals is conceivable provided, in particular, that the mixing model of FIG. 2. These treatments can also be generalized to any number of input and output components in equal numbers.
La figure 3 illustre une structure symétrique de type "backward", de débruitage au sens de la référence "Al-Kindi et Dunlop", précitée. La figure 4 illustre une structure symétrique "forward" de débruitage au sens de la référence "Van Gerven et Van Compernolle", précitée. De façon générale, on retiendra que les structures illustrées sur les figures 3 et 4 ramènent le débruitage des observations à un problème d'identification d'un système inverse. La structure de séparation de sources forward, en particulier, présente un avantage de convergence assurée vers la solution mais qui requiert l'utilisation d'un post-filtre origine de problèmes dans l'extraction des signaux de sortie. Cette structure est détaillée ci-après.FIG. 3 illustrates a symmetrical structure of the "backward" type, of denoising in the sense of the reference "Al-Kindi and Dunlop", mentioned above. Figure 4 illustrates a symmetrical structure "forward" denoising within the meaning of the reference "Van Gerven and Van Compernolle", supra. In general, it will be remembered that the structures illustrated in FIGS. 3 and 4 reduce the denoising of the observations to a problem of identification of an inverse system. The forward source separation structure, in particular, has a convergence advantage provided towards the solution but which requires the use of a post-filter causing problems in extracting the output signals. This structure is detailed below.
Selon le modèle de la figure 5, qui généralise le modèle de la figure 2, les signaux de sortie de mélange convolutif pj (n) et p2 («) , qui seront utilisés comme des entrées de la structure de séparation de source forward de la figure 4, sont donnés par :According to the model of FIG. 5, which generalizes the model of FIG. 2, the convolutional mixing output signals p j (n) and p 2 ("), which will be used as inputs of the forward source separation structure of Figure 4, are given by:
(n) = hn* s(n) + h2f b{n) + nx (n) (6) et P2 (n) = h22 * b{n) + hl2 * s(n) + n2 (n) (7) où : hu et Ii22 (non montrées) représentent les réponses impulsionnelles de chaque canal séparément, hγi et /*2i représentent les effets du couplage mutuel entre les deux canaux, (n) = h n * s (n) + h 2 fb {n) + n x (n) (6) and P 2 (n) = h 22 * b {n) + h 12 * s (n) + n 2 (n) (7) where: h u and Ii22 (not shown) represent the impulse responses of each channel separately, hγi and / * 2 i represent the effects of the mutual coupling between the two channels,
- s(ή) et b(n) sont, respectivement, deux sources supposées spatialement ponctuelles de signal utile (par exemple une parole) et de bruit, nγ et «2 représentent les bruits de fond additifs, décorrélés des signaux s(ή) et b(n),- s (ή) and b (n) are, respectively, two spatially punctual sources of useful signal (for example speech) and noise, nγ and "2 represent additive background noise, uncorrelated signals s (ή) and b (n),
- le symbole "*" représentant, bien entendu, l'opération de convolution.- the symbol "*" representing, of course, the convolution operation.
Dans la figure 2 comme dans la figure 5 qui illustre le modèle de mélange des signaux, les filtres hx x et /122 sont supposés être des filtres "identité", ce qui n'altère pas l'utilisation pratique du modèle puisqu'un locuteur utilisateur d'un terminal à plusieurs capteurs est censé rester à proximité des microphones. Cette hypothèse traduit aussi le fait que l'on n'a généralement pas d'information a priori sur la localisation de source de bruit (supposée ponctuelle). On note que /ι12 et /ι21 sont en général non stationnaires. Afin de séparer les composantes des mélanges issus du modèle décrit en référence à la figure 5, la structure forward de séparation de la figure 6 peut être utilisée. La figure 6, présentant la structure forward de séparation des mélanges, complète (avec post-filtres réducteurs de distorsion), comporte alors deux boucles d'adaptation des deux filtres w12(z) et w21 (z), ainsi que les deux post-filtres PFl et PF2 appliqués sur les sorties respectives Sι(n) et s2(n). En théorie, les deux post-filtres permettent l'extraction parfaite (sans distorsion) des signaux originaux à partir des signaux du mélange.In FIG. 2, as in FIG. 5, which illustrates the signal mixing model, the filters h xx and / 1 22 are assumed to be "identity" filters, which does not affect the practical use of the model since User speaker of a multi-sensor terminal is expected to stay close to the microphones. This hypothesis also reflects the fact that we generally do not have information a priori on the location of source of noise (supposedly point). Note that / ι 12 and / ι 21 are generally non-stationary. In order to separate the components of the mixtures resulting from the model described with reference to FIG. 5, the forward separation structure of FIG. 6 can be used. FIG. 6, showing the forward separation structure of the mixtures, complete (with post-distortion reducing filters), then comprises two adaptation loops of the two filters w 12 (z) and w 21 (z), as well as the two PF1 and PF2 post-filters applied to the respective outputs Sι (n) and s 2 (n). In theory, the two post-filters allow the perfect extraction (without distortion) of the original signals from the signals of the mixture.
Il a été observé que la minimisation de la corrélation entre les deux sorties de cette structure de la figure 6 revient exactement à minimiser l'erreur quadratique moyenne de chaque sortie. Les deux sorties u\ in) et u2in) de la structure de séparation sont calculées comme suit : u\(n) = pi in)- p2 in) * W21 in) et U2 in) = p2 in)- pγ in) * w\2 in)It has been observed that the minimization of the correlation between the two outputs of this structure of FIG. 6 exactly amounts to minimizing the mean squared error of each output. The two outputs u \ in) and u 2 in) of the separation structure are calculated as follows: u \ (n) = pi in) - p 2 in) * W 21 in) and U 2 in) = p 2 in ) - pγ in) * w \ 2 in)
En remplaçant les expressions de p\(n ) et p2(n ) données par les équations (6) et (7) dans les expressions de et u2 in) et avec hn et h22 égaux à l'identité, on trouve :By replacing the expressions of p \ (n) and p 2 (n) given by equations (6) and (7) in the expressions of and u 2 in) and with h n and h 22 equal to the identity, we find:
M1 (n) = bin) * [h2ι in)- w2\ in)\+ sin) * [δin)- hγ2 in) * w2\ in)\+ n\ in) - n2 in) * w2\ in) u2in) = sin) * [hι2in)- wι2in)\+ bin) * \δin)-h2ιin) * wι2in)\+ n2in) - nγin) * Wγ2in)M 1 (n) = bin) * [h 2 ι in) - w 2 \ in) \ + sin) * [δin) - hγ 2 in) * w 2 \ in) \ + n \ in) - n 2 in ) * w 2 \ in) u 2 in) = sin) * [hι 2 in) - wι 2 in) \ + bin) * \ δin) -h 2 ιin) * wι 2 in) \ + n 2 in) - nγin) * Wγ 2 in)
Les solutions théoriques optimales pour les deux expressions de u\ in) et u2 in) sont obtenues respectivement lorsque w2χ = h2i et W12 = hi2 . Dans ce cas, et en l'absence des composantes de bruit diffus «j in) et n2 in) sur deux capteurs, les signaux de sortie sont donnés par :The optimal theoretical solutions for the two expressions of u \ in) and u 2 in) are obtained respectively when w 2 χ = h 2i and W 12 = h i2 . In this case, and in the absence of diffuse noise components (j in) and n 2 in) on two sensors, the output signals are given by:
sin) = u\ in) * [δin)- sin) = u \ in) * [δin) -
Les expressions des deux post-filtres théoriques qui interviennent dans le calcul des signaux de sortie de la structure de séparation de sources forward sont donc données par les équations suivantes : - pour le post-filtre PFl : [δ(n)-h12(n) * (8)The expressions of the two theoretical post-filters involved in the calculation of the output signals of the forward source separation structure are thus given by the following equations: for the post-filter PF1: [δ (n) -h 12 (n) * (8)
- et pour le post-filtre PF2 : [δ(n)- h2l (n) * wl2 (n)\ (9)- and for the PF2 post-filter: [δ (n) - h 2l (n) * w l2 (n) \ (9)
Ainsi, lors de la convergence des deux filtres adaptatifs wl2(n) et w2l(n) vers leur solution théorique w2\ = h2χ et w\2 = h\2 , les deux post-filtres PFl et PF2 tendentThus, when the two adaptive filters w l2 (n) and w 2l (n) converge to their theoretical solution w 2 \ = h 2 χ and w \ 2 = h \ 2 , the two post-filters PF1 and PF2 tend to
vers une même solution idéale : |δ(ra)- hi2 (n) * to the same ideal solution: | δ (ra) - h i2 (n) *
Toutefois, en pratique, l'obtention directe de ces deux post-filtres sous les formes des équations (8) et (9) est difficile, car en général on ne connaît pas a priori le filtre hχ2 dans l'équation (8) et le filtre /i2i dans l'équation (9). En remplaçant /i2i Par W 2\ et h\2 par w\2 , on peut obtenir des estimations de ces deux post-filtres conformes aux expressions théoriques des équations (8) et (9). Ce schéma est néanmoins difficilement applicable en pratique car les estimations w2\ et surtout w\2 sont perturbées par la technique d'estimation de ces filtres par filtrage adaptatif. Pour pouvoir calculer directement ces deux post-filtres à partir de leurs expressions données par les équations (8) et (9), il faut que leur inverse ait une caractéristique à phase minimale, ce qui n'est, en général, pas le cas en pratique. Donc cette structure, telle qu'elle a été décrite en référence à la figure 6, donne des résultats insatisfaisants sans utilisation d'autres méthodes et moyens de calcul des post-filtres.However, in practice, the direct obtaining of these two post-filters in the form of equations (8) and (9) is difficult, because in general we do not know a priori the filter hχ 2 in equation (8) and the filter / i 2 i in equation (9). By replacing / i 2 i P ar W 2 \ and h \ 2 by w \ 2 , one can obtain estimates of these two post-filters according to the theoretical expressions of equations (8) and (9). This scheme is nevertheless difficult to apply in practice because the estimates w 2 \ and especially w \ 2 are disturbed by the technique of estimating these filters by adaptive filtering. To be able to directly calculate these two post-filters from their expressions given by equations (8) and (9), their inverse must have a minimal-phase characteristic, which is generally not the case. in practice. Therefore, this structure, as described with reference to FIG. 6, gives unsatisfactory results without the use of other methods and means for calculating the post-filters.
La présente invention vient améliorer la situation.The present invention improves the situation.
Elle a pour objet la détermination de post-filtres satisfaisants de façon à minimiser la distorsion des signaux en sortie, notamment sur un signal de parole en sortie.Its purpose is the determination of satisfactory post-filters so as to minimize the distortion of the output signals, in particular on an output speech signal.
Elle propose à cet effet un dispositif de réduction de bruit dans au moins un signal, comportant : - une structure de type forward à au moins deux voies de filtrage adaptatif à réduction de bruit sur deux signaux d'entrée, pour délivrer deux signaux filtrés et réduits en bruit, et au moins un post-filtre en sortie d'une voie choisie parmi les deux voies, pour réduire une distorsion sur le signal filtré de ladite voie choisie.It proposes for this purpose a device for reducing noise in at least one signal, comprising: a structure of the forward type with at least two adaptive filtering channels with noise reduction on two input signals, for delivering two filtered and noise-reduced signals, and at least one post-filter at the output of a channel chosen from among both channels, to reduce distortion on the filtered signal of said selected channel.
Au sens de l'invention, ce post-filtre comporte un moyen d'adaptation selon une comparaison faisant intervenir le signal d'entrée de ladite voie choisie.Within the meaning of the invention, this post-filter comprises an adaptation means according to a comparison involving the input signal of said chosen channel.
Ce moyen d'adaptation peut être constitué par un chemin en boucle ouverte ou par une rétroaction d'adaptation.This adaptation means can be constituted by an open loop path or an adaptation feedback.
Dans un premier mode de réalisation, le post-filtre comporte une rétroaction d'adaptation par filtrage adaptatif temporel, selon une comparaison récurrente basée sur la différence entre le signal de sortie et le signal d'entrée de ladite voie choisie.In a first embodiment, the post-filter includes adaptive adaptive filtering feedback, based on a recursive comparison based on the difference between the output signal and the input signal of said selected channel.
Dans un deuxième mode de réalisation, le post- filtre comporte un moyen d'adaptation par filtrage égaliseur fréquentiel en boucle ouverte, selon une comparaison basée sur un rapport de densités spectrales de puissance, respectivement entre le signal filtré et le signal d'entrée de ladite voie choisie, ramenés dans le domaine des fréquences.In a second embodiment, the post-filter comprises an open loop frequency equalizing filter matching means, according to a comparison based on a ratio of power spectral densities, respectively between the filtered signal and the input signal. said chosen channel, brought back to the frequency domain.
Dans un troisième mode de réalisation, le post-filtre comporte une rétroaction d'adaptation par filtrage adaptatif fréquentiel, selon une comparaison récurrente basée sur la différence entre le signal de sortie et le signal d'entrée, ramenés dans le domaine des fréquences.In a third embodiment, the post-filter comprises adaptive adaptive filter adaptive feedback, according to a recursive comparison based on the difference between the output signal and the input signal, brought back into the frequency domain.
D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels, outre les figures 1 à 6 décrites ci-avant :Other characteristics and advantages of the invention will appear on examining the detailed description below, and the appended drawings in which, in addition to FIGS. 1 to 6 described above:
- la figure 7 illustre un dispositif de réduction de bruit comportant une structure forward à deux étages avec post-filtrage mettant en œuvre une rétroaction d'adataption au sens de l'invention, par filtrage adaptatif temporel selon le premier mode de réalisation précité,FIG. 7 illustrates a noise reduction device comprising a two-stage forward structure with post-filtering implementing a feedback of adataption in the sense of the invention, by temporal adaptive filtering according to the first embodiment mentioned above,
- la figure 8 illustre un dispositif de réduction de bruit comportant une structure forward à deux étages avec post-filtrage mettant en œuvre un moyen d'adataption au sens de l'invention, par filtrage égaliseur fréquentiel en boucle ouverte selon le deuxième mode de réalisation précité,FIG. 8 illustrates a noise reduction device comprising a two-stage forward structure with post-filtering implementing a means of adataption in the sense of the invention, by open loop frequency equalizer filtering according to the second embodiment. supra,
- la figure 9 illustre un dispositif de réduction de bruit comportant une structure forward à deux étages avec post-filtrage mettant en œuvre une rétroaction d'adataption au sens de l'invention, par filtrage adaptatif fréquentiel selon le troisième mode de réalisation précité,FIG. 9 illustrates a noise reduction device comprising a two-stage forward structure with post-filtering implementing adataption feedback within the meaning of the invention, by adaptive frequency matching filtering according to the third embodiment mentioned above,
- la figure 10 illustre schématiquement un équipement de télécommunication, tel qu'un terminal de téléphonie, comportant un module d'acquisition sonore incluant deux microphones reliés à un dispositif de réduction de bruit au sens de l'invention, et - la figure 11 illustre schématiquement les étapes d'un procédé au sens de l'invention, pour la mise en œuvre d'un traitement selon l'un des deuxième ou troisième modes de réalisation précités.FIG. 10 schematically illustrates telecommunication equipment, such as a telephony terminal, comprising a sound acquisition module including two microphones connected to a noise reduction device in the sense of the invention, and FIG. 11 illustrates schematically the steps of a method in the sense of the invention, for the implementation of a treatment according to one of the second or third embodiments mentioned above.
En référence aux figures 7 à 9, dans l'application de l'invention à des fins de débruitage, on considère essentiellement une seule sortie d'un signal de parole exempt de bruit et qui correspondrait à la voie du signal u\ {n) de la figure 6 présentée précédemment. Cette approche au sens de l'invention diffère typiquement des approches de l'art antérieur donné ci-avant, notamment :With reference to FIGS. 7 to 9, in the application of the invention for denoising purposes, essentially only one output of a noise-free speech signal which corresponds to the signal path u \ {n) is considered. of Figure 6 presented previously. This approach in the sense of the invention typically differs from the approaches of the prior art given above, in particular:
"Signal séparation by symmetric adaptive decorrelation: stability, convergence, and uniqueness" , S.Van Gerven et D.Van Compernolle, IEEE"Signal separation by symmetric adaptive decorrelation: stability, convergence, and uniqueness", S. Van Gerven and D.Van Compernolle, IEEE
Trans. Signal Processing, vol. 43 No.7, p.1602-1612, Juillet 1995.Trans. Signal Processing, Vol. 43 No.7, p.1602-1612, July 1995.
De manière générale, sur les figures 7 à 9 au sens de l'invention données à titre d'exemple, la structure réductrice de bruit, de type structure forward, comportant : - une première entrée pour recevoir un premier signal original pi(n), - et au moins une deuxième entrée pour recevoir un deuxième signal original p2(n). Le premier et le deuxième signal comportent deux versions respectives de bruit sensiblement corrélées. La structure comporte en outre :In a general manner, in FIGS. 7 to 9 in the sense of the invention, given by way of example, the noise reduction structure, of the forward structure type, comprising: a first input for receiving a first original signal pi (n) , and at least one second input for receiving a second original signal p 2 (n). The first and second signals have two respective substantially correlated noise versions. The structure further comprises:
- un premier filtre Wn(Z) (optionnel), de type filtre adaptatif réducteur de bruit, appliqué au premier signal,a first filter Wn (Z) (optional), of adaptive noise reduction filter type, applied to the first signal,
- un deuxième filtre W21 (z), de type filtre adaptatif réducteur de bruit, appliqué au deuxième signal,a second filter W 21 (z), of adaptive noise reduction filter type, applied to the second signal,
- un premier soustracteur Ss1 entre le premier signal et le deuxième signal filtré, pour délivrer un troisième signal ui(n), le troisième signal étant de bruit réduit et correspondant au premier signal auquel est soustrait le deuxième signal filtré,a first subtracter Ss 1 between the first signal and the second filtered signal, for delivering a third signal ui (n), the third signal being of reduced noise and corresponding to the first signal to which the second filtered signal is subtracted,
- un deuxième soustracteur ss2 (optionnel) entre le deuxième signal et le premier signal filtré pour délivrer un quatrième signal u2(n), le quatrième signal étant de composante de signal utile réduite et correspondant au second signal auquel est soustrait le premier signal filtré. Le troisième signal alimente le deuxième filtre pour une rétroaction adaptative et le quatrième signal alimente le premier filtre pour une rétroaction adaptative. La structure forward comporte en outre, dans l'exemple représenté sur les figures 7 à 9 :a second subtracter ss 2 (optional) between the second signal and the first filtered signal to deliver a fourth signal u 2 (n), the fourth signal being of reduced useful signal component and corresponding to the second signal from which the first signal is subtracted filtered. The third signal feeds the second filter for adaptive feedback and the fourth signal feeds the first filter for adaptive feedback. The forward structure further comprises, in the example shown in FIGS. 7 to 9:
- un premier post-filtre, réducteur de distorsion, appliqué au troisième signal ui(n), pour délivrer un cinquième signal S1 (n), en une première sortie de la structure, et - un deuxième post-filtre wp2(z) (optionnel), réducteur de distorsion, appliqué au quatrième signal u2(n), pour délivrer (éventuellement) un sixième signal s2(n), en une deuxième sortie de la structure.a first post-filter, a distortion reducer, applied to the third signal ui (n), for delivering a fifth signal S 1 (n), in a first output of the structure, and a second post-filter w p2 (z) ) (optional), a distortion reducer applied to the fourth signal u 2 (n), to (optionally) deliver a sixth signal s 2 (n) to a second output of the structure.
Selon l'invention, le premier post-filtre précité, au moins, comporte un moyen d'adaptation selon une comparaison faisant intervenir le premier signal pi(n) et : - le cinquième signal si(n) dans les premier (figure 7) et troisième (figure 9) modes de réalisation, ou le troisième signal U1 (n) dans le second mode de réalisation (figure 8), comme on le verra ci-après. Deux approches possibles, au sens de l'invention, sont présentées ci-après pour la mise en œuvre du post-filtre de la voie du signal pγ («) .According to the invention, the aforementioned first post-filter, at least, comprises an adaptation means according to a comparison involving the first signal pi (n) and: the fifth signal si (n) in the first signal (FIG. 7) and third (FIG. 9) embodiments, or the third signal U 1 (n) in the second embodiment (FIG. 8), as will be seen below. Two possible approaches, within the meaning of the invention, are presented below for the implementation of the post-filter of the signal path p γ (").
La première approche possible, mais présentant toutefois quelques inconvénients expliqués plus loin, est basée sur un calcul direct de gain dans le domaine temporel, correspondant à un post-filtre théorique convergent. Dans la deuxième approche, on prévoit plutôt un calcul dans le domaine fréquentiel.The first possible approach, but with some disadvantages explained below, is based on a direct calculation of gain in the time domain, corresponding to a convergent theoretical post-filter. In the second approach, a frequency domain calculation is preferred.
On décrit ici la première approche, selon une structure forward avec calcul du post- filtre par filtrage adaptatif temporel. Une forme de la structure de séparation de source, avec post-filtrage, est donnée par la figure 7.We describe here the first approach, according to a forward structure with calculation of the post-filter by temporal adaptive filtering. A form of the source separation structure, with post-filtering, is given in FIG.
La particularité de cette structure, modifiée par rapport à la structure originale de la figure 6, est telle que le post-filtre donné par les équations (8) et (9) et présenté dans la structure de base, est estimé au moyen du filtre adaptatif wp qui est adapté par la rétroaction de la différence entre sa sortie et celle du mélange, ou "erreur de filtrage". Il s'agit donc d'estimer par identification adaptative le post-filtre dont l'expression théorique est donnée par l'équation (8) en minimisant l'énergie de la différence entre les deux signaux pι(ή) et s\(ή) (correspondant respectivement au premier signal original d'entrée et au cinquième signal, de sortie, de la structure forward). En pratique, on minimise préférentiellement l'erreur quadratique moyenne. On notera que le filtre wp peut être un filtre à réponse impulsionnelle finie (FIR) et peut être mis à jour à partir d'une formule du type : wpi in) = w pi \n-lj+ μe(n)uι (n) ,The peculiarity of this structure, modified with respect to the original structure of FIG. 6, is such that the post-filter given by equations (8) and (9) and presented in the basic structure is estimated by means of the filter adaptive w p which is adapted by the feedback of the difference between its output and that of the mixture, or "filtering error". It is therefore necessary to estimate by adaptive identification the post-filter whose theoretical expression is given by equation (8) by minimizing the energy of the difference between the two signals pι (ή) and s \ (ή ) (respectively corresponding to the first original input signal and the fifth output signal of the forward structure). In practice, the average squared error is preferably minimized. Note that the filter w p can be a finite impulse response (FIR) filter and can be updated from a formula of the type: w pi in) = w pi \ n-lj + μe (n) uι ( not) ,
où e(n) est l'erreur de filtrage donnée par : e(n) = /J1 Oi)- S1 Oi) , et μ un coefficient multiplicatif. On note que le filtre wft agit en tant qu'égaliseur temporel, à chaque itération n, du résultat du traitement de l'étage qui le précède, c'est-à-dire de la structure de séparation de source forward originale.where e (n) is the filtering error given by: e (n) = / J 1 Oi) - S 1 Oi), and μ a multiplicative coefficient. It is noted that the filter w ft acts as a time equalizer, at each iteration n, of the result of the processing of the stage which precedes it, that is to say of the original forward source separation structure.
A la convergence sur plusieurs itérations, le filtre égaliseur temporel wft tend vers l'inverse de la quantité l- hl2 *w2l , avec vt>2i = ^2i - Cette dernière condition est assurée en pratique grâce à l'utilisation de la détection d'activité vocale sur le signal de parole. En effet, suivant un procédé connu de l'état de l'art mais avantageux pour la mise en œuvre de l'invention, le filtre vt>2i est mis à jour uniquement pendant les phases de non-activité vocale et le filtre égaliseur wft est mis à jour uniquement pendant les périodes d'activité vocale. Une telle réalisation assure par conséquent une égalisation en amplitude du canal acoustique en préservant la même phase que le signal original.At convergence over several iterations, the temporal equalizer filter w ft tends to the inverse of the quantity l-h l2 * w 2l , with vt> 2i = ^ 2i - This last condition is ensured in practice by the use of voice activity detection on the speech signal. Indeed, according to a method known from the state of the art but advantageous for the implementation of the invention, the filter vt> 2 i is updated only during the phases of non-vocal activity and the equalizer filter w ft is updated only during periods of voice activity. Such an embodiment therefore ensures equalization in amplitude of the acoustic channel while preserving the same phase as the original signal.
Plus généralement, pour l'approche temporelle, comme pour l'approche fréquentielle décrite plus loin, on utilise avantageusement un module de détection d'activité vocale DAV (figure 11) pour estimer une quantité représentative du bruit pendant les phases de non-activité et une quantité représentative du signal utile pendant les phases d'activité. Pour des signaux audio quelconques, autres que vocaux, on peut prévoir un dispositif de l'état de l'art tel qu'un détecteur de seuil.More generally, for the time approach, as for the frequency approach described below, a voice activity detection module DAV (FIG. 11) is advantageously used to estimate a representative quantity of the noise during the non-activity phases and a representative quantity of the useful signal during the activity phases. For any audio signals, other than voice, one can provide a device of the state of the art such as a threshold detector.
Ce premier mode de réalisation basé sur une adaptation temporelle présente néanmoins quelques inconvénients. Le filtre adaptatif wp doit être long, et sa convergence est perturbée par la présence du bruit superposé à la parole dans le signal pι(n). On considère donc qu'en pratique, cette approche de calcul temporel donne des performances insuffisantes, contrairement à l'approche basée sur le calcul fréquentiel décrite ci-après. La seconde approche au sens de l'invention est basée sur un calcul de gain dans le domaine fréquentiel. Le deuxième mode de réalisation de l'invention vise le calcul direct de gain dans le domaine fréquentiel, correspondant à un post-filtre théorique. Dans le troisième mode de réalisation, toujours selon cette approche "fréquentielle", on utilise avantageusement un algorithme adaptatif fréquentiel, par exemple de type FLMS (pour "Frequency-domain Least Mean Squares") pour le calcul du post-filtre. Un algorithme de ce type est décrit notamment dans :This first embodiment based on a temporal adaptation nevertheless has some disadvantages. The adaptive filter w p must be long, and its convergence is disturbed by the presence of noise superimposed on the speech in the signal pι (n). It is therefore considered that, in practice, this temporal computation approach gives insufficient performance, contrary to the approach based on the frequency calculation described hereinafter. The second approach in the sense of the invention is based on a gain calculation in the frequency domain. The second embodiment of the invention is directed to the direct gain calculation in the frequency domain, corresponding to a theoretical post-filter. In the third embodiment, still according to this "frequency" approach, a frequency adaptive algorithm is advantageously used, for example of the FLMS type (for "Frequency-domain Least Mean Squares") for calculating the post-filter. An algorithm of this type is described in particular in:
"Fast implementation of LMS adaptive filter" , E.R. Ferrara, IEEE Trans."Fast implementation of LMS adaptive filter", E.R. Ferrara, IEEE Trans.
Acoustics Speech and Signal Processing, vol. ASSP-28, pages 474-475, août 1980.Acoustics Speech and Signal Processing, Vol. ASSP-28, pp. 474-475, August 1980.
Sur la figure 8, on a représenté une structure forward avec calcul du post-filtre par filtre égaliseur fréquentiel en boucle ouverte pour la mise en œuvre de l'invention selon le second mode de réalisation précité. On calcule ici le gain fréquentiel G(ω,k) qui est utilisé pour faire une égalisation en amplitude (et non pas en phase) du signal de sortie de la structure de séparation W1 (n) . Ce gain est calculé à partir du signal de sortie non égalisé et du signal de mélange. Il vise à restituer, pour chaque composante spectrale du signal de sortie, la même amplitude que l'amplitude correspondante de la composante du signal de parole présent dans le signal de mélange p\(n ) . Les densités spectrales de puissance des signaux W1 (n) et p\ (n) sont estimées ici au moyen d'une formule de calcul récursif du premier ordre à partir du calcul de leurs transformées de Fourier rapide (ou « FFT »). Le calcul du gain fréquentiel est réalisé par la formule suivante:FIG. 8 shows a forward structure with calculation of the open loop frequency equalizer filter post-filter for the implementation of the invention according to the second aforementioned embodiment. Here, the frequency gain G (ω, k) is calculated which is used to equalize in amplitude (and not in phase) the output signal of the separation structure W 1 (n). This gain is calculated from the unbalanced output signal and the mixing signal. It aims to restore, for each spectral component of the output signal, the same amplitude as the corresponding amplitude of the component of the speech signal present in the mixing signal p \ (n). The power spectral densities of the signals W 1 (n) and p \ (n) are estimated here by means of a recursive calculation formula of the first order from the calculation of their fast Fourier transforms (or "FFT"). The calculation of the frequency gain is realized by the following formula:
où les deux quantités DSP _signal et DSP _hw représentent les densités spectrales de puissance estimées à partir du signal original bruité p\ (n) et, respectivement, du signal filtré exempt de bruit W1 Oi) sur une fenêtre de plusieurs échantillons (ou "trame" k). Avantageusement, la densité spectrale de puissance du signal original est calculée pendant les périodes d'activité vocale en retranchant la densité spectrale de puissance du bruit qui, elle, est estimée pendant les périodes de non activité vocale, à la densité spectrale de puissance du signal de mélange W1 (n) . On exploite donc la propriété de l'intermittence du signal de parole pour estimer les différentes densités de puissance de la structure. Le signal de parole en sortie de cette structure est récupéré après la modification de chaque composante fréquentielle du signal W1 U) par le gain fréquentiel G(ω,k) . Ce signal est enfin restitué dans le domaine temporel suite à une transformée de Fourier inverse et une reconstruction classique, par exemple de type "overlap-save" décrite notamment dans la référence Ferrara (1980) donnée précédemment. where the two quantities DSP _signal and DSP _hw represent the power spectral densities estimated from the noisy original signal p \ (n) and, respectively, from the noise-free filtered signal W 1 Oi) on a window of several samples (or " frame "k). Advantageously, the power spectral density of the original signal is calculated during the periods of speech activity by subtracting the power spectral density of the noise, which is estimated during periods of non-speech activity, with the spectral power density of the signal. mixing mixture W 1 (n). The property of the intermittency of the speech signal is therefore exploited to estimate the different power densities of the structure. The speech signal at the output of this structure is recovered after the modification of each frequency component of the signal W 1 U) by the frequency gain G (ω, k). This signal is finally restored in the time domain following an inverse Fourier transform and a conventional reconstruction, for example of the "overlap-save" type described in particular in the reference Ferrara (1980) given previously.
On comprendra que la bonne estimation du signal en sortie de cette structure est basée sur la bonne estimation du signal de parole (calcul de sa densité spectrale de puissance). Pour ce faire et pour bien synchroniser les signaux à l'entrée de l'égaliseur, le signal de mélange peut avantageusement être retardé par un retard D (module z~D des figures 8 et 9). Il est donc préférable de s'assurer du réglage correct du paramètre de retard D pour le bon fonctionnement de cette structure au sens de l'invention. Typiquement, ce paramètre D peut être réglé à la moitié de la taille de la réponse impulsionnelle du post-filtre.It will be understood that the good estimate of the signal at the output of this structure is based on the good estimation of the speech signal (calculation of its power spectral density). To do this and to properly synchronize the signals at the input of the equalizer, the mixing signal can advantageously be delayed by a delay D (module z ~ D of Figures 8 and 9). It is therefore preferable to ensure the correct setting of the delay parameter D for the proper functioning of this structure within the meaning of the invention. Typically, this parameter D can be set to half the size of the impulse response of the post-filter.
Le troisième mode de réalisation est décrit ci-après en référence à la figure 9, présentant une structure forward avec calcul du post-filtre, par filtrage adaptatif fréquentiel. Ce mode de réalisation est basé sur l'utilisation d'un algorithme adaptatif pour l'actualisation des coefficients du gain G{ω,k) , calculé dans le domaine fréquentiel. Les signaux étant échantillonnés par trames successives, pour chaque trame de signal k, on prévoit une équation du type :The third embodiment is described below with reference to FIG. 9, presenting a forward structure with calculation of the post-filter, by adaptive frequency filtering. This embodiment is based on the use of an adaptive algorithm for updating the coefficients of gain G {ω, k), calculated in the frequency domain. The signals being sampled in successive frames, for each signal frame k, an equation of the following type is provided:
G(ω,k) = G(ω,k -l) + μ(ω,k)E(ω,k)Uι (ω,k) , où :G (ω, k) = G (ω, k-1) + μ (ω, k) E (ω, k) U ι (ω, k), where:
- le terme G(ω,k -Ï) est le gain calculé pour une trame k-l, précédant la trame courante k,the term G (ω, k-1) is the calculated gain for a frame k-1, preceding the current frame k,
- E(ω,k) est l'erreur de filtrage fréquentiel calculée sur chaque trame k, donnée par- E (ω, k) is the frequency filtering error calculated on each frame k, given by
E(<o,k) = Pι (<o,k)- G(<o,k)Uι (<o,k) ,E (<o, k) = Pι (<o, k) - G (<o, k) Uι (<o, k),
- la notation E* symbolise ici le nombre complexe conjugué de la variable E,the notation E * here symbolizes the complex conjugate number of the variable E,
- et les notations P[ (ω,k) et Uι (ω,k) représentent les composantes fréquentielles du signal de mélange et, respectivement, du signal de sortie de la structure de séparation de source forward sans post-filtre.and the notations P [(ω, k) and Uι (ω, k) represent the frequency components of the mixing signal and, respectively, the output signal of the forward source separation structure without post-filter.
Le calcul du pas d'adaptation μ(ω,fc) , à chaque trame, est typiquement réalisé suivant une fonction qui suit les règles et les principes classiques de réduction de bruit. Il peut s'agir d'une estimation de rapport de densités spectrales de puissance respectives de signal utile et de bruit. Plus particulièrement, cette fonction est basée sur le calcul des composantes de rapport signal sur bruit de chaque raie de fréquence. Dans une réalisation particulière, la fonction de Wiener est utilisée pour le calcul du pas μ(ω,k) comme suit :The calculation of the adaptation step μ (ω, fc), at each frame, is typically performed according to a function which follows the rules and conventional principles of noise reduction. It can be a ratio estimate of respective power spectral densities of useful signal and noise. More particularly, this function is based on the calculation of the signal-to-noise ratio components of each frequency line. In a particular embodiment, the Wiener function is used for calculating the pitch μ (ω, k) as follows:
RSB io (ω,k) ^'k) = ι+RSBpnMkY (10) où la quantité RSBprio représente le rapport signal à bruit, a priori, qui est défini par le rapport entre l'estimation de la densité spectrale de puissance du signal de parole nettoyé du bruit et la densité spectrale de puissance estimée du bruit. Ce rapport signal à bruit est donné donc par une formule du type :RSB io (ω, k) 'k) = ι + RSB pn MkY (10) where the RSB prio quantity represents the signal-to-noise ratio, a priori, which is defined by the ratio between the estimate of the spectral density of power of the noise-cleaned speech signal and the estimated power spectral density of the noise. This signal-to-noise ratio is therefore given by a formula of the type:
DSP_signal(ω,k) RSBprio (ω,k) =DSP_signal (ω, k) RSB prio (ω, k) =
DSP _bruit(ω,k)\ L'utilisation d'un pas d'adaptation variable en fonction du rapport signal à bruit tel que défini dans l'équation (10) est avantageuse car elle permet une convergence robuste du filtre adaptatif fréquentiel et lui permet aussi de corriger la distorsion du signal de parole.DSP_noise (ω, k) \ The use of a variable adaptation step as a function of the signal-to-noise ratio as defined in equation (10) is advantageous because it allows a robust convergence of the adaptive frequency filter and also enables it to correct the signal distortion. of speech.
Le signal en sortie de cette structure, en utilisant cette approche de filtrage adaptatif, est obtenu par la relation Si (<o,k) = G(<o,k)Uι (<o,k),The output signal of this structure, using this adaptive filtering approach, is obtained by the relation Si (<o, k) = G (<o, k) Uι (<o, k),
Là encore, le traitement "overlap-save" peut être appliqué pour la reconstruction du signal de sortie temporel noté S1 (n - D) sur la figure 9.Here again, the "overlap-save" processing can be applied for the reconstruction of the temporal output signal denoted S 1 (n-D) in FIG. 9.
Selon les essais réalisés, le troisième mode de réalisation s'est avéré le plus robuste aux imprécisions dans les calculs des densités spectrales de puissance de tous les signaux qui interviennent dans le calcul du filtre. Ainsi, ce troisième mode de réalisation permet de récupérer un signal proche du signal initial, ce qui a été confirmé d'ailleurs par des écoutes subjectives.According to the tests carried out, the third embodiment proved to be the most robust to inaccuracies in the calculations of the spectral power densities of all the signals involved in the calculation of the filter. Thus, this third embodiment makes it possible to recover a signal close to the initial signal, which has moreover been confirmed by subjective listening.
Ainsi, l'invention, visant le débruitage du signal de parole exploitant la structure de séparation de source forward, permet le calcul du post-filtre théorique quelle que soit la nature du post-filtre. Les réalisations présentées précédemment permettent de corriger les inconvénients de la structure forward qui produit une distorsion du signal de parole en sortie si elle n'est pas suivie du post-filtre.Thus, the invention, aimed at denoising the speech signal using the forward source separation structure, allows the calculation of the theoretical post-filter regardless of the nature of the post-filter. The embodiments presented above make it possible to correct the disadvantages of the forward structure which produces a distortion of the output speech signal if it is not followed by the post-filter.
La présente invention vise aussi un module d'acquisition sonore, notamment pour un équipement de télécommunication (par exemple un appareil de téléphonie fixe ou mobile) tel que représenté sur la figure 10. Le module d'acquisition sonore comporte au moins :The present invention also aims at a sound acquisition module, in particular for a telecommunication equipment (for example a fixed or mobile telephony apparatus) as represented in FIG. 10. The sound acquisition module comprises at least:
- un microphone MICl pour acquérir un signal comportant une composante utile et une composante de bruit, - un microphone MIC2 pour acquérir une référence de bruit sensiblement corrélée à la composante de bruit du signal d'entrée, eta microphone MIC1 for acquiring a signal comprising a useful component and a noise component, a microphone MIC2 for acquiring a noise reference substantially correlated with the noise component of the input signal, and
- un dispositif de réduction de bruit FW au sens de l'invention pour délivrer un signal utile su, exempt de bruit et sans distorsion.- a FW noise reduction device according to the invention for supplying a useful signal s u, free from noise and distortion.
Le signal comportant la composante utile est appliqué en tant que signal d'entrée de la voie comportant le post-filtrage adaptatif au sens de l'invention, et la référence de bruit est appliquée en tant que signal d'entrée dans l'autre voie de la structure forward du dispositif de réduction de bruit.The signal comprising the useful component is applied as an input signal of the channel comprising adaptive post-filtering within the meaning of the invention, and the noise reference is applied as an input signal in the other channel. of the forward structure of the noise reduction device.
Préférentiellement, les deux signaux ainsi acquis (celui incluant la composante de bruit précitée et celui correspondant à la référence de bruit) comportent des versions respectives de bruit sensiblement corrélées.Preferably, the two signals thus acquired (that including the aforementioned noise component and that corresponding to the noise reference) comprise respective substantially correlated versions of noise.
La présente invention vise aussi un procédé de réduction de bruit dans au moins un signal, dans lequel on prévoit une structure de type forward à au moins deux voies de filtrage adaptatif à réduction de bruit W12 (z) , W21 (z) sur deux signaux d'entréeThe present invention also aims at a noise reduction method in at least one signal, in which a forward structure is provided at least two adaptive noise reduction filter channels W 12 (z), W 21 (z) on two input signals
P1 (n) , p2 (n) , pour délivrer deux signaux filtrés M1 (w) , u2 (n) , le signal M1 («) étant réduit en bruit. En sortie d'au moins une voie choisie parmi les deux voies de la structure forward, on applique un post-filtrage avec un moyen d'adaptation selon une comparaison faisant intervenir le signal d'entrée pγ (n) de ladite voie choisie, pour réduire une distorsion sur le signal filtré M1 {n) de cette voie choisie.P 1 (n), p 2 (n), for outputting two filtered signals M 1 (w), u 2 (n), the signal M 1 (") being reduced to noise. At the output of at least one channel selected from the two paths of the forward structure, a post-filtering is applied with an adaptation means according to a comparison involving the input signal p γ (n) of said chosen channel, to reduce a distortion on the filtered signal M 1 {n) of this chosen channel.
On a représenté sur la figure 11 les étapes du procédé pour le deuxième et pour le troisième mode de réalisation décrits ci-avant. Sous le contrôle d'une détection d'activité vocale DAV (étape SlOO), on calcule les densités spectrales de puissance DSP (étape SlOl) permettant d'évaluer le rapport signal sur bruit (étape S 102) et, de là, le gain G(ω,k) (étape S103). Dans les deuxième et troisième modes de réalisation décrits ci-avant, on calcule un gain fréquentiel G(ω,k) (étape S103), en exploitant le rapport signal sur bruit précité et, plus particulièrement, le rapport des densités spectrales de puissances DSP respectives. Pour réaliser cette étape SlOl de calcul des densités spectrales de puissances DSP, le signal d'entrée original p\(n) et le signal filtré W1(W) sont ramenés dans le domaine des fréquences. A cet effet, on applique un retard D au signal d'entrée original p\(n) (étape S104), puis on ramène le signal retardé dans le domaine des fréquences par application d'une FFT (étape S 105). On ramène aussi le signal filtré, exempt de bruit, W1(^z) dans le domaine des fréquences par application d'une FFT (étape S106). Une fois le gain calculé G(ω,k) (étape S103), par la technique du second mode de réalisation (égalisation fréquentielle) ou par la technique du troisième mode de réalisation (adaptation fréquentielle), on applique le gain au signal filtré et exprimé dans le domaine des fréquences W1 (^) (étape S107 dans le second comme dans le troisième mode de réalisation). Toutefois, dans le troisième mode de réalisation (illustré par des traits pointillés), on prévoit en outre une soustraction (étape S 108) du signal d'origine P1 (Co) exprimé dans le domaine des fréquences, pour réaliser schématiquement l'adaptation du filtrage. Finalement, le signal Su ainsi filtré est ramené dans le domaine temporel par une FFT inverse (étape S 109).FIG. 11 shows the process steps for the second and for the third embodiments described above. Under the control of a voice activity detection DAV (step S100), the DSP power spectral densities (step S101) for evaluating the signal-to-noise ratio (step S102) are calculated and hence the gain G (ω, k) (step S103). In the second and third embodiments described above, a frequency gain G (ω, k) (step S103) is calculated by exploiting the aforementioned signal-to-noise ratio and, more particularly, the ratio of the spectral densities of DSP powers. respectively. To perform this step SlOl for calculating the spectral densities of DSP powers, the original input signal p \ (n) and the filtered signal W 1 (W) are brought back to the frequency domain. For this purpose, a delay D is applied to the original input signal p \ (n) (step S104), and then the delayed signal is returned to the frequency domain by applying an FFT (step S 105). The filtered, noise-free signal W 1 (z) is also returned to the frequency domain by applying an FFT (step S106). Once the calculated gain G (ω, k) (step S103), by the technique of the second embodiment (frequency equalization) or by the technique of the third embodiment (frequency adaptation), the gain is applied to the filtered signal and expressed in the frequency domain W 1 ()) (step S107 in the second as in the third embodiment). However, in the third embodiment (illustrated by dashed lines), provision is furthermore made for a subtraction (step S 108) of the original signal P 1 (Co) expressed in the frequency domain, to schematically carry out the adaptation filtering. Finally, the signal S u thus filtered is brought back into the time domain by an inverse FFT (step S 109).
Dès lors que les signaux d'entrée peuvent être numériques, un processeur d'un dispositif de réduction de bruit, judicieusement programmé, peut mettre en œuvre les étapes du procédé. A ce titre, la présente invention vise aussi un programme informatique, destiné à être exécuté par un tel processeur, et comportant des instructions pour la mise en œuvre du procédé. La figure 11 peut illustrer l'organigramme d'un tel programme informatique.Since the input signals can be digital, a processor of a noise reduction device, judiciously programmed, can implement the steps of the method. As such, the present invention also provides a computer program, intended to be executed by such a processor, and including instructions for the implementation of the method. Figure 11 can illustrate the flowchart of such a computer program.
Bien entendu, la présente invention ne se limite pas à la forme de réalisation décrite ci- avant à titre d'exemple ; elle s'étend à d'autres variantes. Ainsi, même si deux voies seulement sont représentées dans les structures forward des figures 7 à 9, on comprendra qu'il est possible de prévoir une structure forward comportant plus de deux voies et/ou plus d'un post-filtrage adaptatif au sens de l'invention. Par ailleurs, le post- filtrage wP2(z) sur la voie de la référence de bruit des figures 7 à 9 n'est pas nécessaire pour la mise en œuvre de l'invention et pourrait être supprimé. Of course, the present invention is not limited to the embodiment described above by way of example; it extends to other variants. Thus, even if only two paths are represented in the forward structures of FIGS. 7 to 9, it will be understood that it is possible to provide a forward structure comprising more than two channels and / or more than one adaptive post-filtering in the sense of the invention. Furthermore, the post-filtering w P 2 (z) on the noise reference channel of FIGS. 7 to 9 is not necessary for the implementation of the invention and could be omitted.

Claims

Revendications claims
1. Dispositif de réduction de bruit dans au moins un signal, comportant :1. A device for reducing noise in at least one signal, comprising:
- une structure de type forward à au moins deux voies de filtrage adaptatif à réduction de bruit (w12 (z) , w21 (z) ) sur deux signaux d'entrée ( py (n) , p2 (n) ), pour délivrer deux signaux filtrés et réduits en bruit (M1 (n) , w2 (n) ), et au moins un post- filtre (PFl) en sortie d'une voie choisie parmi les deux voies, pour réduire une distorsion sur le signal filtré ( W1 (w) ) de ladite voie choisie, caractérisé en ce que le post-filtre (PFl) comporte un moyen d'adaptation selon une comparaison faisant intervenir le signal d'entrée ( pγ {n) ) de ladite voie choisie.a forward-type structure with at least two adaptive noise reduction filtering channels (w 12 (z), w 21 (z)) on two input signals (p y (n), p 2 (n)) , to output two filtered and noise-reduced signals (M 1 (n), w 2 (n)), and at least one post-filter (PF1) output from a channel selected from both channels, to reduce distortion on the filtered signal (W 1 (w)) of said chosen channel, characterized in that the post-filter (PF1) comprises an adaptation means according to a comparison involving the input signal (p γ (n)) of said chosen path.
2. Dispositif selon la revendication 1, caractérisé en ce que les deux signaux d'entrée ( P1 {n) , p2 (n) ) comportent des versions respectives de bruit sensiblement corrélées.2. Device according to claim 1, characterized in that the two input signals (P 1 (n), p 2 (n)) comprise respectively substantially correlated versions of noise.
3. Dispositif selon la revendication 2, caractérisé en ce que le signal d'entrée ( pγ {n) ) de ladite voie choisie comporte une composante utile, tandis que le signal d'entrée ( p2 {n) ) de l'autre voie de la structure forward comporte une référence de bruit.3. Device according to claim 2, characterized in that the input signal (p γ {n)) of said selected channel comprises a useful component, while the input signal (p 2 (n)) of the Another way of the forward structure includes a noise reference.
4. Dispositif selon l'une des revendications 1 à 3, caractérisé en ce que le post-filtre (PFl) comporte une rétroaction d'adaptation par filtrage adaptatif temporel selon une comparaison récurrente basée sur la différence entre le signal de sortie ( sγ {n) ) et le signal d'entrée ( pγ {n) ) de ladite voie choisie.4. Device according to one of claims 1 to 3, characterized in that the post-filter (PFl) comprises adaptive feedback adaptive temporal filtering according to a recurrent comparison based on the difference between the output signal (s γ {n)) and the input signal (p γ {n)) of said chosen channel.
5. Dispositif selon l'une des revendications 1 à 3, caractérisé en ce que le post-filtre (PFl) comporte un moyen d'adaptation par filtrage égaliseur fréquentiel en boucle ouverte selon une comparaison basée sur un rapport de densités spectrales de puissance, respectivement entre le signal filtré ( W1 («) ) et le signal d'entrée ( pγ (n) ) de ladite voie choisie, ramenés dans le domaine des fréquences. 5. Device according to one of claims 1 to 3, characterized in that the post-filter (PFl) comprises an open loop frequency equalizer filter matching means according to a comparison based on a spectral power density ratio, respectively between the filtered signal (W 1 (")) and the input signal (p γ (n)) of said selected channel, brought back to the frequency domain.
6. Dispositif selon la revendication 5, dans lequel les signaux d'entrée sont échantillonnés par trames k successives, caractérisé en ce que le filtrage égaliseur fréquentiel met en œuvre le calcul d'un gain G(ω,k) donné, pour une trame courante k, par une formule du type :6. Device according to claim 5, wherein the input signals are sampled in successive k-frames, characterized in that the frequency equalizer filtering implements the calculation of a given gain G (ω, k) for a frame. current k, by a formula of the type:
où les quantités DSP _signal et DSP _hw représentent les densités spectrales de puissance estimées respectivement à partir du signal d'entrée ( pγ (n) ) et du signal filtré (M1 {n) ) de ladite voie choisie, pour la trame courante k. where the quantities DSP _signal and DSP _hw represent the power spectral densities respectively estimated from the input signal (p γ (n)) and the filtered signal (M 1 {n)) of said chosen channel, for the current frame k.
7. Dispositif selon l'une des revendications 1 à 3, caractérisé en ce que le post-filtre (PFl) comporte une rétroaction d'adaptation par filtrage adaptatif fréquentiel selon une comparaison récurrente basée sur la différence entre le signal de sortie ( ^ (w) ) et le signal d'entrée ( P1 {n) ), ramenés dans le domaine des fréquences.7. Device according to one of claims 1 to 3, characterized in that the post-filter (PFl) comprises adaptive adaptive filtering adaptation feedback according to a recurrent comparison based on the difference between the output signal (^ ( w)) and the input signal (P 1 (n)), brought back to the frequency domain.
8. Dispositif selon la revendication 7, dans lequel les signaux d'entrée sont échantillonnés par trames successives, caractérisé en ce que le filtrage adaptatif fréquentiel met en œuvre le calcul récursif d'un gain G(ω,k) donné par une formule8. Device according to claim 7, wherein the input signals are sampled in successive frames, characterized in that the adaptive frequency filtering implements the recursive calculation of a gain G (ω, k) given by a formula.
du type G(ω,k) = G(ω,k -ï) + μ[ω,k)E(^ω,k)Uι [ω,k) , où : - le terme G(ω,k -l) est le gain calculé pour une trame k-l, précédant une trame courante k, - le terme μ(ω,k) est un pas d'adaptation calculé pour chaque trame courante k en fonction d'une estimation de rapport de densités spectrales de puissance respectives de signal utile et de bruit pour ladite voie choisie, - la notation E^ω,k) symbolise ici le complexe conjugué du terme E(ω,k) , ce terme E(ω,k) représentant une erreur de filtrage fréquentiel sur la trame courante k, donnée par une formule du type :Type G (ω, k) = G (ω, k -i) + μ [ω, k) E (^ ω, k) U ι [ω, k), wherein: - the term G (ω, k - l) is the calculated gain for a frame k1, preceding a current frame k, - the term μ (ω, k) is an adaptation step calculated for each current frame k as a function of a ratio estimate of spectral densities of respective power of wanted signal and noise for said selected channel, the notation E ^ ω, k) symbolizes here the conjugate complex of the term E (ω, k), this term E (ω, k) representing a frequency filtering error on the current frame k, given by a formula of the type:
E(ω,fc) = P[ (ω, k)~ G((o,k)Uι ((o, k) , où les notations P[ ((o,k) et Uι ((o,k) représentent des composantes fréquentielles du signal d'entrée et, respectivement, du signal filtré de ladite voie choisie.E (ω, fc) = P [(ω, k) ~ G ((o, k) Uι ((o, k), where the notation P [((o, k) and Uι ((o, k) represent frequency components of the input signal and, respectively, the filtered signal of said selected channel.
9. Dispositif selon l'une des revendications 5 à 8, les signaux d'entrée étant des signaux de parole, caractérisé en ce qu'il comporte un module de détection d'activité vocale (DAV) pour autoriser le calcul de la densité spectrale de puissance de bruit pendant des phases de non-activité vocale et autoriser le calcul de la densité spectrale de puissance de signal utile pendant les phases d'activité vocale.9. Device according to one of claims 5 to 8, the input signals being speech signals, characterized in that it comprises a voice activity detection module (DAV) to allow the calculation of the spectral density. of noise power during voice non-activity phases and allow the calculation of the useful signal power spectral density during the speech activity phases.
10. Dispositif selon l'une des revendications 5 à 9, caractérisé en ce que le post-filtre comporte un module ( z~D ) appliquant un retard choisi au signal d'entrée de la voie choisie ( pγ (n) ) pour déterminer ladite comparaison faisant intervenir le signal d'entrée10. Device according to one of claims 5 to 9, characterized in that the post-filter comprises a module (z ~ D ) applying a selected delay to the input signal of the chosen channel (p γ (n)) for determine said comparison involving the input signal
11. Dispositif selon la revendication 10, caractérisé en ce que le post-filtre est un filtre à réponse finie de longueur donnée, et en ce que le retard (D) appliqué au signal d'entrée est choisi pour correspondre sensiblement à la moitié de la longueur du postfiltre.11. Device according to claim 10, characterized in that the post-filter is a finite-response filter of given length, and in that the delay (D) applied to the input signal is chosen to correspond substantially to half of the length of the postfilter.
12. Module d'acquisition sonore, comprenant au moins : - un microphone pour acquérir un signal comportant une composante utile et une composante de bruit,12. Sound acquisition module, comprising at least: a microphone for acquiring a signal comprising a useful component and a noise component,
- et un microphone pour acquérir une référence de bruit sensiblement corrélée à ladite composante de bruit, caractérisé en ce qu'il comporte un dispositif de réduction de bruit selon l'une des revendications précédentes, dans lequel :and a microphone for acquiring a noise reference substantially correlated with said noise component, characterized in that it comprises a noise reduction device according to one of the preceding claims, wherein:
- le signal comportant la composante utile est appliqué en tant que signal d'entrée de la voie choisie du dispositif de réduction de bruit, et - la référence de bruit est appliquée en tant que signal d'entrée dans l'autre voie du dispositif de réduction de bruit.the signal comprising the useful component is applied as an input signal of the selected channel of the noise reduction device, and the noise reference is applied as an input signal in the other channel of the noise reduction device; noise reduction.
13. Equipement de télécommunication, caractérisé en ce qu'il comporte un module d'acquisition sonore selon la revendication 12.13. Telecommunication equipment, characterized in that it comprises a sound acquisition module according to claim 12.
14. Procédé de réduction de bruit dans au moins un signal, dans lequel on prévoit une structure de type forward à au moins deux voies de filtrage adaptatif à réduction de bruit ( w12 (z) , w21 (z) ) sur deux signaux d'entrée ( /J1 (^) , /?2 («) ), pour délivrer deux signaux filtrés (M1 (n) , M2 (n) ), dont l'un (u\(n)), est réduit en bruit, caractérisé en ce que, en sortie d'au moins une voie choisie parmi les deux voies de la structure forward, on applique un post- filtrage avec un moyen d'adaptation selon une comparaison faisant intervenir le signal d'entrée ( P1 {n) ) de ladite voie choisie, pour réduire une distorsion sur le signal filtré (M1 {n) ) de ladite voie choisie.A method of reducing noise in at least one signal, wherein a forward-looking structure is provided with at least two adaptive noise reduction filtering channels (w 12 (z), w 21 (z)) on two signals input (/ J 1 (^), /? 2 (")), for outputting two filtered signals (M 1 (n), M 2 (n)), one of which (u \ (n)), is reduced to noise, characterized in that, at the output of at least one channel chosen from the two paths of the forward structure, post-filtering is applied with an adaptation means according to a comparison involving the input signal (P 1 (n)) of said selected channel, to reduce distortion on the filtered signal (M 1 (n)) of said selected channel.
15. Programme informatique, destiné à être exécuté par un processeur d'un dispositif de réduction de bruit, caractérisé en ce qu'il comporte des instructions pour la mise en œuvre du procédé selon la revendication 14. Computer program, intended to be executed by a processor of a noise reduction device, characterized in that it comprises instructions for carrying out the method according to claim 14.
EP07823855A 2006-09-28 2007-09-26 Noise and distortion reduction in a forward-type structure Withdrawn EP2078301A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0608525 2006-09-28
PCT/FR2007/052010 WO2008037925A1 (en) 2006-09-28 2007-09-26 Noise and distortion reduction in a forward-type structure

Publications (1)

Publication Number Publication Date
EP2078301A1 true EP2078301A1 (en) 2009-07-15

Family

ID=38093418

Family Applications (1)

Application Number Title Priority Date Filing Date
EP07823855A Withdrawn EP2078301A1 (en) 2006-09-28 2007-09-26 Noise and distortion reduction in a forward-type structure

Country Status (2)

Country Link
EP (1) EP2078301A1 (en)
WO (1) WO2008037925A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8812309B2 (en) * 2008-03-18 2014-08-19 Qualcomm Incorporated Methods and apparatus for suppressing ambient noise using multiple audio signals
US8184816B2 (en) 2008-03-18 2012-05-22 Qualcomm Incorporated Systems and methods for detecting wind noise using multiple audio sources

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001095666A2 (en) * 2000-06-05 2001-12-13 Nanyang Technological University Adaptive directional noise cancelling microphone system
WO2004008731A1 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Echo canceller with model mismatch compensation
US7092529B2 (en) * 2002-11-01 2006-08-15 Nanyang Technological University Adaptive control system for noise cancellation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2008037925A1 *

Also Published As

Publication number Publication date
WO2008037925A1 (en) 2008-04-03

Similar Documents

Publication Publication Date Title
EP1789956B1 (en) Method of processing a noisy sound signal and device for implementing said method
EP1830349B1 (en) Method of noise reduction of an audio signal
EP1356461B1 (en) Noise reduction method and device
EP2680262B1 (en) Method for suppressing noise in an acoustic signal for a multi-microphone audio device operating in a noisy environment
EP0932964B1 (en) Method and device for blind equalizing of transmission channel effects on a digital speech signal
FR2831717A1 (en) INTERFERENCE ELIMINATION METHOD AND SYSTEM FOR MULTISENSOR ANTENNA
EP2057835A1 (en) Method of reducing the residual acoustic echo after echo removal in a hands-free device
EP2131357A1 (en) System for automatic control of the gain applied to an audio signal according to environmental noise
FR2789823A1 (en) UNILATERAL SUB-BAND FILTERS
EP0998166A1 (en) Device for audio processing,receiver and method for filtering the wanted signal and reproducing it in presence of ambient noise
EP2494772A1 (en) Method and device for cancelling acoustic echo by audio watermarking
EP0884926B1 (en) Method and device for optimized processing of an interfering signal when recording sound
EP2774147A1 (en) Audio signal noise attenuation
FR2906070A1 (en) Electronic voice signal preprocessing system for hands free mobile telephone, has non coherent filtering stage filtering output of coherent filtering stage such that signal is successively subjected to coherent and non coherent filterings
EP2078301A1 (en) Noise and distortion reduction in a forward-type structure
KR20110024969A (en) Apparatus for filtering noise by using statistical model in voice signal and method thereof
FR3009121A1 (en) METHOD OF SUPPRESSING LATE REVERBERATION OF A SOUND SIGNAL
FR2906071A1 (en) Electronic filter e.g. non-coherent filter, for e.g. hands-free mobile phone in vehicle, has control section limiting calibration gain such that variation threshold of calibration gain does not exceed preset variation threshold
EP2515300A1 (en) Method and System for noise reduction
FR2790342A1 (en) METHOD AND SYSTEM FOR ANTENNA TREATMENT
WO2022079365A1 (en) Method and device for variable pitch echo cancellation
EP1438815A1 (en) Inter-symbol interference canceller
WO1999027523A1 (en) Method for reconstructing sound signals after noise abatement
WO2010029247A1 (en) Low-distortion noise cancellation
WO2006077005A2 (en) Device for acoustic echo cancellation, and corresponding method and computer program

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20090416

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC MT NL PL PT RO SE SI SK TR

17Q First examination report despatched

Effective date: 20090929

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

DAX Request for extension of the european patent (deleted)
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20111223