EP0918317A1 - Procédé de filtrage fréquentiel appliqué au débruitage de signaux sonores mettant en oeuvre un filtre de Wiener - Google Patents

Procédé de filtrage fréquentiel appliqué au débruitage de signaux sonores mettant en oeuvre un filtre de Wiener Download PDF

Info

Publication number
EP0918317A1
EP0918317A1 EP98402894A EP98402894A EP0918317A1 EP 0918317 A1 EP0918317 A1 EP 0918317A1 EP 98402894 A EP98402894 A EP 98402894A EP 98402894 A EP98402894 A EP 98402894A EP 0918317 A1 EP0918317 A1 EP 0918317A1
Authority
EP
European Patent Office
Prior art keywords
noise
signals
frame
model
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP98402894A
Other languages
German (de)
English (en)
Other versions
EP0918317B1 (fr
Inventor
Dominique Thomson-CSF Prop. Intel. Pastor
Gérard Thomson-CSF Prop. Intel. Reynaud
Pierre-Albert Thomson-CSF Prop. Intel. Breton
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales Avionics SAS
Original Assignee
Thales Avionics SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thales Avionics SAS filed Critical Thales Avionics SAS
Publication of EP0918317A1 publication Critical patent/EP0918317A1/fr
Application granted granted Critical
Publication of EP0918317B1 publication Critical patent/EP0918317B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Definitions

  • the present invention relates to a method of frequency filtering using a Wiener filter.
  • the main areas concern telephone or radiotelephone communications, the voice recognition, sound recording on board aircraft civil or military, and more generally of all noisy vehicles, on-board intercoms, etc.
  • noises result from engines, air conditioning, ventilation of on-board equipment or aerodynamic noises. All these noises are picked up, at less partially, by the microphone in which the pilot or another member of the crew.
  • one of the characteristics noises is to be very variable over time. In indeed, they are very dependent on the operating regime engines (take-off phase, stabilized speed, etc.).
  • Useful signals i.e. signals representing the conversations, also present particularities: they are most often short-lived.
  • voicing relates to elementary characteristics of pieces of speech, and more specifically concerns vowels, as well only part of the consonants: "b”, “d”, “g”, “j”, etc. These letters are characterized by an audio signal from pseudo-periodic structure.
  • These processes generally include the steps following main ones: a division into frames of the signal to denoise, the processing of these frames by a Fourier transform operation (or a similar transform) to move into the field frequency, the proper denoising treatment by digital filtering, and dual processing of the first, by an inverse Fourier transform, to return to the time domain.
  • the last step is a signal reconstruction. This reconstruction can be obtained by multiplying each of the frames by a window of weighting.
  • Wiener filter in particular a so-called optimal Wiener filter. This one presents the advantage of differentiating the frames successive.
  • Wiener's optimal filtering is at the center of the methods signal processing, based on second order statistical characteristics and therefore of the notion of correlation.
  • Wiener filtering allows the separation of decorrelation signals. Its importance is linked to the simplicity of theoretical calculations. In addition, it can apply to a multitude of specific processes, and in particular, with regard to the preferred application targeted by the invention, the extraction of noise polluting a signal of speech.
  • the invention therefore sets itself the aim of overcoming the disadvantages of filtering methods of the known art, especially the main drawback which has just been recalled: the presence of a parasitic residual noise in the denoised signal, called "musical noise".
  • the invention aims to more generally, to increase the intelligibility of the speech, in its main application.
  • the Wiener filter used for digital filtering is modified in an optimized way by introducing a term of energy compensation aimed at overestimating the level of noise.
  • this compensation term is adaptive.
  • Each block referenced 0 to 5, represents a phase of the process, which itself can be subdivided into elementary steps.
  • the method of the invention includes a step of splitting the signal into frames audiophonic to denois (block 0).
  • the frame cutting step as indicated in FIG. 1, is therefore preceded by a sampling digitization step.
  • the stages of digitization and cutting into frames (block 0) are common to known art.
  • the samples numeric thus created are stored in a buffer memory circulating type "FIFO” (ie type "first in - first out ”) to be read as frames successive.
  • FIFO buffer memory circulating type
  • the operations carried out in block 1 consists in identify segments of the signal to be denoised that do not contain only noise.
  • the output of this block consists of a series of digital samples representative of noise only.
  • a noise model is developed at from noisy signals, or more precisely from frames successively read (block 0).
  • block 3 has a step of estimating the spectral density of the frame signal current and its energy calculation.
  • the coefficients of the filter frequency denoising the signal are determined in the manner which will be detailed below.
  • the method of the invention is based on a energy compensation and noise overestimation.
  • the denoised time signal is rebuilt, ensuring the best continuity possible between frames.
  • the signals can be used as is by various methods such as automatic speech recognition. In itself, this phase of the process is common to the known art, and there is no no need to detail the reconstruction method or for processing the signals at the output of block 4.
  • the process makes it possible to modify and optimize the coefficients of the Wiener filter used for the phase of denoising proper (block 4), so as to eliminate or, to say the least, strongly attenuate the so-called parasitic noises "musical".
  • the dispersion is quantified by a coefficient from the analysis carried out in block 2, from the model of noise developed in block 1.
  • the method according to the invention overestimates this spectral density, in y introducing a degree of adaptability in order to optimize the perception of the denoised signal.
  • FIG. 2 very schematically illustrates a Wiener filter used to denoise a noisy signal U (n) .
  • the coefficients of the filter Wiener are modified using parameters determined in blocks 2 and 3, in the way that will now be detailed.
  • the process according to the invention optimally modifies the coefficients of the Wiener filter and introduces a compensation term energy, artificially overestimating the level of noise, with different levels of adaptivity of this compensation.
  • the exponential attenuation coefficient ⁇ is a term commonly used in the literature on digital filtering and, more specifically, denoising. A typical value for this parameter is 0.5.
  • the curve in FIG. 4a shows that the energy of the signal in the frequency band ⁇ , represented by the spectral density ⁇ x , is not negligible.
  • noise denoising alone is okay but it can be too brutal within parts of the useful signal.
  • remains close to a typical equal value to 10, when the noisy signal contains only noise, and varies between 0 and 10, when a useful signal is present in the noisy signal. A degree is therefore advantageously introduced adaptivity.
  • FIG. 5 This third modification is illustrated by FIG. 5.
  • This type of filter therefore has good efficiency. in terms of eliminating degraded signal segments in which speech is absent and decrease in distortions inflicted on the wanted speech signal.
  • the probability of generating "musical noise” is also related, as noted, to the variance of estimates of the spectral density of noise over all frames.
  • the value of the overestimation coefficient is made dependent on the statistical properties of the noise.
  • a coefficient, called maximum below is introduced proportional to the dispersion of the spectral density values of the noise.
  • the maximum coefficient is equal to the maximum ratio, for all the frames of the noise model, between the maximum of the spectral density of the frame of the noise model considered, and the maximum of the estimated spectral density of the noise model.
  • this coefficient characterizes the maximum noise disparity for frequency channels carrying significant energy. Multiplied by the coefficient ⁇ , it provides proportional additional attenuation to this disparity.
  • the method is based on a permanent and automatic search for a noise model. This research is done on the signal samples u (t) digitized and stored in an input buffer memory. This memory is capable of simultaneously memorizing all the samples of several frames of the input signal (at least 2 frames and, in the general case, N frames).
  • the noise model sought consists of a succession of several frames including energy stability and the relative energy level suggest that it is ambient noise and not a speech signal or other disturbing noise. We will see later how this automatic search.
  • ambient noise is a signal with a minimum energy stable in the short term. In the short term, it must hear a few frames, and we will see in the example practice given below that the number of frames intended for assess the noise stability is from 5 to 20. The energy must be stable on several frames, otherwise we must assume that the signal contains speech or a noise other than ambient noise. It must be minimal, otherwise, the signal is considered to contain breathing or phonetic elements of speech resembling noise but superimposed on ambient noise.
  • Figure 6 shows a typical configuration of time evolution of the energy of a signal microphone at the start of a broadcast, speech, with a breathing noise phase, which goes out during a few tens to hundreds of milliseconds to make room for ambient noise alone, after which an energy level high indicates the presence of speech, to finally return to the ambient noise.
  • N1 5
  • the digital values of all the samples of these N frames are stored.
  • This set of NxP samples constitutes the current noise model. It is used in denoising. Analysis of the following frames continues.
  • the ambient noise changes slowly, the change will be taken into account that the comparison threshold with the stored model is greater than 1. If it evolves more rapidly in the increasing direction, evolution risks not not be taken into account, so it is better to schedule a reset from time to time looking for a noise pattern. For example, on an airplane on the ground when stationary, the ambient noise will be relatively low, and it should not be that during the takeoff phase the noise model remains frozen on what it was at standstill the fact that a noise model is only replaced by a less energetic or not much more energetic. The reset methods will be explained later. considered.
  • Figure 7 shows a flowchart of automatic noise pattern search operations ambient.
  • n The number of the current frame in a search operation for a noise model is designated by n and is counted by a counter as the search is carried out. At the initialization of the search, n is set to 1. This number n will be incremented as a model of several successive frames is developed. When analyzing the current frame n , the model already includes by hypothesis n -1 successive frames meeting the conditions imposed to be part of a model.
  • the signal energy of the frame is calculated by summation of the squares of the numerical values of the samples of the frame. It is kept in memory.
  • the ratio between the energies of the two frames is calculated. If this ratio is between two thresholds S and S 'one of which is greater than 1 and the other of which is less than 1, it is considered that the energies of the two frames are close and that the two frames can be part of a noise model.
  • the frames are declared incompatible and the search is reset by resetting n to 1.
  • the rank n of the current frame is incremented, and in an iterative procedure loop, the energy of the next frame is calculated and a comparison with the energy of the previous frame or previous frames, using thresholds S and S ' .
  • the first type of comparison consists in comparing only the energy of the frame n to l energy of the frame n -1.
  • the second type consists in comparing the energy of frame n with each of frames 1 to n -1. The second way leads to a greater homogeneity of the model but it has the disadvantage of not taking into account sufficiently well the cases where the noise level increases or decreases quickly.
  • the energy of the frame of rank n is compared with the energy of the frame of rank n -1 and possibly of other previous frames (not necessarily all for that matter).
  • the number N2 is chosen so as to limit the computation time in the subsequent operations for estimating the spectral noise density.
  • n is less than N2 , the homogeneous frame is added to the previous ones to help build the noise model, n is incremented and the next frame is analyzed.
  • n is equal to N2 , the frame is also added to the previous n -1 homogeneous frames and the model of n homogeneous frames is stored for use in eliminating noise.
  • the search for a model is also reset by setting n to 1.
  • the previous steps relate to the first model search. But once a model has been stored, it can be replaced at any time by a model more recent.
  • the replacement condition is still a energy condition but this time it's about the average energy of the model and no longer on the energy of each frame.
  • the new model is considered to be better and it is stored in place of the previous one. Otherwise, the new model is rejected and the old one remains in force.
  • the threshold SR is preferably slightly greater than 1.
  • the threshold SR is approximately 1.5. Above this threshold we will keep the old model; below this threshold we will replace the old model with the new one. In both cases, the search will be reinitialized by recommencing the reading of a first frame of the input signal u (t) , and setting n to 1.
  • This inhibition is to prevent certain sounds are taken for noise, whereas they are useful phonemes, that a noise model based on these sounds be stored and that noise suppression after the development of the model then tends to remove all similar sounds.
  • Ambient noise can indeed increase significantly and rapidly, for example during the acceleration phase of the engines of an airplane or other vehicle, air, land or sea.
  • the threshold SR requires that the previous noise model be kept when the average noise energy increases too quickly.
  • Periodicity can be based on the average duration of speech in the application considered; for example the speaking times are in average of a few seconds for the crew of an airplane, and resetting can take place with a frequency of a few seconds.
  • Figure 1 block 1
  • the implementation of the method of developing a noise model ( Figure 1: block 1) and, more general of the process according to the invention, can be done at from non-specialized computers, provided with necessary calculation programs and receiving the digitized signal samples as supplied by an analog-digital converter, via a port adapted.
  • This implementation can also be done from a specialized computer based on signal processors digital, which enables faster processing large number of digital signals.
  • the computers are associated, as is well known, with different types of memories, static and dynamic, for recording the programs and the intermediate data, as well as with circulating memories of the "FIFO" type.
  • the system includes an analog-to-digital converter, for digitizing u (t) signals , and a digital-to-analog converter, as needed, if the denoised signals are to be used in analog form.
  • Figure 8 is a summary diagram all the stages of the filtering process according to the invention, in a preferred embodiment.
  • stages are divided into a first subset steps to determine the parameters depending on the noise model, and a second subset steps to determine the dependent parameters only from the current frame of the signal to be denoised.
  • the first step of the first subset includes an initial step of selecting a suitable noise model to the specific application, advantageously a model of noise determined by the method described above, in reference to Figures 6 and 7.
  • This first subset of steps includes two branches.
  • the energy of the frame is calculated for each frame of the noise model (in the time domain), then the average energy of the frames of the model is calculated, which makes it possible to estimate the average energy of the model, i.e. the parameter E x .
  • the second subset of steps also includes two branches.
  • the energy of the current frame, E u is determined, and in the second branch, the spectral density of the current frame ⁇ u is estimated.
  • the coefficients ⁇ and ⁇ are fixed coefficients predetermined, typically equal to 10 and 0.5, respectively.
  • the invention is not not reduced to the only domain of filtering of signals containing noisy speech, even if this domain constitutes one of the favorite apps.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Noise Elimination (AREA)

Abstract

Le procédé selon l'invention utilise le filtrage fréquentiel de Wiener pour débruiter des signaux sonores (u(t)). Il comprend une étape préliminaire consistant à numériser par échantillonnage des signaux sonores à débruiter (u(t)) et à les découper en trames. Le procédé comprend ensuite une première série d'étapes consistant à créer un modèle de bruit (1) sur N trames, estimer (2) la densité spectrale du bruit, l'énergie du modèle de bruit et calculer un coefficient traduisant la dispersion statistique du bruit. Il comprend également une seconde série d'étapes consistant à calculer (3) la densité spectrale des signaux à débruiter, pour chaque trame. Les coefficients du filtre de Wiener sont modifiés (4), pour chaque trame successivement traitée, à l'aide des paramètres déterminés à l'issue des deux séries d'étapes, de manière à introduire une compensation énergétique et une surestimation adaptative du bruit. <IMAGE>

Description

La présente invention concerne un procédé de filtrage fréquentiel mettant en oeuvre un filtre de Wiener.
Elle s'applique notamment, bien que non exclusivement, au débruitage de signaux sonores contenant de la parole captée en milieux bruités et de façon plus générale au débruitage de tous signaux sonores.
Les domaines principaux concernent les communications téléphoniques ou radiotéléphoniques, la reconnaissance vocale, la prise de son à bord d'aéronefs civils ou militaires, et de façon plus générale de tous véhicules bruyants, les intercommunications de bord, etc.
A titre d'exemple non limitatif, dans le cas d'un aéronef, les bruits résultent des moteurs, de la climatisation, de la ventilation des équipements de bord ou des bruits aérodynamiques. Tous ces bruits sont captés, au moins partiellement, par le microphone dans lequel parle le pilote ou un autre membre de l'équipage. En outre, pour ce type d'application en particulier, une des caractéristiques des bruits est d'être très variables dans le temps. En effet, ils sont très dépendants du régime de fonctionnement des moteurs (phase de décollage, régime stabilisé, etc.). Les signaux utiles, c'est-à-dire les signaux représentant les conversations, présentent également des particularités : ils sont le plus souvent de brève durée.
Enfin, quelle que soit l'application envisagée, si on s'intéresse au "voisement", on peut mettre en évidence certaines particularités. Comme il est connu, le voisement concerne des caractéristiques élémentaires de morceaux de parole, et plus précisément concerne les voyelles, ainsi qu'une partie des consonnes : "b", "d", "g", "j", etc. Ces lettres se caractérisent par un signal audiophonique de structure pseudo-périodique.
En traitement de la parole, il est courant de considérer que les régimes stationnaires, notamment le voisement précité, s'établissent sur des durées comprises entre 10 et 20 ms. Cet intervalle de temps est caractéristique des phénomènes élémentaires de la production de la parole et sera dénommé trame ci-après.
Aussi, il est usuel que les procédé de débruitage prennent en compte cette caractéristique importante des signaux sonores comprenant de la parole.
Ces procédés comprennent généralement les étapes principales suivantes : un découpage en trames du signal audiophonique à débruiter, le traitement de ces trames par une opération de transformée de Fourier (ou d'une transformée similaire) pour passer dans le domaine fréquentiel, le traitement de débruitage proprement dit par filtrage numérique, et un traitement, dual du premier, par une transformée de Fourier inverse, pour revenir dans le domaine temporel. La dernière étape consiste en une reconstruction du signal. Cette reconstruction peut être obtenue en multipliant chacune des trames par une fenêtre de pondération.
Un des filtres numériques les plus utilisés pour ce type d'application est le filtre de Wiener, en particulier un filtre de Wiener dit optimal. Celui-ci présente l'avantage de traiter de façon différenciée les trames successives.
En d'autres termes, et de façon plus générale, Le filtrage optimal de Wiener se trouve au centre des méthodes optimales de traitement du signal, basées sur les caractéristiques statistiques du second ordre et donc de la notion de corrélation.
Le filtrage de Wiener permet la séparation des signaux par décorrélation. Son importance est liée à la simplicité des calculs théoriques. En outre, il peut s'appliquer à une multitude de processus particuliers, et notamment, en ce qui concerne l'application préférée visée par l'invention, l'extraction d'un bruit polluant un signal de parole.
Cependant, dans l'art connu, un problème classique rencontré lors du débruitage par filtrage de Wiener est la présence d'un bruit, appelé bruit musical, qui dégrade la perception du signal débruité. Ce bruit musical est dû aux fluctuations des densités spectrales du bruit présent dans le signal d'entrée. Pour certaines trames, en effet, la densité spectrale du bruit est supérieure, au moins sur un canal fréquentiel, à celle du modèle de bruit que l'on utilise dans ces techniques. Dans ce cas, les mécanismes propres au filtrage de Wiener provoquent l'apparition d'un bruit résiduel sur le signal débruité. Celui-ci est particulièrement désagréable d'un point de vue perceptuel de part son instabilité. En effet, lors de l'écoute d'un signal de parole, on distingue des bruits résiduels sous la forme de "glouglou", qui s'apparente à des distorsions que l'on peut attribuer à une grande variabilité du bruit polluant le signal de parole débruité ou signal "utile".
L'invention se fixe donc pour but de pallier les inconvénients des procédés de filtrage de l'art connu, notamment l'inconvénient principal qui vient d'être rappelé : la présence d'un bruit résiduel parasite dans le signal débruité, dit "bruit musical". L'invention vise, de façon plus générale, à augmenter l'intelligibilité de la parole, dans son application principale.
En vue d'atténuer fortement les effets du bruit musical, l'invention tire profit des deux observations expérimentales suivantes :
  • la probabilité de bruit musical est d'autant plus forte que l'estimée des densités spectrales du bruit est instable d'une trame à l'autre ;
  • la probabilité de présence de bruit musical est d'autant plus forte que l'estimée de la densité spectrale du bruit est faible par rapport à sa densité spectrale réelle.
Selon une caractéristique principale de l'invention, le filtre de Wiener utilisé pour le filtrage numérique est modifié de façon optimisée en y introduisant un terme de compensation énergétique visant à surestimer le niveau de bruit. En outre, ce terme de compensation est adaptatif.
L'invention a donc pour objet un procédé de filtrage fréquentiel pour le débruitage de signaux sonores bruités constitués de signaux sonores dits utiles mélangés à des signaux de bruit, le procédé comprenant au moins une étape de découpage desdits signaux sonores en une série de trames identiques d'une longueur déterminée et une étape de filtrage fréquentiel à l'aide d'un filtre de Wiener, caractérisé en ce qu'il comprend, en outre, les étapes suivantes :
  • élaboration à partir desdits signaux bruités d'un modèle de bruit sur un nombre N déterminé desdites trames, N étant compris entre des bornes minimale et maximale prédéterminées ;
  • application d'une transformée de Fourier auxdites N trames ;
  • estimation, pour chaque trame dudit modèle, de la densité spectrale de cette trame ;
  • estimation de la densité spectrale moyenne dudit modèle de bruit ;
  • calcul, à partir de ces deux estimations, d'un coefficient de surestimation statistique, ledit coefficient statistique étant égal au rapport maximal, pour lesdites N trames du modèle de bruit, entre le maximum de la densité spectrale d'une trame considérée dudit modèle de bruit, et le maximum de la densité spectrale estimée du modèle de bruit ;
  • estimation, pour chaque trame desdits signaux à débruiter, de sa densité spectrale ; et
  • modification, pour chaque trame desdits signaux à débruiter, des coefficients dudit filtre de Wiener pour que la relation suivante soit vérifiée : W(ν) = β1 - α · maxi · γ x ν γ u ν ,    relation dans laquelle α et β sont des coefficients fixes prédéterminés, dits coefficient statique de compensation énergétique et coefficient d'atténuation exponentielle, respectivement, ν décrit l'ensemble des canaux fréquentiels de ladite transformée de Fourier, γ u (ν) étant l'estimée de la densité spectrale de la trame à débruiter, γ x (ν) est ladite densité spectrale du modèle de bruit, et maxi ledit coefficient de surestimation statistique, modifiant le coefficient statique de compensation énergétique α.
L'invention sera mieux comprise et d'autres caractéristiques et avantages apparaítront à la lecture de la description qui suit en référence aux figures annexées, parmi lesquelles :
  • la figure 1 illustre, sous forme de bloc diagramme, les principales étapes du procédé selon l'invention ;
  • la figure 2 illustre schématiquement un filtre de Wiener de l'art connu ;
  • la figure 3 est un diagramme illustrant la densité spectrale d'un modèle de bruit et les densités spectrales γ u de chaque trame de ce modèle de bruit ;
  • les figures 4a et 4b sont des diagrammes comparatifs illustrant ces mêmes paramètres avec surestimation de la densité spectrale du modèle de bruit ;
  • la figure 5 est un diagramme illustrant ces mêmes paramètres avec surestimation adaptative de la densité spectrale du modèle de bruit ;
  • la figure 6 représente un exemple typique de signal issu d'une prise de son bruitée ;
  • la figure 7 est un organigramme représentant les étapes d'un procédé particulier de recherche d'un modèle de bruit ;
  • et la figure 8 est un organigramme détaillé représentant les étapes du procédé de filtrage numérique selon un mode de réalisation préféré de l'invention.
Les principales phases et étapes du procédé selon l'invention vont maintenant être décrites par référence au bloc diagramme de la figure 1. Chaque bloc, référencés 0 à 5, représente une phase du procédé, elle-même pouvant être subdivisée en étapes élémentaires.
Dans ce qui suit, pour fixer les idées et sans que cela limite en quoi que ce soit la portée de l'invention, on va se placer, dans le cadre du traitement de la parole bruitée. Comme il a été indiqué précédemment, il est courant de considérer que les régimes stationnaires, notamment le voisement, s'établissent sur des durées comprises entre 10 et 20 ms, intervalle de temps caractéristique des phénomènes élémentaires de la production de la parole et qui sera dénommé trame ci-après.
Comme dans l'art connu, le procédé de l'invention, comprend une étape de découpage en trames du signal audiophonique à débruiter (bloc 0).
Dans la pratique, on met en oeuvre des techniques numériques. Aussi, les signaux de trame ne sont pas des signaux à "évolution continue", mais des signaux discrets, obtenus par échantillonnage. On suppose que les signaux sont échantillonnés à la période Te , avant traitement numérique. Il est courant de considérer alors 2p échantillons pour une trame de signal, en choisissant p de manière à ce que la valeur 2p Te soit de l'ordre grandeur de la durée D d'une trame. A titre d'exemple, pour une fréquence d'échantillonnage de 10 kHz, on choisit souvent des trames de 12,8 ms, de manière à pouvoir disposer de 128 points pour chaque trame, ce qui constitue une puissance de deux. Le nombre d'échantillons correspondant à une trame sera noté ci-après LGtrame. La relation suivante : D = LGtrame × Te est donc satisfaite. L'étape de découpage en trames, comme indiqué sur la figure 1, est donc précédée d'une étape de numérisation par échantillonnage.
Par convention, le signal d'entrée sera noté u(t), le signal utile s(t) et le bruit perturbateur x(t) de telle façon que : u(t) = s(t) + x(t) en temps continu u(kTe ) = s(kTe ) + x(kTe ) en temps discret
Les étapes de numérisation et de découpage en trames (bloc 0) sont communes à l'art connu. Les échantillons numériques ainsi créés sont rangés dans une mémoire tampon circulante de type "FIFO" (c'est-à-dire du type "premier entré - premier sorti") afin d'être lus sous forme de trames successives.
Les trames successivement lues subissent alors une série d'étapes de traitement autonomes, selon deux voies que l'on peut qualifier de "parallèles".
Les opérations effectuées dans le bloc 1, consiste à identifier des segments du signal à débruiter ne contenant que du bruit. La sortie de ce bloc est constituée d'une suite d'échantillons numériques représentatifs du bruit seul. En d'autres termes, un modèle de bruit est élaboré à partir des signaux bruités, ou plus précisément à partir des trames successivement lues (bloc 0). De nombreux procédés peuvent être mis en oeuvre et un exemple de procédé de recherche de modèle de bruit sera explicité ci-après.
Dans le bloc 2, trois étapes sont réalisées et consistent, à partir des échantillons fournis par le bloc 1, à effectuer :
  • l'estimation de la densité spectrale moyenne du bruit (par exemple par spectre moyen et corrélogramme lissé) ;
  • la détermination de l'énergie moyenne du modèle de bruit ;
  • et la détermination d'un coefficient traduisant la dispersion statistique du bruit.
Les étapes ci-dessus, et notamment la dernière étape qui constitue une des caractéristiques principales de l'invention, seront détaillées ci-après.
Dans la branche "parallèle", le bloc 3 comporte une étape d'estimation de la densité spectrale de la trame courante de signal et de calcul de son énergie.
Dans le bloc 4, selon une autre caractéristique essentielle de l'invention, les coefficients du filtre fréquentiel effectuant le débruitage du signal sont déterminés de la manière qui sera détaillée ci-après. Comme il a été indiqué, le procédé de l'invention est basé sur une compensation énergétique et une surestimation du bruit.
Enfin, dans le bloc 5, le signal temporel débruité est reconstruit, en assurant la meilleure continuité possible entre les trames. Dans d'autres applications que l'application principale visée par l'invention les signaux peuvent être exploités tels quels par des divers procédés tels que la reconnaissance automatique de la parole. En soi, cette phase du procédé est commune à l'art connu, et il n'y a pas lieu de détailler la méthode de reconstruction ou d'exploitation des signaux en sortie du bloc 4.
Selon la caractéristique principale de l'invention, le procédé permet de modifier et d'optimiser les coefficients du filtre de Wiener utilisé pour la phase de débruitage proprement dite (bloc 4), de façon à éliminer ou, pour le moins, fortement atténuer, les bruits parasites dits "musicaux".
Comme il a été rappelé, ces bruits sont attribuables à deux causes principales :
  • a/ la probabilité de bruit musical est d'autant plus forte que l'estimée des densités spectrales du bruit est instable d'une trame à l'autre ;
  • b/ la probabilité de présence de bruit musical est d'autant plus forte que l'estimée de la densité spectrale du bruit est faible par rapport à la densité spectrale réelle du bruit.
  • Selon l'invention, en relation avec la cause a/, la dispersion est quantifiée par un coefficient issu de l'analyse effectuée dans le bloc 2, à partir du modèle de bruit élaboré dans le bloc 1.
    De même, en relation avec la cause b/, pour réduire l'influence de la densité spectrale du bruit, en particulier lorsqu'elle est faible, le procédé selon l'invention effectue une surestimation de cette densité spectrale, en y introduisant un degré d'adaptivité afin d'optimiser la perception du signal débruité.
    Avant de décrire plus en détail le procédé de l'invention, il est utile de rappeler brièvement les caractéristiques d'un filtre de Wiener selon l'art connu.
    La figure 2 illustre de façon très schématique un filtre de Wiener utilisé pour débruiter un signal bruité U(n).
    A titre d'exemples non limitatifs, des filtres de Wiener sont décrits dans les livres suivants, auxquels on pourra se référer avec profit :
    • Yves THOMAS : "Signaux et systèmes linéaires", éditions MASSON (1994) ; et :
    • François MICHAUT : "Méthodes adaptatives pour le signal", édition HERMES (1992).
    Sur la figure 2 les conventions suivantes ont été adoptées :
    • U(n) : transformée de Fourier discrète du processus aléatoire observé, soit le signal bruité ;
    • S(n) : transformée de Fourier discrète du processus "désiré", à estimer par filtrage linéaire de U(n) ;
    • X(n) : transformée de Fourier discrète du bruit additif polluant le signal utile ;
    • S and(n) : estimation de S(n) exprimée dans le domaine de
    Fourier, avec ε=S and-S= erreur d'estimation (S étant le signal débruité réel) ; et
    • W(z) : filtre d'estimation exprimé dans le domaine fréquentiel.
    Le filtre optimal de Wiener minimise la distance entre les variables aléatoires S(n) et S and(n) mesurée par l'erreur quadratique moyenne J : J=E[(S(n) - S (n))2]
    La minimisation de ce critère revient à rendre l'erreur d'estimation orthogonale au signal observé, ce qui se traduit par le principe d'orthogonalité : E[ε(n).U*(n)] = 0
    En notant :
    γS
    la densité spectrale du signal utile, et
    γX
    la densité spectrale du bruit parasite,
       le filtre de Wiener est décrit par la relation suivante : W(n) = γ S(n) γ S(n) + γ X(n)
    En prenant en compte l'indépendance de S(n) et de X(n), on obtient la relation ci-dessous : γUS + γX    relation dans laquelle γU représentant la densité spectrale du signal observé.
    La relation décrivant le filtre de Wiener devient donc finalement : W(n) = γ S(n) γ S(n) + γ X(n) = 1 - γ X(n) γ U(n)
    En pratique, c'est cette seconde formulation du filtre de Wiener qui est utilisée, puisqu'elle ne fait intervenir que des termes directement accessibles, c'est-à-dire, d'une part, le signal bruité reçu du bloc 3 et, d'autre part, le bruit, préalablement déterminé par le calcul du modèle de bruit (bloc 1).
    Il doit être remarqué que les coefficients W(n) du filtre de Wiener sont toujours positifs. Si des artefacts de calcul provoque une valeur négative pour un coefficient, ce coefficient est rendu égal à zéro.
    Selon l'art connu, la suppression du bruit additif par une méthode de soustraction spectrale, telle qu'elle est réalisée par un filtre Wiener, débouche sur la création de bruits dits "musicaux". Pour éviter l'apparition de ces bruits parasites désagréables à l'écoute et nuisibles à l'intelligibilité de la parole, ou pour le moins empêcher au maximum leur apparition, selon une caractéristique essentielle de l'invention, les coefficients du filtre de Wiener sont modifiés à l'aide de paramètres déterminés dans les blocs 2 et 3, de la manière qui va maintenant être détaillée.
    Lorsque le signal d'entrée ne contient que du bruit, le "bruit musical" supplémentaire est présent parce que, dans la pratique, l'estimation du rapport γ s / γ u fluctue à chaque fréquence, bien qu'en théorie ce rapport devrait être égal à l'unité quelles que soient les fréquences. Ce sont ces erreurs d'estimation qui produisent des filtres atténuateurs dont les variations des coefficients sont aléatoires, selon les fréquences et au cours du temps.
    Pour fixer les idées, on considère l'exemple du débruitage d'un bruit seul, échantillonné à 44 kHz. On détermine la densité spectrale γ x d'un modèle de bruit choisi à l'aide de ce signal et les densités spectrales γ u de chaque trame (de longueur LGtrame) de ce bruit.
    On a représenté la variation de ces deux paramètres sous forme de courbes dans le diagramme de la figure 3, en fonction du nombre de canaux de transformée de Fourier FFT. Pour tracer les courbes, il a été supposé que la longueur de trame était de 128 échantillons, soit LGtrame=128.
    Ce diagramme montre clairement que les allures des deux courbes γ x et γ u sont similaires mais les deux estimées présentent une différence d'amplitude nette. Le pic principal de γ u , qui se situe à la fréquence 2.75 kHz (64 canaux FFT correspondant à 22 kHz, soit la demi-fréquence d'échantillonnage) a une amplitude environ sept fois supérieure à celui de γ x situé à la même fréquence. Ceci constitue la raison principale de la présence des bruits "musicaux". Lorsque, pour certaines fréquences référencées ν, γ u (ν) est bien supérieur à γ x (ν), cela signifie, en théorie, que la trame ne contient pas seulement du bruit mais une autre partie de signal. Dans ce cas, le filtrage de Wiener selon l'art connu débruite la trame correspondante comme si elle contenait du signal de parole utile, ce qui entraíne la présence de résidus de bruits.
    Pour éviter cet effet parasite, le procédé selon l'invention modifie de façon optimisée les coefficients du filtre de Wiener et introduit un terme de compensation énergétique, venant surestimer artificiellement le niveau du bruit, avec différents niveaux d'adaptativité de cette compensation.
    Les coefficients du filtre de Wiener modifié obéissent à la relation suivante : W(ν) = β1 - α · maxi · Ex Eu · γ x ν γ u ν
    En se reportant de nouveau à la relation (7), on constate aisément que quatre nouveaux termes ont été introduits, à savoir :
  • β : coefficient d'atténuation exponentielle ;
  • α : coefficient statique de compensation énergétique ;
  • E x / E u : rapport de pondération énergétique ; et
  • maxi : coefficient de surestimation statistique issu de l'analyse statistique du bruit, ce à partir d'un modèle de bruit établi lors de la phase du procédé correspondant au bloc 1.
  • Chacun de ces termes va maintenant être explicité.
    Le coefficient d'atténuation exponentielle β est un terme communément utilisé dans la littérature consacré au domaine du filtrage numérique et, plus particulièrement, au débruitage. Une valeur typique de ce paramètre est de 0,5.
    A titre d'exemple non limitatif, on pourra se reporter à l'article de L. Arslan, A. Mc Cree et V. Viswana- Than, intitulé :"New Methods for adaptive noise suppression", IEEEE, mai 1995, pages 812-815.
    Le coefficient de compensation énergétique statique α permet de surestimer le bruit et est particulièrement pertinent dans le cas de la suppression de bruit seul. En effet, une valeur typique de α=10 appliquée à l'exemple de la figure 3 augmente l'estimée du spectre moyen de bruit γ x d'environ +10 dB, ce qui permet alors de diminuer le niveau de bruit résiduel, puisque les coefficients du filtre de Wiener ne peuvent être négatifs. Dans le cas contraire, ils sont alors forcés à zéro.
    Cependant, si cette modification est très efficace pour éliminer le bruit seul, elle pose à son tour des problèmes lorsque les trames à débruiter contiennent du signal utile. Si ce signal utile est beaucoup plus énergétique que le bruit, ce coefficient multiplicateur α n'a pas d'effet sur la dégradation de ce signal. Mais, dans le cas contraire, il peut exister des fréquences ν pour lesquelles une trame de signal utile a une énergie non négligeable mais proche de celle du bruit pour les mêmes fréquences. Dans ce cas, la multiplication par α de γ x (ν) impose des coefficients de Wiener W(ν) nuls et donc entraíne une disparition de l'énergie du signal pour ces fréquences.
    Ce problème est illustré par les figures 4a et 4b. Sur ces figures les conventions suivantes ont été adoptées.
  • γ u : : densité spectrale de la trame de signal considérée (trame de signal faiblement énergétique devant le bruit) ; et
  • γ x : densité spectrale du modèle de bruit choisi (bloc 1).
  • La courbe de la figure 4a permet de constater que l'énergie du signal dans la bande de fréquences Δν, représentée par la densité spectrale γ x , n'est pas négligeable.
    En se référant à la figure 4b, on peut constater que la multiplication de γ x par le paramètre α=10 rend α.γx supérieur à γ u dans la bande Δν. Il s'ensuit que le gain de Wiener est nul pour cette bande de fréquences qui n'apparaít plus dans la trame débruitée.
    Le rapport de pondération énergétique décrit ci-dessous permet de réduire cette distorsion dans le signal débruité.
    Comme indiqué précédemment, le débruitage du bruit seul est correct, mais il peut être trop brutal dans les parties du signal utile.
    Dans une variante préférée de l'invention, on remédie à cet inconvénient en faisant varier le coefficient α, ce en fonction de la présence ou non d'une partie de signal utile dans le signal à débruiter. De façon avantageuse, α reste proche de d'une valeur typique égale à 10, lorsque le signal bruité ne contient que du bruit, et varie entre 0 et 10, lorsqu'un signal utile est présent dans le signal bruité. On introduit donc avantageusement un degré d'adaptativité.
    C'est la fonction qui est assignée au rapport E x / E u qui vient multiplier α dans la relation (8), rapport dans lequel E x est l'énergie moyenne du modèle de bruit et E u l'énergie de la trame courante. Cela permet donc aux coefficients du filtre de Wiener de changer à chaque trame de façon différenciée selon la présence plus ou moins grande (en terme d'énergie) du signal de parole.
    Si E x E u, alors α≅10 et la trame est considérée comme du bruit seul. Elle est correctement débruitée.
    Si au contraire E x << E u, cela signifie que la trame considérée est très énergétique devant le bruit et qu'il est nécessaire d'atténuer au minimum cette partie de signal.
    Cette troisième modification est illustrée par la figure 5. Sur cette figure, la trame de signal considérée est la même que celle utilisée pour les figures 4a et 4b, α = 10 et E x E u = 0,2.
    Grâce à cette pondération du coefficient α par E xx / E uu , la bande de fréquences Δν' dans laquelle le signal utile est éliminé, (c'est-à-dire les fréquences pour lesquelles les coefficients de γ x sont supérieurs à ceux de γ u ) est bien moins importante que lors de la modification par multiplication du seul coefficient α=10.
    Ce type de filtre présente donc une bonne efficacité en termes d'élimination des segments de signal dégradés dans lesquels la parole est absente et de diminution des distorsions infligées au signal de parole utile.
    La probabilité de génération du "bruit musical" est également liée, comme il a été indiqué, à la variance des estimées de la densité spectrale du bruit sur l'ensemble des trames.
    En effet, plus les densités spectrales estimées du bruit varient d'une trame à l'autre, plus la formation du bruit "musical" est probable.
    Selon un autre aspect important de l'invention, on rend dépendant la valeur du coefficient de surestimation des propriétés statistiques du bruit. Pour ce faire, il est introduit un coefficient, appelé maxi ci-après, proportionnel à la dispersion des valeurs de densités spectrales du bruit.
    Le coefficient de surestimation devient alors :
       α = α*maxi, avec maxi satisfaisant la relation suivante :
    Figure 00170001
    relation dans laquelle :
    • N est le nombre de trames du modèle de bruit ;
    • ν décrit l'ensemble des canaux fréquentiels, soit LGtrame/2 canaux ;
    • γ i(ν) est la densité spectrale de la i ème trame du modèle de bruit dans le canal ν ; et
    • γ x(ν) est la densité spectrale du modèle de bruit.
    Le coefficient maxi est égal au rapport maximal, pour toutes les trames du modèle de bruit, entre le maximum de la densité spectrale de la trame du modèle de bruit considérée, et le maximum de la densité spectrale estimée du modèle de bruit.
    En d'autres termes, ce coefficient caractérise la disparité maximale du bruit pour les canaux fréquentiels portant une énergie importante. Multiplié par le coefficient α, il apporte une atténuation complémentaire proportionnelle à cette disparité.
    Pour élaborer une partie des paramètres entrant dans la modification des coefficients du filtre de Wiener, il est nécessaire de disposer d'un modèle de bruit (bloc 1 de la figure 1).
    L'élaboration d'un modèle de bruit d'un signal bruité est une opération classique en soi. Cependant, la méthode spécifique mise en oeuvre pour cette opération peut être une méthode de l'art connu, mais aussi une méthode originale.
    On va décrire ci-après, par référence aux figures 6 et 7, une méthode d'élaboration d'un modèle de bruit, particulièrement adaptée aux applications principales visées par le procédé de l'invention, notamment le débruitage de signaux de parole bruités.
    La méthode repose sur une recherche permanente et automatique d'un modèle de bruit. Cette recherche est faite sur les échantillons de signal u(t) numérisés et stockés dans une mémoire tampon d'entrée. Cette mémoire est capable de mémoriser simultanément tous les échantillons de plusieurs trames du signal d'entrée (au moins 2 trames et, dans le cas général, N trames).
    Le modèle de bruit recherché est constitué par une succession de plusieurs trames dont la stabilité en énergie et le niveau d'énergie relative font penser qu'il s'agit d'un bruit ambiant et non d'un signal de parole ou d'un autre bruit perturbateur. On verra plus loin comment se fait cette recherche automatique.
    Lorsqu'un modèle de bruit est trouvé, tous les échantillons des N trames successives représentant ce modèle de bruit sont conservés en mémoire, de sorte que le spectre de ce bruit peut être analysé et peut servir au débruitage. Mais la recherche automatique de bruit continue à partir du signal d'entrée u(t) pour trouver éventuellement un modèle plus récent et plus adapté, soit parce qu'il représente mieux le bruit ambiant, soit parce que le bruit ambiant a évolué. Le modèle de bruit plus récent est mis en mémoire à la place du précédent, si la comparaison avec le précédent montre qu'il est plus représentatif du bruit ambiant.
    Les postulats de départ pour l'élaboration automatique d'un modèle de bruit sont les suivants :
    • le bruit qu'on veut éliminer est le bruit de fond ambiant,
    • le bruit ambiant a une énergie relativement stable à court terme,
    • la parole est le plus souvent précédée d'un bruit de respiration du pilote qu'il ne faut pas confondre avec le bruit ambiant; mais ce bruit de respiration s'éteint quelques centaines de millisecondes avant la première émission de parole proprement dite, de sorte qu'on ne retrouve que le bruit ambiant juste avant l'émission de parole,
    • et enfin, les bruits et la parole se superposent en termes d'énergie de signal, de sorte qu'un signal contenant de la parole ou un bruit perturbateur, y compris la respiration dans le microphone, contient forcément plus d'énergie qu'un signal de bruit ambiant.
    Il en résulte qu'on fera l'hypothèse simple suivante : le bruit ambiant est un signal présentant une énergie minimale stable à court terme. Par court terme, il faut entendre quelques trames, et on verra dans l'exemple pratique donné ci-après que le nombre de trames destiné à évaluer la stabilité du bruit est de 5 à 20. L'énergie doit être stable sur plusieurs trames, faute de quoi on doit supposer que le signal contient plutôt de la parole ou un bruit autre que le bruit ambiant. Elle doit être minimale, faute de quoi on considère que le signal contient de la respiration ou des éléments phonétiques de parole ressemblant à du bruit mais se superposant au bruit ambiant.
    La figure 6 représente une configuration typique d'évolution temporelle de l'énergie d'un signal microphonique au moment d'un début d'émission, de parole, avec une phase de bruit de respiration, qui s'éteint pendant quelques dizaines à centaines de millisecondes pour faire place au bruit ambiant seul, après quoi un niveau d'énergie élevé indique la présence de parole, pour revenir enfin au bruit ambiant.
    La recherche automatique du bruit ambiant consiste alors à trouver au moins N1 trames successives (par exemple N1 = 5) dont les énergies sont proches les unes des autres, c'est-à-dire que le rapport entre l'énergie de signal contenue dans une trame et l'énergie de signal contenue dans la ou, de préférence, les trames précédentes est situé à l'intérieur d'une gamme de valeurs déterminée (par exemple compris entre 1/3 et 3). Lorsqu'une telle succession de trames d'énergie relativement stable a été trouvée, on stocke les valeurs numériques de tous les échantillons de ces N trames. Cet ensemble de NxP échantillons constitue le modèle courant de bruit. Il est utilisé dans le débruitage. L'analyse des trames suivantes continue. Si on trouve une autre succession d'au moins N1 trames successives répondant aux mêmes conditions de stabilité d'énergie (rapports d'énergies de trames dans une gamme déterminée), on compare alors l'énergie moyenne de cette nouvelle succession de trames à l'énergie moyenne du modèle stocké, et on remplace ce dernier par la nouvelle succession si le rapport entre l'énergie moyenne de la nouvelle succession et l'énergie moyenne du modèle stocké est inférieur à un seuil de remplacement déterminé qui peut être de 1,5 par exemple.
    De ce remplacement d'un modèle de bruit par un modèle plus récent moins énergétique ou pas beaucoup plus énergétique, il résulte que le modèle de bruit se cale globalement sur le bruit ambiant permanent. Même avant une prise de parole, précédée d'une respiration, il existe une phase où le bruit ambiant seul est présent pendant une durée suffisante pour pouvoir être pris en compte comme modèle de bruit actif. Cette phase de bruit ambiant seul, après respiration, est brève. Le nombre N1 est choisi relativement faible, afin qu'on ait le temps de recaler le modèle de bruit sur le bruit ambiant après la phase de respiration.
    Si le bruit ambiant évolue lentement, l'évolution sera prise en compte du fait que le seuil de comparaison avec le modèle stocké est supérieur à 1. S'il évolue plus rapidement dans le sens croissant, l'évolution risque de ne pas être prise en compte, de sorte qu'il est préférable de prévoir de temps en temps une réinitialisation de la recherche d'un modèle de bruit. Par exemple, dans un avion au sol à l'arrêt, le bruit ambiant sera relativement faible, et il ne faudrait pas qu'au cours de la phase de décollage le modèle de bruit reste figé sur ce qu'il était à l'arrêt du fait qu'un modèle de bruit n'est remplacé que par un modèle moins énergétique ou pas beaucoup plus énergétique. On expliquera plus loin les méthodes de réinitialisation envisagées.
    La figure 7 représente un organigramme des opérations de recherche automatique d'un modèle de bruit ambiant.
    Le signal d'entrée u (t) , échantillonné à la fréquence Fe = 1/Te et numérisé par un convertisseur analogique-numérique, est stocké dans une mémoire tampon capable de stocker tous les échantillons d'au moins 2 trames.
    Le numéro de la trame courante dans une opération de recherche d'un modèle de bruit est désigné par n et est compté par un compteur au fur et à mesure de la recherche. A l'initialisation de la recherche, n est mis à 1. Ce numéro n sera incrémenté au fur et à mesure de l'élaboration d'un modèle de plusieurs trames successives. Lorsqu'on analyse la trame courante n, le modèle comprend déjà par hypothèse n-1 trames successives répondant aux conditions imposées pour faire partie d'un modèle.
    On considère d'abord qu'il s'agit d'une première élaboration de modèle, aucun autre modèle précédent n'ayant été construit. On verra ensuite ce qui se passe pour des élaborations ultérieures.
    L'énergie de signal de la trame est calculée par sommation des carrés des valeurs numériques des échantillons de la trame. Elle est conservée en mémoire.
    On lit ensuite la trame suivante de rang n = 2, et son énergie est calculée de la même manière. Elle est également conservée en mémoire.
    On calcule le rapport entre les énergies des deux trames. Si ce rapport est compris entre deux seuils S et S' dont l'un est supérieur à 1 et l'autre est inférieur à 1, on considère que les énergies des deux trames sont proches et que les deux trames peuvent faire partie d'un modèle de bruit. Les seuils S et S' sont de préférence inverses l'un de l'autre (S' = 1/S) de sorte qu'il suffit de définir l'un pour avoir l'autre. Par exemple, une valeur typique est S = 3, S' = 1/3. Si les trames peuvent faire partie d'un même modèle de bruit, les échantillons qui les composent sont stockés pour commencer à construire le modèle, et la recherche continue par itération en incrémentant n d'une unité.
    Si le rapport entre les énergies des deux premières trames sort de l'intervalle imposé, les trames sont déclarées incompatibles et la recherche est réinitialisée en remettant n à 1.
    Dans le cas où la recherche continue, on incrémente le rang n de la trame courante, et on effectue, dans une boucle de procédure itérative, un calcul d'énergie de la trame suivante et une comparaison avec l'énergie de la trame précédente ou des trames précédentes, en utilisant les seuils S et S'.
    On notera à ce propos que deux types de comparaison sont possibles pour ajouter une trame à n-1 trames précédentes qui ont déjà été considérées comme homogènes en énergie : le premier type de comparaison consiste à comparer uniquement l'énergie de la trame n à l'énergie de la trame n-1. Le deuxième type consiste à comparer l'énergie de la trame n à chacune des trames 1 à n-1. La deuxième manière aboutit à une plus grande homogénéité du modèle mais elle a l'inconvénient de ne pas prendre en compte suffisamment bien les cas où le niveau de bruit croít ou décroít rapidement.
    Ainsi, l'énergie de la trame de rang n est comparée avec l'énergie de la trame de rang n-1 et éventuellement d'autres trames précédentes (pas forcément toutes d'ailleurs).
    Si la comparaison indique qu'il n'y a pas homogénéité avec les trames précédentes, du fait que le rapport des énergies n'est pas compris entre 1/S et S, deux cas sont possibles :
    • ou bien n est inférieur ou égal à un nombre minimal N1 en dessous duquel le modèle ne peut pas être considéré comme significatif du bruit ambiant parce que la durée d'homogénéité est trop courte; par exemple N1 = 5; dans ce cas on abandonne le modèle en cours d'élaboration, et on réinitialise la recherche au début en remettant n à 1 ;
    • ou bien n est supérieur au nombre minimal N1. Dans ce cas, puisqu'on trouve maintenant un manque d'homogénéité, on considère qu'il y a peut-être un début de parole après une phase de bruit homogène, et on conserve à titre de modèle de bruit tous les échantillons des n-1 trames de bruit homogènes qui ont précédé le manque d'homogénéité. Ce modèle reste stocké jusqu'à ce qu'on trouve un modèle plus récent qui semble également représenter du bruit ambiant. La recherche est réinitialisée de toute façon en remettant n à 1.
    Mais la comparaison de la trame n avec les précédentes aurait pu encore aboutir à la constatation d'une trame encore homogène en énergie avec la ou les précédentes. Dans ce cas, ou bien n est inférieur à un deuxième nombre N2 (par exemple N2 = 20) qui représente la longueur maximale souhaitée pour le modèle de bruit, ou bien n est devenu égal à ce nombre N2. Le nombre N2 est choisi de manière à limiter le temps de calcul dans les opérations ultérieures d'estimation de densité spectrale de bruit.
    Si n est inférieur à N2, la trame homogène est ajoutée aux précédentes pour contribuer à construire le modèle de bruit, n est incrémenté et la trame suivante est analysée.
    Si n est égal à N2, la trame est également ajoutée aux n-1 trames homogènes précédentes et le modèle de n trames homogènes est stocké pour servir dans l'élimination du bruit. La recherche d'un modèle est par ailleurs réinitialisée en remettant n à 1.
    Les étapes précédentes concernent la première recherche de modèle. Mais une fois qu'un modèle a été stocké, il peut à tout moment être remplacé par un modèle plus récent.
    La condition de remplacement est encore une condition d'énergie, mais cette fois elle porte sur l'énergie moyenne du modèle et non plus sur l'énergie de chaque trame.
    Par conséquent, si un modèle possible vient d'être trouvé, avec N trames où N1 < N < N2, on calcule l'énergie moyenne de ce modèle qui est la somme des énergies des N trames, divisée par N, et on la compare à l'énergie moyenne des N' trames du modèle précédemment stocké.
    Si le rapport entre l'énergie moyenne du nouveau modèle possible et l'énergie moyenne du modèle actuel en vigueur est inférieur à un seuil de remplacement SR, le nouveau modèle est considéré comme meilleur et on le stocke à la place du précédent. Sinon, le nouveau modèle est rejeté et l'ancien reste en vigueur.
    Le seuil SR est de préférence légèrement supérieur à 1.
    Si le seuil SR était inférieur ou égal à 1, on stockerait à chaque fois les trames homogènes les moins énergétiques, ce qui correspond bien au fait qu'on considère que le bruit ambiant est le niveau d'énergie au dessous duquel on ne descend jamais. Mais, on éliminerait toute possibilité d'évolution du modèle si le bruit ambiant se mettait à augmenter.
    Si le seuil SR était trop élevé au dessus de 1, on risquerait de mal distinguer le bruit ambiant et d'autres bruits perturbateurs (respiration), voire même certains phonèmes qui ressemblent à du bruit (consonnes sifflantes ou chuintantes par exemple). L'élimination de bruit à partir d'un modèle de bruit calé sur la respiration ou sur des consonnes sifflantes ou chuintantes risquerait alors de nuire à l'intelligibilité du signal débruité.
    Dans un exemple préféré le seuil SR est d'environ 1,5. Au-dessus de ce seuil on conservera l'ancien modèle ; en dessous de ce seuil on remplacera l'ancien modèle par le nouveau. Dans les deux cas, on réinitialisera la recherche en recommençant la lecture d'une première trame du signal d'entrée u(t), et en mettant n à 1.
    Pour rendre l'élaboration du modèle de bruit plus fiable, on peut prévoir que la recherche d'un modèle est inhibée si une émission de parole est détectée dans le signal utile. Les traitements numériques de signal couramment utilisés en détection de parole permettent d'identifier la présence de paroles en se fondant sur les spectres caractéristiques de périodicité de certains phonèmes, notamment les phonèmes correspondant à des voyelles ou à des consonnes voisées.
    Le but de cette inhibition est d'éviter que certains sons soient pris pour du bruit, alors que ce sont des phonèmes utiles, qu'un modèle de bruit fondé sur ces sons soit stocké et que la suppression du bruit postérieure à l'élaboration du modèle tende alors à supprimer tous les sons similaires.
    Par ailleurs, il est souhaitable de prévoir de temps en temps une réinitialisation de la recherche du modèle pour permettre une remise à jour du modèle alors que les augmentations du bruit ambiant n'ont pas été prises en compte du fait que SR n'est pas beaucoup supérieur à 1.
    Le bruit ambiant peut en effet augmenter de façon importante et rapide, par exemple pendant la phase d'accélération des moteurs d'un avion ou d'un autre véhicule, aérien, terrestre ou maritime. Mais le seuil SR impose que le modèle de bruit précédent soit conservé lorsque l'énergie moyenne de bruit augmente trop vite.
    Si on souhaite remédier à cette situation, on peut procéder de différentes manières, mais la manière la plus simple est de réinitialiser le modèle périodiquement en recherchant un nouveau modèle et en l'imposant comme modèle actif indépendamment de la comparaison entre ce modèle et le modèle précédemment stocké. La périodicité peut être basée sur la durée moyenne d'élocution dans l'application envisagée ; par exemple les durées d'élocution sont en moyenne de quelques secondes pour l'équipage d'un avion, et la réinitialisation peut avoir lieu avec une périodicité de quelques secondes.
    La mise en oeuvre de la méthode d'élaboration d'un modèle de bruit (figure 1 : bloc 1) et, de façon plus générale du procédé selon l'invention, peut se faire à partir de calculateurs non spécialisés, pourvus de programmes de calcul nécessaires et recevant les échantillons de signaux numérisés tels qu'ils sont fournis par un convertisseur analogique-numérique, via un port adapté.
    Cette mise en oeuvre peut aussi se faire à partir d'un calculateur spécialisé à base de processeurs de signaux numériques, ce qui permet de traiter plus rapidement un plus grand nombre de signaux numériques.
    Les calculateurs sont associés, comme il est bien connu, à différents types de mémoires, statiques et dynamique, pour enregistrer les programmes et les données intermédiaires, ainsi qu'à des mémoires circulantes de type "FIFO". Le système comprend enfin un convertisseur analogique-numérique, pour la numérisation des signaux u(t), et un convertisseur numérique-analogique, en tant que de besoin, si les signaux débruités doivent être utilisés sous forme analogique.
    En conclusion, et pour décrire de façon plus détaillée le procédé de l'invention, on peut découper les étapes de façon différente de ce qui a été décrit en référence à la figure 1 (qui illustre le procédé de façon plus synthétique). La figure 8 est un diagramme résumant toutes les étapes du procédé de filtrage selon l'invention, dans un mode de réalisation préféré.
    Ces étapes se répartissent en un premier sous-ensemble d'étapes permettant de déterminer les paramètres dépendant du modèle de bruit, et un second sous-ensemble d'étapes permettant de déterminer les paramètre dépendant seulement de la trame courante du signal à débruiter.
    La première étape du premier sous-ensemble, comprend une étape initiale de sélection d'un modèle de bruit adapté à l'application spécifique, avantageusement un modèle de bruit déterminé par la méthode décrite ci-dessus, en référence aux figures 6 et 7.
    Ce premier sous-ensemble d'étapes comprend deux branches.
    Dans la première branche, on calcule pour chaque trame du modèle de bruit (dans le domaine temporel), l'énergie de la trame, puis on calcule l'énergie moyenne des trames du modèle, ce qui permet d'estimer l'énergie moyenne du modèle, c'est-à-dire le paramètre Ex.
    Dans la deuxième branche, on applique une transformée de Fourier aux trames du modèle de bruit, de façon à passer dans le domaine fréquentiel. Puis on détermine successivement la densité spectrale de la trame i (avec i = 1 .. N) du modèle de bruit dans le canal fréquentiel ν, soit γ i(ν), et la densité spectrale du modèle de bruit dans le canal fréquentiel ν, soit γ x(ν). A partir de ces deux paramètres, on détermine le coefficient statistique maxi de telle sorte qu'il vérifie la relation (9). Le paramètre γ x(ν) est également utilisé pour le calcul d'un des autres coefficients du filtre de Wiener.
    Le second sous-ensemble d'étapes comprend également deux branches.
    Dans la première branche, on détermine l'énergie de la trame courante, soit E u , et dans la seconde branche, on effectue l'estimation de la densité spectrale de la trame courante γ u .
    A partir de ces deux paramètres et des paramètres γ x et Ex, déterminés précédemment, on obtient les coefficients [E x /E u ] et [γ x(ν) u(ν)].
    Tous les coefficients du filtre de Wiener, conforme à la relation (8), sont donc déterminés à l'issu de ces étapes. Les coefficients α et β sont des coefficients fixes prédéterminés, typiquement égaux à 10 et 0,5, respectivement.
    A la lecture de ce qui précède, on constate aisément que l'invention atteint bien les buts qu'elle s'est fixés.
    Il doit être clair cependant que l'invention n'est pas limitée aux seuls exemples de réalisations explicitement décrits, notamment en relation avec les figures 1 à 8.
    En particulier, les exemples numériques n'ont été donnés que pour mieux préciser l'invention mais sont essentiellement liés à l'application spécifique envisagée. De ce fait, ils participent d'un simple choix technologique à la portée de l'Homme du Métier.
    En outre, comme il été rappelé, l'invention ne se réduit pas au seul domaine du filtrage de signaux contenant de la parole bruitée, même si ce domaine constitue une des applications préférées.

    Claims (9)

    1. Procédé de filtrage fréquentiel pour le débruitage de signaux sonores bruités (u(t)) constitués de signaux sonores dits utiles mélangés à des signaux de bruit, le procédé comprenant au moins une étape de découpage (0) desdits signaux sonores en une série de trames identiques d'une longueur déterminée et une étape de filtrage fréquentiel (4) à l'aide d'un filtre de Wiener, caractérisé en ce qu'il comprend, en outre, les étapes suivantes :
      élaboration à partir desdits signaux bruités (u(t)) d'un modèle de bruit (1) sur un nombre N déterminé desdites trames, N étant compris entre des bornes minimale et maximale prédéterminées ;
      application d'une transformée de Fourier auxdites N trames ;
      estimation (2), pour chaque trame dudit modèle, de la densité spectrale de cette trame ;
      estimation (2) de la densité spectrale moyenne dudit modèle de bruit ;
      calcul (2), à partir de ces deux estimations, d'un coefficient de surestimation statistique, ledit coefficient statistique étant égal au rapport maximal, pour lesdites N trames du modèle de bruit, entre le maximum de la densité spectrale d'une trame considérée dudit modèle de bruit, et le maximum de la densité spectrale estimée du modèle de bruit ;
      estimation (3), pour chaque trame desdits signaux à débruiter (u(t)), de sa densité spectrale ; et :
      modification (4), pour chaque trame desdits signaux à débruiter (u(t)), des coefficients dudit filtre de Wiener pour que la relation suivante soit vérifiée : W(ν) = β1 - α · maxi · γ x ν γ u ν , relation dans laquelle α et β sont des coefficients fixes prédéterminés, dits coefficient statique de compensation énergétique et coefficient d'atténuation exponentielle, respectivement, ν décrit l'ensemble des canaux fréquentiels de ladite transformée de Fourier, γ u(ν) étant l'estimée de la densité spectrale de la trame à débruiter, γ x(ν) est ladite densité spectrale du modèle de bruit, et maxi ledit coefficient de surestimation statistique, modifiant le coefficient statique de compensation énergétique α.
    2. Procédé selon la revendication 1, caractérisé en ce que ledit coefficient statistique maxi vérifie la relation suivante :
      Figure 00310001
    3. Procédé selon l'une des revendications 1 ou 2, caractérisé en ce qu'il comprend les étapes supplémentaires suivantes :
      calcul de l'énergie moyenne dudit modèle de bruit Ex ;
      calcul, pour chaque trame desdits signaux à débruiter (u(t)), de l'énergie de la trame en cours Eu ; et
      multiplication dudit coefficient statique de compensation énergétique α par un coefficient de pondération énergétique égal au rapport Ex /Eu , de manière à modifier sélectivement ces coefficients pour chaque trame desdits signaux à débruiter (u(t)) par application d'un coefficient continûment variable entre un extrêma et un minima, l'extrêma étant sensiblement égal à l'unité lorsque lesdits signaux utiles sont absents desdits signaux à débruiter (u(t)) et sensiblement égal à zéro lorsque l'énergie desdits signaux utiles est très supérieure à l'énergie desdits signaux de bruit, et à ce que lesdits coefficients du filtre de Wiener satisfassent la relation suivante : W(ν) = β1 - α · maxi · Ex Eu · γ x ν γ u ν
    4. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que ledit coefficient statique de compensation énergétique α est égal à 10.
    5. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que ledit coefficient d'atténuation exponentielle β est égal à 0,5.
    6. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend une étape initiale (0) consistant à numériser lesdits signaux à débruiter (u(t)) par échantillonnage, chaque trame comprenant p échantillons.
    7. Procédé selon la revendication 6, caractérisé en ce que ledit modèle de bruit (1) est obtenu par une recherche répétitive effectuée en permanence dans lesdits signaux à débruiter (u(t)), en recherchant N trames successives, de p échantillons chacune, ayant les caractéristiques attendues d'un bruit, en stockant les NxP échantillons correspondants pour constituer ledit modèle de bruit, et en réitérant la recherche pour trouver un nouveau modèle de bruit et stocker le nouveau modèle en remplacement du précédent ou conserver le modèle précédent selon les caractéristiques respectives des deux modèles.
    8. Application du procédé selon l'une quelconque des revendications précédentes au débruitage de signaux de parole bruités (u(t)).
    9. Application du procédé selon la revendication 8, caractérisé en ce que la durée desdites trames est comprise dans la gamme 10 à 20 ms.
    EP98402894A 1997-11-21 1998-11-20 Procédé de filtrage fréquentiel appliqué au débruitage de signaux sonores mettant en oeuvre un filtre de Wiener Expired - Lifetime EP0918317B1 (fr)

    Applications Claiming Priority (2)

    Application Number Priority Date Filing Date Title
    FR9714641 1997-11-21
    FR9714641A FR2771542B1 (fr) 1997-11-21 1997-11-21 Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener

    Publications (2)

    Publication Number Publication Date
    EP0918317A1 true EP0918317A1 (fr) 1999-05-26
    EP0918317B1 EP0918317B1 (fr) 2003-08-27

    Family

    ID=9513645

    Family Applications (1)

    Application Number Title Priority Date Filing Date
    EP98402894A Expired - Lifetime EP0918317B1 (fr) 1997-11-21 1998-11-20 Procédé de filtrage fréquentiel appliqué au débruitage de signaux sonores mettant en oeuvre un filtre de Wiener

    Country Status (5)

    Country Link
    US (1) US6445801B1 (fr)
    EP (1) EP0918317B1 (fr)
    JP (1) JPH11265198A (fr)
    DE (1) DE69817507D1 (fr)
    FR (1) FR2771542B1 (fr)

    Cited By (8)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    EP1132896A1 (fr) * 2000-03-08 2001-09-12 Motorola, Inc. Procédé de filtrage fréquentiel appliqué au débruitage de signaux acoustiques mettant en oeuvre un filtre de Wiener
    EP1154405A1 (fr) * 2000-05-09 2001-11-14 Thales Procédé et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
    EP1170728A1 (fr) * 2000-07-05 2002-01-09 Alcatel Dispositif de réduction adaptive du bruit dans des signaux de parole
    FR2820227A1 (fr) * 2001-01-30 2002-08-02 France Telecom Procede et dispositif de reduction de bruit
    EP1278185A2 (fr) * 2001-07-13 2003-01-22 Alcatel Procédé pour améliorer la reduction de bruit lors de la transmission de la voix
    EP1277202A1 (fr) * 2000-03-28 2003-01-22 Tellabs Operations, Inc. Techniques de ponderation du rapport du bruit relatif pour suppression adaptative du bruit
    DE10137348A1 (de) * 2001-07-31 2003-02-20 Alcatel Sa Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen
    EP1242992B2 (fr) 1999-11-15 2009-11-25 Nokia Corporation Dispositif anti-bruit

    Families Citing this family (26)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US6633842B1 (en) * 1999-10-22 2003-10-14 Texas Instruments Incorporated Speech recognition front-end feature extraction for noisy speech
    FR2786308B1 (fr) * 1998-11-20 2001-02-09 Sextant Avionique Procede de reconnaissance vocale dans un signal acoustique bruite et systeme mettant en oeuvre ce procede
    WO2001050663A1 (fr) * 1999-12-30 2001-07-12 Comlink 3000 Systemes de communication a acces multiple a base de filtres a correspondance electromagnetique
    JP4560899B2 (ja) * 2000-06-13 2010-10-13 カシオ計算機株式会社 音声認識装置、及び音声認識方法
    US6990446B1 (en) * 2000-10-10 2006-01-24 Microsoft Corporation Method and apparatus using spectral addition for speaker recognition
    US6931138B2 (en) * 2000-10-25 2005-08-16 Matsushita Electric Industrial Co., Ltd Zoom microphone device
    US7289626B2 (en) * 2001-05-07 2007-10-30 Siemens Communications, Inc. Enhancement of sound quality for computer telephony systems
    US6959276B2 (en) * 2001-09-27 2005-10-25 Microsoft Corporation Including the category of environmental noise when processing speech signals
    FR2842064B1 (fr) * 2002-07-02 2004-12-03 Thales Sa Systeme de spatialisation de sources sonores a performances ameliorees
    AU2002950530A0 (en) * 2002-08-01 2002-09-12 Lake Technology Limited Approximation sequence processing
    US7295250B2 (en) * 2003-07-31 2007-11-13 Broadcom Corporation Apparatus and method for restoring DC spectrum for analog television reception using direct conversion turners
    EP1683134B1 (fr) * 2003-11-12 2010-06-23 Telecom Italia S.p.A. Procede et circuit de calcul des bruits, filtre a cet effet, terminal et reseau de communication l'utilisant, et progiciel a cet effet
    US7725314B2 (en) * 2004-02-16 2010-05-25 Microsoft Corporation Method and apparatus for constructing a speech filter using estimates of clean speech and noise
    GB2414646B (en) * 2004-03-31 2007-05-02 Meridian Lossless Packing Ltd Optimal quantiser for an audio signal
    US7516069B2 (en) * 2004-04-13 2009-04-07 Texas Instruments Incorporated Middle-end solution to robust speech recognition
    ATE476733T1 (de) * 2004-09-16 2010-08-15 France Telecom Verfahren zum verarbeiten eines rauschbehafteten tonsignals und einrichtung zur implementierung des verfahrens
    US7760887B2 (en) * 2004-10-15 2010-07-20 Lifesize Communications, Inc. Updating modeling information based on online data gathering
    EP2012725A4 (fr) * 2006-05-04 2011-10-12 Sony Computer Entertainment Inc Suppression de bruit pour dispositif electronique equipe d'un microphone de champ lointain sur console
    US7912567B2 (en) * 2007-03-07 2011-03-22 Audiocodes Ltd. Noise suppressor
    JP5152800B2 (ja) * 2008-07-09 2013-02-27 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧評価装置およびプログラム
    JP5152799B2 (ja) * 2008-07-09 2013-02-27 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧装置およびプログラム
    EP2151821B1 (fr) * 2008-08-07 2011-12-14 Nuance Communications, Inc. Procédé de réduction de bruit de signaux vocaux
    JP5376635B2 (ja) * 2009-01-07 2013-12-25 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧処理選択装置,雑音抑圧装置およびプログラム
    US9886968B2 (en) * 2013-03-04 2018-02-06 Synaptics Incorporated Robust speech boundary detection system and method
    US11335312B2 (en) 2016-11-08 2022-05-17 Andersen Corporation Active noise cancellation systems and methods
    EP3788619A1 (fr) 2018-05-04 2021-03-10 Andersen Corporation Ciblage de fréquence multibande pour atténuation de bruit

    Citations (1)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    EP0534837A1 (fr) * 1991-09-25 1993-03-31 MATRA COMMUNICATION Société Anonyme Procédé de traitement de la parole en présence de bruits acoustiques utilisant la sous traction spectrale non-linéaire et les modèles de Markov cachés

    Family Cites Families (5)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    EP0525408A3 (en) * 1991-07-01 1993-12-22 Eastman Kodak Co Method for multiframe wiener restoration of noisy and blurred image sequences
    JP3565226B2 (ja) * 1993-12-06 2004-09-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノイズ低減システム、ノイズ低減装置及びこの装置を具える移動無線局
    SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
    JPH11502324A (ja) * 1995-12-15 1999-02-23 フィリップス エレクトロニクス エヌ ベー 適応雑音除去装置、雑音減少システム及び送受信機
    FR2744277B1 (fr) 1996-01-26 1998-03-06 Sextant Avionique Procede de reconnaissance vocale en ambiance bruitee, et dispositif de mise en oeuvre

    Patent Citations (1)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    EP0534837A1 (fr) * 1991-09-25 1993-03-31 MATRA COMMUNICATION Société Anonyme Procédé de traitement de la parole en présence de bruits acoustiques utilisant la sous traction spectrale non-linéaire et les modèles de Markov cachés

    Non-Patent Citations (3)

    * Cited by examiner, † Cited by third party
    Title
    ARSLAN L ET AL: "NEW METHODS FOR ADAPTIVE NOISE SUPPRESSION", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), DETROIT, MAY 9 - 12, 1995 SPEECH, vol. VOL. 1, 9 May 1995 (1995-05-09), INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS, pages 812 - 815, XP000658118 *
    HANSEN J H L ET AL: "Text-directed speech enhancement employing phone class parsing and feature map constrained vector quantization", SPEECH COMMUNICATION, vol. 21, no. 3, April 1997 (1997-04-01), pages 169-189, XP004059541 *
    SUN T S ET AL: "SPEECH ENHANCEMENT USING A TERNARY-DECISION BASED FILTER", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), DETROIT, MAY 9 - 12, 1995 SPEECH, vol. VOL. 1, 9 May 1995 (1995-05-09), INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS, pages 820 - 823, XP000658120 *

    Cited By (15)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US7889874B1 (en) 1999-11-15 2011-02-15 Nokia Corporation Noise suppressor
    EP1242992B2 (fr) 1999-11-15 2009-11-25 Nokia Corporation Dispositif anti-bruit
    EP1132896A1 (fr) * 2000-03-08 2001-09-12 Motorola, Inc. Procédé de filtrage fréquentiel appliqué au débruitage de signaux acoustiques mettant en oeuvre un filtre de Wiener
    EP1277202A1 (fr) * 2000-03-28 2003-01-22 Tellabs Operations, Inc. Techniques de ponderation du rapport du bruit relatif pour suppression adaptative du bruit
    EP1277202A4 (fr) * 2000-03-28 2005-11-16 Tellabs Operations Inc Techniques de ponderation du rapport du bruit relatif pour suppression adaptative du bruit
    US6859773B2 (en) 2000-05-09 2005-02-22 Thales Method and device for voice recognition in environments with fluctuating noise levels
    EP1154405A1 (fr) * 2000-05-09 2001-11-14 Thales Procédé et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
    FR2808917A1 (fr) * 2000-05-09 2001-11-16 Thomson Csf Procede et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
    EP1170728A1 (fr) * 2000-07-05 2002-01-09 Alcatel Dispositif de réduction adaptive du bruit dans des signaux de parole
    WO2002003383A1 (fr) * 2000-07-05 2002-01-10 Alcatel Systeme de reduction de bruit et procede
    WO2002061731A1 (fr) * 2001-01-30 2002-08-08 France Telecom Procede et dispositif de reduction de bruit
    FR2820227A1 (fr) * 2001-01-30 2002-08-02 France Telecom Procede et dispositif de reduction de bruit
    EP1278185A3 (fr) * 2001-07-13 2005-02-09 Alcatel Procédé pour améliorer la reduction de bruit lors de la transmission de la voix
    EP1278185A2 (fr) * 2001-07-13 2003-01-22 Alcatel Procédé pour améliorer la reduction de bruit lors de la transmission de la voix
    DE10137348A1 (de) * 2001-07-31 2003-02-20 Alcatel Sa Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen

    Also Published As

    Publication number Publication date
    JPH11265198A (ja) 1999-09-28
    FR2771542A1 (fr) 1999-05-28
    FR2771542B1 (fr) 2000-02-11
    EP0918317B1 (fr) 2003-08-27
    US6445801B1 (en) 2002-09-03
    DE69817507D1 (de) 2003-10-02

    Similar Documents

    Publication Publication Date Title
    EP0918317B1 (fr) Procédé de filtrage fréquentiel appliqué au débruitage de signaux sonores mettant en oeuvre un filtre de Wiener
    EP0993671B1 (fr) Procede de recherche d&#39;un modele de bruit dans des signaux sonores bruites
    EP1789956B1 (fr) Procede de traitement d&#39;un signal sonore bruite et dispositif pour la mise en oeuvre du procede
    EP1154405B1 (fr) Procédé et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
    EP1356461B1 (fr) Procede et dispositif de reduction de bruit
    EP1016072B1 (fr) Procede et dispositif de debruitage d&#39;un signal de parole numerique
    EP1593116B1 (fr) Procédé pour le traitement numérique différencié de la voix et de la musique, le filtrage de bruit, la création d&#39;effets spéciaux et dispositif pour la mise en oeuvre dudit procédé
    EP2772916B1 (fr) Procédé de débruitage d&#39;un signal audio par un algorithme à gain spectral variable à dureté modulable dynamiquement
    EP0594480A1 (fr) Procédé de détection de la parole
    WO1999005831A1 (fr) Procede et dispositif d&#39;egalisation aveugle des effets d&#39;un canal de transmission sur un signal de parole numerique
    FR3012928A1 (fr) Modificateurs reposant sur un snr estime exterieurement pour des calculs internes de mmse
    EP1131813B1 (fr) Procede de reconnaissance vocale dans un signal acoustique bruite et systeme mettant en oeuvre ce procede
    EP1016071B1 (fr) Procede et dispositif de detection d&#39;activite vocale
    FR3012927A1 (fr) Estimation precise du rapport signal a bruit par progression reposant sur une probabilite de la presence de la parole mmse
    WO2011144215A2 (fr) Méthode d&#39;atténuation du bruit harmonique en vibrosismique par filtrage temps-variant avec référence
    EP1016073B1 (fr) Procede et dispositif de debruitage d&#39;un signal de parole numerique
    EP2515300B1 (fr) Procédé et système de réduction du bruit
    FR3086451A1 (fr) Filtrage d&#39;un signal sonore acquis par un systeme de reconnaissance vocale
    EP1021805B1 (fr) Procede et disposition de conditionnement d&#39;un signal de parole numerique
    WO1999027523A1 (fr) Procede de reconstruction, apres debruitage, de signaux sonores
    EP4315328A1 (fr) Estimation d&#39;un masque optimise pour le traitement de donnees sonores acquises
    CA2389785A1 (fr) Procede et systeme de pre et de post-traitement d&#39;un signal audio pour la transmission sur un canal fortement perturbe
    WO2002093553A1 (fr) Estimation de periodes fondamentales de sources concurrentes multiples notamment de son

    Legal Events

    Date Code Title Description
    PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

    Free format text: ORIGINAL CODE: 0009012

    AK Designated contracting states

    Kind code of ref document: A1

    Designated state(s): DE FR GB NL

    AX Request for extension of the european patent

    Free format text: AL;LT;LV;MK;RO;SI

    17P Request for examination filed

    Effective date: 19990723

    RAP1 Party data changed (applicant data changed or rights of an application transferred)

    Owner name: THOMSON-CSF SEXTANT

    AKX Designation fees paid

    Free format text: DE FR GB NL

    RAP1 Party data changed (applicant data changed or rights of an application transferred)

    Owner name: THALES AVIONICS S.A.

    GRAH Despatch of communication of intention to grant a patent

    Free format text: ORIGINAL CODE: EPIDOS IGRA

    RIC1 Information provided on ipc code assigned before grant

    Ipc: 7G 10L 21/02 A

    GRAH Despatch of communication of intention to grant a patent

    Free format text: ORIGINAL CODE: EPIDOS IGRA

    GRAA (expected) grant

    Free format text: ORIGINAL CODE: 0009210

    AK Designated contracting states

    Designated state(s): DE FR GB NL

    PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

    Ref country code: NL

    Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

    Effective date: 20030827

    Ref country code: GB

    Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

    Effective date: 20030827

    REG Reference to a national code

    Ref country code: GB

    Ref legal event code: FG4D

    Free format text: NOT ENGLISH

    REF Corresponds to:

    Ref document number: 69817507

    Country of ref document: DE

    Date of ref document: 20031002

    Kind code of ref document: P

    PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

    Ref country code: DE

    Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

    Effective date: 20031128

    NLV1 Nl: lapsed or annulled due to failure to fulfill the requirements of art. 29p and 29m of the patents act
    GBV Gb: ep patent (uk) treated as always having been void in accordance with gb section 77(7)/1977 [no translation filed]

    Effective date: 20030827

    PLBE No opposition filed within time limit

    Free format text: ORIGINAL CODE: 0009261

    STAA Information on the status of an ep patent application or granted ep patent

    Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

    26N No opposition filed

    Effective date: 20040528

    REG Reference to a national code

    Ref country code: FR

    Ref legal event code: PLFP

    Year of fee payment: 18

    PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

    Ref country code: FR

    Payment date: 20151023

    Year of fee payment: 18

    REG Reference to a national code

    Ref country code: FR

    Ref legal event code: ST

    Effective date: 20170731

    PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

    Ref country code: FR

    Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

    Effective date: 20161130