FR2765715A1 - Procede de recherche d'un modele de bruit dans des signaux sonores bruites - Google Patents

Procede de recherche d'un modele de bruit dans des signaux sonores bruites Download PDF

Info

Publication number
FR2765715A1
FR2765715A1 FR9708509A FR9708509A FR2765715A1 FR 2765715 A1 FR2765715 A1 FR 2765715A1 FR 9708509 A FR9708509 A FR 9708509A FR 9708509 A FR9708509 A FR 9708509A FR 2765715 A1 FR2765715 A1 FR 2765715A1
Authority
FR
France
Prior art keywords
model
noise
search
frames
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9708509A
Other languages
English (en)
Other versions
FR2765715B1 (fr
Inventor
Dominique Pastor
Gerard Reynaud
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales Avionics SAS
Original Assignee
Thales Avionics SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thales Avionics SAS filed Critical Thales Avionics SAS
Priority to FR9708509A priority Critical patent/FR2765715B1/fr
Priority to DE69806006T priority patent/DE69806006T2/de
Priority to PCT/FR1998/001428 priority patent/WO1999001862A1/fr
Priority to EP98935094A priority patent/EP0993671B1/fr
Priority to US09/446,886 priority patent/US6438513B1/en
Priority to JP50654799A priority patent/JP4338226B2/ja
Publication of FR2765715A1 publication Critical patent/FR2765715A1/fr
Application granted granted Critical
Publication of FR2765715B1 publication Critical patent/FR2765715B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Noise Elimination (AREA)

Abstract

L'invention concerne principalement le débruitage de signaux sonores captés en ambiance bruyante, par exemple dans le poste de pilotage d'un avion ou d'un autre véhicule, et plus précisément elle concerne la recherche d'un modèle de bruit dans les signaux sonores. On numérise les signaux d'entrée, et on traite ces signaux à partir d'un modèle de bruit, en principe en vue d'éliminer au mieux le bruit correspondant au modèle. Les signaux d'entrée sont découpés en trames successives de P échantillons chacune, et une recherche répétitive d'un modèle de bruit est effectuée en permanence dans les signaux d'entrée eux-mêmes,en recherchant N trames successives (N compris entre un minimum N1 et un maximum N2) ayant les caractéristiques attendues d'un bruit, en stockant les NxP échantillons correspondants pour constituer un modèle de bruit utile au traitement de débruitage des signaux d'entrée, et en réitérant la recherche pour trouver un nouveau modèle de bruit et stocker le nouveau modèle en remplacement du précédent ou conserver le modèle précédent selon les caractéristiques respectives des deux modèles. Le modèle est obtenu en trouvant N trames dont les énergies sont proches les unes des autres (rapport d'énergies compris entre deux valeurs S et 1/ S).

Description

PROCEDE DE RECHERCHE D'UN MODELE DE BRUIT
DANS DES SIGNAUX SONORES BRUITES
L'invention concerne l'amélioration de l'intelligibilité des communications vocales en présence de bruit. Elle s'applique plus spécialement mais non exclusivement aux communications téléphoniques ou radiotéléphoniques ou par d'autres moyens électroniques, à la reconnaissance vocale, etc., chaque fois que l'environnement de la prise de son est bruité et risque de détériorer la perception ou la reconnaissance de la voix transmise.
Un exemple peut en être donné à propos des communications vocales à l'intérieur d'un avion ou d'un autre véhicule bruyant. Dans le cas d'un avion, les bruits résultent des moteurs, de la climatisation, de la ventilation des équipements de bord, des bruits aérodynamiques. Ces bruits sont captés par le microphone dans lequel parle le pilote ou un membre de l'équipage.
L'invention propose un procédé de recherche d'un modèle de bruit pouvant servir en particulier dans des traitements de réduction du bruit. Les traitements de réduction de bruit fondés sur le modèle de bruit trouvé permettent d'augmenter le rapport signal/bruit du signal transmis, un but étant de détériorer le moins possible l'intelligibilité du signal. Dans cette demande, les néologismes débruitage et débruiter seront utilisés pour parler des opérations visant à enlever ou réduire des composantes de bruit présentes dans le signal.
Le débruitage pourra se fonder comme on le verra sur la recherche permanente d'un modèle de bruit ambiant, sur l'analyse spectrale numérique de ce bruit, et sur la reconstruction numérique d'un signal utile éliminant autant que possible le bruit modélisé.
Le modèle de bruit est recherché dans les signaux bruités euxmêmes et chaque fois qu'un modèle de bruit plausible a été trouvé, ce modèle de bruit est stocké pour pouvoir être utilisé. Puis, une nouvelle recherche commence pour trouver un modèle plus adapté ou simplement plus récent.
Plus précisément, I'invention propose un procédé de recherche automatique de modèles de bruit dans des signaux d'entrée sonores bruités, dans lequel on numérise les signaux d'entrée, et on traite ces signaux à partir d'un modèle trouvé (par exemple en vue d'éliminer au mieux le bruit correspondant au modèle), caractérisé en ce que les signaux d'entrée sont découpés en trames successives de P échantillons chacune, et une recherche répétitive d'un modèle de bruit est effectuée en permanence dans les signaux d'entrée eux-mêmes, en recherchant N trames successives ayant les caractéristiques attendues d'un bruit, en stockant les NxP échantillons correspondants pour constituer un modèle de bruit utile au traitement de débruitage des signaux d'entrée, et en réitérant la recherche pour trouver un nouveau modèle de bruit et stocker le nouveau modèle en remplacement du précédent ou conserver le modèle précédent selon les caractéristiques respectives des deux modèles.
Par conséquent, le modèle de bruit servant notamment au débruitage n'est pas un modèle prédéterminé connu ou un modèle choisi parmi plusieurs modèles prédéterminés, mais c'est un modèle trouvé dans le signal bruité lui-même, ce qui permet non seulement d'adapter le débruitage au véritable bruit gênant, mais aussi d'adapter le débruitage aux variations de ce bruit.
Le modèle de bruit est obtenu en considérant que les signaux dont l'énergie est stable (et, de préférence, comme on le verra, dont l'énergie est minimale), sur une certaine durée représentent probablement du bruit; la recherche d'un modèle de bruit comprend alors la recherche de
N trames successives dont les énergies sont proches les unes des autres (N étant compris entre une valeur minimale N1 et une valeur maximale N2), le calcul de l'énergie moyenne des N trames successives trouvées, et le stockage des NxP échantillons à titre de nouveau modèle actif si le rapport entre cette énergie moyenne et l'énergie moyenne des trames du modèle actif précédemment stocké est inférieur à un seuil de remplacement déterminé.
La recherche de N trames successives comprend alors au moins les étapes itératives suivantes : calcul de l'énergie d'une trame courante de rang n susceptible d'être ajoutée à un modèle en cours d'élaboration comprenant déjà n-l trames successives; calcul du rapport entre cette énergie et l'énergie de la trame précédente de rang n-1 (et de préférence celle d'autres trames précédentes entre 1 et ne1 ); comparaison de ce rapport avec un seuil bas inférieur à 1 et un seuil haut supérieur à 1; et décision sur la possibilité d'incorporer la trame de rang n au modèle en cours d'élaboration : la trame n'est pas incorporée au modèle si le rapport n'est pas compris entre les deux seuils; elle est incorporée au modèle si le rapport est compris entre les deux seuils. La procédure est réitérée sur la trame courante suivante des signaux d'entrée, avec incrémentation de n, jusqu'à l'arrêt de l'élaboration du modèle.
L'élaboration du modèle est arrêtée soit dans le cas où n atteint la valeur haute N2, soit dans le cas où la trame de rang n n'est pas incorporée au modèle parce que le rapport d'énergies calculé sort de la gamme prescrite. Dans ce dernier cas, le modèle élaboré ne peut être pris en compte comme modèle actif que si n-l est déjà supérieur ou égal au minimum N1, car le principe est qu'un modèle de bruit est représentatif s'il a une énergie à peu près stable sur au moins N1 trames.
De préférence, le modèle élaboré ne devient actif à la place du modèle précédent que si le rapport entre son énergie moyenne par trame et l'énergie moyenne du modèle précédent ne dépasse pas un seuil de remplacement prédéterminé.
Dans tous les cas, la recherche d'un nouveau modèle recommence dès que l'élaboration du précédent est interrompue.
Enfin, de préférence, on peut prévoir que le remplacement d'un modèle précédent par un nouveau modèle est inhibé dès que de la parole est détectée dans les signaux bruités. La présence de parole peut en effet être détectée par des procédures de traitement de signal numérique (telles que celles qu'on peut utiliser dans la reconnaissance de parole).
D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description détaillée qui suit et qui est faite en référence aux dessins annexés dans lesquels:
- la figure 1 représente un organigramme général d'un procédé de réduction de bruit utilisant le procédé de l'invention;
- la figure 2 représente un exemple typique de signal issu d'une prise de son bruitée;
- la figure 3 représente l'organigramme des étapes de recherche d'un modèle de bruit dans le signal d'entrée;
- la figure 4 représente un exemple d'architecture de circuit électronique pour la mise en oeuvre d'opérations de débruitage utilisant le procédé selon l'invention.
Dans l'analyse de la parole, il est usuel de considérer que les régimes stationnaires de production du son s'établissent sur des durées comprises entre 10 et 20 millisecondes.
L'analyse de signaux qui permet le débruitage reposera sur l'analyse spectrale des signaux dans des intervalles de temps de durée D, qu'on appellera "trames", et qui auront à peu près cette durée.
Chaque trame comportera P =2P échantillons de signal numérisé, le nombre P dépendant de la fréquence d'échantillonnage du signal traité, de manière que la trame ait une durée de l'ordre de 10 à 20 ms quelle que soit la fréquence d'échantillonnage F. = lIT.. Par exemple, pour une fréquence d'échantillonnage de 10 kHz, la trame comportera P = 128 échantillons (p = 7) et durera 12,8 ms.
Le schéma de la figure 1 est un organigramme expliquant le principe général du procédé de débruitage.
Le signal d'entrée à traiter, issu par exemple d'un microphone, est noté u(t), avec une partie utile s(t) et un bruit indésirable b(t), avec u(t) = s(t) + b(t), le temps t étant supposé discret (t = kT.) puisque le signal est échantillonné avant d'être numérisé dans un convertisseur analogiquenumérique.
Dans la suite, on considérera, à titre d'exemple représentant l'application principale de l'invention, que le traitement des signaux d'entrée est un traitement de débruitage à partir du modèle de bruit trouvé. D'autres applications peuvent être envisagées (recherche de consonnes sifflantes ou chuintantes, par exemple).
Le principe général du procédé de débruitage repose sur une recherche permanente et automatique d'un modèle de bruit qui servira à traiter le signal d'entrée pour le débruiter. Cette recherche est faite sur les échantillons de signal u(t) numérisés et stockés dans une mémoire tampon d'entrée. Cette mémoire est capable de mémoriser simultanément tous les échantillons de plusieurs trames du signal d'entrée (par exemple au moins 2 trames).
Le modèle de bruit recherché est constitué par une succession de plusieurs trames dont la stabilité en énergie et le niveau d'énergie relative font penser qu'il s'agit d'un bruit ambiant et non d'un signal de parole ou d'un autre bruit perturbateur. On verra plus loin comment se fait cette recherche automatique.
Lorsqu'un modèle de bruit est trouvé, tous les échantillons des
N trames successives représentant ce modèle de bruit sont conservés en mémoire, de sorte que le spectre de ce bruit peut être analysé et peut servir au débruitage. Mais la recherche automatique de bruit continue à partir du signal d'entrée u(t) pour trouver éventuellement un modèle plus récent et plus adapté, soit parce qu'il représente mieux le bruit ambiant, soit parce que le bruit ambiant a évolué. Le modèle de bruit plus récent est mis en mémoire à la place du précédent, si la comparaison avec le précédent montre qu'il est plus représentatif du bruit ambiant.
Le débruitage du signal d'entrée u(t) se fait à partir du modèle de bruit qui est en mémoire, et plus précisément à partir des caractéristiques spectrales de ce modèle. Une transformée de Fourier et une estimation de densité spectrale moyenne de bruit sont donc effectuées sur le modèle de bruit stocké. L'opération de débruitage se fait de préférence grâce à un filtrage numérique de Wiener sur lequel on reviendra plus en détail. Le filtre de Wiener est paramétré par les caractéristiques spectrales du modèle de bruit enregistré et par les caractéristiques spectrales du signal u(t) à débruiter. Le signal d'entrée numérisé subit donc une transformée de
Fourier et une estimation de densité spectrale. Les valeurs numériques de la transformée de Fourier, c'eSt-à-dire le signal d'entrée représenté par ses composantes fréquentielles, sont traitées par le filtre de Wiener et la sortie du filtre de Wiener représente, dans l'espace fréquentiel, le signal numérique débruité, c'est-å-dire débarrassé le mieux possible du bruit représenté par le modèle enregistré.
Le signal numérique filtré sert soit à la reconstruction d'un signal sonore dans lequel le bruit ambiant a été en partie éliminé, soit à la reconnaissance vocale.
La phase de recherche automatique d'un modèle de bruit et la mise à jour permanente de ce modèle sont des étapes cruciales du procédé et font plus précisément l'objet de l'invention.
Les postulats de départ pour l'élaboration automatique d'un modèle de bruit sont les suivants:
- le bruit qu'on veut éliminer est le bruit de fond ambiant;
- le bruit ambiant a une énergie relativement stable â court terme,
- la parole est le plus souvent précédée d'un bruit de respiration du pilote qu'il ne faut pas confondre avec le bruit ambiant; mais ce bruit de respiration s'éteint quelques centaines de millisecondes avant la première émission de parole proprement dite, de sorte qu'on ne retrouve que le bruit ambiant juste avant l'émission de parole;
-et enfin, les bruits et la parole se superposent en termes d'énergie de signal, de sorte qu'un signal contenant de la parole ou un bruit perturbateur, y compris la respiration dans le microphone, contient forcément plus d'énergie qu'un signal de bruit ambiant.
II en résulte qu'on fera l'hypothèse simple suivante : le bruit ambiant est un signal présentant une énergie minimale stable à court terme.
Par court terme il faut entendre quelques trames, et on verra dans l'exemple pratique donné ci-après que le nombre de trames destiné à évaluer la stabilité du bruit est de 5 à 20. L'énergie doit être stable sur plusieurs trames, faute de quoi on doit supposer que le signal contient plutot de la parole ou un bruit autre que le bruit ambiant. Elle doit être minimale, faute de quoi on considère que le signal contient de la respiration ou des éléments phonétiques de parole ressemblant à du bruit mais se superposant au bruit ambiant.
La figure 2 représente une configuration typique d'évolution temporelle de l'énergie d'un signal microphonique au moment d'un début d'émission de parole, avec une phase de bruit de respiration, qui s'éteint pendant quelques dizaines à centaines de millisecondes pour faire place au bruit ambiant seul, après quoi un niveau d'énergie élevé indique la présence de parole, pour revenir enfin au bruit ambiant.
La recherche automatique du bruit ambiant consiste alors à trouver au moins N1 trames successives (par exemple N1 = 5) dont les énergies sont proches les unes des autres, c'est-à-dire que le rapport entre l'énergie de signal contenue dans une trame et l'énergie de signal contenue dans la ou, de préférence, les trames précédentes est situé à l'intérieur d'une gamme de valeurs déterminée (par exemple compris entre 1/3 et 3).
Lorsqu'une telle succession de trames d'énergie relativement stable a été trouvée, on stocke les valeurs numériques de tous les échantillons de ces N trames. Cet ensemble de NxP échantillons constitue le modèle courant de bruit. II est utilisé dans le débruitage. L'analyse des trames suivantes continue. Si on trouve une autre succession d'au moins N1 trames successives répondant aux mêmes conditions de stabilité d'énergie (rapports d'énergies de trames dans une gamme déterminée), on compare alors l'énergie moyenne de cette nouvelle succession de trames à l'énergie moyenne du modèle stocké, et on remplace ce dernier par la nouvelle succession si le rapport entre l'énergie moyenne de la nouvelle succession et l'énergie moyenne du modèle stocké est inférieur à un seuil de remplacement déterminé qui peut être de 1,5 par exemple.
De ce remplacement d'un modèle de bruit par un modèle plus récent moins énergétique ou pas beaucoup plus énergétique, il résulte que le modèle de bruit se cale globalement sur le bruit ambiant permanent.
Même avant une prise de parole, précédée d'une respiration, il existe une phase où le bruit ambiant seul est présent pendant une durée suffisante pour pouvoir être pris en compte comme modèle de bruit actif. Cette phase de bruit ambiant seul après respiration est brève; le nombre N1 est choisi relativement faible, afin qu'on ait le temps de recaler le modèle de bruit sur le bruit ambiant après la phase de respiration.
Si le bruit ambiant évolue lentement, I'évolution sera prise en compte du fait que le seuil de comparaison avec le modèle stocké est supérieur à 1. S'il évolue plus rapidement dans le sens croissant, I'évolution risque de ne pas être prise en compte, de sorte qu'il est préférable de prévoir de temps en temps une réinitialisation de la recherche d'un modèle de bruit. Par exemple, dans un avion au sol à l'arrêt, le bruit ambiant sera relativement faible, et il ne faudrait pas qu'au cours de la phase de décollage le modèle de bruit reste figé sur ce qu'il était à l'arrêt du fait qu'un modèle de bruit n'est remplacé que par un modèle moins énergétique ou pas beaucoup plus énergétique. On expliquera plus loin les méthodes de réinitialisation envisagées.
La figure 3 représente un organigramme des opérations de recherche automatique d'un modèle de bruit ambiant.
Le signal d'entrée u(t), échantillonné à la fréquence F. = 11T. et numérisé par un convertisseur analogique-numérique, est stocké dans une mémoire tampon capable de stocker tous les échantillons d'au moins 2 trames.
Le numéro de la trame courante dans une opération de recherche d'un modèle de bruit est désigné par n et est compté par un compteur au fur et à mesure de la recherche. A l'initialisation de la recherche, n est mis à 1. Ce numéro n sera incrémenté au fur et à mesure de l'élaboration d'un modèle de plusieurs trames successives. Lorsqu'on analyse la trame courante n, le modèle comprend déjà par hypothèse n-l trames successives répondant aux conditions imposées pour faire partie d'un modèle.
On considère d'abord qu'il s'agit d'une première élaboration de modèle, aucun autre modèle précédent n'ayant été construit. On verra ensuite ce qui se passe pour des élaborations ultérieures.
L'énergie de signal de la trame est calculée par sommation des carrés des valeurs numériques des échantillons de la trame. Elle est conservée en mémoire.
On lit ensuite la trame suivante de rang n = 2, et son énergie est calculée de la même manière. Elle est également conservée en mémoire.
On calcule le rapport entre les énergies des deux trames. Si ce rapport est compris entre deux seuils S et S' dont l'un est supérieur à 1 et l'autre est inférieur à 1, on considère que les énergies des deux trames sont proches et que les deux trames peuvent faire partie d'un modèle de bruit.
Les seuils S et S' sont de préférence inverses l'un de l'autre (S' = 1/S) de sorte qu'il suffit de définir l'un pour avoir l'autre. Par exemple, une valeur typique est S = 3, S' = 1/3. Si les trames peuvent faire partie d'un même modèle de bruit, les échantillons qui les composent sont stockés pour commencer à construire le modèle, et la recherche continue par itération en incrémentant n d'une unité.
Si le rapport entre les énergies des deux premières trames sort de l'intervalle imposé, les trames sont déclarées incompatibles et la recherche est réinitialisée en remettant n à 1.
Dans le cas où la recherche continue, on incrémente le rang n de la trame courante, et on effectue, dans une boucle de procédure itérative, un calcul d'énergie de la trame suivante et une comparaison avec l'énergie de la trame précédente ou des trames précédentes, en utilisant les seuils S et S'.
On notera à ce propos que deux types de comparaison sont possibles pour ajouter une trame à n-l trames précédentes qui ont déjà été considérées comme homogènes en énergie le premier type de comparaison consiste à comparer uniquement l'énergie de la trame n à l'énergie de la trame n-1. Le deuxième type consiste à comparer l'énergie de la trame n à chacune des trames 1 à n-l La deuxième manière aboutit à une plus grande homogénéité du modèle mais elle a l'inconvénient de ne pas prendre en compte suffisamment bien les cas où le niveau de bruit croît ou décroît rapidement.
Ainsi, L'énergie de la trame de rang n est comparée avec l'énergie de la trame de rang n-1 et éventuellement d'autres trames précédentes (pas forcément toutes d'ailleurs).
Si la comparaison indique qu'il n'y a pas homogénéité avec les trames précédentes, du fait que le rapport des énergies n'est pas compris entre 11S et S, deux cas sont possibles:
- ou bien n est inférieur ou égal à un nombre minimal NI en dessous duquel le modèle ne peut pas être considéré comme significatif du bruit ambiant parce que la durée d'homogénéité est trop courte; par exemple NI = 5; dans ce cas on abandonne le modèle en cours d'élaboration, et on réinitialise la recherche au début en remettant n à 1;
- ou bien n est supérieur au nombre minimal N1. Dans ce cas, puisqu'on trouve maintenant un manque d'homogénéité, on considère qu'il y a peut-être un début de parole après une phase de bruit homogène, et on conserve à titre de modèle de bruit tous les échantillons des n-l trames de bruit homogènes qui ont précédé le manque d'homogénéité. Ce modèle reste stocké jusqu'à ce qu'on trouve un modèle plus récent qui semble également représenter du bruit ambiant. La recherche est réinitialisée de toutes façons en remettant n à 1.
Mais la comparaison de la trame n avec les précédentes aurait pu encore aboutir à la constatation d'une trame encore homogène en énergie avec la ou les précédentes. Dans ce cas, ou bien n est inférieur à un deuxième nombre N2 (par exemple N2 = 20) qui représente la longueur maximale souhaitée pour le modèle de bruit, ou bien n est devenu égal à ce nombre N2. Le nombre N2 est choisi de manière à limiter le temps de calcul dans les opérations ultérieures d'estimation de densité spectrale de bruit.
Si n est inférieur à N2, la trame homogène est ajoutée aux précédentes pour contribuer à construire le modèle de bruit, n est incrémenté et la trame suivante est analysée.
Si n est égal à N2, la trame est également ajoutée aux n-l trames homogènes précédentes et le modèle de n trames homogènes est stocké pour servir dans l'élimination du bruit. La recherche d'un modèle est par ailleurs réinitialisée en remettant n à 1.
Les étapes précédentes concernent la première recherche de modèle. Mais une fois qu'un modèle a été stocké, il peut à tout moment être remplacé par un modèle plus récent.
La condition de remplacement est encore une condition d'énergie, mais cette fois elle porte sur l'énergie moyenne du modèle et non plus sur l'énergie de chaque trame.
Par conséquent, si un modèle possible vient d'être trouvé, avec
N trames où N1 < N < N2, on calcule l'énergie moyenne de ce modèle qui est la somme des énergies des N trames, divisée par N, et on la compare à l'énergie moyenne des N' trames du modèle précédemment stocké.
Si le rapport entre l'énergie moyenne du nouveau modèle possible et l'énergie moyenne du modèle actuel en vigueur est inférieur à un seuil de remplacement SR, le nouveau modèle est considéré comme meilleur et on le stocke à la place du précédent. Sinon, le nouveau modèle est rejeté et l'ancien reste en vigueur.
Le seuil SR est de préférence légèrement supérieur à 1.
Si le seuil SR était inférieur ou égal à 1, on stockerait à chaque fois les trames homogènes les moins énergétiques, ce qui correspond bien au fait qu'on considère que le bruit ambiant est le niveau d'énergie au dessous duquel on ne descend jamais. Mais, on éliminerait toute possibilité d'évolution du modèle si le bruit ambiant se mettait à augmenter.
Si le seuil SR était trop élevé au dessus de 1, on risquerait de mal distinguer le bruit ambiant et d'autres bruits perturbateurs (respiration), voire même certains phonèmes qui ressemblent à du bruit (consonnes sifflantes ou chuintantes par exemple). L'élimination de bruit à partir d'un modèle de bruit calé sur la respiration ou sur des consonnes sifflantes ou chuintantes risquerait alors de nuire à l'intelligibilité du signal bruité.
Dans un exemple préféré le seuil SR est d'environ 1,5. Au dessus de ce seuil on conservera l'ancien modèle; en dessous de ce seuil on remplacera l'ancien modèle par le nouveau. Dans les deux cas, on réinitialisera la recherche en recommençant la lecture d'une première trame du signal d'entrée u(t), et en mettant n à 1.
Pour rendre l'élaboration du modèle de bruit plus fiable, on peut prévoir que la recherche d'un modèle est inhibée si une émission de parole est détectée dans le signal utile. Les traitements numériques de signal couramment utilisés en détection de parole permettent d'identifier la présence de paroles en se fondant sur les spectres caractéristiques de périodicité de certains phonèmes, notamment les phonèmes correspondant à des voyelles ou à des consonnes voisées.
Le but de cette inhibition est d'éviter que certains sons soient pris pour du bruit alors que ce sont des phonèmes utiles, qu'un modèle de bruit fondé sur ces sons soit stocké et que la suppression du bruit postérieure à l'élaboration du modèle tende alors à supprimer tous les sons similaires.
Par ailleurs, il est souhaitable de prévoir de temps en temps une réinitialisation de la recherche du modèle pour permettre une remise à jour du modèle alors que les augmentations du bruit ambiant n'ont pas été prises en compte du fait que SR n'est pas beaucoup supérieur à 1.
Le bruit ambiant peut en effet augmenter de façon importante et rapide, par exemple pendant la phase d'accélération des moteurs d'un avion ou d'un autre véhicule, aérien, terrestre ou maritime. Mais le seuil SR impose que le modèle de bruit précédent soit conservé lorsque l'énergie moyenne de bruit augmente trop vite.
Si on souhaite remédier à cette situation, on peut procéder de différentes manières, mais la manière la plus simple est de réinitialiser le modèle périodiquement en recherchant un nouveau modèle et en l'imposant comme modèle actif indépendamment de la comparaison entre ce modèle et le modèle précédemment stocké. La périodicité peut être basée sur la durée moyenne d'élocution dans l'application envisagée; par exemple les durées d'élocution sont en moyenne de quelques secondes pour l'équipage d'un avion, et la réinitialisation peut avoir lieu avec une périodicité de quelques secondes.
Le traitement de débruitage proprement dit, effectué à partir d'un modèle de bruit stocké, peut être effectué de la manière suivante, en travaillant sur les transformées de Fourier du signal d'entrée.
La transformée de Fourier du signal d'entrée est effectué trame par trame et fournit pour chaque trame P échantillons dans l'espace fréquentiel, chaque échantillon correspondant à une fréquence F,,"i avec i variant de 1 à P. Ces P échantillons seront traités de préférence dans un filtre de Wiener. Le filtre de Wiener est un filtre numérique de P coefficients correspondant chacun à une des fréquences F*/i de l'espace fréquentiel.
Chaque échantillon du signal d'entrée dans l'espace fréquentiel est multiplié par le coefficient W respectif du filtre. L'ensemble des P échantillons ainsi traités constitue une trame de signal débruité, dans l'espace fréquentiel.
Pour les applications de reconnaissance vocale, on utilise directement ces trames débruitées dans l'espace fréquentiel. Pour des applications où on veut reconstituer un signal sonore réel débruité, on effectue successivement une transformée de Fourier inverse sur chaque trame, une conversion numérique-analogique, et un lissage.
Les coefficients Wi du filtre de Wiener sont calculés à partir de la densité spectrale du signal d'entrée bruité et de la densité spectrale de bruit du modèle de bruit stocké.
La densité spectrale d'une trame du signal d'entrée est obtenue à partir de la transformée de Fourier du signal d'entrée bruité. Pour chaque fréquence, on prend le module au carré de l'échantillon fourni par la transformée de Fourier, pour obtenir une valeur DSj pour chaque fréquence Fui .
Pour la densité spectrale du modèle de bruit, on calcule le module au carré des P échantillons pour chaque trame, et on moyenne sur les N trames du modèle de bruit les N modules au carré correspondant à une même fréquence F.Ii. On obtient P valeurs de densité de bruit DB1.
Le coefficient de Wiener W pour la fréquence FJi est alors Wi =1-DBI/DSi.
L'échantillon de rang i de la transformée de Fourier d'une trame de signal d'entrée est multiplié par W et la succession des P échantillons ainsi multipliés par P coefficients de Wiener constitue la trame d'entrée débruitée.
La mise en oeuvre du procédé selon l'invention peut se faire à partir de calculateurs non spécialisés, pourvus des programmes de calcul nécessaires et recevant les échantillons de signaux numérisés tels qu'ils sont foumis par un convertisseur analogique-numérique.
Cette mise en oeuvre peut aussi se faire à partir d'un calculateur spécialisé à base de processeurs de signaux numériques, ce qui permet de traiter plus rapidement un plus grand nombre de signaux numériques.
La figure 4 représente un exemple d'architecture générale d'un calculateur spécialisé recevant le signal sonore à débruiter et foumissant en temps réel un signal sonore débruité.
Le calculateur comprend deux processeurs de signaux numériques DSP1 et DSP2 et des mémoires de travail associées à ces processeurs.
Les signaux sonores bruités passent dans un convertisseur analogique-numérique CNN et sont stockés en parallèle dans deux mémoires tampons FIFO1 et FIF02 (du type "first-in, first-out", c'est-à-dire premier entré premier sorti). L'une des mémoires est reliée au p une mémoire de travail dynamique DRAME dans laquelle on stocke l'échantillon de trame courante pendant un calcul, L'énergie d'une trame courante, L'énergie de la ou des trames précédentes, les échantillons de transformée de Fourier du modèle de bruit. II est couplé également à une mémoire de travail statique dans laquelle sont stockées les tables servant au calcul de transformées de Fourier, et les seuils de comparaison S et SR.
Le processeur DSP2 est dédié plutôt au calcul de transformées de Fourier du signal à débruiter, au calcul de densité spectrale de ce signal, au calcul des coefficients de Wiener, au filtrage de Wiener, et à la transformée de Fourier inverse si cette dernière doit être effectuée. Le processeur DSP2 est couplé à une mémoire de travail dynamique DRAM2 et une mémoire de travail statique SRAM2. La mémoire DRAM2 stocke des échantillons de trame courante, des résultats de calcul de transformée de
Fourier, des résultats de calcul de densité spectrale d'énergie du signal, les coefficients de Wiener calculés, etc... La mémoire SRAM2 stocke notamment des tables servant au calcul de transformées de Fourier.
Les échantillons de signal sonore débruités calculés par le processeur DSP2 sont transmis, à travers une mémoire tampon circulante Fiv03, à un convertisseur numérique analogique CN/A, et à un circuit de lissage qui reconstitue sous forme analogique le signal sonore débruité.

Claims (9)

REVENDICATIONS
1. Procédé de recherche automatique de modèles de bruit dans des signaux d'entrée sonores bruités, dans lequel on numérise les signaux d'entrée, et on traite ces signaux à partir d'un modèle trouvé, caractérisé en ce que les signaux d'entrée sont découpés en trames successives de P échantillons chacune, et une recherche répétitive d'un modèle de bruit est effectuée en permanence dans les signaux d'entrée euxmêmes, en recherchant N trames successives ayant les caractéristiques attendues d'un bruit, en stockant les NxP échantillons correspondants pour constituer un modèle de bruit utile au traitement de débruitage des signaux d'entrée, et en réitérant la recherche pour trouver un nouveau modèle de bruit et stocker le nouveau modèle en remplacement du précédent ou conserver le modèle précédent selon les caractéristiques respectives des deux modèles.
2. Procédé selon la revendication 1, caractérisé en ce que la recherche d'un modèle de bruit comprend la recherche de N trames successives dont les énergies sont proches les unes des autres, N étant compris entre une valeur minimale NI et une valeur maximale N2, le calcul de l'énergie moyenne des N trames successives trouvées, et le stockage des NxP échantillons à titre de nouveau modèle actif si le rapport entre cette énergie moyenne et l'énergie moyenne des trames du modèle actif précédemment stocké est inférieur à un seuil de remplacement déterminé.
3. Procédé selon la revendication 2, caractérisé en ce que la recherche de N trames successives comprend alors au moins les étapes itératives suivantes : calcul de l'énergie d'une trame courante de rang n susceptible d'être ajoutée à un modèle en cours d'élaboration comprenant déjà n-l trames successives; calcul du rapport entre cette énergie et l'énergie de la trame précédente de rang n-1; comparaison de ce rapport avec un seuil bas inférieur à 1 et un seuil haut supérieur à 1; et décision sur la possibilité d'incorporer la trame de rang n au modèle en cours d'élaboration en fonction du résultat de la comparaison.
4. Procédé selon la revendication 3, caractérisé en ce que la recherche de N trames successives comprend également le calcul du rapport entre l'énergie de la trame courante et l'énergie d'une ou plusieurs autres trames précédentes, la comparaison avec les seuils, la trame étant incorporée au modèle en cours d'élaboration en fonction du résultat de la comparaison.
5. Procédé selon l'une des revendications 3 et 4, caractérisé en ce que dans le cas où la trame de rang n est incorporée au modèle, on incrémente n d'une unité pour continuer l'élaboration du modèle si n est inférieur à N2, et, dans le cas contraire, on arrête l'élaboration du modèle, on calcule l'énergie moyenne des n trames, on calcule le rapport entre cette énergie et l'énergie moyenne des trames du modèle précédemment stocké, on conserve le modèle précédent ou on le remplace par le modèle en cours d'élaboration selon la valeur du rapport, et on recommence la recherche itérative d'un nouveau modèle.
6. Procédé selon l'une des revendications 3 et 4, caractérisé en ce que dans le cas où la trame courante de rang n n'est pas incorporée au modèle en cours d'élaboration,
- on arrête l'élaboration du modèle de n-l trames;
- si n est supérieur à N1, on calcule le rapport entre l'énergie moyenne des trames du modèle en cours d'élaboration et l'énergie moyenne des trames du modèle précédemment stocké, et on conserve le modèle précédent ou on le remplace par le nouveau modèle selon la valeur du rapport,
- et on recommence une recherche itérative d'un nouveau modèle.
7. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'on recherche la présence de parole dans le signal d'entrée, et on inhibe la recherche d'un nouveau modèle si la présence de parole est détectée.
8. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'on réinitialise périodiquement la recherche en imposant le nouveau modèle quelles que soient les caractéristiques respectives du nouveau modèle et du modèle précédent.
9. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'on traite les signaux d'entrée bruités à partir d'un modèle de bruit trouvé, par filtrage spectral, en vue d'éliminer au mieux le bruit correspondant au modèle.
FR9708509A 1997-07-04 1997-07-04 Procede de recherche d'un modele de bruit dans des signaux sonores bruites Expired - Fee Related FR2765715B1 (fr)

Priority Applications (6)

Application Number Priority Date Filing Date Title
FR9708509A FR2765715B1 (fr) 1997-07-04 1997-07-04 Procede de recherche d'un modele de bruit dans des signaux sonores bruites
DE69806006T DE69806006T2 (de) 1997-07-04 1998-07-03 Verfahren zur bestimmung eines rauschmodells in einem gestörten audiosignal
PCT/FR1998/001428 WO1999001862A1 (fr) 1997-07-04 1998-07-03 Procede de recherche d'un modele de bruit dans des signaux sonores bruites
EP98935094A EP0993671B1 (fr) 1997-07-04 1998-07-03 Procede de recherche d'un modele de bruit dans des signaux sonores bruites
US09/446,886 US6438513B1 (en) 1997-07-04 1998-07-03 Process for searching for a noise model in noisy audio signals
JP50654799A JP4338226B2 (ja) 1997-07-04 1998-07-03 ノイズを含む音声信号内のノイズモデルを探索する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9708509A FR2765715B1 (fr) 1997-07-04 1997-07-04 Procede de recherche d'un modele de bruit dans des signaux sonores bruites

Publications (2)

Publication Number Publication Date
FR2765715A1 true FR2765715A1 (fr) 1999-01-08
FR2765715B1 FR2765715B1 (fr) 1999-09-17

Family

ID=9508879

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9708509A Expired - Fee Related FR2765715B1 (fr) 1997-07-04 1997-07-04 Procede de recherche d'un modele de bruit dans des signaux sonores bruites

Country Status (6)

Country Link
US (1) US6438513B1 (fr)
EP (1) EP0993671B1 (fr)
JP (1) JP4338226B2 (fr)
DE (1) DE69806006T2 (fr)
FR (1) FR2765715B1 (fr)
WO (1) WO1999001862A1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1104925A1 (fr) * 1999-12-03 2001-06-06 Siemens Aktiengesellschaft Procédé de traitement de la parole par soustraction d'une fonction du bruit
DE102013111784A1 (de) * 2013-10-25 2015-04-30 Intel IP Corporation Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6633842B1 (en) * 1999-10-22 2003-10-14 Texas Instruments Incorporated Speech recognition front-end feature extraction for noisy speech
EP1152399A1 (fr) * 2000-05-04 2001-11-07 Faculte Polytechniquede Mons Traitement en sous bandes de signal de parole par réseaux de neurones
FR2808917B1 (fr) * 2000-05-09 2003-12-12 Thomson Csf Procede et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US6954745B2 (en) * 2000-06-02 2005-10-11 Canon Kabushiki Kaisha Signal processing system
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
EP1170728A1 (fr) * 2000-07-05 2002-01-09 Alcatel Dispositif de réduction adaptive du bruit dans des signaux de parole
US7062442B2 (en) * 2001-02-23 2006-06-13 Popcatcher Ab Method and arrangement for search and recording of media signals
BR0207553A (pt) * 2001-02-23 2004-09-14 Popcatcher Inc Método e dispositivo para busca e gravação de sinais de mìdia
GB2380644A (en) * 2001-06-07 2003-04-09 Canon Kk Speech detection
FR2842064B1 (fr) * 2002-07-02 2004-12-03 Thales Sa Systeme de spatialisation de sources sonores a performances ameliorees
SE524162C2 (sv) * 2002-08-23 2004-07-06 Rickard Berg Förfarande för att behandla signaler
CN1802696A (zh) * 2003-06-05 2006-07-12 松下电器产业株式会社 音质调整装置及音质调整方法
EP1494040A1 (fr) * 2003-06-30 2005-01-05 Sulzer Markets and Technology AG Méthode de compensation de bruit de quantification et utilisation de la méthode
US8718298B2 (en) * 2003-12-19 2014-05-06 Lear Corporation NVH dependent parallel compression processing for automotive audio systems
US7813921B2 (en) * 2004-03-31 2010-10-12 Pioneer Corporation Speech recognition device and speech recognition method
US7139701B2 (en) * 2004-06-30 2006-11-21 Motorola, Inc. Method for detecting and attenuating inhalation noise in a communication system
CN101031963B (zh) * 2004-09-16 2010-09-15 法国电信 处理有噪声的声音信号的方法以及实现该方法的装置
JP5724361B2 (ja) * 2010-12-17 2015-05-27 富士通株式会社 音声認識装置、音声認識方法および音声認識プログラム
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
US9633669B2 (en) * 2013-09-03 2017-04-25 Amazon Technologies, Inc. Smart circular audio buffer
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
JP6851310B2 (ja) * 2015-01-20 2021-03-31 ドルビー ラボラトリーズ ライセンシング コーポレイション ドローン推進システム・ノイズのモデル化および削減
CN105991900B (zh) * 2015-02-05 2019-08-09 扬智科技股份有限公司 噪声检测方法和去噪方法
CN106067847B (zh) * 2016-05-25 2019-10-22 腾讯科技(深圳)有限公司 一种语音数据传输方法及装置
CN109087659A (zh) * 2018-08-03 2018-12-25 三星电子(中国)研发中心 音频优化方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US5550924A (en) * 1993-07-07 1996-08-27 Picturetel Corporation Reduction of background noise for speech enhancement
WO1997018647A1 (fr) * 1995-11-13 1997-05-22 Motorola Inc. Procede et dispositif de suppression du bruit dans un systeme de communications

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5029118A (en) * 1985-12-04 1991-07-02 Nissan Motor Co. Ltd. Periodic noise canceling system and method
FR2677828B1 (fr) 1991-06-14 1993-08-20 Sextant Avionique Procede de detection d'un signal utile bruite.
FR2697101B1 (fr) 1992-10-21 1994-11-25 Sextant Avionique Procédé de détection de la parole.
FR2704111B1 (fr) 1993-04-16 1995-05-24 Sextant Avionique Procédé de détection énergétique de signaux noyés dans du bruit.
US5521851A (en) * 1993-04-26 1996-05-28 Nihon Kohden Corporation Noise reduction method and apparatus
JPH07193548A (ja) * 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
JP3453898B2 (ja) * 1995-02-17 2003-10-06 ソニー株式会社 音声信号の雑音低減方法及び装置
JP2685031B2 (ja) * 1995-06-30 1997-12-03 日本電気株式会社 雑音消去方法及び雑音消去装置
FR2744871B1 (fr) 1996-02-13 1998-03-06 Sextant Avionique Systeme de spatialisation sonore, et procede de personnalisation pour sa mise en oeuvre
US5937381A (en) * 1996-04-10 1999-08-10 Itt Defense, Inc. System for voice verification of telephone transactions
US6144937A (en) * 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
TW333610B (en) * 1997-10-16 1998-06-11 Winbond Electronics Corp The phonetic detecting apparatus and its detecting method
US6216103B1 (en) * 1997-10-20 2001-04-10 Sony Corporation Method for implementing a speech recognition system to determine speech endpoints during conditions with background noise
US6182018B1 (en) * 1998-08-25 2001-01-30 Ford Global Technologies, Inc. Method and apparatus for identifying sound in a composite sound signal
US6188981B1 (en) * 1998-09-18 2001-02-13 Conexant Systems, Inc. Method and apparatus for detecting voice activity in a speech signal
US6108610A (en) * 1998-10-13 2000-08-22 Noise Cancellation Technologies, Inc. Method and system for updating noise estimates during pauses in an information signal
US6289309B1 (en) * 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US5550924A (en) * 1993-07-07 1996-08-27 Picturetel Corporation Reduction of background noise for speech enhancement
WO1997018647A1 (fr) * 1995-11-13 1997-05-22 Motorola Inc. Procede et dispositif de suppression du bruit dans un systeme de communications

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1104925A1 (fr) * 1999-12-03 2001-06-06 Siemens Aktiengesellschaft Procédé de traitement de la parole par soustraction d'une fonction du bruit
DE102013111784A1 (de) * 2013-10-25 2015-04-30 Intel IP Corporation Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren
US10249322B2 (en) 2013-10-25 2019-04-02 Intel IP Corporation Audio processing devices and audio processing methods
DE102013111784B4 (de) * 2013-10-25 2019-11-14 Intel IP Corporation Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren

Also Published As

Publication number Publication date
US6438513B1 (en) 2002-08-20
EP0993671B1 (fr) 2002-06-12
JP2002513479A (ja) 2002-05-08
WO1999001862A1 (fr) 1999-01-14
JP4338226B2 (ja) 2009-10-07
EP0993671A1 (fr) 2000-04-19
FR2765715B1 (fr) 1999-09-17
DE69806006D1 (de) 2002-07-18
DE69806006T2 (de) 2002-12-19

Similar Documents

Publication Publication Date Title
EP0993671B1 (fr) Procede de recherche d&#39;un modele de bruit dans des signaux sonores bruites
EP0918317B1 (fr) Procédé de filtrage fréquentiel appliqué au débruitage de signaux sonores mettant en oeuvre un filtre de Wiener
EP1154405B1 (fr) Procédé et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
EP0594480B1 (fr) Procédé de détection de la parole
EP1830349B1 (fr) Procédé de débruitage d&#39;un signal audio
EP2057835B1 (fr) Procédé de réduction de l&#39;écho acoustique résiduel après suppression d&#39;écho dans un dispositif &#34;mains libres&#34;
EP0932964B1 (fr) Procede et dispositif d&#39;egalisation aveugle des effets d&#39;un canal de transmission sur un signal de parole numerique
EP1789956A1 (fr) Procede de traitement d&#39;un signal sonore bruite et dispositif pour la mise en ceuvre du procede
FR2943875A1 (fr) Procede et dispositif de classification du bruit de fond contenu dans un signal audio.
EP2419900A1 (fr) Procede et dispositif d&#39;evaluation objective de la qualite vocale d&#39;un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal
FR2836226A1 (fr) Procede d&#39;identification d&#39;une source d&#39;un signal
FR3012928A1 (fr) Modificateurs reposant sur un snr estime exterieurement pour des calculs internes de mmse
EP1451548A2 (fr) System de detection de parole dans un signal audio en environnement bruite
EP1131813B1 (fr) Procede de reconnaissance vocale dans un signal acoustique bruite et systeme mettant en oeuvre ce procede
CA2404441C (fr) Parametres robustes pour la reconnaissance de parole bruitee
WO2009004225A1 (fr) Post-traitement de reduction du bruit de quantification d&#39;un codeur, au decodage
EP0534837B1 (fr) Procédé de traitement de la parole en présence de bruits acoustiques utilisant la sous traction spectrale non-linéaire et les modèles de Markov cachés
EP0905678A1 (fr) Procédé d&#39;apprentissage dans un système de reconnaissance de parole
CA2304015A1 (fr) Procede de debruitage d&#39;un signal de parole numerique
WO1999027523A1 (fr) Procede de reconstruction, apres debruitage, de signaux sonores
WO2002093553A1 (fr) Estimation de periodes fondamentales de sources concurrentes multiples notamment de son

Legal Events

Date Code Title Description
CL Concession to grant licences
ST Notification of lapse