FR2950461A1 - Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile - Google Patents

Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile Download PDF

Info

Publication number
FR2950461A1
FR2950461A1 FR0956506A FR0956506A FR2950461A1 FR 2950461 A1 FR2950461 A1 FR 2950461A1 FR 0956506 A FR0956506 A FR 0956506A FR 0956506 A FR0956506 A FR 0956506A FR 2950461 A1 FR2950461 A1 FR 2950461A1
Authority
FR
France
Prior art keywords
noise
signal
speech
microphones
incidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0956506A
Other languages
English (en)
Other versions
FR2950461B1 (fr
Inventor
Guillaume Vitte
Julie Seris
Guillaume Pinto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Parrot SA
Original Assignee
Parrot SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Parrot SA filed Critical Parrot SA
Priority to FR0956506A priority Critical patent/FR2950461B1/fr
Priority to ES10167065T priority patent/ES2375844T3/es
Priority to EP10167065A priority patent/EP2309499B1/fr
Priority to AT10167065T priority patent/ATE529860T1/de
Priority to US12/840,976 priority patent/US8195246B2/en
Publication of FR2950461A1 publication Critical patent/FR2950461A1/fr
Application granted granted Critical
Publication of FR2950461B1 publication Critical patent/FR2950461B1/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Otolaryngology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

Le procédé comporte dans le domaine fréquentiel les étapes suivantes : a) calcul (18) d'une première référence de bruit par analyse de cohérence spatiale des signaux captés ; b) calcul (20) d'une seconde référence de bruit par analyse des directions d'incidence des signaux captés ; c) estimation (24) d'une direction principale d'incidence (θ(k, l)) des signaux captés ; d) sélection (22) comme signal de bruit référent (Ref(k,l)) de l'une ou l'autre des références de bruit en fonction de la direction principale estimée ; e) combinaison (28) des signaux captés en un signal combiné bruité (X(k,l)) ; f) calcul (26) d'une probabilité d'absence de parole (q(k,l)) dans le signal combiné bruité, à partir des niveaux respectifs d'énergie spectrale du signal combiné bruité (X(k,l)) et du signal de bruit référent (Ref(k,l)) ; et g) réduction sélective du bruit (34) par application d'un gain variable propre à chaque bande de fréquences et à chaque trame temporelle.

Description

L'invention concerne le traitement de la parole en milieu bruité. Elle concerne notamment, mais de façon non limitative, le traitement des signaux de parole captés par des dispositifs de téléphonie pour véhicules automobiles.
Ces appareils comportent un microphone ("micro") sensible captant non seulement la voix de l'utilisateur, mais également le bruit environnant, bruit qui constitue un élément perturbateur pouvant aller, dans certains cas, jusqu'à rendre incompréhensibles les paroles du locuteur. Il en est de même si l'on veut mettre en oeuvre des techniques de reconnaissance vo- cale, car il est très difficile d'opérer une reconnaissance de forme sur des mots noyés dans un niveau de bruit élevé. Cette difficulté liée aux bruits environnants est particulièrement contraignante dans le cas des dispositifs "mains-libres". En particulier, la dis-tance importante entre le micro et le locuteur entraîne un niveau relatif de bruit élevé qui rend difficile l'extraction du signal utile noyé dans le bruit. De plus, le milieu très bruité typique de l'environnement automobile pré-sente des caractéristiques spectrales non stationnaires, c'est-à-dire qui évoluent de manière imprévisible en fonction des conditions de conduite : passage sur des chaussées déformées ou pavées, autoradio en fonction- nement, etc. Certains de ces dispositifs prévoient l'utilisation de plusieurs micros, généralement deux micros, et utilisent la moyenne des signaux captés, ou d'autres opérations plus complexes, pour obtenir un signal avec un niveau de perturbations moindre. En particulier, une technique dite beamforming permet de créer par des moyens logiciels une directivité qui améliore le rapport signal/bruit, mais les performances de cette technique sont très limitées lorsque seulement deux micros sont utilisés (concrètement, on estime qu'une telle méthode ne fournit de bons résultats qu'à condition de disposer d'un réseau d'au moins huit micros).
Par ailleurs, les techniques classiques sont surtout adaptées au filtrage des bruits diffus, stationnaires, provenant des alentours du dispositif et se retrouvant à des niveaux comparables dans les signaux captés par les deux micros.
En revanche, un bruit non stationnaire ou "transient", c'est-à-dire un bruit évoluant de manière imprévisible en fonction du temps, ne sera pas discriminé de la parole et ne sera donc pas atténué. Or, dans un environnement automobile ces bruits non stationnaires et di-5 rectifs sont très fréquents : coup de klaxon, passage d'un scooter, dépassement par une voiture, etc. Une difficulté du filtrage de ces bruits non stationnaires tient au fait que leurs caractéristiques temporelles et spatiales sont très proches de celles de la parole, d'où la difficulté d'une part, d'estimer la présence d'une pa- l 0 rote (car le locuteur ne parle pas tout le temps) et d'autre part d'extraire le signal utile de parole dans un environnement très bruité tel qu'un habitacle de véhicule automobile. L'un des buts de la présente invention est de proposer un dispositif mains-libres multi-microphone, notamment un système qui mette en oeuvre seu-15 lement deux microphones, permettant : de distinguer de façon efficace les bruits non stationnaires de la parole ; et d'adapter le débruitage à la présence et aux caractéristiques des bruits non stationnaires détectés, sans altérer la parole éventuellement pré- 20 sente, afin de traiter le signal bruité de la manière la plus efficace. Le point de départ de l'invention consiste à associer (i) une analyse de cohérence spatiale du signal capté par les deux micros, à (ii) une analyse de la direction d'incidence de ces signaux. L'invention repose en effet sur deux constatations, à savoir que : 25 la parole présente généralement une cohérence spatiale supérieure au bruit ; et par ailleurs que la direction d'incidence de la parole est généralement bien définie, et peut être supposée connue (dans le cas d'un véhicule automobile, elle est définie par la position du conducteur, vers lequel est tourné le mi- 30 cro). Ces deux propriétés seront utilisées pour calculer deux références de bruit selon des méthodes différentes : - une première référence de bruit calculée en fonction de la cohérence spatiale des signaux captés û une telle référence sera intéressante dans la mesure où elle intègre les bruits non stationnaires peu directifs (accrocs dans le ronronnement du moteur, etc.) ; et une seconde référence de bruit calculée en fonction de la direction principale d'incidence des signaux û cette caractéristique est en effet déterminable lorsque l'on utilise un réseau de plusieurs micros (au moins deux), conduisant à une référence de bruit intégrant surtout les bruits non stationnaires directifs (coups de klaxon, passage d'un scooter, dépassement par une voiture, etc.). Ces deux références de bruit seront utilisées en alternance selon la na- Lure du bruit présent, en fonction de la direction d'incidence des signaux : de manière générale, la première référence de bruit (celle calculée par cohérence spatiale) sera utilisée par défaut ; en revanche, lorsque la direction principale d'incidence du signal sera éloignée de celle du signal utile (la direction du locuteur, supposée connue a priori) û c'est-à-dire en présence d'un bruit directif assez puissant û la seconde référence de bruit sera utilisée de façon à introduire majoritairement dans cette dernière les bruits non stationnaires directifs et puissants. Une fois la référence de bruit ainsi sélectionnée, cette référence sera utili- sée pour, d'une part, calculer une probabilité d'absence/présence de pa- role et pour, d'autre part, débruiter le signal capté par les micros. Plus précisément, l'invention vise, de façon générale, un procédé de dé-bruitage d'un signal acoustique bruité capté par une pluralité de micro-phones d'un dispositif audio multi-microphone opérant dans un milieu bruité, notamment un dispositif téléphonique "mains libres" pour véhicule automobile. Le signal acoustique bruité comprend une composante utile de parole issue d'une source de parole directive et une composante para-site de bruit, cette composante de bruit incluant elle-même une composante de bruit latéral non stationnaire directif.
De façon caractéristique de l'invention, ce procédé comporte, dans le domaine fréquentiel pour une pluralité de bandes de fréquences définies pour des trames temporelles successives de signal, les étapes de traite-ment du signal suivantes : a) calcul d'une première référence de bruit par analyse de cohérence 35 spatiale des signaux captés par la pluralité de microphones ; b) calcul d'une seconde référence de bruit par analyse des directions d'incidence des signaux captés par la pluralité de microphones ; c) estimation d'une direction principale d'incidence des signaux captés par la pluralité de microphones ; d) sélection comme signal de bruit référent de l'une ou l'autre des références de bruit calculées aux étapes a) et b), en fonction de la direction principale estimée à l'étape c) ; e) combinaison de la pluralité de signaux captés par la pluralité correspondante de microphones en un signal combiné bruité ; f) calcul d'une probabilité d'absence de parole dans le signal combiné bruité, à partir des niveaux respectifs d'énergie spectrale du signal combiné bruité et du signal de bruit référent ; g) à partir de la probabilité d'absence de parole calculée à l'étape f) et du signal combiné bruité, réduction sélective du bruit par application d'un 15 gain variable propre à chaque bande de fréquences et à chaque trame temporelle. Selon diverses caractéristiques subsidiaires avantageuses : le calcul de la première référence de bruit de l'étape a) comprend un filtrage linéaire prédictif appliqué aux signaux captés par la pluralité de 20 microphones, notamment avec application d'un algorithme de prédiction linéaire de type moindres carrés moyens LMS, et soustraction avec compensation du déphasage entre le signal capté et le signal de sortie du filtre prédictif ; le calcul de la seconde référence de bruit de l'étape b) comprend le 25 blocage spatial des composantes des signaux captés dont la direction d'incidence est située à l'intérieur d'un cône de référence défini de part et d'autre d'une direction prédéterminée d'incidence du signal utile ; - l'estimation de la direction principale d'incidence de l'étape c) comprend les sous-étapes successives suivantes : cl) partition de l'espace en 30 une pluralité de secteurs angulaires ; c2) pour chaque secteur, évaluation d'un estimateur de direction d'incidence à partir de la pluralité de signaux captés par la pluralité correspondante de microphones ; et c3) à partir des valeurs d'estimateurs calculées à l'étape c2), estimation de ladite direction principale d'incidence ; - la sélection de l'étape d) est une sélection de la seconde référence de bruit comme signal de bruit référent si la direction principale estimée à l'étape c) est située hors d'un cône de référence défini de part et d'autre d'une direction prédéterminée d'incidence du signal utile ; - la combinaison de l'étape e) comprend un préfiltrage de type fixed beamforming ; - le calcul de probabilité d'absence de parole de l'étape f) comprend l'estimation de composantes de bruit pseudo-stationnaire respectives contenues dans le signal combiné bruité et dans le signal de bruit réfé- rent, la probabilité d'absence de parole étant calculée à partir égale- ment de ces composantes de bruit pseudo-stationnaire respectives ; - la réduction sélective du bruit de l'étape g) est un traitement par application d'un gain à amplitude log-spectrale modifié optimisé OM-LSA. 0
On va maintenant décrire un exemple de mise en oeuvre du procédé de l'invention en référence à la figure annexée. La Figure 1 est un schéma par blocs montrant les différents modules et 20 fonctions mis en oeuvre par le procédé de l'invention ainsi que leurs inte- ractions. 0
Le procédé de l'invention est mis en oeuvre par des moyens logiciels, qu'il 25 est possible de décomposer et schématiser par un certain nombre de blocs 10 à 36 illustrés Figure 1. Ces traitements sont mis en oeuvre sous forme d'algorithmes appropriés exécutés par un microcontrôleur ou un processeur numérique de signal. Bien que, pour la clarté de l'exposé, ces divers traitements soient présen- 30 tés sous forme de modules distincts, ils mettent en oeuvre des éléments communs et correspondent en pratique à une pluralité de fonctions globalement exécutées par un même logiciel. Le signal que l'on souhaite débruiter est issu d'une pluralité de signaux captés par un réseau de micros (qui, dans la configuration minimale, peut 35 être simplement un réseau de deux micros, comme dans l'exemple illus- tré) disposés selon une configuration prédéterminée. En pratique, ces deux micros peuvent par exemple être installés sur le plafonnier d'un habitacle de voiture, à environ 5 cm l'un de l'autre ; et avoir le lobe principal de leur diagramme de directivité orienté vers le conducteur. Cette direc- tion, considérée comme a priori connue, sera désignée direction d'incidence du signal utile. On appellera "bruit latéral" un bruit non stationnaire directif dont la direction d'incidence est éloignée de celle du signal utile, et on appellera "cône privilégié" la direction ou secteur angulaire de l'espace où se trouve la source de signal utile (la parole du locuteur) par rapport au réseau de micros. Lorsqu'une source sonore se manifestera en dehors du cône privilégié, il s'agira donc d'un bruit latéral, que l'on cherchera à atténuer. Comme illustré sur la Figure 1, les signaux bruités captés par les deux micros x1(n) et x2(n) font l'objet d'une transposition dans le domaine fréquen- tiel (blocs 10) par un calcul de transformée de Fourrier à court terme (FFT) dont le résultat est noté respectivement XI(k,l) et X2(k,l), k étant l'indice de la bande de fréquence et l étant l'indice de la trame temporelle. Les signaux issus des deux micros sont également appliqués à un module 12 mettant en oeuvre un algorithme LMS prédictif schématisé par le bloc 14 et donnant, après calcul d'une transformée de Fourrier à court terme (bloc 16) un signal Y(k,l) qui servira au calcul d'une première référence de bruit Refi(k,l) exécuté par un bloc 18, essentiellement sur un critère de cohérence spatiale. Une autre référence de bruit Ref2(k,l) est calculée par un bloc 20, essen- tiellement sur un critère de blocage angulaire), à partir des signaux X1(k,l) et X2(k,l) directement obtenus, dans le domaine fréquentiel, à partir des signaux x1(n) et x2(n). Un bloc 22 opère la sélection de l'une ou l'autre des références de bruit Refi(k,l) ou Ref2(k,l) en fonction du résultat d'un calcul de l'angle d'inci-30 dence des signaux opéré par le bloc 24 à partir des signaux XI(k,l) et X2(k,l). La référence de bruit choisie, Ref(k,l), est utilisée comme canal de bruit référent d'un bloc 26 de calcul d'une probabilité d'absence de parole opérée sur un signal bruité X(k,l) résultant d'une combinaison, opérée par le bloc 28, des deux signaux XI(k,l) et X2(k,l). Le bloc 26 prend également 35 en compte les composantes de bruit pseudo-stationnaire respectives du canal de bruit référent et du signal bruité, composantes estimées par les blocs 30 et 32. Le résultat q(k,l) du calcul de probabilité d'absence de parole et le signal bruité X(k,l) sont appliqués en entrée d'un algorithme de contrôle de gain OM-LSA (bloc 34) dont le résultat I S(k,l) est soumis (bloc 36) à une transformation de Fourrier inverse (iFFT) pour obtenir dans le domaine temporel une estimée s(t) du signal de parole débruité. On va maintenant décrire en détail chacune des étapes du traitement.
Transformée de Fourier des signaux captés par les micros (blocs 10)
Le signal dans le domaine temporel x,,(t) issu de chacun des N micros (N=1,2 dans l'exemple illustré) est numérisé, découpé en trames de T points temporels, fenêtré temporellement par une fenêtre de type Han- ning, puis la transformée de Fourier rapide FFT (transformée à court terme) Xä(k,l) est calculée pour chacun de ces signaux : X,,(k,l) = a,,.d,, (k)x S(k,l)+Vä(k,l) avec : d,,(k)=e'2 l étant l'indice de la trame temporelle, k étant l'indice de la bande de fréquences, et fk étant la fréquence centrale de la bande de fréquences indicée par k, S(k,l) désignant la source de signal utile, a,, et désignant l'atténuation et le délai subis par le signal utile capté au niveau du micro n, et Vä(k,l) désignant le bruit capté par le micro n.
Calcul d'une première référence de bruit par cohérence spatiale (bloc 12) L'idée fondamentale sur laquelle repose l'invention est que, dans un environnement de télécommunications, la parole est un signal émis par une 35 source bien localisée, relativement proche des micros et presque entiè- rement captée en chemin direct. À l'inverse, les bruits stationnaires et non stationnaires, qui proviennent surtout des alentours de l'utilisateur, peu-vent être associés à des sources éloignées, en grand nombre et possédant une corrélation statistique inférieure à la parole entre les deux mi- cros. Dans un environnement de télécommunications, la parole est donc plus cohérente spatialement que le bruit. Partant de ce principe, il est possible d'exploiter la propriété de cohérence spatiale pour construire un canal de bruit de référence plus riche et plus adapté qu'avec un beamformer. Le système prévoit à cet effet d'utiliser un filtre prédictif 14 de type LMS (Least Mean Squares, moindres carrés moyens) ayant pour entrées les signaux x, (n) et x2(n) captés par le couple de micros. On notera y(n) la sortie du LMS et e(n) l'erreur de prédiction.
Ce filtre prédictif est utilisé pour prédire à partir de x2(n) la composante parole qui se trouve dans x, (n). En effet, étant plus cohérente spatiale-ment, la parole sera mieux prédite par le filtre adaptatif que le bruit. Une première possibilité consiste à prendre pour le canal de bruit référent la transformée de Fourier de l'erreur de prédiction : E(k,l) = X, (k,l)ù Y(k,l) E(k, l) , X, (k, l) et Y(k,l) étant les transformées de Fourier à court terme (TFCT) respectives de e(k, l) , x, (k, l) et y(k, l) .
On constate cependant en pratique un certain déphasage entre XI(k,l) et Y(k,l) dû à une convergence imparfaite de l'algorithme LMS, ce qui empêche une bonne discrimination entre parole et bruit. Pour pallier ce défaut, il est possible de définir le premier signal de bruit référent Réf, (k, l) par : Rej; (k,l)= X,(k,l)ùX,(k,l) À la différence de nombreuses méthodes classiques d'estimation du bruit, aucune hypothèse de stationnarité n'est utilisée sur le bruit pour calculer ce premier canal de bruit de référence Réf, (k, l ). L'un des avantages est par conséquent que ce canal de bruit intègre une partie des bruits non stationnaires, en particulier ceux qui ont une faible corrélation statistique et qui ne sont pas prédictibles entre les deux micros. Calcul d'une seconde référence de bruit par blocage spatial (bloc 20) Dans un environnement de télécommunications, il est possible de rencontrer des bruits dont la source est bien localisée et relativement proche 10 des micros. Il s'agit en général de bruits ponctuels assez puissants (pas-sage d'un scooter, dépassement par une voiture, etc.), et qui peuvent être gênants. Les hypothèses utilisées pour le calcul du premier canal de bruit référent ne sont pas vérifiées sur ce type de bruit ; en revanche, ces bruits ont la 15 particularité d'avoir une direction d'incidence bien définie et distincte de la direction d'incidence de la parole. Pour exploiter cette propriété, on supposera que l'angle d'incidence 8S de la parole est connu, par exemple défini comme étant l'angle entre la médiatrice du couple de micros et la direction de référence correspondant à 20 la source de parole utile. Plus précisément, on opère une partition de l'espace en secteurs angulaires qui décrivent l'espace, et dont chacun correspond à une direction dé- finie par un angle 8p j E [1,M], avec par exemple M = 19, donnant la collection d'angles {-90°,-800 ...,00 ,...+800,+90°}. On notera qu'il n'y a aucun 25 lien entre le nombre N de micros et le nombre Md'angles testés : par exemple, il est tout à fait possible de tester M = 19 angles avec un seul couple de micros (N=2). On se donne la partition {A,I} des angles 8; qui sont respectivement "autorisés" et "interdits", les angles 8a E A étant "autorisés" en ce qu'ils cor- 30 respondant à des signaux en provenance d'un cône privilégié centré sur 8S , tandis que les angles 8; E I sont "interdits" en ce qu'ils correspondent à des bruits latéraux indésirables.5 Le second canal de bruit référent Réfz (k, l) est défini de la manière sui-vante : 1 Ref2(k,l)= A 0 e A.fk.d.sin X1(k,l)- X2(k,l)x e c J, X1(k,l) étant la TFCT du signal enregistré par le micro d'indice 1, X2(k,l) étant la TFCT du signal enregistré par le micro d'indice 2, fk étant la fréquence centrale de la bande de fréquences k, 1 étant la trame, d étant la distance entre les deux micros, c étant la célérité du son, et A étant le nombre d'angles "autorisés" du cône privilégié. Dans chaque terme de cette somme, on retranche au signal du micro d'indice 1 le signal du micro d'indice 2 déphasé d'un angle 0, qui appartient à A (sous-collection des angles "autorisés"). Ainsi, dans chaque terme on bloque spatialement les signaux ayant une direction de propagation BQ "autorisée". Ce blocage spatial est effectué pour tous les angles autorisés. Dans ce second canal de bruit référent Réf2 (k, l), on laisse donc passer les éventuels bruits latéraux (bruits non stationnaires directifs), en blo- quant spatialement le signal de parole.
Choix de la référence de bruit en fonction de la direction d'incidence des signaux (blocs 22 et 24) Cette sélection implique une estimation de l'angle d'incidence â(k, l) des signaux. Cet estimateur (bloc 24) peut par exemple s'appuyer sur un calcul d'inter-corrélation, en prenant comme direction d'incidence l'angle qui maximise le module de l'estimateur, soit : 9 (k, l) = arg tnax B ,je[1,M]P1,(01,k,l) 11 avec : ,k l) = E(X,(k 1)X2 (k, l) e '2342-i) z~ =d ùsine. c Le canal de bruit référent sélectionné Ref (k,l) va dépendre de la détection d'un angle "autorisé" ou "interdit" pour la trame let la bande de fréquence k: 10 si 8(k, l) est "autorisé" (e(k, l) e A ), alors Ref (k,l) = Ref l(k, l ) si 8(k, l) est "interdit" (9(k, l) e I ), alors Ref (k,l) = Ref 2(k, l)
- si 8(k,l) n'est pas défini, alors Ref(k,l) =Ref,(k,l) Ainsi, dans le cas d'un angle "autorisé" détecté, ou en l'absence de si-
15 gnaux directifs à l'entrée des micros, le canal de bruit référent Ref (k,l) est calculé par cohérence spatiale, ce qui permet d'intégrer les bruits non stationnaires peu directifs.
En revanche si un angle "interdit" est détecté, cela signifie qu'un bruit directif et assez puissant est présent. Dans ce cas, le canal de bruit référent
20 Ref (k,l) est calculé suivant une méthode différente, par blocage spatial, de façon à introduire efficacement dans ce canal les bruits non stationnaires directifs et puissants. Constitution d'un signal combiné partiellement débruité (bloc 28) Les signaux Xä(k,l) (les TFCT des signaux captés par les micros) peu-vent être combinés entre eux par une technique simple de préfiltrage par beamforming du type Delay and Sum, qui est appliquée pour obtenir un signal combiné X(k,l) partiellement débruité : 30 P,2 X(k,l) = 2 {2950461 et 5 25 avec : (.z2 (k) = ei2~rs s d avec z = ù sin 8 c
Lorsque le système considéré comporte, comme dans le présent exem- pie, deux micros dont la médiatrice coupe la source, l'angle9Sest nul et il s'agit d'une simple moyenne qui est faite sur les deux micros. Il est par ail-leurs à noter que, concrètement, le nombre de micros étant limité, ce traitement ne procure qu'une faible amélioration du rapport signal/bruit, de l'ordre de 1 dB seulement.
Estimation du bruit pseudo-stationnaire (blocs 30 et 32) Cette étape a pour objet de calculer une estimation de la composante de bruit pseudo-stationnaire présente dans la référence de bruit Ref (k,l) (bloc 30) et, de la même manière, la composante de bruit pseudostationnaire présente dans le signal à débruiter X(k,l) (bloc 32). Il existe de très nombreuses publications sur ce sujet, l'estimation de la composante de bruit pseudo-stationnaire étant en effet un problème classique assez bien résolu. Différentes méthodes sont efficaces et utilisables à cet effet, notamment un algorithme d'estimation de l'énergie de la composante de bruit pseudo-stationnaire à moyennage récursif par contrôle des minima (MCRA) comme celui décrit par I. Cohen et B. Berdugo, Noise Estimation by Minima Controlled Recursive Averaging for Robust Speech Enhancement, IEEE Signal Processing Letters, Vol. 9, No 1, pp. 12-15, Jan. 2002.
Calcul de la probabilité d'absence de parole (bloc 26)
Une méthode efficace et reconnue pour estimer la probabilité d'absence de parole dans un environnement bruité est celle du rapport des transients, décrite par I. Cohen et B. Berdugo, Two-Channel Signal Detection and Speech Enhancement Based on the Transient Beam-to-Reference Ratio, Proc. ICASSP 2003, Hong-Kong, pp. 233-236, Apr. 2003. 12 Le rapport des transients est défini de la manière suivante : Q(k, l) S[X (k, l )] ù M [X (k, l )] S [Ref (k, l )] ù M [Ref (k, l )] X(k,l) étant le signal combiné partiellement débruité, Ref(k,l) étant le canal de bruit référent calculé dans la partie précédente, k étant la bande de fréquences, et 1 étant la trame L'opérateur S est une estimation de l'énergie instantanée, et l'opérateur M est une estimation de l'énergie pseudo-stationnaire (estimation effectuée par les blocs 30 et 32). SûM fournit une estimation des parties transitoires du signal analysé, appelés aussi transients. Les deux signaux analysés sont ici le signal bruité combiné X(k,l) et le signal du canal de bruit référent Ref (k,l) . Le numérateur va donc mettre en évidence les transients de parole et de bruits, alors que le dénominateur va extraire uniquement les transients de bruits se trouvant dans le canal de bruit référent. Ainsi, en présence de parole mais en l'absence de bruit non stationnaire, le ratio S2(k,l) va tendre vers une limite haute 52,,,ax(k), alors qu'à l'inverse, en l'absence de parole mais en présence de bruit non stationnaire, ce ratio va se rapprocher de la limite basse gn,,, (k), k étant la bande de fréquences. Ceci va permettre de réaliser la différenciation entre parole et bruits non stationnaires. Dans le cas général, on a < min k< û k,l û max (k) La probabilité d'absence de parole, notée ici q(k,l), va être calculée de la manière suivante.
Pour chaque trame 1 et chaque bande de fréquences k : i) Calcul de S[X(k,l)], S[Ref(k,l)], M[X(k,l)] et M[Ref(k,l)] ; ii) Si S[X(k,l)]aXM[X(k,l)], la parole est susceptible d'être présente, l'analyse est poursuivie à l'étape (iii), dans le cas contraire, la parole est absente : alors q(k, l) =1 ; iii) Si S[Ref (k, 1)] aRef.M[Ref (k,1)], du bruit transitoire est susceptible d'être présent, l'analyse est poursuivie à l'étape (iv), dans le cas contraire, ceci signifie les transients trouvés dans X(k, l) sont tous des transients de parole : alors q(k, 1) = 0 ; iv) Calcul du ratio Q(k, l) _ S[X (k, l )] - M [X (k, l )] v) Détermination de la probabilité d'absence de parole : q(k, l) = max(minmax. l~ S2 (k ,0 Max (k , l) mm (k l , ) Les constantes aX et aRef, utilisées dans cet algorithme sont en fait des seuils de détection des parties transitoires. Les paramètres aX , aRef ainsi que SQ,n;,, (k) et ç2,nax (k), sont tous choisis de manière à correspondre à des situations typiques, proches de la réalité. Réduction de bruit par application d'un gain OM-LSA (bloc 34) La probabilité q(k,l) d'absence de parole calculée au bloc 26 va être utilisée comme paramètre d'entrée dans une technique (en elle-même 25 connue) de débruitage. Elle présente l'avantage de permettre d'identifier les périodes d'absence de parole même en présence d'un bruit non stationnaire, peu directif ou directif. La probabilité d'absence de parole est un estimateur crucial pour le bon fonctionnement d'une structure de débruitage telle que nous allons utiliser, car elle sous-tend la bonne estimation 30 du bruit et le calcul d'un gain de débruitage efficace. On peut avantageusement utiliser une méthode de débruitage de type OM-LSA (Optimally Modified - Log Spectral Amplitude) telle que celle décrite par : I. Cohen, Optimal Speech Enhancement Under Signal Presence S [Ref (k, 1)] - M [Ref (k, 1)] ' 20 Uncertainty Using Log-Spectral Amplitude Estimator, IEEE Signal Processing Letters, Vol. 9, No 4, April 2002. Essentiellement, l'application d'un gain nommé "gain LSA" (Log-Spectral Amplitude) permet de minimiser la distance quadratique moyenne entre le logarithme de l'amplitude du signal estimé et le logarithme de l'amplitude du signal de parole originel. Ce second critère se montre supérieur au premier car la distance choisie est en meilleure adéquation avec le comportement de l'oreille humaine et donne donc qualitativement de meilleurs résultats. Dans tous les cas, l'idée essentielle est de diminuer l'énergie des composantes fréquentielles très parasitées en leur appliquant un gain faible, tout en laissant intactes (par l'application d'un gain égal à 1) celles qui le sont peu ou pas du tout. L'algorithme "OM-LSA" (Optimally-Modified Log-Spectral Amplitude) améliore le calcul du gain LSA à appliquer en le pondérant par la probabilité conditionnelle de présence de parole. Dans cette méthode, la probabilité d'absence de parole intervient à deux moments importants, pour l'estimation de l'énergie du bruit et pour le cal-cul du gain final, et la probabilité q(k,l) sera utilisée à ces deux niveaux. Si l'on note /lB,.U;t(k,l) l'estimation de la densité spectrale de puissance du bruit, cette estimation est donnée par : ~Bt tt,r (lz,1) = aBrutr ( k , l) •ÂBruil ( k , l -1) + [1û aBr,,i, ( k , 1)1 avec : aB/-ttrr (k, l) = aB + (1 û aB ).Pspa (k, l) On peut noter ici que la probabilité q(k,l) vient moduler le facteur d'oubli dans l'estimation du bruit, qui est mise à jour plus rapidement sur le signal bruité X(k,l) lorsque la probabilité d'absence de parole est forte, ce mé- canisme conditionnant entièrement la qualité de 2B,.UIt(k,l).
Le gain de débruitageGo,tii-csA(k,l) est donné par : Gong-zsA(k, 1) = {GH,(k,l)}1-q(k,I) "q(,/) 'min X(k,l GHI (k, l) étant un gain de débruitage (dont le calcul dépend de l'estimation du bruit ) décrit dans l'article précité de Cohen, et G,n n étant une constante correspondant au débruitage appliqué lorsque la parole est considérée comme absente.
On notera que la probabilité q(k,l) joue ici un grand rôle dans la détermination du gain Govl_LSA(k,l) . Notamment, lorsque cette probabilité est nulle, le gain est égal à G,,,;,, et une réduction de bruit maximale est appliquée : si par exemple une valeur de 20 dB est choisie pourGn,;n , les bruits non stationnaires précédemment détectés sont atténués de 20 dB.
Le signal débruité S(k,l) en sortie du bloc 34 est donné par : S(k,l) = Gou_LsA(k,l).X(k,l)
On notera que d'ordinaire une telle structure de débruitage produit un ré- sultat peu naturel et agressif sur les bruits non stationnaires, qui sont confondus avec la parole utile. L'un des intérêts majeurs de l'invention est, au contraire, d'éliminer efficacement ces bruits non stationnaires. D'autre part, dans une variante avantageuse, il est possible d'utiliser dans les expressions données plus haut une probabilité d'absence de parole hybride gh,;br;d(k,l) , qui sera calculée à l'aide de q(k,l) et d'une autre probabilité d'absence de parole gs,d(k,l), par exemple évaluée selon la méthode décrite dans le WO 2007/099222 Al (Parrot SA). On a alors :
ghyb,-;d (k, l) = max (q (k, 1), qs,d (k, l) ) Reconstitution temporelle du signal (bloc 36)
La dernière étape consiste à appliquer au signal S(k,l) une transformée de Fourier rapide inverse iFFT pour obtenir dans le domaine temporel le 30 signal de parole débruité s(t) recherché.25

Claims (10)

  1. REVENDICATIONS1. Un procédé de débruitage d'un signal acoustique bruité capté par une pluralité de microphones d'un dispositif audio multi-microphone opérant dans un milieu bruité, notamment un dispositif téléphonique "mains libres" pour véhicule automobile, le signal acoustique bruité comprenant une composante utile de parole is- sue d'une source de parole directive et une composante parasite de bruit, cette composante de bruit incluant elle-même une composante de bruit la- téral non stationnaire directif, procédé caractérisé en ce qu'il comporte, dans le domaine fréquentiel pour une pluralité de bandes de fréquences définies pour des trames temporelles successives de signal, les étapes de traitement du signal sui-vantes : a) calcul (18) d'une première référence de bruit par analyse de cohé- rence spatiale des signaux captés par la pluralité de microphones ; b) calcul (20) d'une seconde référence de bruit par analyse des direc- tions d'incidence des signaux captés par la pluralité de microphones ; c) estimation (24) d'une direction principale d'incidence (8(k,l)) des signaux captés par la pluralité de microphones ; d) sélection (22) comme signal de bruit référent (Ref(k,l)) de l'une ou l'au-20 tre des références de bruit calculées aux étapes a) et b), en fonction de la direction principale estimée à l'étape c) ; e) combinaison (28) de la pluralité de signaux captés par la pluralité correspondante de microphones en un signal combiné bruité (X(k, l)) ; f) calcul (26) d'une probabilité d'absence de parole (q(k,l)) dans le signal 25 combiné bruité, à partir des niveaux respectifs d'énergie spectrale du signal combiné bruité (X(k, l)) et du signal de bruit référent (Ref(k,l)) ; g) à partir de la probabilité d'absence de parole (q(k,l)) calculée à l'étape f) et du signal combiné bruité (X(k,l)), réduction sélective du bruit (34) par application d'un gain variable propre à chaque bande de fré- 30 quences et à chaque trame temporelle.
  2. 2. Le procédé de la revendication 1, dans lequel le calcul (18) de la première référence de bruit de l'étape a) comprend un filtrage linéaire prédictif appliqué aux signaux captés par la pluralité de microphones.
  3. 3. Le procédé de la revendication 2, dans lequel le filtrage prédictif comprend l'application d'un algorithme de prédiction linéaire de type moindres carrés moyens LMS.
  4. 4. Le procédé de la revendication 2, dans lequel le filtrage prédictif com-10 prend une soustraction avec compensation du déphasage entre le signal capté et le signal de sortie du filtre prédictif.
  5. 5. Le procédé de la revendication 1, dans lequel le calcul (20) de la seconde référence de bruit de l'étape b) comprend le blocage spatial des 15 composantes des signaux captés dont la direction d'incidence est située à l'intérieur d'un cône de référence défini de part et d'autre d'une direction prédéterminée d'incidence du signal utile.
  6. 6. Le procédé de la revendication 1, dans lequel l'estimation (24) de la di-20 rection principale d'incidence de l'étape c) comprend les sous-étapes successives suivantes : cl) partition de l'espace en une pluralité de secteurs angulaires ; c2) pour chaque secteur, évaluation d'un estimateur de direction d'inci- dence à partir de la pluralité de signaux captés par la pluralité cor- 25 respondante de microphones ; et c3) à partir des valeurs d'estimateurs calculées à l'étape c2), estimation de ladite direction principale d'incidence ;
  7. 7. Le procédé de la revendication 1, dans lequel la sélection (22) de 30 l'étape d) est une sélection de la seconde référence de bruit comme signal de bruit référent si la direction principale estimée à l'étape c) est si-tuée hors d'un cône de référence défini de part et d'autre d'une direction prédéterminée d'incidence du signal utile.
  8. 8. Le procédé de la revendication 1, dans lequel la combinaison (28) de l'étape e) comprend un préfiltrage de type fixed beamforming.
  9. 9. Le procédé de la revendication 1, dans lequel le calcul (26) de probabi- lité d'absence de parole de l'étape f) comprend l'estimation (30, 32) de composantes de bruit pseudo-stationnaire respectives contenues dans le signal combiné bruité et dans le signal de bruit référent, la probabilité d'absence de parole (q(k,l)) étant calculée à partir également de ces composantes de bruit pseudo-stationnaire respectives.
  10. 10. Le procédé de la revendication 1, dans lequel la réduction sélective du bruit (34) de l'étape g) est un traitement par application d'un gain à amplitude log-spectrale modifié optimisé OM-LSA.
FR0956506A 2009-09-22 2009-09-22 Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile Expired - Fee Related FR2950461B1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FR0956506A FR2950461B1 (fr) 2009-09-22 2009-09-22 Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
ES10167065T ES2375844T3 (es) 2009-09-22 2010-06-23 Procedimiento de filtrado optimizado de los ruidos no estacionarios captados por un dispositivo de audio multimicrófono, en particular un dispositivo telefónico "manos libres" para veh�?culo automóvil.
EP10167065A EP2309499B1 (fr) 2009-09-22 2010-06-23 Procédé de filtrage optimisé des bruits non stationnaires captés par un dispositif audio multi-microphone, notamment un dispositif téléphonique "mains libres" pour véhicule automobile
AT10167065T ATE529860T1 (de) 2009-09-22 2010-06-23 Verfahren zur optimierten filterung nicht stationärer geräusche, die von einem audiogerät mit mehreren mikrophonen eingefangen werden, insbesondere eine freisprechtelefonanlage für kraftfahrzeuge
US12/840,976 US8195246B2 (en) 2009-09-22 2010-07-21 Optimized method of filtering non-steady noise picked up by a multi-microphone audio device, in particular a “hands-free” telephone device for a motor vehicle

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0956506A FR2950461B1 (fr) 2009-09-22 2009-09-22 Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile

Publications (2)

Publication Number Publication Date
FR2950461A1 true FR2950461A1 (fr) 2011-03-25
FR2950461B1 FR2950461B1 (fr) 2011-10-21

Family

ID=42061020

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0956506A Expired - Fee Related FR2950461B1 (fr) 2009-09-22 2009-09-22 Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile

Country Status (5)

Country Link
US (1) US8195246B2 (fr)
EP (1) EP2309499B1 (fr)
AT (1) ATE529860T1 (fr)
ES (1) ES2375844T3 (fr)
FR (1) FR2950461B1 (fr)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
JP2011191668A (ja) * 2010-03-16 2011-09-29 Sony Corp 音声処理装置、音声処理方法およびプログラム
DK2395506T3 (da) * 2010-06-09 2012-09-10 Siemens Medical Instr Pte Ltd Fremgangsmåde og system til behandling af akustisk signal til undertrykkelse af interferens og støj i binaurale mikrofonkonfigurationer
JP5594133B2 (ja) * 2010-12-28 2014-09-24 ソニー株式会社 音声信号処理装置、音声信号処理方法及びプログラム
US9626982B2 (en) * 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
FR2976710B1 (fr) * 2011-06-20 2013-07-05 Parrot Procede de debruitage pour equipement audio multi-microphones, notamment pour un systeme de telephonie "mains libres"
GB2493327B (en) * 2011-07-05 2018-06-06 Skype Processing audio signals
CN103907152B (zh) * 2011-09-02 2016-05-11 Gn奈康有限公司 用于音频信号噪声抑制的方法和系统
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
WO2015122809A1 (fr) 2014-02-14 2015-08-20 Telefonaktiebolaget L M Ericsson (Publ) Génération de bruit de confort
JP6260504B2 (ja) * 2014-02-27 2018-01-17 株式会社Jvcケンウッド オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
US10939198B2 (en) * 2016-07-21 2021-03-02 Mitsubishi Electric Corporation Noise eliminating device, echo cancelling device, and abnormal sound detecting device
US10366701B1 (en) * 2016-08-27 2019-07-30 QoSound, Inc. Adaptive multi-microphone beamforming
US10462567B2 (en) * 2016-10-11 2019-10-29 Ford Global Technologies, Llc Responding to HVAC-induced vehicle microphone buffeting
DE102017212980B4 (de) 2017-07-27 2023-01-19 Volkswagen Aktiengesellschaft Verfahren zur Kompensation von Störgeräuschen bei einer Freisprecheinrichtung in einem Kraftfahrzeug und Freisprecheinrichtung
US11195540B2 (en) * 2019-01-28 2021-12-07 Cirrus Logic, Inc. Methods and apparatus for an adaptive blocking matrix
CN111640428B (zh) * 2020-05-29 2023-10-20 阿波罗智联(北京)科技有限公司 一种语音识别方法、装置、设备和介质
CN111933103B (zh) * 2020-09-08 2024-01-05 亿咖通(湖北)技术有限公司 车辆主动降噪系统、主动降噪方法及计算机存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1830349A1 (fr) * 2006-03-01 2007-09-05 Parrot Procédé de débruitage d'un signal audio

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103541B2 (en) * 2002-06-27 2006-09-05 Microsoft Corporation Microphone array signal enhancement using mixture models
US20080120100A1 (en) * 2003-03-17 2008-05-22 Kazuya Takeda Method For Detecting Target Sound, Method For Detecting Delay Time In Signal Input, And Sound Signal Processor
KR20060113714A (ko) * 2003-11-24 2006-11-02 코닌클리케 필립스 일렉트로닉스 엔.브이. 비상관된 잡음에 대해 내성을 갖는 적응형 빔포머
DE102004005998B3 (de) * 2004-02-06 2005-05-25 Ruwisch, Dietmar, Dr. Verfahren und Vorrichtung zur Separierung von Schallsignalen
EP1818909B1 (fr) * 2004-12-03 2011-11-02 Honda Motor Co., Ltd. Système de reconnaissance vocale

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1830349A1 (fr) * 2006-03-01 2007-09-05 Parrot Procédé de débruitage d'un signal audio

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
COHEN I ET AL: "Speech enhancement based on a microphone array and log-spectral amplitude estimation", ELECTRICAL AND ELECTRONICS ENGINEERS IN ISRAEL, 2002. THE 22ND CONVENT ION OF DEC. 1, 2002, PISCATAWAY, NJ, USA,IEEE, 1 January 2002 (2002-01-01), pages 4 - 6, XP010631024, ISBN: 978-0-7803-7693-9 *
COHEN I ET AL: "Two-channel signal detection and speech enhancement based on the transient beam-to-reference ratio", PROCEEDINGS OF INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP'03) 6-10 APRIL 2003 HONG KONG, CHINA; [IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP)], 2003 IEEE INTERNATIONAL CONFERENCE, vol. 5, 6 April 2003 (2003-04-06), pages V_233 - V_236, XP010639251, ISBN: 978-0-7803-7663-2 *
MOHAMMED J R ED - ZOOLFAKAR A S ET AL: "Intelligent Method for Designing Exact Orthogonal Blocking Matrix into Robust Wideband Beamformer Using Auxiliary Sensors", MODELING&SIMULATION, 2008. AICMS 08. SECOND ASIA INTERNATIONAL CONFERENCE ON, IEEE, PISCATAWAY, NJ, USA, 13 May 2008 (2008-05-13), pages 511 - 515, XP031265054, ISBN: 978-0-7695-3136-6 *
SIOW YONG LOW ET AL: "Robust microphone array using subband adaptive beamformer and spectral subtraction", COMMUNICATION SYSTTEMS, 2002. ICCS 2002. THE 8TH INTERNATIONAL CONFERE NCE ON NOV. 25-28, 2002, PISCATAWAY, NJ, USA,IEEE, vol. 2, 25 November 2002 (2002-11-25), pages 1020 - 1024, XP010629375, ISBN: 978-0-7803-7510-9 *

Also Published As

Publication number Publication date
FR2950461B1 (fr) 2011-10-21
US8195246B2 (en) 2012-06-05
US20110070926A1 (en) 2011-03-24
EP2309499B1 (fr) 2011-10-19
ES2375844T3 (es) 2012-03-06
ATE529860T1 (de) 2011-11-15
EP2309499A1 (fr) 2011-04-13

Similar Documents

Publication Publication Date Title
EP2309499B1 (fr) Procédé de filtrage optimisé des bruits non stationnaires captés par un dispositif audio multi-microphone, notamment un dispositif téléphonique &#34;mains libres&#34; pour véhicule automobile
EP2293594B1 (fr) Procédé de filtrage des bruits latéraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif téléphonique &#34;mains libres&#34; pour véhicule automobile
EP2538409B1 (fr) Procédé de débruitage pour équipement audio multi-microphones, notamment pour un système de téléphonie &#34;mains libres&#34;
EP2680262B1 (fr) Procédé de débruitage d&#39;un signal acoustique pour un dispositif audio multi-microphone opérant dans un milieu bruité
EP2430825B1 (fr) Procede de selection d&#39;un microphone parmi deux microphones ou plus, pour un systeme de traitement de la parole tel qu&#39;un dispositif telephonique &#34;mains libres&#34; operant dans un environnement bruite
EP2530673B1 (fr) Equipement audio comprenant des moyens de débruitage d&#39;un signal de parole par filtrage à délai fractionnaire
EP1830349B1 (fr) Procédé de débruitage d&#39;un signal audio
US7295972B2 (en) Method and apparatus for blind source separation using two sensors
KR102487160B1 (ko) 정량적 신호 대 노이즈비 분석 및 적응형 위너 필터링에 기초한 오디오 신호 품질 향상 방법
JP2021533423A (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
EP2772916B1 (fr) Procédé de débruitage d&#39;un signal audio par un algorithme à gain spectral variable à dureté modulable dynamiquement
FR2909773A1 (fr) Procede de traitement radar passif multivoies d&#39;un signal d&#39;opportunite en fm.
FR2897733A1 (fr) Procede de discrimination et d&#39;attenuation fiabilisees des echos d&#39;un signal numerique dans un decodeur et dispositif correspondant
FR2883656A1 (fr) Traitement continu de la parole utilisant une fonction de transfert heterogene et adaptee
FR2831717A1 (fr) Methode et systeme d&#39;elimination d&#39;interference pour antenne multicapteur
FR3012928A1 (fr) Modificateurs reposant sur un snr estime exterieurement pour des calculs internes de mmse
FR3012929A1 (fr) Modificateur de la presence de probabilite de la parole perfectionnant les performances de suppression du bruit reposant sur le log-mmse
WO2020118290A1 (fr) Système et procédé de localisation acoustique de sources multiples à l&#39;aide d&#39;un pré-filtrage spatial
FR2906070A1 (fr) Reduction de bruit multi-reference pour des applications vocales en environnement automobile
FR2906071A1 (fr) Reduction de bruit multibande avec une reference de bruit non acoustique
FR2974443A1 (fr) Procede et systeme de reduction du bruit
Fox et al. A subband hybrid beamforming for in-car speech enhancement
FR3113537A1 (fr) Procédé et dispositif électronique de réduction du bruit multicanale dans un signal audio comprenant une partie vocale, produit programme d’ordinateur associé
FR3106691A1 (fr) Conversion de la parole par apprentissage statistique avec modélisation complexe des modifications temporelles
FR2878399A1 (fr) Dispositif et procede de debruitage a deux voies mettant en oeuvre une fonction de coherence associee a une utilisation de proprietes psychoacoustiques, et programme d&#39;ordinateur correspondant

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20130531