EP2538409A1 - Procédé de débruitage pour équipement audio multi-microphones, notamment pour un système de téléphonie "mains libres" - Google Patents

Procédé de débruitage pour équipement audio multi-microphones, notamment pour un système de téléphonie "mains libres" Download PDF

Info

Publication number
EP2538409A1
EP2538409A1 EP12170874A EP12170874A EP2538409A1 EP 2538409 A1 EP2538409 A1 EP 2538409A1 EP 12170874 A EP12170874 A EP 12170874A EP 12170874 A EP12170874 A EP 12170874A EP 2538409 A1 EP2538409 A1 EP 2538409A1
Authority
EP
European Patent Office
Prior art keywords
signal
sensors
speech
probability
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP12170874A
Other languages
German (de)
English (en)
Other versions
EP2538409B1 (fr
Inventor
Charles Fox
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Parrot SA
Original Assignee
Parrot SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Parrot SA filed Critical Parrot SA
Publication of EP2538409A1 publication Critical patent/EP2538409A1/fr
Application granted granted Critical
Publication of EP2538409B1 publication Critical patent/EP2538409B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers
    • H04R3/005Circuits for transducers for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Definitions

  • the invention relates to the treatment of speech in a noisy environment.
  • microphones sensitive not only to the voice of the user, but also capturing the surrounding noise and the echo due to the phenomenon of reverberation by the environment, typically the passenger compartment of the vehicle .
  • the useful component (the speech signal of the near speaker) is thus embedded in a parasitic component of noise (external noises and reverberation) that can go, often, to make incomprehensible to the distant speaker (the one who is at the other end of the voice signal transmission path) the words of the nearby speaker.
  • Some of these devices provide for the use of multiple microphones and use the average of the picked-up signals, or other more complex operations, to obtain a signal with a lower level of interference.
  • so-called beamforming techniques make it possible to create, by software means, a directivity which improves the signal / noise ratio.
  • the performances of this technique are very limited when only two microphones are used (concretely, it is estimated that such a method only gives good results if condition of having a network of at least eight microphones). The performance is also very degraded when the environment is reverberant.
  • the aim of the invention is to propose a solution for denoising the audio signals picked up by such a multichannel, multi-microphone system, in a very noisy and very reverberant environment, typically the passenger compartment of a car.
  • the main difficulty related to the methods of speech processing by multichannel systems is the difficulty of estimating useful parameters for the treatments to be applied, because the estimators are strongly related to the ambient environment.
  • the EP 2 293 594 A1 (Parrot SA) describes a method for the spatial detection and filtering of nonstationary and directional noises such as horn blasts, passing a scooter, overtaking by a car, etc.
  • the proposed technique consists in associating the properties of temporal and frequency non-stationarity, on the one hand, and spatial directivity, on the other hand, to detect a type of noise that is usually difficult to discriminate from speech. , in order to ensure an efficient filtering of this noise and to deduce otherwise a probability of presence of speech which will further improve the attenuation of the noise.
  • the EP 2 309 499 A1 (Parrot SA) describes a system with two microphones operating a spatial coherence analysis of the signal picked up in order to determine a direction of incidence.
  • the system calculates two noise references according to different methods, one according to the spatial coherence of the signals picked up (which integrates non-stationary non-directional noise) and another according to the main direction of incidence of the signals (which especially integrates directive nonstationary noises).
  • This denoising technique is based on the hypothesis that speech generally has a higher spatial coherence than noise and that, moreover, the direction of speech incidence is generally well defined and can be assumed to be known: in the case of motor vehicle, it is defined by the position of the driver, to which the microphones are turned.
  • the denoised signal obtained at the output satisfactorily reproduces the amplitude of the initial speech signal, but not its phase, which can cause a distortion of the voice reproduced by the device.
  • the problem of the invention is to take into account a reverberant environment that does not make it possible to satisfactorily calculate a direction of arrival of the useful signal and, alternatively, to obtain a denoising which restores both the amplitude and phase of the initial signal, thus not distorting the voice of the speaker when it is reproduced by the device.
  • the method of the invention is a denoising method for a device comprising a network formed of a plurality of microphone sensors arranged in a predetermined configuration.
  • the calculation of the optimal linear projector of the step d) is carried out by a beamforming processing of Capon with a minimum variance response without distortion MVDR.
  • step e) is effected by OM-LSA optimized modified log-spectral amplitude gain processing.
  • the estimation of the transfer function of step c) is performed by calculating an adaptive filter to cancel the difference between the signal collected by the sensor whose evaluation is to be evaluated. transfer function and the signal collected by the sensor of the useful signal reference, with modulation by the probability of presence of speech.
  • the adaptive filter can in particular be a LMS mean linear least linear prediction algorithm and the speech presence probability modulation, a variation modulation of the iteration pitch of the adaptive filter.
  • the spectrum of the signal to be denoised can be divided into a low frequency portion and a high frequency portion.
  • the denoising processing steps are then performed only on the signals collected by the sensors furthest away from the network.
  • step c) it is also possible, again with a signal spectrum to be denoised divided into a plurality of distinct spectrum parts, to differentially estimate, in step c), the transfer function of the acoustic channels by applying different treatments to each of the parts of the spectrum.
  • the sensor array is a linear array of aligned sensors and the sensors are grouped into a plurality of sub-arrays each associated with one of the parts of the spectrum: for the low frequency part, the processing of denoising is performed only on the signals collected by the sensors furthest away from the network and the estimation of the transfer function is performed by calculating an adaptive filter ; and for the high frequency part, the denoising process is performed on the signals collected by all the sensors of the network, and the estimation of the transfer function is performed by a diagonalization processing.
  • each sensor can be likened to a single microphone M 1 ... M n capturing a reverberated version of a speech signal emitted by a useful signal source S (the speech of a near speaker 10), which signal is added a noise.
  • x i is the signal picked up
  • h i being the impulse response between the useful signal source S and the sensor M i
  • s being the useful signal produced by the source S (speech signal of the near speaker 10)
  • b i being the additive noise
  • the proposed technique consists, on the basis of the elements that have just been described, to search in the time domain for an optimal linear projector for each frequency.
  • projector means an operator corresponding to a transformation of a plurality of signals, collected concurrently by a multichannel device, into a single single-channel signal.
  • This projection is an "optimal" linear projection in that the residual noise component on the single-channel signal output is minimized (noise and reverberation) and that the useful speech component is the least deformed possible.
  • H being the acoustic channel considered.
  • R not ⁇ k + 1 ⁇ ⁇ R not k + 1 - ⁇ ⁇ XX T where k +1 is the number of the current frame, and ⁇ is a forgetting factor between 0 and 1.
  • a first technique consists of using an LMS type algorithm in the frequency domain.
  • the reverberation (thus parasitized) version of the speech signal S picked up by the microphone M 1 is taken as a useful signal reference, the presence of the reverberation in the signal picked up is not a problem because stage one seeks to operate a denoising and not a de-reverberation.
  • the LMS algorithm aims (in known manner) to estimate a filter H (block 14) by means of an adaptive algorithm, corresponding to the signal x i delivered by the microphone M i , by estimating the transfer of noise between the microphone M i and the microphone M i (taken as reference).
  • the output of the filter 14 is subtracted at 16 from the signal x 1 picked up by the microphone M 1 to give a prediction error signal allowing iterative adaptation of the filter 14. It is thus possible to predict from the signal x i the speech component (reverberated) contained in the signal x i .
  • the signal x 1 is slightly delayed (block 18). .
  • an element 20 for weighting the error signal of the adaptive filter 14 by the probability of presence of speech p delivered at the output of the block 22 is added: it is a matter of adapting the filter only when the probability of presence of speech is high. This weighting can be made in particular by modifying the adaptation step as a function of the probability p .
  • H i ⁇ k + 1 H i k + ⁇ ⁇ X ⁇ k 1 T ⁇ X ⁇ k 1 - H ⁇ k i ⁇ X ⁇ k i
  • Another possible technique for estimating the acoustic channel is to operate by matrix diagonalization.
  • R not ⁇ k + 1 ⁇ ⁇ R not k + 1 - ⁇ ⁇ XX T ⁇ being a forgetting factor (fixed, since we take into account the entire signal).
  • MSC f sinc 2 fd vs f being the frequency considered, d being the distance between the sensors, and where c is the speed of sound.
  • the distance of the microphones which makes it possible to decorrelate the noises, however has the disadvantage of being translated, in the spatial field, to a sampling at a lower frequency, with the consequence of a folding of the high frequencies, which will be less well restored. .
  • the invention proposes to solve this difficulty by selecting different sensor configurations according to the frequencies processed.
  • the Figure 5 is a block diagram showing the different steps of signal processing from a linear array of four microphones M 1 ... M 4 such as that illustrated Figure 4 .
  • the treatment that will be described is applied in the frequency domain, at each frequency bin , that is to say for each frequency band defined for the successive time frames of the signal collected by the microphones (the four microphones M 1 , M 2 , M 3 and M 4 for the high of the spectrum HF, and the two microphones M 1 and M 4 for the low of the spectrum BF).
  • These signals correspond, in the frequency domain, vectors X 1 ... X n ( X 1 , X 2 , X 3 and X 4 and X 1 , X 4 , respectively).
  • a block 22 produces from the signals collected by the microphones a probability p of presence of speech. As indicated above, this estimation is carried out according to a technique that is itself known, for example that described in FIG. WO 2007/099222 A1 , which can be referred to for more details.
  • Block 44 schematizes a selector of the acoustic channel estimation method, ie by diagonalization on the basis of the signals collected by the four microphones M 1 , M 2 , M 3 and M 4 (block 28 of FIG. Figure 5 , for the high frequency spectrum HF), or by adaptive filter LMS on the basis of the signals collected by the two extreme microphones M 1 and M 4 (block 38 of the Figure 5 , for the low end of the BF spectrum).
  • Block 46 corresponds to the estimate of the spectral noise matrix, designated R n , used for the calculation of the optimal linear projector, and also used for the diagonalization calculation of block 28 when the transfer function of the acoustic channel is estimated from this way.
  • Block 48 corresponds to the calculation of the optimal linear projector.
  • the projection calculated at 48 is an optimal linear projection, in that the residual noise component on the single channel signal output is minimized (noise and reverberation).
  • the optimal linear projector has the particularity of recalibrating the phases of the different input signals, which makes it possible to obtain at the output a projected signal S pr which returns to the phase of the initial speech signal of the speaker (and also the amplitude of this signal, of course).
  • the final step (block 50) consists of selectively reducing the noise by applying a variable gain specific to each frequency band and each time frame to the projected signal S pr .
  • This denoising is also modulated by the probability of speech presence p .
  • the signal S HF / BF outputted by the denoising block 50 will then undergo a fast inverse Fourier transform iFFT (blocks 30, 40 of the Figure 5 ) to obtain in the time domain the denoised speech signal S HF or S BF sought giving, after reconstruction of the complete spectrum, the final denoised speech signal s.
  • iFFT fast inverse Fourier transform
  • LSA Log-Spectral Amplitude
  • the "OM-LSA” Optimally-Modified Log-Spectral Amplitude
  • the "OM-LSA” improves the calculation of the LSA gain to be applied by weighting it by the conditional probability of presence of speech p .

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

Ce procédé comporte les étapes suivantes, dans le domaine fréquentiel :
a) estimation (22) d'une probabilité de présence de parole (p);
b) estimation (46), modulée par la probabilité de présence de parole (p), d'une matrice spectrale de covariance (Rn ) des bruits recueillis par les capteurs ;
c) estimation (28, 38), modulée par la probabilité de présence de parole (p), de la fonction de transfert (H) des canaux acoustiques entre la source de parole et au moins certains des capteurs, par rapport à une référence constituée par le signal recueilli par l'un des capteurs ;
d) calcul (48) d'un projecteur linéaire optimal donnant un signal combiné unique à partir des signaux (X1... Xn) recueillis par au moins certains des capteurs, de la matrice spectrale de covariance (Rn ), et des fonctions de transfert estimées (H1...Hn); et
e) à partir de la probabilité de présence de parole (p) et du signal combiné de sortie du projecteur, réduction sélective du bruit (50) par application d'un gain variable.

Description

  • L'invention concerne le traitement de la parole en milieu bruité.
  • Elle concerne notamment, mais de façon non limitative, le traitement des signaux de parole captés par des dispositifs de téléphonie pour véhicules automobiles.
  • Ces appareils comportent un ou plusieurs microphones ("micros") sensible non seulement à la voix de l'utilisateur, mais captant aussi le bruit environnant ainsi que l'écho dû au phénomène de réverbération par l'environnement, typiquement l'habitacle du véhicule. La composante utile (le signal de parole du locuteur proche) se trouve ainsi noyée dans une composante parasite de bruit (bruits externes et réverbération) pouvant aller, souvent, jusqu'à rendre incompréhensible pour le locuteur distant (celui qui est à l'autre bout de la voie de transmission du signal téléphonique) les paroles du locuteur proche.
  • Il en est de même si l'on veut mettre en oeuvre des techniques de reconnaissance vocale, car il est très difficile d'opérer une reconnaissance de forme sur des mots noyés dans un niveau de bruit élevé.
  • Cette difficulté liée aux bruits environnants est particulièrement contraignante dans le cas des dispositifs "mains-libres". En particulier, la distance importante entre le micro et le locuteur entraîne un niveau relatif de bruit élevé qui rend difficile l'extraction du signal utile noyé dans le bruit. De plus, le milieu très bruité typique de l'environnement automobile présente des caractéristiques spectrales non stationnaires, c'est-à-dire qui évoluent de manière imprévisible en fonction des conditions de conduite : passage sur des chaussées déformées ou pavées, autoradio en fonctionnement, etc.
  • Certains de ces dispositifs prévoient l'utilisation de plusieurs micros et utilisent la moyenne des signaux captés, ou d'autres opérations plus complexes, pour obtenir un signal avec un niveau de perturbations moindre. En particulier, des techniques dites de beamforming permettent de créer par des moyens logiciels une directivité qui améliore le rapport signal/bruit. Mais les performances de cette technique sont très limitées lorsque seulement deux micros sont utilisés (concrètement, on estime qu'une telle méthode ne fournit de bons résultats qu'à condition de disposer d'un réseau d'au moins huit micros). Les performances sont en outre très dégradées lorsque l'environnement est réverbérant.
  • Le but de l'invention est de proposer une solution de débruitage des signaux audio captés par un tel système multicanal, multi-microphones, dans un environnement très bruyant et très réverbérant, typiquement l'habitacle d'une voiture.
  • La principale difficulté liée aux méthodes de traitement de la parole par des systèmes multicanal est la difficulté d'estimation des paramètres utiles pour les traitements à appliquer, car les estimateurs sont fortement liés à l'environnement ambiant.
  • La plupart des techniques se basent sur l'hypothèse que le signal utile et/ou les bruits parasites présentent une certaine directivité, et combinent les signaux issus des différents micros de manière à améliorer le rapport signal/bruit en fonction de ces conditions de directivité.
  • Ainsi, le EP 2 293 594 A1 (Parrot SA) décrit un procédé à détection spatiale et filtrage des bruits non stationnaires et directifs tels que coups de klaxon, passage d'un scooter, dépassement par une voiture, etc. La technique proposée consiste à associer les propriétés de non-stationnarité temporelle et fréquentielle, d'une part, et de directivité spatiale, d'autre part, pour détecter un type de bruit qu'il est d'ordinaire difficile de discriminer de la parole, afin d'assurer un filtrage efficace de ce bruit et de déduire par ailleurs une probabilité de présence de parole qui permettra d'améliorer encore l'atténuation du bruit.
  • Le EP 2 309 499 A1 (Parrot SA) décrit un système à deux micros opérant une analyse de cohérence spatiale du signal capté de manière à déterminer une direction d'incidence. Le système calcule deux références de bruits selon des méthodes différentes, l'une en fonction de la cohérence spatiale des signaux captés (qui intègre les bruits non stationnaires peu directifs) et une autre en fonction de la direction principale d'incidence des signaux (qui intègre surtout les bruits non stationnaires directifs). Cette technique de débruitage repose sur l'hypothèse que la parole présente généralement une cohérence spatiale supérieure au bruit et que, par ailleurs, la direction d'incidence de la parole est généralement bien définie et peut être supposée connue : dans le cas d'un véhicule automobile, elle est définie par la position du conducteur, vers lequel sont tournés les micros.
  • Ces techniques prennent cependant mal en compte l'effet de réverbération typique de l'habitacle d'une voiture, où les réflexions puissantes et nombreuses rendent difficile le calcul d'une direction d'arrivée, avec pour conséquence une dégradation notable de l'efficacité du débruitage.
  • En outre, avec ces techniques le signal débruité obtenu en sortie restitue de façon satisfaisante l'amplitude du signal de parole initial, mais non sa phase, ce qui peut entraîner une déformation de la voix reproduite par le dispositif.
  • Le problème de l'invention est la prise en compte d'un environnement réverbérant ne permettant pas de calculer de façon satisfaisante une direction d'arrivée du signal utile et, subsidiairement, l'obtention d'un débruitage qui restitue à la fois l'amplitude et la phase du signal initial, en ne déformant donc pas la voix du locuteur lorsque celle-ci est reproduite par le dispositif.
  • L'invention propose une technique mise en oeuvre dans le domaine fréquentiel, pour une pluralité de bins du signal capté (c'est-à-dire pour chaque bande de fréquences de chaque trame temporelle du signal). Le traitement consiste essentiellement à :
    • calculer une probabilité de présence de parole dans le signal bruité recueilli ;
    • estimer la fonction de transfert du canal acoustique entre la source de parole (le locuteur proche) et chacun des capteurs du réseau de micros ;
    • calculer une projection optimale pour déterminer un canal unique à partir des fonctions de transfert des canaux multiples estimés ; et
    • réduire sélectivement le bruit sur ce canal unique, pour chaque bin, en fonction de la probabilité de présence de parole.
  • Plus précisément, le procédé de l'invention est un procédé de débruitage pour un dispositif comprenant un réseau formé d'une pluralité de capteurs microphoniques disposés selon une configuration prédéterminée.
  • Ce procédé comporte les étapes de traitement suivantes dans le domaine fréquentiel, pour une pluralité de bandes de fréquences définies pour des trames temporelles successives de signal :
    1. a) estimation d'une probabilité de présence de parole dans le signal bruité recueilli ;
    2. b) estimation d'une matrice spectrale de covariance des bruits recueillis par les capteurs, cette estimation étant modulée par la probabilité de présence de parole ;
    3. c) estimation de la fonction de transfert des canaux acoustiques entre la source de parole et au moins certains des capteurs, cette estimation étant opérée par rapport à une référence de signal utile constituée par le signal recueilli par l'un des capteurs, et étant en outre modulée par la probabilité de présence de parole ;
    4. d) calcul d'un projecteur linéaire optimal, donnant un signal combiné débruité unique à partir des signaux recueillis par au moins certains des capteurs, de la matrice spectrale de covariance estimée à l'étape b), et des fonctions de transfert estimées à l'étape c) ; et
    5. e) à partir de la probabilité de présence de parole et du signal combiné donné par le projecteur calculé à l'étape d), réduction sélective du bruit par application d'un gain variable propre à chaque bande de fréquences et à chaque trame temporelle.
  • De préférence, le calcul du projecteur linéaire optimal de l'étape d) est opéré par un traitement de type beamforming de Capon à réponse sans distorsion à variance minimale MVDR.
  • De préférence également, la réduction sélective de bruit de l'étape e) est opérée par un traitement de type gain à amplitude log-spectrale modifié optimisé OM-LSA.
  • Dans une première forme de mise en oeuvre, l'estimation de la fonction de transfert de l'étape c) est opérée par calcul d'un filtre adaptatif visant à annuler la différence entre le signal recueilli par le capteur dont on cherche à évaluer la fonction de transfert et le signal recueilli par le capteur de la référence de signal utile, avec modulation par la probabilité de présence de parole.
  • Le filtre adaptatif peut notamment être un filtre à algorithme de prédiction linéaire de type moindres carrés moyens LMS et la modulation par la probabilité de présence de parole, une modulation par variation du pas d'itération du filtre adaptatif.
  • Dans une deuxième forme de mise en oeuvre, l'estimation de la fonction de transfert de l'étape c) est opérée par un traitement de diagonalisation comprenant :
    • c1) la détermination d'une matrice spectrale de corrélation des signaux recueillis par les capteurs du réseau par rapport au capteur de la référence de signal utile,
    • c2) le calcul de la différence entre, d'une part, la matrice déterminée à l'étape c1) et, d'autre part, la matrice spectrale de covariance des bruits modulée par la probabilité de présence de parole, calculée à l'étape b), et
    • c3) la diagonalisation de la matrice différence calculée à l'étape c2). Par ailleurs, le spectre du signal à débruiter est avantageusement divisé en une pluralité de parties de spectre distinctes, les capteurs étant regroupés en une pluralité de sous-réseaux associés chacun à l'une des parties du spectre. Le traitement de débruitage est alors opéré de façon différenciée, pour chacune des parties du spectre, sur les signaux recueillis par les capteurs du sous-réseau correspondant à la partie du spectre considérée.
  • En particulier, dans le cas où le réseau de capteurs est un réseau linéaire de capteurs alignés, le spectre du signal à débruiter peut être divisé en une partie basse fréquence et une partie haute fréquence. Pour la partie basse fréquence, les étapes du traitement de débruitage sont alors opérées seulement sur les signaux recueillis par les capteurs les plus éloignés du réseau.
  • Il est également possible, toujours avec un spectre de signal à débruiter divisé en une pluralité de parties de spectre distinctes, d'estimer de manière différenciée, à l'étape c), la fonction de transfert des canaux acoustiques par application de traitements différents pour chacune des parties du spectre.
  • En particulier, dans le cas où le réseau de capteurs est un réseau linéaire de capteurs alignés et où les capteurs sont regroupés en une pluralité de sous-réseaux associés chacun à l'une des parties du spectre : pour la partie basse fréquence, le traitement de débruitage est opéré seulement sur les signaux recueillis par les capteurs les plus éloignés du réseau et l'estimation de la fonction de transfert est opérée par calcul d'un filtre adaptatif ; et pour la partie haute fréquence, le traitement de débruitage est opéré sur les signaux recueillis par tous les capteurs du réseau, et l'estimation de la fonction de transfert est opérée par un traitement de diagonalisation.
  • On va maintenant décrire un exemple de mise en oeuvre du dispositif de l'invention, en référence aux dessins annexés où les mêmes références numériques désignent d'une figure à l'autre des éléments identiques ou fonctionnellement semblables.
    • La Figure 1 est une représentation schématique des différents phénomènes acoustiques impliqués dans le recueil de signaux bruités.
    • La Figure 2 est une représentation schématique par blocs fonctionnels d'un filtre adaptatif pour l'estimation de la fonction de transfert d'un canal acoustique.
    • La Figure 3 est une caractéristique montrant les variations de la corrélation entre deux capteurs pour un champ de bruit diffus, en fonction de la fréquence.
    • La Figure 4 illustre de façon schématique un réseau de quatre micros utilisables de façon sélective, en fonction de la fréquence, pour la mise en oeuvre de l'invention.
    • La Figure 5 est un schéma d'ensemble, sous forme de blocs fonctionnels, montrant les différents traitements selon l'invention pour le débruitage des signaux recueillis pas le réseau de micros de la Figure 4.
    • La Figure 6 illustre plus précisément, sous forme de schéma par blocs, les fonctions mises en oeuvre, dans le domaine fréquentiel, pour le traitement selon l'invention illustré Figure 5.
  • On va maintenant décrire en détail la technique de débruitage proposée par l'invention.
  • On considérera, comme illustré Figure 1, un ensemble de n capteurs microphoniques, chaque capteur pouvant être assimilé à un micro unique M1 ... Mn captant une version réverbérée d'un signal de parole émis par une source de signal utile S (la parole d'un locuteur proche 10), signal auquel vient s'ajouter un bruit.
  • Chaque micro capte donc :
    • une composante du signal utile (le signal de parole),
    • une composante de la réverbération de ce signal de parole par l'habitacle du véhicule, et
    • une composante du bruit parasite environnant, sous toutes ses formes (directif ou diffus, stationnaire ou évoluant de manière imprévisible, etc.).
    Modélisation des signaux captés
  • Il s'agit de traiter les (multiples) signaux de ces micros en opérant un débruitage (bloc 12) donnant en sortie un signal (unique) : on reconnaît dans ce schéma un modèle MISO (Multiple Input Single Output).
  • Le signal de sortie devra être le plus proche possible du signal de parole émis par le locuteur 10, c'est-à-dire :
    • contenir le moins de bruit possible, et
    • déformer le moins possible la voix du locuteur restituée en sortie.
  • Sur le capteur de rang i, le signal recueilli sera : x i t = h i s t + b i t
    Figure imgb0001

    xi étant le signal capté, hi étant la réponse impulsionnelle entre la source de signal utile S et le capteur Mi, s étant le signal utile produit par la source S (signal de parole du locuteur proche 10) et bi étant le bruit additif.
  • Pour l'ensemble des capteurs, on peut utiliser la notation vectorielle : x t = h s t + b t
    Figure imgb0002
  • Dans le domaine fréquentiel, cette expression devient : X ω = H ω S ω + B ω
    Figure imgb0003
  • On fera une première hypothèse selon laquelle la voix ainsi que le bruit sont gaussiens centrés.
  • Ceci se traduit dans le domaine fréquentiel par les conditions suivantes, pour toutes les fréquences ω:
    • S est gaussien centré de puissance φ s
    • B est un vecteur gaussien centré de matrice de covariance R n
    • S et B sont décorrélés et chacun est décorrélé lorsque les fréquences sont différentes
  • On fera par ailleurs une deuxième hypothèse selon laquelle les bruits et la voix sont décorrélés. Cela se traduit par le fait que S est décorrélé avec toutes les composantes de B . De plus, pour des fréquences ω i et ω j différentes, S i ) et S j ) sont décorrélés. Cette hypothèse est également valable pour le vecteur de bruit B .
  • Calcul d'un projecteur optimal
  • La technique proposée consiste, sur la base des éléments que l'on vient d'exposer, à rechercher dans le domaine temporel un projecteur linéaire optimal pour chaque fréquence.
  • On entendra par "projecteur" un opérateur correspondant à une transformation d'une pluralité de signaux, recueillis concurremment par un dispositif multicanal, en un signal unique monocanal.
  • Cette projection est une projection linéaire "optimale" en ce sens que la composante de bruit résiduel sur le signal monocanal délivré en sortie soit minimisée (bruit et réverbération) et que la composante utile de parole soit le moins déformée possible.
  • Cette optimisation implique de rechercher pour chaque fréquence un vecteur A tel que :
    • la projection A T X contienne le moins de bruit possible, c'est-à-dire que la puissance du bruit résiduel, qui vaut E[ A T VV T A ] = A T R n A , soit minimisée, et
    • ne déforme pas la voix du locuteur, ce qui se traduit par la contrainte A T H= 1.
    R n étant la matrice de corrélation entre les micros, pour chaque fréquence, et
  • H étant le canal acoustique considéré.
  • Ce problème est un problème d'optimisation sous contrainte, à savoir la recherche de min ( A T R n A ) sous la contrainte A T H=1.
  • Il peut être résolu en utilisant la méthode des multiplieurs de Lagrange, qui conduit à la solution : A T = H T R n - 1 H T R n - 1 H
    Figure imgb0004
  • Dans le cas où les transferts H correspondent à un retard pur, on reconnait la formule du beamforming MVDR (Minimum Variance Distorsionless Response), aussi appelé beamforming de Capon.
  • On notera que la puissance de bruit résiduel vaut, après projection : 1 H T R n - 1 H
    Figure imgb0005
  • De plus, en écrivant des estimateurs de type Minimum Mean-Squared Error sur l'amplitude et la phase du signal à chaque fréquence, on constate que ces estimateurs s'écrivent comme un beamforming de Capon suivi d'un traitement monocanal, comme décrit dans :
    • [1] R. C. Hendriks et al., On optimal multichannel mean-squared error estimators for speech enhancement, IEEE Signal Processing Letters, vol. 16, no. 10, 2009.
      Le traitement de débruitage sélectif du bruit appliqué au signal monocanal résultant du traitement de beamforming est avantageusement un traitement de type gain à amplitude log-spectrale modifié optimisé OM-LSA tel que décrit par exemple dans :
    • [2] 1. Cohen, Optimal Speech Enhancement Under Signal Presence Uncertainty Using Log-Spectral Amplitude Estimator, IEEE Signal Processing Letters, vol.9, no. 4, pp. 113-116, April 2002.
    Estimation des paramètres pour le calcul du projecteur linéaire optimal
  • Pour la mise en oeuvre de cette technique, il est nécessaire d'estimer la fonction de transfert acoustique H 1, H 2 ... H n entre la source de parole S et chacun des micros M1, M2 ... Mn.
  • Il est également nécessaire d'estimer la matrice spectrale de covariance des bruits, notée R n .
  • Pour ces estimations, on utilisera une probabilité de présence de parole, notée p.
  • La probabilité de présence de parole p est un paramètre pouvant prendre plusieurs valeurs différentes comprises entre 0 et 100 % (et non seulement un valeur binaire 0 ou 1). Ce paramètre est calculé selon une technique en elle-même connue, dont des exemples sont notamment exposés dans :
    • [3] I. Cohen et B. Berdugo, Two-Channel Signal Detection and Speech Enhancement Based on the Transient Beam-to-Reference Ratio, Proc. ICASSP 2003, Hong-Kong, pp. 233-236, Apr. 2003.
  • On pourra également se référer au WO 2007/099222 A1 , qui décrit une technique de débruitage mettant en oeuvre un calcul de probabilité de présence de parole.
  • En ce qui concerne la matrice spectrale de covariance des bruits Rn, on peut utiliser un estimateur d'espérance à fenêtre exponentielle, ce qui revient à appliquer un facteur d'oubli : R n k + 1 = α R n k + 1 - α XX T
    Figure imgb0006

    k+1 étant le numéro de la trame courante, et
    α est un facteur d'oubli compris entre 0 et 1.
  • Pour ne prendre en compte que les éléments où seul le bruit est présent, on module le facteur d'oubli α par la probabilité de présence de parole : α = α 0 + 1 - α 0 p
    Figure imgb0007

    avec α 0∈[01].
  • Pour estimer la fonction de transfert H du canal acoustique considéré, plusieurs techniques sont utilisables.
  • Une première technique consiste à utiliser un algorithme de type LMS dans le domaine fréquentiel.
  • Les algorithmes de type LMS - ou NLMS (Normalized LMS) qui est une version normalisée du LMS - sont des algorithmes relativement simples et peu exigeants en termes de ressources de calcul. Il s'agit d'algorithmes en eux-mêmes connus, décrits par exemple dans :
    • [4] B. Widrow, Adaptative Filters, Aspect of Network and System Theory, R. E. Kalman and N. De Claris Eds., New York: Holt, Rinehart and Winston, pp. 563-587, 1970 ;
    • [5] J. Prado et E. Moulines, Frequency-domain adaptive filtering with applications to acoustic echo cancellation, Springer, Ed. Annals of Telecommunications, 1994 ;
    • [6] B. Widrow et S. Stearns, Adaptative Signal Processing, Prentice-Hall Signal Processing Series, Alan V. Oppenheim Series Editor, 1985.
  • Le principe de cet algorithme est illustré Figure 2.
  • De façon caractéristique de l'invention, on prendra l'un des canaux comme référence de signal utile, par exemple le canal du micro M1, et l'on calculera les fonctions de transfert H2 ... Hn , pour les autres canaux. Ceci revient à contraindre H1 = 1.
  • On notera que bien que l'on prenne comme référence de signal utile la version réverbérée (donc parasitée) du signal de parole S captée par le micro M1, la présence de la réverbération dans le signal capté n'est pas gênante car à ce stade on cherche à opérer un débruitage et non une dé-réverbération.
  • Comme illustré Figure 2, l'algorithme LMS vise (de façon connue) à estimer un filtre H (bloc 14) au moyen d'un algorithme adaptatif, correspondant au signal xi délivré par le micro Mi, en estimant le transfert de bruit entre le micro Mi et le micro Mi (pris comme référence). La sortie du filtre 14 est soustraite en 16 au signal x1 capté par le micro M1 pour donner un signal d'erreur de prédiction permettant l'adaptation itérative du filtre 14. Il est ainsi possible de prédire à partir du signal xi la composante de parole (réverbérée) contenue dans le signal xi .
  • Pour éviter les problèmes liés à la causalité (c'est-à-dire pour être sûr que les signaux xi n'arrivent pas en avance par rapport à la référence x1 ), on retarde légèrement (bloc 18) le signal x1 .
  • Par ailleurs, on ajoute un élément 20 permettant de pondérer le signal d'erreur du filtre adaptatif 14 par la probabilité de présence de parole p délivrée en sortie du bloc 22 : il s'agit de procéder à l'adaptation du filtre seulement quand la probabilité de présence de parole est élevée. Cette pondération peut être notamment opérée par modification du pas d'adaptation en fonction de la probabilité p.
  • L'équation de mise à jour du filtre adaptatif s'écrit, pour chaque trame k et pour chaque capteur i, : H i k + 1 = H i k + µ X k 1 T X k 1 - H k i X k i
    Figure imgb0008
  • Le pas µ d'adaptation de l'algorithme, modulé par la probabilité de présence de parole, s'écrit, en normalisant le LMS (le dénominateur correspondant à la puissance spectrale du signal x1 à la fréquence considérée) : µ = p E X 1 2
    Figure imgb0009
  • L'hypothèse que les bruits sont décorrélés conduit à une prédiction par l'algorithme LMS de la voix, et non du bruit, de sorte que la fonction de transfert estimée correspond effectivement au canal acoustique H entre le locuteur et les micros.
  • Une autre technique possible d'estimation du canal acoustique consiste à opérer par diagonalisation de matrice.
  • Ce mode d'estimation est basé sur l'utilisation de la matrice spectrale de corrélation du signal observé, que l'on notera R x=E[XXT ].
  • On estime cette matrice de la même façon que R n : R n k + 1 = α R n k + 1 - α XX T
    Figure imgb0010

    α étant un facteur d'oubli (fixe, puisque l'on prend en compte tout le signal).
  • On peut ensuite estimer R x-R n=φ s HH T : il s'agit d'une matrice de rang 1, dont la seule valeur propre non nulle est φs , qui est associée au vecteur propre H
  • On peut ainsi estimer H en diagonalisant R x-R n, mais on ne peut calculer que vect( H ), autrement dit on n'estime H qu'à un facteur complexe près.
  • Pour lever cette ambiguïté, de la même manière que précédemment pour l'estimation par algorithme LMS, on choisit l'un des canaux comme canal de référence, ce qui revient à contraindre H 1 = 1.
  • Échantillonnage spatial du champ sonore
  • Dans le cas d'un système multi-microphone, qui réalise donc un échantillonnage spatial du champ sonore, le placement relatif des différents micros est un aspect crucial pour l'efficacité du traitement des signaux captés par ces micros.
  • En particulier, comme on l'a indiqué au début, on fait l'hypothèse que les bruits présents sur les micros sont décorrélés pour utiliser une identification adaptative de type LMS. Pour être au plus près de cette hypothèse, il conviendrait d'éloigner les micros les uns des autres, car la fonction de corrélation s'écrit, pour un modèle de bruit diffus, comme une fonction décroissante de la distance entre les micros, ce qui rend les estimateurs de canal acoustique plus robustes.
  • En effet, la corrélation entre deux capteurs pour un champ de bruit diffus s'écrit : MSC f = sinc 2 fd c
    Figure imgb0011

    f étant la fréquence considérée,
    d étant la distance entre les capteurs, et
    c étant la vitesse du son.
  • La caractéristique correspondante est illustrée Figure 3, pour une distance entre micros d = 10 cm.
  • L'éloignement des micros, qui permet de décorréler les bruits, présente cependant l'inconvénient de se traduire, dans le domaine spatial, à un échantillonnage à une fréquence plus faible, avec pour conséquence un repliement des hautes fréquences, qui seront moins bien restituées. L'invention propose de résoudre cette difficulté en sélectionnant des configurations de capteurs différentes selon les fréquences traitées.
  • Ainsi, sur la Figure 4, on a illustré un réseau linéaire de quatre micros alignés M1 ... M4 espacés chacun de d = 5 cm.
  • Pour la région inférieure du spectre (basses fréquences BF) on choisira par exemple d'utiliser seulement les deux micros extrêmes M1 et M4, éloignés donc de 3d = 15 cm, tandis que pour la partie haute du spectre (hautes fréquences HF) on utilisera les quatre micros M1, M2, M3 et M4 espacés chacun de seulement d = 5 cm.
  • En variante ou en complément, selon un autre aspect de l'invention, on peut aussi sélectionner, pour l'estimation de la fonction de transfert H du canal acoustique, des méthodes différentes en fonction des fréquences traitées. Par exemple, pour les deux méthodes exposées plus haut (traitement fréquentiel par LMS, et traitement par diagonalisation), on peut choisir l'une ou l'autre méthode en fonction de critères tels que :
    • la corrélation des bruits : pour tenir compte du fait que la méthode par diagonalisation y est moins sensible, mais est moins précise, ou
    • le nombre de micros employés : pour tenir compte du fait que la méthode par diagonalisation devient très coûteuse en calculs lorsque la dimension des matrices augmente, du fait de l'augmentation du nombre n de micros.
    Description d'un mode de réalisation préférentiel
  • Cet exemple est décrit en référence aux Figures 5 et 6, et met en oeuvre les différents éléments évoqués plus haut du traitement des signaux, avec leurs différentes variantes possibles.
  • La Figure 5 est un schéma par blocs montrant les différentes étapes de traitement des signaux issus d'un réseau linéaire de quatre micros M1 ... M4 tels que celui illustré Figure 4.
  • Des traitements différents sont opérés pour le haut du spectre (hautes fréquences HF, correspondant aux blocs 24 à 32), et pour le bas du spectre (basses fréquences BF, correspondant aux blocs 34 à 42) :
    • pour le haut du spectre, sélectionné par un filtre 24, les signaux des quatre micros M1 ... M4 sont utilisés conjointement. Ces signaux font d'abord l'objet d'une transformée rapide de Fourier FFT (bloc 26) pour passer dans le domaine fréquentiel, puis d'un traitement 28 (décrit plus bas en référence à la Figure 6) impliquant une diagonalisation de matrice. Le signal monocanal résultant SHF est soumis à une transformée de Fourier rapide inverse iFFT (bloc 30) pour repasser dans le domaine temporel, puis le signal résultant sHF est appliqué à un filtre de synthèse (bloc 32) pour restituer le haut du spectre du canal de sortie s ;
    • pour le bas du spectre, sélectionné par le filtre 34, seuls les signaux des deux micros extrêmes M1 et M4 sont utilisés. Ces signaux font d'abord l'objet d'une transformée rapide de Fourier FFT (bloc 36) pour passer dans le domaine fréquentiel, puis d'un traitement 38 (décrit plus bas en référence à la Figure 6) impliquant un filtrage adaptatif LMS. Le signal monocanal résultant SBF est soumis à une transformée de Fourier rapide inverse iFFT (bloc 40) pour repasser dans le domaine temporel, puis le signal résultant sBF est appliqué à un filtre de synthèse (bloc 42) pour restituer le bas du spectre du canal de sortie s.
  • On va maintenant décrire en référence à la Figure 6 les traitements opérés par les blocs 28 ou 38 de la Figure 5.
  • Le traitement que l'on va décrire est appliqué dans le domaine fréquentiel, à chaque bin de fréquence, c'est-à-dire pour chaque bande de fréquences définie pour les trames temporelles successives du signal recueilli par les micros (les quatre micros M1, M2, M3 et M4 pour le haut du spectre HF, et les deux micros M1 et M4 pour le bas du spectre BF).
  • A ces signaux correspondent, dans le domaine fréquentiel, des vecteurs X1 ... Xn (X1, X2, X3 et X4 et X1, X4, respectivement).
  • Un bloc 22 produit à partir des signaux recueillis par les micros une probabilité p de présence de parole. Comme indiqué plus haut, cette estimation est opérée selon une technique en elle-même connue, par exemple celle décrite dans le WO 2007/099222 A1 , auquel on pourra se référer pour plus de détails.
  • Le bloc 44 schématise un sélecteur de la méthode d'estimation du canal acoustique, soit par diagonalisation sur la base des signaux recueillis par les quatre micros M1, M2, M3 et M4 (bloc 28 de la Figure 5, pour le haut du spectre HF), soit par filtre adaptatif LMS sur la base des signaux recueillis par les deux micros extrêmes M1 et M4 (bloc 38 de la Figure 5, pour le bas du spectre BF).
  • Le bloc 46 correspond à l'estimation de la matrice spectrale des bruits, désignée Rn, utilisée pour le calcul du projecteur linéaire optimal, et utilisée également pour le calcul de diagonalisation du bloc 28 lorsque la fonction de transfert du canal acoustique est estimée de cette manière. Le bloc 48 correspond au calcul du projecteur linéaire optimal. Comme on l'a indiqué plus haut, la projection calculée en 48 est une projection linéaire optimale, en ce sens que la composante de bruit résiduel sur le signal monocanal délivré en sortie est minimisée (bruit et réverbération). Comme on l'a également indiqué, le projecteur linéaire optimal présente la particularité de recaler les phases des différents signaux d'entrée, ce qui permet d'obtenir en sortie un signal projeté Spr qui retrouve la phase du signal initial de parole du locuteur (et également l'amplitude de ce signal, bien entendu).
  • L'étape finale (bloc 50) consiste à opérer une réduction sélective du bruit par application d'un gain variable propre à chaque bande de fréquences et à chaque trame temporelle au signal projeté Spr.
  • Ce débruitage est également modulé par la probabilité de présence de parole p.
  • Le signal S HF/BF délivré en sortie par le bloc 50 de débruitage fera ensuite l'objet d'une transformation de Fourier rapide inverse iFFT (blocs 30, 40 de la Figure 5) pour obtenir dans le domaine temporel le signal de parole débruitée SHF ou SBF recherché donnant, après reconstitution du spectre complet, le signal de parole débruitée final s.
  • On peut avantageusement utiliser pour le débruitage du bloc 50 une méthode de type OM-LSA (Optimally Modified - Log Spectral Amplitude) telle que celle décrite par la référence précitée :
    • [2] I. Cohen, Optimal Speech Enhancement Under Signal Presence Uncerlainty Using Log-Spectral Amplitude Estimator, IEEE Signal Processing Letters, Vol. 9, No 4, April 2002.
  • Essentiellement, l'application d'un gain nommé "gain LSA" (Log-Spectral Amplitude) permet de minimiser la distance quadratique moyenne entre le logarithme de l'amplitude du signal estimé et le logarithme de l'amplitude du signal de parole originel. Ce second critère se montre supérieur au premier car la distance choisie est en meilleure adéquation avec le comportement de l'oreille humaine et donne donc qualitativement de meilleurs résultats. Dans tous les cas, l'idée essentielle est de diminuer l'énergie des composantes fréquentielles très parasitées en leur appliquant un gain faible, tout en laissant intactes (par l'application d'un gain égal à 1) celles qui le sont peu ou pas du tout.
  • L'algorithme "OM-LSA" (Optimally-Modified Log-Spectral Amplitude) améliore le calcul du gain LSA à appliquer en le pondérant par la probabilité conditionnelle de présence de parole p.
  • Dans cette méthode, la probabilité de présence de parole p intervient à deux niveaux importants :
    • pour l'estimation de l'énergie du bruit, la probabilité vient moduler le facteur d'oubli dans le sens d'une mise à jour plus rapide de l'estimation du bruit sur le signal bruité lorsque la probabilité de présence de parole est faible ;
    • pour le calcul du gain final, elle joue également un grand rôle, car la réduction de bruit appliquée est d'autant plus importante (c'est-à-dire que le gain appliqué est d'autant plus faible) que la probabilité de présence de parole est faible.

Claims (11)

  1. Un procédé de débruitage d'un signal acoustique bruité pour un dispositif audio multi-microphone opérant dans un milieu bruité, notamment un dispositif téléphonique "mains libres",
    le signal acoustique bruité comprenant une composante utile issue d'une source de parole (S) et une composante parasite de bruit,
    ledit dispositif comprenant un réseau de capteurs formé d'une pluralité de capteurs microphoniques (M1...Mn) disposés selon une configuration prédéterminée et aptes à recueillir le signal bruité,
    caractérisé en ce qu'il comporte les étapes de traitement suivantes dans le domaine fréquentiel, pour une pluralité de bandes de fréquences définies pour des trames temporelles successives de signal :
    a) estimation (22) d'une probabilité de présence de parole (p) dans le signal bruité recueilli ;
    b) estimation (46) d'une matrice spectrale de covariance (Rn ) des bruits recueillis par les capteurs, cette estimation étant modulée par la probabilité de présence de parole (p) ;
    c) estimation de la fonction de transfert (H1..Hn ) des canaux acoustiques entre la source de parole (S) et au moins certains des capteurs (M1...Mn), cette estimation étant opérée par rapport à une référence de signal utile constituée par le signal recueilli par l'un des capteurs (M1), et étant en outre modulée par la probabilité de présence de parole (p) ;
    d) calcul (48) d'un projecteur linéaire optimal donnant un signal combiné débruité unique à partir des signaux (X1...Xn ) recueillis par au moins certains des capteurs, de la matrice spectrale de covariance (Rn ) estimée à l'étape b), et des fonctions de transfert (H1...Hn ) estimées à l'étape c) ; et
    e) à partir de la probabilité de présence de parole (p) et du signal combiné donné par le projecteur calculé à l'étape d), réduction sélective du bruit (50) par application d'un gain variable propre à chaque bande de fréquences et à chaque trame temporelle.
  2. Le procédé de la revendication 1, dans lequel le calcul (48) du projecteur linéaire optimal de l'étape d) est opéré par un traitement de type beamforming de Capon à réponse sans distorsion à variance minimale MVDR.
  3. Le procédé de la revendication 1, dans lequel la réduction sélective de bruit (50) de l'étape e) est opérée par un traitement de type gain à amplitude log-spectrale modifié optimisé OM-LSA.
  4. Le procédé de la revendication 1, dans lequel l'estimation de la fonction de transfert de l'étape c) est opérée par calcul (38) d'un filtre adaptatif (14) visant à annuler la différence entre le signal (Xi ) recueilli par le capteur dont on cherche à évaluer la fonction de transfert et le signal (X1 ) recueilli par le capteur de ladite référence de signal utile, avec modulation par la probabilité de présence de parole (p).
  5. Le procédé de la revendication 4, dans lequel le filtre adaptatif (14) est un filtre à algorithme de prédiction linéaire de type moindres carrés moyens LMS.
  6. Le procédé de la revendication 4, dans lequel ladite modulation par la probabilité de présence de parole (p) est une modulation par variation du pas d'itération du filtre adaptatif (14).
  7. Le procédé de la revendication 1, dans lequel l'estimation de la fonction de transfert de l'étape c) est opérée par un traitement de diagonalisation (28) comprenant :
    c1) la détermination d'une matrice spectrale de corrélation (Rx ) des signaux recueillis par les capteurs du réseau par rapport au capteur de ladite référence de signal utile,
    c2) le calcul de la différence entre, d'une part, la matrice (Rx ) déterminée à l'étape c1) et, d'autre part, ladite matrice spectrale de covariance (Rn ) des bruits modulée par la probabilité de présence de parole (p), calculée à l'étape b), et
    c3) la diagonalisation de la matrice différence calculée à l'étape c2).
  8. Le procédé de la revendication 1, dans lequel :
    - le spectre du signal à débruiter est divisé en une pluralité de parties de spectre distinctes (BF, HF),
    - les capteurs sont regroupés en une pluralité de sous-réseaux (M1...M4 ; M1,M4) associés chacun à l'une desdites parties du spectre, et
    - le traitement de débruitage est opéré de façon différenciée, pour chacune desdites parties du spectre, sur les signaux recueillis par les capteurs du sous-réseau correspondant à la partie du spectre considérée.
  9. Le procédé de la revendication 8, dans lequel :
    - le réseau de capteurs est un réseau linéaire de capteurs alignés (M1...M4),
    - le spectre du signal à débruiter est divisé en une partie basse fréquence (BF) et une partie haute fréquence (HF), et
    - pour la partie basse fréquence, les étapes du traitement de débruitage sont opérées seulement sur les signaux recueillis par les capteurs les plus éloignés du réseau (M1,M4).
  10. Le procédé de la revendication 1, dans lequel :
    - le spectre du signal à débruiter est divisé en une pluralité de parties de spectre distinctes (BF, HF), et
    - l'étape c) d'estimation de la fonction de transfert des canaux acoustiques est opérée de manière différenciée par application de traitements différents (28, 38) pour chacune desdites parties du spectre.
  11. Le procédé de la revendication 10, dans lequel :
    - le réseau de capteurs est un réseau linéaire de capteurs alignés (M1...M4),
    - les capteurs sont regroupés en une pluralité de sous-réseaux (M1...M4 ; M1,M4) associés chacun à l'une desdites parties du spectre,
    - pour la partie basse fréquence (BF), le traitement de débruitage est opéré seulement sur les signaux recueillis par les capteurs (M1,M4) les plus éloignés du réseau, et l'estimation de la fonction de transfert est opérée par calcul d'un filtre adaptatif (38), et
    - pour la partie haute fréquence, le traitement de débruitage est opéré sur les signaux recueillis par tous les capteurs du réseau (M1...M4), et l'estimation de la fonction de transfert est opérée par un traitement de diagonalisation (28).
EP12170874.7A 2011-06-20 2012-06-05 Procédé de débruitage pour équipement audio multi-microphones, notamment pour un système de téléphonie "mains libres" Active EP2538409B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1155377A FR2976710B1 (fr) 2011-06-20 2011-06-20 Procede de debruitage pour equipement audio multi-microphones, notamment pour un systeme de telephonie "mains libres"

Publications (2)

Publication Number Publication Date
EP2538409A1 true EP2538409A1 (fr) 2012-12-26
EP2538409B1 EP2538409B1 (fr) 2013-08-28

Family

ID=46168348

Family Applications (1)

Application Number Title Priority Date Filing Date
EP12170874.7A Active EP2538409B1 (fr) 2011-06-20 2012-06-05 Procédé de débruitage pour équipement audio multi-microphones, notamment pour un système de téléphonie "mains libres"

Country Status (4)

Country Link
US (1) US8504117B2 (fr)
EP (1) EP2538409B1 (fr)
CN (1) CN102855880B (fr)
FR (1) FR2976710B1 (fr)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626982B2 (en) * 2011-02-15 2017-04-18 Voiceage Corporation Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec
US9641933B2 (en) * 2012-06-18 2017-05-02 Jacob G. Appelbaum Wired and wireless microphone arrays
FR2992459B1 (fr) * 2012-06-26 2014-08-15 Parrot Procede de debruitage d'un signal acoustique pour un dispositif audio multi-microphone operant dans un milieu bruite.
US10473628B2 (en) * 2012-06-29 2019-11-12 Speech Technology & Applied Research Corporation Signal source separation partially based on non-sensor information
US10872619B2 (en) * 2012-06-29 2020-12-22 Speech Technology & Applied Research Corporation Using images and residues of reference signals to deflate data signals
US10540992B2 (en) * 2012-06-29 2020-01-21 Richard S. Goldhor Deflation and decomposition of data signals using reference signals
CN104781880B (zh) * 2012-09-03 2017-11-28 弗劳恩霍夫应用研究促进协会 用于提供通知的多信道语音存在概率估计的装置和方法
US9257132B2 (en) * 2013-07-16 2016-02-09 Texas Instruments Incorporated Dominant speech extraction in the presence of diffused and directional noise sources
BR112016012162B1 (pt) * 2013-11-29 2022-09-27 Huawei Technologies Co., Ltd Método para reduzir sinal de autointerferência em sistema de comunicações, e aparelho
US9544687B2 (en) 2014-01-09 2017-01-10 Qualcomm Technologies International, Ltd. Audio distortion compensation method and acoustic channel estimation method for use with same
JP6048596B2 (ja) * 2014-01-28 2016-12-21 三菱電機株式会社 集音装置、集音装置の入力信号補正方法および移動機器情報システム
CN106068535B (zh) * 2014-03-17 2019-11-05 皇家飞利浦有限公司 噪声抑制
CN105681972B (zh) * 2016-01-14 2018-05-01 南京信息工程大学 线性约束最小方差对角加载的稳健频率不变波束形成方法
US10657983B2 (en) 2016-06-15 2020-05-19 Intel Corporation Automatic gain control for speech recognition
GB2556058A (en) * 2016-11-16 2018-05-23 Nokia Technologies Oy Distributed audio capture and mixing controlling
CN110088834B (zh) * 2016-12-23 2023-10-27 辛纳普蒂克斯公司 用于语音去混响的多输入多输出(mimo)音频信号处理
EP3641337B1 (fr) * 2017-06-12 2024-12-11 Yamaha Corporation Dispositif de traitement de signal, dispositif de réalisation de téléconférence et procédé de traitement de signal
US11270720B2 (en) * 2019-12-30 2022-03-08 Texas Instruments Incorporated Background noise estimation and voice activity detection system
CN116110421B (zh) * 2021-11-11 2025-07-04 深圳市韶音科技有限公司 语音活动检测方法、系统、语音增强方法以及系统
CN114813129B (zh) * 2022-04-30 2024-03-26 北京化工大学 基于wpe与emd的滚动轴承声信号故障诊断方法
CN117995193B (zh) * 2024-04-02 2024-06-18 山东天意装配式建筑装备研究院有限公司 一种基于自然语言处理的智能机器人语音交互方法
CN119785807B (zh) * 2024-12-13 2025-12-02 西安工业大学 基于人工智能算法数据交互系统
CN119789033B (zh) * 2025-03-12 2025-07-11 深圳市纯听科技有限公司 一种用于双耳助听器的声源定位及增强方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040150558A1 (en) * 2003-02-05 2004-08-05 University Of Florida Robust capon beamforming
WO2007099222A1 (fr) 2006-03-01 2007-09-07 Parrot Procede de debruitage d'un signal audio
EP2293594A1 (fr) 2009-07-23 2011-03-09 Parrot Procédé de filtrage des bruits latéraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif téléphonique "mains libres" pour véhicule automobile
EP2309499A1 (fr) 2009-09-22 2011-04-13 Parrot Procédé de filtrage optimisé des bruits non stationnaires captés par un dispositif audio multi-microphone, notamment un dispositif téléphonique "mains libres" pour véhicule automobile

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103541B2 (en) * 2002-06-27 2006-09-05 Microsoft Corporation Microphone array signal enhancement using mixture models
US20080120100A1 (en) * 2003-03-17 2008-05-22 Kazuya Takeda Method For Detecting Target Sound, Method For Detecting Delay Time In Signal Input, And Sound Signal Processor
KR20060113714A (ko) * 2003-11-24 2006-11-02 코닌클리케 필립스 일렉트로닉스 엔.브이. 비상관된 잡음에 대해 내성을 갖는 적응형 빔포머
GB2437559B (en) * 2006-04-26 2010-12-22 Zarlink Semiconductor Inc Low complexity noise reduction method
US7945442B2 (en) * 2006-12-15 2011-05-17 Fortemedia, Inc. Internet communication device and method for controlling noise thereof
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
US9224395B2 (en) * 2008-07-02 2015-12-29 Franklin S. Felber Voice detection for automatic volume controls and voice sensors
US8380497B2 (en) * 2008-10-15 2013-02-19 Qualcomm Incorporated Methods and apparatus for noise estimation
CN101916567B (zh) * 2009-11-23 2012-02-01 瑞声声学科技(深圳)有限公司 应用于双麦克风系统的语音增强方法
CN101894563B (zh) * 2010-07-15 2013-03-20 瑞声声学科技(深圳)有限公司 语音增强的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040150558A1 (en) * 2003-02-05 2004-08-05 University Of Florida Robust capon beamforming
WO2007099222A1 (fr) 2006-03-01 2007-09-07 Parrot Procede de debruitage d'un signal audio
EP2293594A1 (fr) 2009-07-23 2011-03-09 Parrot Procédé de filtrage des bruits latéraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif téléphonique "mains libres" pour véhicule automobile
EP2309499A1 (fr) 2009-09-22 2011-04-13 Parrot Procédé de filtrage optimisé des bruits non stationnaires captés par un dispositif audio multi-microphone, notamment un dispositif téléphonique "mains libres" pour véhicule automobile

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
B. WIDROW: "Adaptative Filters, Aspect of Network and System The- ory", 1970, HOLT, RINEHART AND WINSTON, pages: 563 - 587
B. WIDROW; S. STEARNS: "Adaptative Signal Processing", 1985, PRENTICE-HALL SIGNAL PROCESSING SERIES
COHEN I ET AL: "Speech enhancement based on a microphone array and log-spectral amplitude estimation", ELECTRICAL AND ELECTRONICS ENGINEERS IN ISRAEL, 2002. THE 22ND CONVENT ION OF DEC. 1, 2002, PISCATAWAY, NJ, USA,IEEE, 1 January 2002 (2002-01-01), pages 4 - 6, XP010631024, ISBN: 978-0-7803-7693-9 *
COHEN: "Optimal Speech Enhancement Under Signal Presence Uncertainty Using Log-Spectral Amplitude Estimator", IEEE SIGNAL PROCESSING LETTERS, vol. 9, no. 4, April 2002 (2002-04-01), pages 113 - 116, XP011433542, DOI: doi:10.1109/97.1001645
COHEN: "Optimal Speech Enhancement Under Signal Presence Uncertainty Using Log-Spectral Amplitude Estimator", IEEE SIGNAL PROCESSING LETTERS, vol. 9, no. 4, April 2002 (2002-04-01), XP011433542, DOI: doi:10.1109/97.1001645
COHEN; B. BERDUGO: "Two-Channel Signal Detection and Speech Enhancement Based on the Transient Beam-to-Reference Ratio", PROC. ICASSP 2003, HONG-KONG, April 2003 (2003-04-01), pages 233 - 236
HENDRIKS R C ET AL: "On Optimal Multichannel Mean-Squared Error Estimators for Speech Enhancement", IEEE SIGNAL PROCESSING LETTERS, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 16, no. 10, 1 October 2009 (2009-10-01), pages 885 - 888, XP011269912, ISSN: 1070-9908, DOI: 10.1109/LSP.2009.2026205 *
J. PRADO; E. MOULINES: "Annals of Telecommunications", 1994, article "Frequency-domain adaptive filtering with applications to acoustic echo cancellation"
R. C. HENDRIKS ET AL.: "On optimal multichannel mean-squared error estimators for speech enhancement", IEEE SIGNAL PROCESSING LETTERS, vol. 16, no. 10, 2009, XP011269912, DOI: doi:10.1109/LSP.2009.2026205

Also Published As

Publication number Publication date
EP2538409B1 (fr) 2013-08-28
FR2976710B1 (fr) 2013-07-05
US20120322511A1 (en) 2012-12-20
CN102855880A (zh) 2013-01-02
CN102855880B (zh) 2016-09-28
FR2976710A1 (fr) 2012-12-21
US8504117B2 (en) 2013-08-06

Similar Documents

Publication Publication Date Title
EP2538409B1 (fr) Procédé de débruitage pour équipement audio multi-microphones, notamment pour un système de téléphonie "mains libres"
EP2680262B1 (fr) Procédé de débruitage d'un signal acoustique pour un dispositif audio multi-microphone opérant dans un milieu bruité
EP2309499B1 (fr) Procédé de filtrage optimisé des bruits non stationnaires captés par un dispositif audio multi-microphone, notamment un dispositif téléphonique "mains libres" pour véhicule automobile
EP2293594B1 (fr) Procédé de filtrage des bruits latéraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif téléphonique "mains libres" pour véhicule automobile
EP1830349B1 (fr) Procédé de débruitage d'un signal audio
EP2772916B1 (fr) Procédé de débruitage d'un signal audio par un algorithme à gain spectral variable à dureté modulable dynamiquement
FR2831717A1 (fr) Methode et systeme d'elimination d'interference pour antenne multicapteur
FR2945696A1 (fr) Procede de selection d'un microphone parmi deux microphones ou plus, pour un systeme de traitement de la parole tel qu'un dispositif telephonique "mains libres" operant dans un environnement bruite.
WO2008049982A1 (fr) Procédé de réduction de l'écho acoustique résiduel après suppression d'écho dans un dispositif 'mains libres'
EP2122607A2 (fr) Procede de reduction active d'une nuisance sonore
FR2909773A1 (fr) Procede de traitement radar passif multivoies d'un signal d'opportunite en fm.
EP3238094B1 (fr) Procédé non linéaire d'estimation d'un mélange de signaux
EP2523020A1 (fr) Procédé et système de localisation d'interférences affectant un signal de radionavigation par satellite
EP0998166A1 (fr) Dispositif de traitement audio récepteur et procédé pour filtrer un signal utile et le restituer en présence de bruit ambiant
EP0692883B1 (fr) Procédé d'égalisation aveugle et son application à la reconnaissance de la parole
EP0884926B1 (fr) Procédé et dispositif de traitement optimisé d'un signal perturbateur lors d'une prise de son
WO2015011078A1 (fr) Procédé de suppression de la réverbération tardive d'un signal sonore
FR2808391A1 (fr) Systeme de reception pour antenne multicapteur
EP4315328B1 (fr) Estimation d'un masque optimise pour le traitement de donnees sonores acquises
FR3113537A1 (fr) Procédé et dispositif électronique de réduction du bruit multicanale dans un signal audio comprenant une partie vocale, produit programme d’ordinateur associé
FR2906070A1 (fr) Reduction de bruit multi-reference pour des applications vocales en environnement automobile
EP1155497B1 (fr) Procede et systeme de traitement de signaux d'antenne
FR2906071A1 (fr) Reduction de bruit multibande avec une reference de bruit non acoustique
WO2008037925A1 (fr) Reduction de bruit et de distorsion dans une structure de type forward
FR2878399A1 (fr) Dispositif et procede de debruitage a deux voies mettant en oeuvre une fonction de coherence associee a une utilisation de proprietes psychoacoustiques, et programme d'ordinateur correspondant

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20120605

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

REG Reference to a national code

Ref country code: DE

Ref legal event code: R079

Ref document number: 602012000246

Country of ref document: DE

Free format text: PREVIOUS MAIN CLASS: G10L0021020000

Ipc: G10L0021020800

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RIC1 Information provided on ipc code assigned before grant

Ipc: G10L 21/0208 20130101AFI20130327BHEP

Ipc: H04R 3/00 20060101ALI20130327BHEP

INTG Intention to grant announced

Effective date: 20130423

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: AT

Ref legal event code: REF

Ref document number: 629726

Country of ref document: AT

Kind code of ref document: T

Effective date: 20130915

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602012000246

Country of ref document: DE

Effective date: 20131024

REG Reference to a national code

Ref country code: NL

Ref legal event code: T3

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 629726

Country of ref document: AT

Kind code of ref document: T

Effective date: 20130828

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20131230

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130918

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20131228

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20131128

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20131129

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602012000246

Country of ref document: DE

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20140530

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602012000246

Country of ref document: DE

Effective date: 20140530

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140605

Ref country code: MC

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

REG Reference to a national code

Ref country code: IE

Ref legal event code: MM4A

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20140605

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 4

REG Reference to a national code

Ref country code: DE

Ref legal event code: R081

Ref document number: 602012000246

Country of ref document: DE

Owner name: PARROT AUTOMOTIVE, FR

Free format text: FORMER OWNER: PARROT, PARIS, FR

REG Reference to a national code

Ref country code: GB

Ref legal event code: 732E

Free format text: REGISTERED BETWEEN 20151029 AND 20151104

REG Reference to a national code

Ref country code: FR

Ref legal event code: TP

Owner name: PARROT AUTOMOTIVE, FR

Effective date: 20151201

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: NL

Ref legal event code: PD

Owner name: PARROT AUTOMOTIVE; FR

Free format text: DETAILS ASSIGNMENT: VERANDERING VAN EIGENAAR(S), OVERDRACHT; FORMER OWNER NAME: PARROT

Effective date: 20151102

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20150630

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20150630

Ref country code: SM

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 5

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: RS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140630

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO

Effective date: 20120605

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 6

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 7

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20130828

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: CZ

Payment date: 20190611

Year of fee payment: 8

REG Reference to a national code

Ref country code: NL

Ref legal event code: MM

Effective date: 20200701

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: NL

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20200701

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20230523

Year of fee payment: 12

Ref country code: FR

Payment date: 20230523

Year of fee payment: 12

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20230523

Year of fee payment: 12

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20240605

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20240630

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20240605

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20240605

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20250520

Year of fee payment: 14