EP1395981B1 - Device and method for processing an audio signal - Google Patents
Device and method for processing an audio signal Download PDFInfo
- Publication number
- EP1395981B1 EP1395981B1 EP02743323A EP02743323A EP1395981B1 EP 1395981 B1 EP1395981 B1 EP 1395981B1 EP 02743323 A EP02743323 A EP 02743323A EP 02743323 A EP02743323 A EP 02743323A EP 1395981 B1 EP1395981 B1 EP 1395981B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- windows
- processing
- audio signal
- stage
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012545 processing Methods 0.000 title claims abstract description 72
- 230000005236 sound signal Effects 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 title claims description 36
- 230000011218 segmentation Effects 0.000 claims abstract description 57
- 230000001360 synchronised effect Effects 0.000 claims abstract description 12
- 230000009466 transformation Effects 0.000 claims description 50
- 230000009467 reduction Effects 0.000 claims description 32
- 238000000844 transformation Methods 0.000 claims description 18
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000011282 treatment Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 230000015654 memory Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010719 annulation reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 241000861223 Issus Species 0.000 description 2
- 238000004833 X-ray photoelectron spectroscopy Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000001869 rapid Effects 0.000 description 2
- 238000010420 art technique Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Definitions
- the present invention relates to the field of audio signal processing.
- the invention relates, in particular, the reduction or cancellation of noise in an audio signal processed by a digital communication device, for example of the digital telephone type and / or radio mobile phones type hands-free.
- this problem is remedied by inserting noise attenuators or cancellers, acting on the signal picked up by a microphone, before a specific processing of the audio signal.
- a cancellation and echo or noise reduction device is inserted between a microphone intended to pick up an audio signal and a device for processing the audio signal.
- This device improves the useful signal to noise ratio or reduces the echo so that the signal can be processed later under optimized conditions.
- this technique of the prior art requires a specific dedicated device, which has the disadvantage of resulting in additional costs and increased complexity of use.
- the noise reduction function based on the use of a Fast Fourier Transform (FFT) applied to a continuous stream of voice samples, is integrated in the digital communication device.
- FFT Fast Fourier Transform
- the sample flow is split into 256 sample windows obtained by applying a formatting window, with the windows overlapping by half (the first 128 samples of a window corresponding to the last 128 samples from the previous window).
- An FFT is applied to each window then the result of the FFT is processed by a function of cancellation or reduction of noise or echo.
- the result of this function is processed by an inverse fast Fourier transform (or IFFT) to reconstruct a flow of voice samples that can be processed by a voice processing function.
- IFFT inverse fast Fourier transform
- the invention in its various aspects is intended to overcome these disadvantages of the prior art.
- an object of the invention is to provide a method and an audio processing device in a device that allows a reduction in the complexity of a processing based on a mathematical transformation applying to blocks of data while optimizing audio processing applying to audio frames.
- Another object of the invention is to optimize the integration of processing based on a mathematical transformation and audio processing.
- An object of the invention is also to optimize the delays of these treatments.
- Another object of the invention is to reduce the computing power necessary for these treatments.
- the audio processing steps can be implemented sequentially or in a multitasking environment. Moreover, this implementation is facilitated by the use of memory with a predictable, accurate and economical dimensioning.
- the method is remarkable in that the second segmentation windows are successive frames.
- the method is remarkable in that the last sample of a first sequence is also the last sample, after the first step, of the corresponding second sequence.
- the second stage of audio processing is performed without unnecessary waiting to optimize the overall time of audio processing.
- the first intermediate window being adapted to the mathematical transformation or transformations (it is notably an attenuation of the second lobe of the window relatively strong while the main lobe remains flat), the quality of the corresponding treatment is optimized.
- the second intermediate window being rectangular, the corresponding sample processing is simple and effective.
- the method is remarkable in that the predetermined processing sub-step comprises a reduction or cancellation of noise in the audio signal.
- the method advantageously combines treatments such as reduction and / or cancellation of noise and / or echo and / or voice recognition in a device (for example of the telephone, personal computer or remote control type) which allows a reduction of the complexity while optimizing the effectiveness of these treatments and / or a strong integration of the device (which allows, as a consequence, a reduction in costs and energy consumption this which is relatively important especially for battery-operated communications devices).
- a device for example of the telephone, personal computer or remote control type
- the invention advantageously makes it possible to use one or more mathematical transformations adapted to the first audio processing, these transformations applying to blocks of a size different from the size of the second segmentation windows.
- the method is remarkable in that the source audio signal is a voice signal.
- the invention is thus well suited to the second audio processing when it is specific to speech such as, for example, voice coding ("vocoding") and / or voice compression for storage and / or remote transmission.
- speech such as, for example, voice coding ("vocoding") and / or voice compression for storage and / or remote transmission.
- the invention relates to a computer program product, which is remarkable in that the program comprises instruction sequences adapted to the implementation of an audio processing method as described above when the program is executed on a computer.
- FFT and IFFT deal with windows with a power of 2 samples (typically 128 or 256).
- the speech coding takes into account windows that do not have the same size (typically the voice processing in the context of the GSM considers windows of 160 samples).
- the voice signal is sampled at a frequency of 8 kHz before being transmitted in 20 ms form. compressed to a recipient.
- the noise reduction and / or echo cancellation and / or cancellation device processes a window of length 256 which can intersect up to three windows. length 160. It is, among other things, the asynchronism inherent in this state-of-the-art technique that makes these processes complex and requires an oversizing of the memories and the computing power and / or the clock.
- a DSP Signal Processing Processor
- the two types of processing are synchronized by systematically matching the end of a cancellation or noise reduction and / or echo window with a voice processing frame and preferably with the end of a voice processing frame.
- the noise reduction or cancellation windows have a size equal to 256 samples and if the speech processing frames have a size equal to 160 samples, a reduction or echo cancellation window will contain the a full voice processing frame and 96 samples (ie 256 minus 160) from the previous window.
- Such a window is, for example, obtained by the convolution of a Hanning window of width 97 (denoted Hanning (97)) with a rectangular window of width 160 (denoted Rect (160)).
- a 256-point FFT is then applied to each 256-sample window synchronized to frames of 160 samples.
- the implementation of FFT is well known to those skilled in the art and is particularly detailed in the book "Numerical Recipes in C, 2 nd edition” (or in French “Digital Recipes in C language, 2nd edition") written by Press WH, Teukolsky SA, Vetterling WT and Flannery BP and published in 1992 by Cambridge University Press.
- Blocks of 256 samples are thus treated successively.
- the first 96 processed samples of the current window are added to the last 96 processed samples from the previous window.
- the first 160 samples of the current window are transmitted to the vocoder to be processed according to the speech coding methods known per se, in accordance, where appropriate, with the applicable standard.
- Figure 1 schematically illustrates a general block diagram of a radiotelephone, according to the invention according to a preferred embodiment.
- register designates in each of the memories mentioned, as well a low capacitance memory area (a few binary data) a large capacity memory area (for storing a program whole or all of a sequence of transaction data).
- the DSP is particularly suitable for processing Fourier transform and speech coding. It may be used, for example, a DSP core manufactured by the company "DSP GROUP” (registered trademark) under the reference “OAK” (registered trademark).
- Figure 2 illustrates the successive processing carried out by the radiotelephone of Figure 1, on a voice signal.
- the noisy signal picked up by the microphone 107 is delivered to the Analog / Digital converter 204 where it is converted into a series of digital samples during a step 204.
- the sampling is typically done at frequency equal to 8kHz.
- a step 205 the digital sample sequence is processed.
- L 'frames (160) of processed samples are encoded by a vocoder according to a method known per se (typically as specified in the GSM standard).
- "vocoded" frames are formatted by the unit 112 to be transmitted by the radio module 111 according to techniques known per se (for example, according to the GSM standard).
- FIG. 3 presents a cancellation or noise reduction algorithm implemented in the processing step 205 of FIG. 2.
- the DSP 104 initializes in the RAM 106, a first block of 96 zero samples corresponding to the last samples received as well as all the variables necessary for the proper operation of the processing 205.
- the DSP 104 stores in the RAM 106 following the previously received samples a sequence of 160 incoming samples from the converter 108.
- the DSP 104 applies a segmentation window of length 256 to the sequence of the last 256 received samples. (Note that this window is illustrated below with reference to Figure 7)
- a mathematical transformation of 256-point FFT type is then applied to the sequence obtained by applying the segmentation window.
- a noise reduction type processing (specified later with reference to FIG. 8) is applied to the sequence resulting from the mathematical transformation.
- a transformation inverse to that of the step 302, of the IFFT type is applied to the processed sequence.
- the DSP 104 adds, if necessary (that is to say after a first iteration), the last 96 samples of the preceding processed sequence to the first 96 processed samples of the current sequence. .
- the sequence or frame formed of the first 160 processed current samples is transmitted to the vocoder.
- the 160 received samples corresponding to the 160 samples transmitted during the step 305 are erased from the memory 106.
- step 301 is repeated.
- FIG. 4 presents a coding of the speech, implemented in step 206 of FIG.
- the DSP 104 initializes in the RAM 106, all the variables necessary for the proper functioning of the coding 206.
- the DSP 104 stores in the RAM 106 a frame of 160 samples transmitted during the step 307.
- the DSP 104 applies speech coding processing to the frame of 160 samples according to a technique known per se.
- the coded frame is formatted and transmitted to the unit 102 to be transmitted to a recipient.
- Figure 5 depicts a window of the sample sequences as performed by the treatments of Figures 3 and 4.
- the curve 500 of the intensity 504 of the signal processed in step 205 is shown as a function of time t 502.
- the segmentation of the signal is such that the windows 505 (respectively 506) and 507 (respectively 502) are perfectly synchronous.
- the windows 505 (respectively 506) and 507 (respectively 502) end on the same sample before or after treatment (according to the steps 303, 304 and 305).
- Figure 6 illustrates a shaping window known per se.
- the graph giving the amplitude 602 of a window as a function of the rank of a sample 601 is represented by Hanning windows 603 and 604 of length 256 with an overlap of 128.
- the windowing can in no way be synchronous with a frame segmentation of 160 samples.
- FIG. 7 illustrates shaping windows 700 and 701, optimized according to the invention (corresponding to the windows 505 and 506 respectively of FIG. 5, but represented more precisely).
- the graph gives the amplitude 602 of a window as a function of the rank of a sample 601.
- windows 700 and 701 are Hanning windows obtained by convolution of an intermediate Hanning window of length 97 with a rectangular window of length 160. Thus, with the successive offsets of the windows, 160 parallels are obtained. windows with perfect reconstruction.
- FIG. 8 specifies step 303 of noise reduction type processing as illustrated with reference to FIG. 3.
- a frame 801 having 256 spectral components corresponding to a noisy speech signal is processed according to the treatment 303 described hereinafter.
- the DSP 104 converts the components of the rectangular coordinate frame 801 to polar coordinates to separate the phase of the spectral amplitude.
- 2 (to which a correction value may be added to improve the speed of convergence of the estimate); P xk m ⁇ P xk ⁇ m - 1 + 1 - ⁇
- an improved noise reduction algorithm is used. Nevertheless, the introduction of additional delay in this algorithm required a larger memory size for the storage of spectral components with complex values.
- the coefficient ⁇ is an overestimation factor of the noise that is introduced to obtain better performances of the noise reduction algorithm.
- ⁇ f corresponds to a spectral value floor.
- ⁇ f limits the attenuation of the noise reduction filter to a positive value to leave a minimum noise in the signal.
- the DSP 104 multiplies the amplitude
- g k (m) .
- the DSP 104 constructs the signal 809 with reduced noise from the amplitude
- the signal 809 is then processed according to the inverse Fourier transformation step 304.
- a person skilled in the art can provide any variant in the application of the invention which is not limited to mobile telephony (in particular GSM, UMTS, IS95, etc.) but extends to any type of device comprising audio coding after or before a mathematical transformation on an incoming audio signal.
- mobile telephony in particular GSM, UMTS, IS95, etc.
- any type of device comprising audio coding after or before a mathematical transformation on an incoming audio signal.
- the invention applies not only to the processing of voice source signals but extends to any type of audio processing.
- the mathematical transformation applied is in particular of any type applying to blocks of samples of a particular length which is not equal to the size of the frames processed according to an audio processing or which is not a multiple or divider adjacent to this frame size.
- the invention extends to the case where the size of the audio frames is equal to 160 or more generally is not a power of 2 and where a mathematical transformation applies to block sizes of length 256, 128, 512 or more generally 2 "(where n represents an integer) in particular an FFT, an FHT (of the English" Fast Hadamard Transform “or, in French” Fast Hadamard Transform ”) or a DCT (of the English" Discrete Cosine Transform: “or, in French,” transformed into discrete cosine ”) or variants of these transformations (obtained, for example, by combining one or more of these transformations with one or more other transformations) ...
- the invention applies to any type of processing associated with the mathematical transformation and performed before or after a speech coding step, particularly in the case of voice recognition or cancellation and / or reduction. echo.
- the invention is not limited to a purely material implantation but that it can also be implemented in the form of a sequence of instructions of a computer program or any form mixing a material part and a part software.
- the corresponding instruction sequence can be stored in a removable storage means (such as for example a floppy disk, a CD-ROM or a DVD-ROM) or no, this storage means being partially or completely readable by a computer or a microprocessor.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Telephone Function (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Stereo-Broadcasting Methods (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Stereophonic System (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
Description
La présente invention se rapporte au domaine du traitement de signaux audio.The present invention relates to the field of audio signal processing.
Plus précisément, l'invention concerne, notamment, la réduction ou l'annulation de bruit dans un signal audio traité par un dispositif de communication numérique, par exemple de type téléphone numérique et/ou radio téléphones mobiles de type main-libre.More specifically, the invention relates, in particular, the reduction or cancellation of noise in an audio signal processed by a digital communication device, for example of the digital telephone type and / or radio mobile phones type hands-free.
Lorsque des dispositifs de communication numériques audio sont utilisés dans un environnement bruité (typiquement à l'intérieur d'une voiture), ce dernier peut perturber fortement un signal audio et en conséquence dégrader la qualité d'une communication.When digital audio communication devices are used in a noisy environment (typically inside a car), the latter can greatly disrupt an audio signal and consequently degrade the quality of a communication.
Selon les techniques connues, on remédie à ce problème en insérant des atténuateurs ou annuleurs de bruit, agissant sur le signal capté par un microphone, avant un traitement spécifique du signal audio.According to the known techniques, this problem is remedied by inserting noise attenuators or cancellers, acting on the signal picked up by a microphone, before a specific processing of the audio signal.
Selon une première technique connue, on insère un dispositif d'annulation et de réduction d'écho ou de bruit entre un microphone destiné à capter un signal audio et un dispositif de traitement du signal audio. Ce dispositif améliore le rapport signal utile sur bruit ou diminue l'écho afin que le signal puisse être traité par la suite dans des conditions optimisées. Néanmoins, cette technique de l'art antérieur nécessite un dispositif spécifique dédié, ce qui a pour inconvénient d'entraîner des surcoûts et une complexité d'utilisation accrue.According to a first known technique, a cancellation and echo or noise reduction device is inserted between a microphone intended to pick up an audio signal and a device for processing the audio signal. This device improves the useful signal to noise ratio or reduces the echo so that the signal can be processed later under optimized conditions. Nevertheless, this technique of the prior art requires a specific dedicated device, which has the disadvantage of resulting in additional costs and increased complexity of use.
Selon une deuxième technique connue, la fonction de réduction de bruit, basée sur l'utilisation d'une transformée de Fourier rapide (ou FFT de l'anglais « Fast Fourier Transform ») appliquée à un flux continu d'échantillons vocaux est intégrée au dispositif de communication numérique. Dans un premier temps, le flux d'échantillons est découpé en fenêtres de 256 échantillons obtenus par l'application d'une fenêtre de mise en forme, les fenêtres se chevauchant par moitié (les 128 premiers échantillons d'une fenêtre correspondant aux 128 derniers échantillons de la fenêtre précédente). Une FFT est appliquée à chaque fenêtre puis le résultat de la FFT est traité par une fonction d'annulation ou de réduction de bruit ou d'écho.According to a second known technique, the noise reduction function, based on the use of a Fast Fourier Transform (FFT) applied to a continuous stream of voice samples, is integrated in the digital communication device. At first, the sample flow is split into 256 sample windows obtained by applying a formatting window, with the windows overlapping by half (the first 128 samples of a window corresponding to the last 128 samples from the previous window). An FFT is applied to each window then the result of the FFT is processed by a function of cancellation or reduction of noise or echo.
Ensuite, le résultat de cette fonction est traité par une transformée de Fourier rapide inverse (ou IFFT) afin de reconstituer un flux d'échantillons vocaux qui pourra être traité par une fonction de traitement vocal.Then, the result of this function is processed by an inverse fast Fourier transform (or IFFT) to reconstruct a flow of voice samples that can be processed by a voice processing function.
Un inconvénient de cette technique de l'art antérieur comme illustrée dans le document
L'invention selon ses différents aspects a notamment pour objectif de pallier ces inconvénients de l'art antérieur.The invention in its various aspects is intended to overcome these disadvantages of the prior art.
Plus précisément, un objectif de l'invention est de fournir un procédé et un dispositif de traitement audio dans un dispositif qui permet une réduction de la complexité d'un traitement basé sur une transformation mathématique s'appliquant à des blocs de données tout en optimisant le traitement audio s'appliquant à des trames audio.More specifically, an object of the invention is to provide a method and an audio processing device in a device that allows a reduction in the complexity of a processing based on a mathematical transformation applying to blocks of data while optimizing audio processing applying to audio frames.
Un autre objectif de l'invention est d'optimiser l'intégration du traitement basé sur une transformation mathématique et du traitement audio.Another object of the invention is to optimize the integration of processing based on a mathematical transformation and audio processing.
Un objectif de l'invention est également d'optimiser les délais de ces traitements.An object of the invention is also to optimize the delays of these treatments.
Un autre objectif de l'invention est de réduire la puissance de calcul nécessaire à ces traitements.Another object of the invention is to reduce the computing power necessary for these treatments.
Dans ce but, l'invention telle que définie dans les revendications 1 et 11 propose un procédé de traitement d'un signal audio, comprenant :
- une première étape de traitement d'un signal audio source, mettant en oeuvre au moins une transformation mathématique appliquée sur des premières séquences d'échantillons obtenues par l'application de premières fenêtres de segmentation sur le signal audio source ; et
- une deuxième étape de traitement audio, appliquée sur des secondes séquences d'échantillons obtenues par l'application de secondes fenêtres de segmentation sur le signal délivré par la première étape, les secondes fenêtres de segmentation étant distinctes des premières fenêtres de segmentation ;
- a first step of processing a source audio signal, implementing at least one mathematical transformation applied to first sample sequences obtained by the application of first segmentation windows on the source audio signal; and
- a second audio processing step, applied on second sample sequences obtained by the application of second segmentation windows on the signal delivered by the first step; second segmentation windows being distinct from the first segmentation windows;
Ainsi, les étapes de traitement audio peuvent être mise en oeuvre de manière séquentielle ou dans un environnement multitâche. Par ailleurs, cette mise en oeuvre est facilitée par l'utilisation de mémoire avec un dimensionnement prédictible, précis et économique.Thus, the audio processing steps can be implemented sequentially or in a multitasking environment. Moreover, this implementation is facilitated by the use of memory with a predictable, accurate and economical dimensioning.
Selon une caractéristique particulière, le procédé est remarquable en ce que les secondes fenêtres de segmentation sont des trames successives.According to one particular characteristic, the method is remarkable in that the second segmentation windows are successive frames.
Ainsi, selon l'invention, les délais de traitement du procédé sont optimisés.Thus, according to the invention, the processing times of the process are optimized.
Selon une caractéristique particulière, le procédé est remarquable en ce que le dernier échantillon d'une première séquence est également le dernier échantillon, après la première étape, de la seconde séquence correspondante.According to one particular characteristic, the method is remarkable in that the last sample of a first sequence is also the last sample, after the first step, of the corresponding second sequence.
Ainsi, préférentiellement la deuxième étape de traitement audio est effectuée sans attente inutile pour optimiser les délais globaux de traitement audio.Thus, preferably the second stage of audio processing is performed without unnecessary waiting to optimize the overall time of audio processing.
Selon une caractéristique particulière, le procédé est remarquable en ce que chaque première fenêtre de segmentation est une fenêtre à reconstruction parfaite obtenue par convolution :
- d'une première fenêtre intermédiaire à reconstruction parfaite et possédant des propriétés spectrales adaptées à la ou aux transformations mathématiques ; et
- d'une deuxième fenêtre intermédiaire rectangulaire.
- a first intermediate window with perfect reconstruction and having spectral properties adapted to the mathematical transformation or transformations; and
- a second rectangular intermediate window.
Ainsi, les parties de premières fenêtres de segmentation qui se chevauchent sont à reconstruction parfaite, ce qui permet d'avoir une recombinaison des signaux lors du premier traitement relativement simple.Thus, the portions of the first overlapping segmentation windows are perfectly reconstructed, which makes it possible to have a recombination of the signals during the first relatively simple treatment.
En outre, la première fenêtre intermédiaire étant adaptées à la ou aux transformations mathématiques (on a notamment une atténuation du deuxième lobe de la fenêtre relativement forte alors que le lobe principal reste plat), la qualité du traitement correspondant est optimisée.In addition, the first intermediate window being adapted to the mathematical transformation or transformations (it is notably an attenuation of the second lobe of the window relatively strong while the main lobe remains flat), the quality of the corresponding treatment is optimized.
De plus, la deuxième fenêtre intermédiaire étant rectangulaire, le traitement des échantillons correspondant est simple et efficace.In addition, the second intermediate window being rectangular, the corresponding sample processing is simple and effective.
Selon une caractéristique particulière, le procédé est remarquable en ce que la première étape de traitement appliquée à chaque première séquence comprend, en outre :
- une sous-étape de traitement prédéterminé appliquée à la première séquence;
- une sous-étape de transformation mathématique inverse appliquée aux échantillons traités de la première séquence; et
- une étape d'addition des échantillons vocaux issus de la sous étape de transformation mathématique inverse appliquée à la première séquence et des échantillons vocaux correspondants, issus de la sous étape de transformation mathématique inverse appliquée à la première séquence précédente.
- a predetermined processing sub-step applied to the first sequence;
- a substep of inverse mathematical transformation applied to the processed samples of the first sequence; and
- a step of adding the voice samples from the inverse mathematical transformation sub-step applied to the first sequence and corresponding speech samples from the inverse mathematical transformation sub-step applied to the first preceding sequence.
Selon une caractéristique particulière, le procédé est remarquable en ce que la sous-étape de traitement prédéterminé comprend une réduction ou une annulation de bruit dans le signal audio.According to a particular characteristic, the method is remarkable in that the predetermined processing sub-step comprises a reduction or cancellation of noise in the audio signal.
Selon une caractéristique particulière, le procédé est remarquable en ce que la sous-étape de traitement prédéterminé comprend au moins un traitement faisant partie du groupe comprenant :
- une réduction ou une annulation d'écho dans le signal audio ;
- une reconnaissance vocale dans le signal audio.
- an echo reduction or cancellation in the audio signal;
- voice recognition in the audio signal.
Ainsi, le procédé combine avantageusement des traitements tels que la réduction et/ou annulation de bruit et/ou d'écho et/ou de reconnaissance vocale dans un dispositif (par exemple de type téléphone, ordinateur personnel ou télécommande) qui permet une réduction de la complexité tout en optimisant l'efficacité de ces traitements et/ou une intégration forte du dispositif (ce qui permet, en conséquence, une baisse des coûts et des consommations d'énergie ce qui est relativement important notamment pour des dispositifs de communications fonctionnant sur batterie).Thus, the method advantageously combines treatments such as reduction and / or cancellation of noise and / or echo and / or voice recognition in a device (for example of the telephone, personal computer or remote control type) which allows a reduction of the complexity while optimizing the effectiveness of these treatments and / or a strong integration of the device (which allows, as a consequence, a reduction in costs and energy consumption this which is relatively important especially for battery-operated communications devices).
Selon une caractéristique particulière, le procédé est remarquable en ce que ladite ou lesdites transformations mathématiques appartienent au groupe comprenant :
- les transformations rapides de Fourrier (FFT) et leurs variantes ;
- les transformations rapides de Hadamard (FHT) et leurs variantes ; et
- les transformations en cosinus discrètes (DCT) et leurs variantes .
- fast Fourier transformations (FFT) and their variants;
- fast transformations of Hadamard (FHT) and their variants; and
- discrete cosine transformations (DCT) and their variants.
Ainsi, l'invention permet avantageusement d'utiliser une ou plusieurs transformations mathématiques adaptées au premier traitement audio, ces transformations s'appliquant sur des blocs de taille différente de la taille des deuxièmes fenêtres de segmentation.Thus, the invention advantageously makes it possible to use one or more mathematical transformations adapted to the first audio processing, these transformations applying to blocks of a size different from the size of the second segmentation windows.
Selon une caractéristique particulière, le procédé est remarquable en ce que le signal audio source est un signal vocal.According to a particular characteristic, the method is remarkable in that the source audio signal is a voice signal.
L'invention est ainsi bien adaptée au deuxième traitement audio lorsqu'il est spécifique à la parole tel que, par exemple, le codage vocal (« vocodage ») et/ou la compression vocale pour la mémorisation et/ou la transmission à distance.The invention is thus well suited to the second audio processing when it is specific to speech such as, for example, voice coding ("vocoding") and / or voice compression for storage and / or remote transmission.
L'invention concerne également un dispositif de traitement d'un signal audio, comprenant :
- des premiers moyens de traitement d'un signal audio source, mettant en oeuvre au moins une transformation mathématique appliquée sur des premières séquences d'échantillons obtenues par l'application de premières fenêtres de segmentation sur le signal audio source ; et
- des deuxièmes moyens de traitement audio, appliquées sur des secondes séquences d'échantillons obtenues par l'application de secondes fenêtres de segmentation sur le signal délivré par la première étape, les secondes fenêtres de segmentation étant distinctes des premières fenêtres de segmentation ;
- first means for processing a source audio signal, implementing at least one mathematical transformation applied to first sample sequences obtained by the application of first segmentation windows on the source audio signal; and
- second audio processing means, applied on second sample sequences obtained by the application of second segmentation windows on the signal delivered by the first step, the second segmentation windows being distinct from the first segmentation windows;
L'invention concerne, en outre, un produit programme d'ordinateur comprenant des éléments de programme, enregistrés sur un support lisible par au moins un microprocesseur, remarquable en ce que les éléments de programme contrôlent le ou les microprocesseurs pour qu'ils effectuent :
- une première étape de traitement d'un signal audio source, mettant en oeuvre au moins une transformation mathématique appliquée sur des premières séquences d'échantillons obtenues par l'application de premières fenêtres de segmentation sur le signal audio source ; et
- une deuxième étape de traitement audio, appliquée sur des secondes séquences d'échantillons obtenues par l'application de secondes fenêtres de segmentation sur le signal délivré par la première étape, les secondes fenêtres de segmentation étant distinctes des premières fenêtres de segmentation ;
- a first step of processing a source audio signal, implementing at least one mathematical transformation applied to first sample sequences obtained by the application of first segmentation windows on the source audio signal; and
- a second audio processing step, applied to second sample sequences obtained by the application of second segmentation windows on the signal delivered by the first step, the second segmentation windows being distinct from the first segmentation windows;
De plus, l'invention concerne, un produit programme d'ordinateur, remarquable en ce que le programme comprend des séquences d'instructions adaptées à la mise en oeuvre d'un procédé de traitement audio tel que décrit précédemment lorsque le programme est exécuté sur un ordinateur.In addition, the invention relates to a computer program product, which is remarkable in that the program comprises instruction sequences adapted to the implementation of an audio processing method as described above when the program is executed on a computer.
Les avantages du dispositif de traitement d'un signal audio, et des produits programme d'ordinateur sont les mêmes que ceux du procédé de traitement d'un signal audio, ils ne sont pas détaillés plus amplement.The advantages of the audio signal processing device, and computer program products are the same as those of the audio signal processing method, they are not detailed further.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation préférentiel, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels :
- la figure 1 présente un synoptique général d'un radiotéléphone, conforme à l'invention selon un mode particulier de réalisation ;
- la figure 2 illustre les traitements successifs effectués par le radiotéléphone de la figure 1, sur un signal vocal ;
- la figure 3 présente un algorithme d'annulation ou de réduction de bruit, selon la figure 2;
- la figure 4 présente un traitement vocal appliquer à une trame, selon la figure 2;
- la figure 5 décrit un fenêtrage du flux d'échantillons tel qu'effectué par les traitements des figures 3 et 4 ;
- la figure 6 illustre une fenêtre de mise en forme connue en soi;
- la figure 7 illustre une fenêtre de mise en forme, optimisée et utilisée dans les opérations de fenêtrage de la figure 3 selon un mode préférentiel de l'invention ; et
- la figure 8 décrit plus précisément un traitement de type réduction de bruit présentée à la figure 3.
- Figure 1 shows a general block diagram of a radiotelephone, according to the invention according to a particular embodiment;
- FIG. 2 illustrates the successive processing carried out by the radiotelephone of FIG. 1, on a voice signal;
- FIG. 3 presents a cancellation or noise reduction algorithm, according to FIG. 2;
- Figure 4 shows a voice processing applied to a frame, according to Figure 2;
- Figure 5 depicts a windowing of the sample stream as performed by the processes of Figures 3 and 4;
- FIG. 6 illustrates a shaping window known per se;
- FIG. 7 illustrates a formatting window, optimized and used in the windowing operations of FIG. 3 according to a preferred embodiment of the invention; and
- FIG. 8 more precisely describes a noise reduction type processing shown in FIG. 3.
Le principe général de l'invention repose sur la synchronisation :
- des traitements basés sur une FFT notamment des traitements d'annulation ou de réduction de bruit; et
- de traitement vocal de type codage de la parole.
- FFT-based treatments including noise cancellation or noise reduction treatments; and
- speech coding type speech processing.
En effet, les FFT et IFFT traitent des fenêtres comprenant une puissance de 2 échantillons (typiquement 128 ou 256).Indeed, FFT and IFFT deal with windows with a power of 2 samples (typically 128 or 256).
En revanche, le codage de la parole prend en compte des fenêtres qui n'ont pas la même taille (typiquement le traitement vocal dans le cadre du GSM considère des fenêtres de 160 échantillons).On the other hand, the speech coding takes into account windows that do not have the same size (typically the voice processing in the context of the GSM considers windows of 160 samples).
Dans le cas, par exemple, d'un radiotéléphone répondant aux normes GSM publiées par l'ETSI (« European Telecommunication Standard Institute »), le signal vocal est échantillonné à une fréquence de 8kHz avant d'être transmis par trame de 20ms sous forme compressée vers un destinataire.In the case, for example, of a GSM radio telephone complying with the standards published by the ETSI (European Telecommunication Standard Institute), the voice signal is sampled at a frequency of 8 kHz before being transmitted in 20 ms form. compressed to a recipient.
On note que, selon la norme GSM, le codage de la parole est effectué sur des trames de 160 échantillons, par un vocodeur. Ce codage qui est fonction du débit désiré est notamment spécifié dans les documents suivants :
- « Full Rate (FR) speech transcoding » (GSM06.10) (ou « codage de parole à plein débit » en français) ;
- « Half Rate (HR) speech transcoding » (GSM06.20) (ou « codage de parole à demi-débit » en français);
- « Enhanced Full Rate (EFR) speech transcoding » (GSM06.60) (ou « codage de parole à plein débit amélioré » en français) ; et
- « Adaptive Multi-Rate (AMR) speech transcoding » (GSM 06.90) (ou « codage de parole à débit multiple adaptatif » en français).
- "Full Rate (FR) speech transcoding" (GSM06.10) (or "full-rate speech coding" in French);
- "Half Rate (HR) speech transcoding" (GSM06.20) (or "half-rate speech coding" in French);
- "Enhanced Full Rate (EFR) speech transcoding" (GSM06.60) (or "enhanced full-rate speech coding" in French); and
- "Adaptive Multi-Rate (AMR) speech transcoding" (GSM 06.90) (or "adaptive multiple rate speech coding" in French).
Selon l'état de l'art, en considérant une fenêtre de 160 échantillons traités vocalement, le dispositif de réduction ou d'annulation de bruit et/ou d'écho traite une fenêtre de longueur 256 qui peut recouper jusqu'à trois fenêtres de longueur 160. C'est, entre autres, l'asynchronisme inhérent à cette technique de l'état de l'art qui rend complexe ces traitements et nécessite un surdimensionnement des mémoires et de la puissance de calcul et/ou de l'horloge d'un DSP (Processeur de Traitement de Signal » de l'anglais « Digital Signal Processor » utilisé pour les calculs).According to the state of the art, considering a window of 160 vocally processed samples, the noise reduction and / or echo cancellation and / or cancellation device processes a window of
Selon l'invention, on synchronise les deux types de traitement en faisant coïncider systématiquement la fin d'une fenêtre d'annulation ou de réduction de bruit et/ou d'écho avec une trame de traitement vocal et préférentiellement avec la fin d'une trame de traitement vocal. Ainsi, si les fenêtres de réduction ou d'annulation de bruit ont une taille égale à 256 échantillons et si les trames de traitement vocal ont une taille égale à 160 échantillons, une fenêtre de réduction ou d'annulation d'écho va contenir l'intégralité d'une trame de traitement vocal et 96 échantillons (soit 256 moins 160) de la fenêtre précédente.According to the invention, the two types of processing are synchronized by systematically matching the end of a cancellation or noise reduction and / or echo window with a voice processing frame and preferably with the end of a voice processing frame. Thus, if the noise reduction or cancellation windows have a size equal to 256 samples and if the speech processing frames have a size equal to 160 samples, a reduction or echo cancellation window will contain the a full voice processing frame and 96 samples (
Ainsi, on conserve le synchronisme entre les fenêtres de réduction ou d'annulation de bruit et les trames de traitement vocal et on optimise les délais globaux de traitement.Thus, the synchronism between the noise reduction or cancellation windows and the speech processing frames is maintained and the overall processing times are optimized.
Selon l'invention, une fenêtre de mise en forme (adaptée à des trames vocales associées de 160 échantillons et à des FFT à 256 points) est préférentiellement :
- à reconstruction parfaite, c'est-à-dire que la somme des amplitudes de deux fenêtres se recouvrant est toujours égale à 1 (sur la partie qui se recouvre) ;
- une fenêtre de longueur 256 avec un recouvrement de 96 de chaque coté.
- with perfect reconstruction, that is to say that the sum of the amplitudes of two overlapping windows is always equal to 1 (on the overlapping part);
- a window of
length 256 with a cover of 96 on each side.
Une telle fenêtre est, par exemple, obtenue par la convolution d'une fenêtre de Hanning de largeur 97 (notée Hanning(97)) avec une fenêtre rectangulaire de largeur 160 (notée Rect(160)).Such a window is, for example, obtained by the convolution of a Hanning window of width 97 (denoted Hanning (97)) with a rectangular window of width 160 (denoted Rect (160)).
Une FFT à 256 points est alors appliquée à chaque fenêtre de 256 échantillons synchronisée sur les trames de 160 échantillons. La mise en oeuvre de FFT est bien connue de l'homme du métier et est notamment détaillée dans le livre « Numerical Recipes in C, 2nd edition» (ou en français « Recettes numériques en langage C, 2ème édition ») écrit par Press W.H., Teukolsky S.A., Vetterling W.T. et Flannery B.P. et paru en 1992 aux éditions Cambridge University Press.A 256-point FFT is then applied to each 256-sample window synchronized to frames of 160 samples. The implementation of FFT is well known to those skilled in the art and is particularly detailed in the book "Numerical Recipes in C, 2 nd edition" (or in French "Digital Recipes in C language, 2nd edition") written by Press WH, Teukolsky SA, Vetterling WT and Flannery BP and published in 1992 by Cambridge University Press.
Puis, on applique un algorithme de réduction de bruit, de tout type connu en soi, avant d'effectuer une opération de transformée inverse (notée IFFT) sur le bloc de 256 échantillons considéré.Then, we apply a noise reduction algorithm, of any type known per se, before performing an inverse transform operation (denoted IFFT) on the block of 256 samples considered.
Des blocs de 256 échantillons sont ainsi traités successivement. Après l'opération de IFFT, les 96 premiers échantillons traités de la fenêtre courante sont ajoutés aux 96 derniers échantillons traités de la fenêtre précédente. Après addition, les 160 premiers échantillons de la fenêtre courante sont transmis au vocodeur pour être traités selon les méthodes de codage de la parole connues en soi, conformément, le cas échéant, à la norme s'appliquant.Blocks of 256 samples are thus treated successively. After the IFFT operation, the first 96 processed samples of the current window are added to the last 96 processed samples from the previous window. After addition, the first 160 samples of the current window are transmitted to the vocoder to be processed according to the speech coding methods known per se, in accordance, where appropriate, with the applicable standard.
On présente, en relation avec la figure 1, un radiotéléphone mettant en oeuvre l'invention.In connection with FIG. 1, a radiotelephone embodying the invention is presented.
La figure 1 illustre schématiquement un synoptique général d'un radiotéléphone, conforme à l'invention selon un mode préféré de réalisation.Figure 1 schematically illustrates a general block diagram of a radiotelephone, according to the invention according to a preferred embodiment.
Le radiotéléphone 100 comprend reliés entre eux par un bus d'adresses et de données 103 :
un microphone 107 ;- un convertisseur Analogique/
Numérique 108 ; - un haut-
parleur 109 ; - un convertisseur Numérique/
Analogique 110 ; - un processeur de traitement du signal (DSP) 104 ;
- une mémoire non volatile 105 ;
- une mémoire vive 106 ;
une interface radio 111 ;- une unité 112 de gestion et de contrôle des échanges des trames de données et de protocoles ; et
- une interface de relation homme/machine (typiquement un clavier et un écran) 113.
- a
microphone 107; - an Analog /
Digital converter 108; - a
speaker 109; - a digital /
analog converter 110; - a signal processing processor (DSP) 104;
- a
non-volatile memory 105; - a
random access memory 106; - a
radio interface 111; - a
unit 112 for managing and controlling exchanges of data frames and protocols; and - a man / machine interface (typically a keyboard and a screen) 113.
Chacun des éléments illustrés en figure 1 est bien connu de l'homme du métier. Ces éléments communs ne sont pas décrits ici.Each of the elements illustrated in Figure 1 is well known to those skilled in the art. These common elements are not described here.
On observe en outre que le mot « registre » utilisé dans toute la description désigne dans chacune des mémoires mentionnées, aussi bien une zone de mémoire de faible capacité (quelques données binaires) qu'une zone mémoire de grande capacité (permettant de stocker un programme entier ou l'intégralité d'une séquence de données de transactions).It is further observed that the word "register" used throughout the description designates in each of the memories mentioned, as well a low capacitance memory area (a few binary data) a large capacity memory area (for storing a program whole or all of a sequence of transaction data).
La mémoire non volatile 105 (ou ROM) conserve dans des registres qui par commodité possèdent les mêmes noms que les données qu'ils conservent :
- le programme de fonctionnement du
DSP 104 dans un registre « prog » 308 ; - une valeur L (valant typiquement 256), représentant une première taille de fenêtre de segmentation correspondant à un nombre de points pris en compte par une FFT dans
un registre 115 ; - une valeur L' (valant typiquement 160), représentant une deuxième taille de fenêtre correspondant à une taille de trame traitées par un vocodeur dans un registre 115 ; et
- des valeurs α, β, γ, κ et β f utilisées pour la réduction de bruit dans le signal.
- the operating program of the
DSP 104 in a " prog " register 308; - a value L (typically 256), representing a first segmentation window size corresponding to a number of points taken into account by an FFT in a
register 115; - a value L '(typically 160), representing a second window size corresponding to a frame size processed by a vocoder in a
register 115; and - values α, β, γ, κ and β f used for noise reduction in the signal.
La mémoire vive 106 conserve des données, des variables et des résultants intermédiaires de traitement et comprend notamment :
un registre 117 dans lequel sont conservées des valeurs d'échantillons bruités du signal reçu ;un registre 118 dans lequel sont conservées des valeurs d'échantillons traités ; et- une séquence d'échantillons traités destinée à un vocodeur.
- a
register 117 in which noisy sample values of the received signal are stored; - a
register 118 in which are kept processed sample values; and - a sequence of processed samples for a vocoder.
Le DSP est adapté notamment aux traitements de type transformation de Fourier et codage de la parole. On pourra utilisé, par exemple, un coeur de DSP fabriqué par la société « DSP GROUP » (marque déposée) sous la référence « OAK » (marque déposée).The DSP is particularly suitable for processing Fourier transform and speech coding. It may be used, for example, a DSP core manufactured by the company "DSP GROUP" (registered trademark) under the reference "OAK" (registered trademark).
La figure 2 illustre les traitements successifs effectués par le radiotéléphone de la figure 1, sur un signal vocal.Figure 2 illustrates the successive processing carried out by the radiotelephone of Figure 1, on a voice signal.
On note que le signal entrant dans le microphone 107 est la somme 203:
- d'un signal vocal pouvant être affecté d'un écho (symbolisé par la somme du signal produit 200 et du signal produit retardé) ; et
d'un bruit 202
- an echo-capable speech signal (symbolized by the sum of the produced
signal 200 and the delayed product signal); and - of a
noise 202
Le signal bruité capté par le microphone 107 est délivré au convertisseur Analogique/Numérique 204 où il converti en une suite d'échantillons numériques au cours d'une étape 204. Selon la norme GSM, on note que l'échantillonnage se fait typiquement à une fréquence égale à 8kHz.The noisy signal picked up by the
Puis, au cours d'une étape 205, la suite d'échantillons numérique est traitée.Then, in a
Ensuite, au cours d'une étape 206, des trames de L' (160) d'échantillons traités sont codées par un vocodeur selon une méthode connue en soi (typiquement telle que spécifiée dans la norme GSM).Then, in a
Puis, au cours d'une étape 207, des trames « vocodées » sont mises en forme par l'unité 112 pour être émises par le module radio 111 selon des techniques connues en soi (par exemple, selon la norme GSM).Then, during a
La figure 3 présente un algorithme d'annulation ou de réduction de bruit, mis en oeuvre dans l'étape de traitement 205 de la figure 2.FIG. 3 presents a cancellation or noise reduction algorithm implemented in the
Au cours d'une étape d'initialisation 300, le DSP 104 initialise dans la RAM 106, un premier bloc de 96 échantillons à zéro correspondants aux derniers échantillons reçus ainsi que toutes les variables nécessaires au bon fonctionnement du traitement 205.During an
Puis au cours d'une étape 301, le DSP 104 mémorise dans la RAM 106 à la suite des échantillons précédemment reçus une séquence de 160 échantillons entrants issus du convertisseur 108.Then during a step 301, the
Ensuite, au cours d'une étape 302, le DSP 104 applique une fenêtre de segmentation de longueur 256 à la séquence formée des derniers 256 échantillons reçus. (On note que cette fenêtre est illustrée plus loin en regard de la figure 7)Then, in a
Une transformation mathématique de type FFT à 256 points est alors appliquée à la séquence obtenue par application de la fenêtre de segmentation.A mathematical transformation of 256-point FFT type is then applied to the sequence obtained by applying the segmentation window.
Puis, au cours d'une étape 303, un traitement de type réduction de bruit (précisé plus loin en regard de la figure 8) est appliqué à la séquence issue de la transformation mathématique.Then, during a
Ensuite, au cours d'une étape 304, une transformation inverse de celle de l'étape 302, de type IFFT est appliquée à la séquence traitée.Then, during a
Puis, au cours d'une étape 305, le DSP 104 ajoute, le cas échéant (c'est-à-dire après une première itération), les 96 derniers échantillons de la séquence traitée précédente aux 96 premiers échantillons traités de la séquence courante.Then, during a
Ensuite, au cours d'une étape 306, la séquence ou trame formée des 160 premiers échantillons traités courants est transmise au vocodeur.Then, during a
Puis, au cours d'une étape 307, les 160 échantillons reçus correspondant aux 160 échantillons transmis lors de l'étape 305 sont effacés de la mémoire 106.Then, during a
Ensuite, l'étape 301 est réitérée.Then, step 301 is repeated.
La figure 4 présente un codage de la parole, mis en oeuvre dans l'étape 206 de la figure 2.FIG. 4 presents a coding of the speech, implemented in
Au cours d'une étape d'initialisation 400, le DSP 104 initialise dans la RAM 106, toutes les variables nécessaires au bon fonctionnement du codage 206.During an
Puis au cours d'une étape 401, le DSP 104 mémorise dans la RAM 106 une trame de 160 échantillons transmise lors de l'étape 307.Then during a
Puis, au cours d'une étape 402, le DSP 104 applique un traitement de codage de la parole à la trame de 160 échantillons selon une technique connue en soi.Then, during a
Ensuite, au cours d'une étape 403, la trame codée est mise en forme et transmise à l'unité 102 pour être émise vers un destinataire.Then, during a
Puis, au cours d'une étape 404, la trame de 160 échantillons est effacée de la mémoire RAM 106.Then, during a
Ensuite, l'opération 401 est réitérée.Then,
La figure 5 décrit un fenêtrage des séquences d'échantillons tel qu'effectué par les traitements des figures 3 et 4.Figure 5 depicts a window of the sample sequences as performed by the treatments of Figures 3 and 4.
Sur un premier graphique, on a représenté la courbe 500 de l'intensité 503 du signal reçu directement du convertisseur 108 en fonction du temps t 502.In a first graph, the
Sur un second graphique, on a représenté la courbe 500 de l'intensité 504 du signal traité lors de l'étape 205 en fonction du temps t 502.On a second graph, the
On note, sur le premier graphique, que le temps est découpé en fenêtres successives 505 et 506 de longueur L égale à 256, se chevauchant sur une longueur L" égale à 96 et obtenues lors de l'étape 302.It is noted in the first graph that the time is divided into
On note également, sur le deuxième graphique, que le temps est découpé en trames successives 507 et 508 de longueur L' égale à 160, ne se chevauchant pas et obtenues lors de l'étape de transmission 306.It is also noted on the second graph that the time is divided into
La segmentation du signal est telle que, les fenêtres 505 (respectivement 506), et 507 (respectivement 502) sont parfaitement synchrones.The segmentation of the signal is such that the windows 505 (respectively 506) and 507 (respectively 502) are perfectly synchronous.
Ainsi, selon le mode préféré de réalisation, les fenêtres 505 (respectivement 506), et 507 (respectivement 502) s'achèvent sur le même échantillon avant ou après traitement (selon les étapes 303, 304 et 305).Thus, according to the preferred embodiment, the windows 505 (respectively 506) and 507 (respectively 502) end on the same sample before or after treatment (according to the
De cette manière, le chevauchement se fait sur une longueur égale à L".In this way, the overlap is on a length equal to L ".
La figure 6 illustre une fenêtre de mise en forme connue en soi.Figure 6 illustrates a shaping window known per se.
On a représenté sur le graphique donnant l'amplitude 602 d'une fenêtre en fonction du rang d'un échantillons 601, des fenêtres 603 et 604 de Hanning de longueur 256 avec un recouvrement de 128.The graph giving the
On note que selon ce découpage connu en soi, le fenêtrage ne peut en aucune façon être synchrone avec une segmentation en trames de 160 échantillons.Note that according to this division known per se, the windowing can in no way be synchronous with a frame segmentation of 160 samples.
La figure 7 illustre des fenêtres 700 et 701 de mise en forme, optimisées selon l'invention (correspondant aux fenêtres respectivement 505 et 506 de la figure 5 mais représentée de manière plus précise).FIG. 7 illustrates shaping
De même que précédemment, le graphique donne l'amplitude 602 d'une fenêtre en fonction du rang d'un échantillon 601.As before, the graph gives the
On note que des fenêtres 700 et 701 sont des fenêtres de Hanning obtenue par convolution d'une fenêtre de Hanning intermédiaire de longueur 97 avec un fenêtre rectangulaire de longueur 160. On obtient ainsi, avec les décalages successifs des fenêtres, égaux à 160 échantillons des fenêtres à reconstruction parfaite.It is noted that
La figure 8 précise l'étape 303 de traitement de type réduction de bruit telle qu'illustrée en regard de la figure 3.FIG. 8 specifies step 303 of noise reduction type processing as illustrated with reference to FIG. 3.
Ce traitement de réduction de bruit est notamment décrit dans les documents suivants :
-
« Spectral substraction based on minimum statistics » (en français « soustraction spectrale basée sur des statistiques minimum ») écrit par R. Martin et publié dans le document « Signal Processing VII : Théories and applications, 1994, EURASIP » aux pages 1182 à 1185 -
« Computationally efficient speech enhancement by spectral minima tracking in subbands » (en français « amélioration de la parole efficace pour le calcul par la recherche de minima spectraux dans des sous-bandes »), écrit par G. DOBLINGER et publié dans les comptes-rendus (pages 1513 à 1516) de la conférence « ESCA. EUROPSPEECH'95, 4th European Conference on speech communication and technology -
« A combination of noise reduction and improved echo cancellation » (en français « une combinaison de réduction de bruit et d'annulation d'écho améliorée ») publié en Allemagne dans la collection « Fachgebiet Theorie der Signale » par l'université de technologie de Darmstadt
-
"Spectral substraction based on minimum statistics" (in French "spectral subtraction based on minimum statistics") written by R. Martin and published in the document "Signal Processing VII: Theories and Applications, 1994, EURASIP" on pages 1182 to 1185 -
"Computationally efficient speech enhancement by spectral minima tracking in subbands", written by G. DOBLINGER and published in the Proceedings (pages 1513 to 1516) of the conference "ESCA. EUROPSPEECH'95, 4th European Conference on speech communication and technology -
"A combination of noise reduction and improved echo cancellation" published in Germany in the "Fachgebiet Theorie der Signal" collection by the University of Technology of Darmstadt
Après avoir été traitée selon l'étape 302, une trame 801 comportant 256 composantes spectrales correspondant à un signal vocal bruité est traitée selon le traitement 303 décrit ci-après.After being processed according to
On note X k(m) la k ième composante de la m ième trame de signal vocal bruité.We denote X k (m) the kth component of the m th frame of the noisy speech signal.
Au cours d'une opération 802, le DSP 104 convertit les composantes de la trame 801 de coordonnées rectangulaires vers des coordonnées polaires pour séparer la phase de l'amplitude spectrale.During an
Au cours des différents traitements, seule l'amplitude spectrale va être modifiée, la phase restant inchangée.During the different treatments, only the spectral amplitude will be modified, the phase remaining unchanged.
Au cours d'une étape 803, on estime d'abord la puissance Pxk(m) du signal à courts termes selon les relations suivantes :
Pxk (1) = (1- α)|X k(1)|2 (auquel on ajoute éventuellement une valeur de correction afin d'améliorer la vitesse de convergence de l'estimation) ;
avec une valeur pour le coefficient « d'oubli » α comprise entre 0,7 et 0,9 ce qui permet d'assurer une recherche adéquate du spectre de parole stationnaire à courts termes.During a
P xk (1) = (1- α) | X k ( 1 ) | 2 (to which a correction value may be added to improve the speed of convergence of the estimate);
with a value for the "forgetting" coefficient α of between 0.7 and 0.9, which makes it possible to ensure an adequate search of the stationary short-term speech spectrum.
Ces relations présentent notamment deux avantages :
- leur simplicité de calcul ; et
- le fait qu'aucun délai de mesure n'est introduit.
- their simplicity of calculation; and
- the fact that no measurement delay is introduced.
Selon une variante de réalisation, on utilise un algorithme amélioré de réduction de bruit. Néanmoins, l'introduction d'un délai supplémentaire dans cet algorithme requérait une taille de mémoire plus importante pour le stockage des composantes spectrales à valeurs complexes.According to an alternative embodiment, an improved noise reduction algorithm is used. Nevertheless, the introduction of additional delay in this algorithm required a larger memory size for the storage of spectral components with complex values.
Ensuite, on estime la puissance spectrale Pnk(m) du bruit selon l'estimateur non linéaire suivant (qui effectue en quelque sorte une recherche des minima temporels de Pxk(m)):
et pour m strictement supérieur à 1 (m>1) :
si Pnk (m-1) < Pxk (m)
alors
sinon Pnk(m) = Pxk(m) ; Then, the spectral power P nk (m) of the noise is estimated according to the following nonlinear estimator (which does some sort of search for the temporal minima of P xk (m)) :
and for m strictly greater than 1 ( m > 1):
if P nk ( m -1) < P xk ( m )
so
otherwise P nk (m) = P xk (m);
Ensuite, au cours d'une étape 806, le DSP 104 calcule un facteur de gain gk(m) à valeurs réelles selon les relations suivantes :
et gk(m) = β f sinonThen, during a
and g k (m) = β f otherwise
Le coefficient κ est un facteur de surestimation du bruit qui est introduit pour obtenir de meilleures performances de l'algorithme de réduction de bruit.The coefficient κ is an overestimation factor of the noise that is introduced to obtain better performances of the noise reduction algorithm.
β f correspond à une valeur spectrale plancher. β f limite l'atténuation du filtre de réduction de bruit à une valeur positive pour laisser subsister un bruit minimal dans le signal.β f corresponds to a spectral value floor. β f limits the attenuation of the noise reduction filter to a positive value to leave a minimum noise in the signal.
Puis, au cours d'une étape 807, le DSP 104 multiplie l'amplitude |X k(m)| par le facteur de gain gk(m) correspondant pour obtenir l'amplitude de signal améliorée |Yk (m)| selon la relation suivante :
|Yk (m)| = gk(m). |X k(m)| pour les valeurs de k comprises entre 1 et 256.Then, during a
| Y k ( m ) | = g k (m) . | X k ( m ) | for the values of k between 1 and 256.
Ensuite, au cours d'une étape 808 de conversion de coordonnée polaires vers rectangulaires, le DSP 104 construit le signal 809 avec bruit réduit à partir de l'amplitude |Yk (m)| déterminée lors de l'étape 807 et de la phase du signal extraite lors de l'étape 802.Then, during a polar-to-rectangular coordinate
Le signal 809 est alors traité selon l'étape 304 de transformation inverse de Fourier.The
Bien entendu, l'invention n'est pas limitée aux exemples de réalisation mentionnés ci-dessus.Of course, the invention is not limited to the embodiments mentioned above.
En particulier, l'homme du métier pourra apporter toute variante dans l'application de l'invention qui ne se limite pas à la téléphonie mobile (notamment de type GSM, UMTS, IS95...) mais s'étend à tout type de dispositif comprenant un codage audio après ou avant une transformation mathématique sur un signal audio entrant.In particular, a person skilled in the art can provide any variant in the application of the invention which is not limited to mobile telephony (in particular GSM, UMTS, IS95, etc.) but extends to any type of device comprising audio coding after or before a mathematical transformation on an incoming audio signal.
De plus, l'invention s'applique non seulement au traitement de signaux sources vocaux mais s'étend à tout type de traitement audio.In addition, the invention applies not only to the processing of voice source signals but extends to any type of audio processing.
Selon l'invention, la transformation mathématique appliquée est notamment de tout type s'appliquant sur des blocs d'échantillons d'une longueur particulière qui n'est pas égale à la taille des trames traitées selon un traitement audio ou qui n'est pas un multiple ou un diviseur voisin de cette taille de trame. Ainsi, l'invention s'étend au cas où la taille des trames audio est égale à 160 ou plus généralement n'est pas une puissance de 2 et où une transformation mathématique s'applique sur des tailles de blocs de longueur 256, 128, 512 ou plus généralement 2" (où n représente un entier) notamment une FFT , une FHT (de l'anglais « Fast Hadamard Transform » ou, en français « Transformée de Hadamard Rapide») ou une DCT (de l'anglais « Discrete Cosine Transform:» ou , en français, « transformée en cosinus discrète ») ou les variantes de ces transformations (obtenues, par exemple, par combinaison d'une ou plusieurs de ces transformations avec une ou plusieurs autres transformations)...According to the invention, the mathematical transformation applied is in particular of any type applying to blocks of samples of a particular length which is not equal to the size of the frames processed according to an audio processing or which is not a multiple or divider adjacent to this frame size. Thus, the invention extends to the case where the size of the audio frames is equal to 160 or more generally is not a power of 2 and where a mathematical transformation applies to block sizes of
En outre, l'invention s'applique à tout type de traitement associée à la transformation mathématique et effectuée avant ou après une étape de codage de la parole, notamment au cas de la reconnaissance vocale ou de l'annulation et/ou de la réduction d'écho.In addition, the invention applies to any type of processing associated with the mathematical transformation and performed before or after a speech coding step, particularly in the case of voice recognition or cancellation and / or reduction. echo.
On notera que l'invention ne se limite pas à une implantation purement matérielle mais qu'elle peut aussi être mise en oeuvre sous la forme d'une séquence d'instructions d'un programme informatique ou toute forme mixant une partie matérielle et une partie logicielle. Dans le cas où l'invention est implantée partiellement ou totalement sous forme logicielle, la séquence d'instructions correspondante pourra être stockée dans un moyen de stockage amovible (tel que par exemple une disquette, un CD-ROM ou un DVD-ROM) ou non, ce moyen de stockage étant lisible partiellement ou totalement par un ordinateur ou un microprocesseur.It will be noted that the invention is not limited to a purely material implantation but that it can also be implemented in the form of a sequence of instructions of a computer program or any form mixing a material part and a part software. In the case where the invention is partially or totally implemented in software form, the corresponding instruction sequence can be stored in a removable storage means (such as for example a floppy disk, a CD-ROM or a DVD-ROM) or no, this storage means being partially or completely readable by a computer or a microprocessor.
Claims (11)
- Method of processing an audio signal, comprising:- a first stage (205) of processing a source audio signal, implementing at least one mathematical transformation which is applied to first sequences of samples which are obtained by application of first segmentation windows (505, 506, 700, 701) to the said source audio signal; and- a second stage (206) of audio processing, applied to second sequences of samples which are obtained by applying second segmentation windows (507, 508) to the signal which the said first stage supplies, the length of the said second segmentation windows being distinct from the length of the said first segmentation windows;characterized in that two successive first windows and/or two successive second windows straddle each other, the straddlings being such that the segmentations are synchronous and the segmentations are synchronised to the end of the said first and second windows.
- Method according to Claim 1, characterized in that the said second segmentation windows are successive frames.
- Method according to one of Claims 1 and 2, characterized in that the last sample of a first sequence is also the last sample, after the said first stage, of the corresponding second sequence.
- Method according to Claims 1 to 3, characterized in that each said first segmentation window (700, 701) is a perfect reconstruction window which is obtained by convolution:- of a first intermediate window with perfect reconstruction and having spectral properties which are suitable for the said mathematical transformation(s); and- of a second rectangular intermediate window.
- Method according to one of Claims 1 to 4, characterized in that the said first processing stage, which is applied to each first sequence, additionally comprises:- a predetermined processing sub-stage (303) which is applied to the said first sequence;- an inverse mathematical transformation sub-stage (304) which is applied to the processed samples of the said first sequence; and- a stage of addition (305) of voice samples from the said inverse mathematical transformation sub-stage, applied to the said first sequence, and corresponding voice samples from the said inverse mathematical transformation sub-stage, applied to the preceding first sequence.
- Method according to Claim 5, characterized in that the said predetermined processing sub-stage includes a reduction or cancellation of noise in the said audio signal.
- Method according to one of Claims 5 and 6, characterized in that the said predetermined processing sub-stage includes at least one process which is part of the group including:- reduction or cancellation of echo in the said audio signal;- voice recognition in the said audio signal.
- Method according to one of Claims 1 to 7, characterized in that the said mathematical transformation(s) belong to the group including:- fast Fourier transformations (FFT) and their variants;- fast Hadamard transformations (FHT) and their variants; and- discrete cosine transformations (DCT) and their variants.
- Method according to one of Claims 1 to 8, characterized in that the said source audio signal is a voice signal.
- Device for processing an audio signal, comprising:- first means for processing a source audio signal, implementing at least one mathematical transformation which is applied to first sequences of samples which are obtained by application of first segmentation windows to the said source audio signal; and- second means for audio processing, applied to second sequences of samples which are obtained by applying second segmentation windows to the signal which the said first stage supplies, the length of the said second segmentation windows being distinct from the length of the said first segmentation windows;characterized in that two successive first windows and/or two successive second windows straddle each other, the straddlings being such that the segmentations are synchronous and the segmentations are synchronised to the end of the said first and second windows.
- Computer program product which can be downloaded from a communication network and/or recorded on a medium which can be read by a computer and/or executed by a processor, characterized in that it includes program code instructions for implementing the method of processing an audio signal according to at least one of Claims 1 to 9.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0106412A FR2824978B1 (en) | 2001-05-15 | 2001-05-15 | DEVICE AND METHOD FOR PROCESSING AN AUDIO SIGNAL |
FR0106412 | 2001-05-15 | ||
PCT/FR2002/001640 WO2002093558A1 (en) | 2001-05-15 | 2002-05-15 | Device and method for processing an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
EP1395981A1 EP1395981A1 (en) | 2004-03-10 |
EP1395981B1 true EP1395981B1 (en) | 2007-10-31 |
Family
ID=8863317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP02743323A Expired - Lifetime EP1395981B1 (en) | 2001-05-15 | 2002-05-15 | Device and method for processing an audio signal |
Country Status (10)
Country | Link |
---|---|
US (1) | US7295968B2 (en) |
EP (1) | EP1395981B1 (en) |
JP (1) | JP2004527797A (en) |
KR (1) | KR20040005965A (en) |
CN (1) | CN1223991C (en) |
AT (1) | ATE377244T1 (en) |
DE (1) | DE60223246D1 (en) |
FR (1) | FR2824978B1 (en) |
IL (2) | IL158797A0 (en) |
WO (1) | WO2002093558A1 (en) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8219391B2 (en) * | 2005-02-15 | 2012-07-10 | Raytheon Bbn Technologies Corp. | Speech analyzing system with speech codebook |
US7562811B2 (en) | 2007-01-18 | 2009-07-21 | Varcode Ltd. | System and method for improved quality management in a product logistic chain |
EP2024863B1 (en) | 2006-05-07 | 2018-01-10 | Varcode Ltd. | A system and method for improved quality management in a product logistic chain |
ATE520120T1 (en) * | 2006-06-29 | 2011-08-15 | Nxp Bv | SOUND FRAME LENGTH ADJUSTMENT |
WO2008135962A2 (en) | 2007-05-06 | 2008-11-13 | Varcode Ltd. | A system and method for quality management utilizing barcode indicators |
CN105045777A (en) | 2007-08-01 | 2015-11-11 | 金格软件有限公司 | Automatic context sensitive language correction and enhancement using an internet corpus |
EP2218055B1 (en) | 2007-11-14 | 2014-07-16 | Varcode Ltd. | A system and method for quality management utilizing barcode indicators |
US11704526B2 (en) | 2008-06-10 | 2023-07-18 | Varcode Ltd. | Barcoded indicators for quality management |
JP5752150B2 (en) | 2010-02-01 | 2015-07-22 | ジンジャー ソフトウェア、インコーポレイティッド | Context-sensitive automatic language correction using an Internet corpus specifically for small keyboard devices |
EP2372703A1 (en) | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window |
US20140025374A1 (en) * | 2012-07-22 | 2014-01-23 | Xia Lou | Speech enhancement to improve speech intelligibility and automatic speech recognition |
US8807422B2 (en) | 2012-10-22 | 2014-08-19 | Varcode Ltd. | Tamper-proof quality management barcode indicators |
EP2848300A1 (en) | 2013-09-13 | 2015-03-18 | Borealis AG | Process for olefin production by metathesis and reactor system therefore |
CN105830152B (en) * | 2014-01-28 | 2019-09-06 | 三菱电机株式会社 | The input signal bearing calibration and mobile device information system of audio collecting device, audio collecting device |
CN104914307B (en) * | 2015-04-23 | 2017-09-12 | 深圳市鼎阳科技有限公司 | A kind of spectral measuring method of frequency spectrograph and its parallel frequency sweep of multi-parameter |
US11060924B2 (en) | 2015-05-18 | 2021-07-13 | Varcode Ltd. | Thermochromic ink indicia for activatable quality labels |
EP3320315B1 (en) | 2015-07-07 | 2020-03-04 | Varcode Ltd. | Electronic quality indicator |
US10594530B2 (en) * | 2018-05-29 | 2020-03-17 | Qualcomm Incorporated | Techniques for successive peak reduction crest factor reduction |
US20210020191A1 (en) * | 2019-07-18 | 2021-01-21 | DeepConvo Inc. | Methods and systems for voice profiling as a service |
US11532314B2 (en) * | 2019-12-16 | 2022-12-20 | Google Llc | Amplitude-independent window sizes in audio encoding |
CN118430527B (en) * | 2024-07-05 | 2024-09-06 | 青岛珞宾通信有限公司 | Voice recognition method based on PDA end edge calculation processing |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1062963C (en) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | Adaptive-block-lenght, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
JPH07264144A (en) * | 1994-03-16 | 1995-10-13 | Toshiba Corp | Signal compression coder and compression signal decoder |
FI100840B (en) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Noise attenuator and method for attenuating background noise from noisy speech and a mobile station |
AU3690197A (en) * | 1996-08-02 | 1998-02-25 | Universite De Sherbrooke | Speech/audio coding with non-linear spectral-amplitude transformation |
US5913191A (en) * | 1997-10-17 | 1999-06-15 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries |
US5903872A (en) * | 1997-10-17 | 1999-05-11 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
US6418405B1 (en) * | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for dynamic segmentation of a low bit rate digital voice message |
US6370500B1 (en) * | 1999-09-30 | 2002-04-09 | Motorola, Inc. | Method and apparatus for non-speech activity reduction of a low bit rate digital voice message |
FI116643B (en) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Noise reduction |
-
2001
- 2001-05-15 FR FR0106412A patent/FR2824978B1/en not_active Expired - Fee Related
-
2002
- 2002-05-15 EP EP02743323A patent/EP1395981B1/en not_active Expired - Lifetime
- 2002-05-15 JP JP2002590150A patent/JP2004527797A/en active Pending
- 2002-05-15 AT AT02743323T patent/ATE377244T1/en not_active IP Right Cessation
- 2002-05-15 CN CNB028129784A patent/CN1223991C/en not_active Expired - Fee Related
- 2002-05-15 IL IL15879702A patent/IL158797A0/en active IP Right Grant
- 2002-05-15 US US10/477,816 patent/US7295968B2/en not_active Expired - Fee Related
- 2002-05-15 KR KR10-2003-7014895A patent/KR20040005965A/en not_active Application Discontinuation
- 2002-05-15 DE DE60223246T patent/DE60223246D1/en not_active Expired - Lifetime
- 2002-05-15 WO PCT/FR2002/001640 patent/WO2002093558A1/en active IP Right Grant
-
2003
- 2003-11-10 IL IL158797A patent/IL158797A/en not_active IP Right Cessation
Non-Patent Citations (1)
Title |
---|
None * |
Also Published As
Publication number | Publication date |
---|---|
US7295968B2 (en) | 2007-11-13 |
EP1395981A1 (en) | 2004-03-10 |
CN1223991C (en) | 2005-10-19 |
IL158797A (en) | 2009-02-11 |
KR20040005965A (en) | 2004-01-16 |
CN1520589A (en) | 2004-08-11 |
JP2004527797A (en) | 2004-09-09 |
DE60223246D1 (en) | 2007-12-13 |
FR2824978B1 (en) | 2003-09-19 |
ATE377244T1 (en) | 2007-11-15 |
FR2824978A1 (en) | 2002-11-22 |
WO2002093558A1 (en) | 2002-11-21 |
IL158797A0 (en) | 2004-05-12 |
US20040236572A1 (en) | 2004-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1395981B1 (en) | Device and method for processing an audio signal | |
EP1593116B1 (en) | Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method | |
EP1016072B1 (en) | Method and apparatus for suppressing noise in a digital speech signal | |
EP1789956B1 (en) | Method of processing a noisy sound signal and device for implementing said method | |
EP1356461B1 (en) | Noise reduction method and device | |
EP0002998B1 (en) | Method and system for speech data compression | |
EP0932964B1 (en) | Method and device for blind equalizing of transmission channel effects on a digital speech signal | |
EP2603862B1 (en) | Method for analyzing signals providing instantaneous frequencies and sliding fourier transforms, and device for analyzing signals | |
EP0557166A1 (en) | Noise reduction method in a speech signal | |
EP0511095B1 (en) | Coding and decoding method and apparatus for a digital signal | |
EP0998166A1 (en) | Device for audio processing,receiver and method for filtering the wanted signal and reproducing it in presence of ambient noise | |
FR2882458A1 (en) | METHOD FOR MEASURING THE GENE DUE TO NOISE IN AN AUDIO SIGNAL | |
EP3192073B1 (en) | Discrimination and attenuation of pre-echoes in a digital audio signal | |
EP3627510B1 (en) | Filtering of an audio signal acquired by a voice recognition system | |
EP1016073B1 (en) | Method and apparatus for suppressing noise in a digital speech signal | |
EP1021805B1 (en) | Method and apparatus for conditioning a digital speech signal | |
EP2515300B1 (en) | Method and system for noise reduction | |
EP0989544A1 (en) | Device and method for filtering a speech signal, receiver and telephone communications system | |
EP2126904B1 (en) | Audio encoding method and device | |
FR2751776A1 (en) | METHOD OF EXTRACTING THE BASIC FREQUENCY OF A SPEECH SIGNAL | |
WO1999027523A1 (en) | Method for reconstructing sound signals after noise abatement | |
FR2821476A1 (en) | METHOD FOR SPECTRAL RECONSTRUCTION OF AN AUDIO SIGNAL WITH INCOMPLETE SPECTRUM AND CORRESPONDING DEVICE | |
FR2773653A1 (en) | Input sound digital word decoding/coding device, especially for analyzing and compressing inputs for recording | |
WO2001091106A1 (en) | Adaptive analysis windows for speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20031117 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
AX | Request for extension of the european patent |
Extension state: AL LT LV MK RO SI |
|
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: WAVECOM |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: LANGUAGE OF EP DOCUMENT: FRENCH |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP |
|
REF | Corresponds to: |
Ref document number: 60223246 Country of ref document: DE Date of ref document: 20071213 Kind code of ref document: P |
|
NLV1 | Nl: lapsed or annulled due to failure to fulfill the requirements of art. 29p and 29m of the patents act | ||
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: NL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20071031 Ref country code: SE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20080131 Ref country code: ES Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20080211 |
|
GBV | Gb: ep patent (uk) treated as always having been void in accordance with gb section 77(7)/1977 [no translation filed] | ||
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: PT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20080331 |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FD4D |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: AT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20071031 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20071031 |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed |
Effective date: 20080801 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20080201 Ref country code: IE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20071031 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20071031 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20080530 Year of fee payment: 7 |
|
BERE | Be: lapsed |
Owner name: WAVECOM Effective date: 20080531 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: MC Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20080531 |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: PL |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: LI Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20080531 Ref country code: GR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20080201 Ref country code: CH Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20080531 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: FI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20071031 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: BE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20080531 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: CY Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20071031 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: ST Effective date: 20100129 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: FR Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20090602 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: LU Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20080515 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: TR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20071031 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IT Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20080531 |