WO2009004225A1 - Post-traitement de reduction du bruit de quantification d'un codeur, au decodage - Google Patents

Post-traitement de reduction du bruit de quantification d'un codeur, au decodage Download PDF

Info

Publication number
WO2009004225A1
WO2009004225A1 PCT/FR2008/051057 FR2008051057W WO2009004225A1 WO 2009004225 A1 WO2009004225 A1 WO 2009004225A1 FR 2008051057 W FR2008051057 W FR 2008051057W WO 2009004225 A1 WO2009004225 A1 WO 2009004225A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
quantization noise
coding
information
compression
Prior art date
Application number
PCT/FR2008/051057
Other languages
English (en)
Inventor
Jean-Luc Garcia
Claude Marro
Balazs Kovesi
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Priority to AT08805992T priority Critical patent/ATE531038T1/de
Priority to JP2010511708A priority patent/JP2010529511A/ja
Priority to US12/663,546 priority patent/US8175145B2/en
Priority to ES08805992T priority patent/ES2376178T3/es
Priority to EP08805992A priority patent/EP2153438B1/fr
Publication of WO2009004225A1 publication Critical patent/WO2009004225A1/fr

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Definitions

  • the present invention relates to signal processing, in particular digital signals in the telecommunications field, these signals being, for example, speech, music, video signals, or other signals.
  • the rate needed to pass an audio and / or video signal with sufficient quality is an important parameter in telecommunications.
  • audio coders have been developed in particular to compress the amount of information necessary to transmit a signal.
  • Some encoders achieve particularly high information compression rates. Such coders generally use advanced information modeling and quantification techniques. Thus, such encoders transmit only models or partial data of the signal.
  • the decoded signal although not identical to the original signal (since some of the information has not been transmitted due to the quantization operation), nevertheless remains very close to the original signal.
  • Quantization noise The difference, from a mathematical point of view, between the decoded signal and the original signal is then called "quantization noise”.
  • disortion introduced by the coding / decoding.
  • a perceptual post-filter of the type used, for example, in CELP type speech decoders (for "Code Excited Linear Prediction"). This is to perform a filtering that improves the subjective quality at the price of a distortion. Indeed, a signal attenuation is applied in the areas where the quantization noise is most audible (especially between the formants).
  • Current perceptual postfilters provide good results for speech signals, but poorer results for other types of signals (music signals, for example).
  • Adaptive Postfiltering for Quality Enhancement of Coded Speech Chen J.H., Gersho A., IEEE Trans. On Speech and Audio Pr oc, (January 1995).
  • the described model is based on a division into two sections: - a "long-term” section reinforces the harmonics (harmonics of the fundamental frequency) and widens the spectral valleys between these harmonics, and a “short-term” section strengthens the formants and also hollow out the spectral valleys between these formants.
  • Harmonics and formants are well-known spectral characteristics of speech but applying this type of processing to a signal other than speech generates strong distortions. For example, the spectral richness of a music signal can not be handled with such a simple signal model.
  • perceptual post-filters can generate distortions, because they rely on a model that is not precise enough. Moreover, the perceptual post filter is usually ineffective in periods of silence.
  • Another treatment family targets conventional noise reduction treatments to distinguish the useful signal from the noise.
  • This type of processing therefore makes it possible to reduce the noise related to the environment of the signal capture and it is often used for speech signals.
  • coding / decoding one may want to transmit the ambient noise and it is then desirable that the noise reduction does not apply to this type of noise.
  • the present invention improves the situation.
  • the method according to the invention comprises an estimation of a quantization noise introduced by the compression coding from information obtained a priori on the type of compression coding, said information being independent of the characteristics of the signal and a determination from the estimated quantization noise, a filtering function to be applied to the decoded signal for applying an estimated quantization noise reduction processing.
  • noise reduction processing is understood to mean an operation of the type described above which consists in extracting the useful signal from a signal to be processed, by filtering the parasitic signals, for example by defining a gain function intervening in a filter applied to the decoded signal.
  • the quantization noise is filtered.
  • a quantization noise reduction model is chosen from information on the type of compression coding, and a quantization noise reduction processing is applied to the decoded signal according to the chosen model.
  • the quantization noise introduced by the compression coding is estimated, and a filtering function (and notably the parameters of this function) is determined from the estimated quantization noise; filtering) to be applied to the decoded signal to apply the quantization noise reduction processing.
  • noise reduction processing specific to each type of compression coding performed.
  • the very way of estimating the characteristics of the noise reduction filter depends on the type of coding performed.
  • the quantization noise itself strongly depends on the type of coding performed. It will be seen that it is possible to establish a variation of the quantization noise as a function of a variation of the decoded signal, and that this variation of the quantization noise is specific to the type of coding implemented.
  • the quantization noise is estimated to determine the filtering function to be applied to the decoded signal having this current parameter value.
  • the information on the type of compression coding is a priori information, independent of the characteristics of the signal, and that, advantageously, it can be deduced from it: a variation model of a signal-to-quantization noise ratio, in a function of at least one parameter of the decoded signal, and / or a spectral staining of the quantization noise (i.e., a spectral variation of the quantization noise as a function of the characteristics of the decoded signal).
  • the prior information on the type of compression coding is obtained during an encoder declaration procedure.
  • the invention is particularly suitable in the case where the type of compression coding is a coding according to the G.711 standard.
  • the present invention also provides a device for processing a signal initially coded in compression according to a predetermined type of coding, and then decoded.
  • the device comprises: means for estimating a quantization noise introduced by the compression coding, on the basis of information obtained a priori on the type of compression coding, said information being independent of the characteristics of the signal, and means for determining, from the estimated quantization noise, a filtering function to be applied to the decoded signal to apply an estimated quantization noise reduction processing.
  • the device advantageously comprises means for implementing the method described above.
  • the present invention also relates to a computer program, intended to be stored in memory of a processing device of the aforementioned type, and comprising instructions for calculating the quantization noise, as well as parameters of a quantization noise reduction filter. when these instructions are executed by a processor of the processing device.
  • An advantageous embodiment may consist in providing a set of instructions for each type of coding implemented and, in each set of instructions, defining a variation of the quantization noise as a function of the decoded signal.
  • a set of appropriate instructions is selected upon receipt of the information a priori.
  • the quantization noise present in the decoded signal is calculated, and the parameters of the post-filter are calculated in correspondence of this quantization noise, to limit or even eliminate this noise.
  • the instructions on the variation of the quantization noise can be programmed offline, on the basis of observations (theoretical or experimental according to the exemplary embodiments which will be described later) made on the type of coding used.
  • the invention proposes a post-processing performed after decoding and which uses a priori information on the characteristics of the quantization operation performed by the encoder.
  • the type of processing (or "processing model" according to the generic terms above) that will be chosen to process the signal is independent of the characteristics of the signal itself.
  • the processing itself in particular the estimation of the gain function
  • the type of treatment is the same and is not based, for example, on only on the energy of a decoded frame received.
  • the invention makes it possible to reduce the quantization noise (and therefore the distortion) that a compression coder of the signal implementing a quantization operation usually introduces.
  • the invention advantageously reduces the quantization noise alone, even during periods of silence, and this, for any type of signal.
  • the implementation of the invention does not perform a conventional noise reduction and therefore does not modify the noise related to the environment of the capture of the signal.
  • the implementation of the invention makes it possible to reduce or even eliminate the quantization noise, without distorting the signal, and this, for any type of signal, simply by using prior information on the type of encoder used (for example the characteristics of the encoder compression model, the characteristics of the quantizer, or other).
  • the present invention finds an advantageous application to the field of speech and music processing, and more generally to the processing of the signal, especially images, since any encoder is required to introduce a quantization noise.
  • the invention applies to all areas where it is sought to reduce a quantization noise of a signal.
  • FIG. 1 schematically illustrates the general structure of a processing unit within the meaning of the invention
  • FIG. 2 diagrammatically illustrates the steps of a method in the sense of the invention
  • FIG. 3 illustrates a variation of the compression law (called "A-law") of the amplitudes, in a coding according to the G.711 standard for illustrate an embodiment of the invention
  • FIG. 4 illustrates the variation of the signal-to-quantization noise ratio RSB as a function of the load factor, this variation being drawn from the variation illustrated in FIG. 3, FIG.
  • FIG. 5 illustrates the steps of an example of processing in the case of a coding according to the G.711 standard, based notably on the observations of the variations of FIGS. 3 and 4,
  • FIG. 6 illustrates an example of the spectrum of the signal. (dashed curve) and the quantization noise spectrum (continuous curve) for standard coding
  • FIG. 7 illustrates an example of a waveform of a speech signal S * (top curve) and the corresponding quantization signal-to-noise ratio RSB (bottom curve), for a coding / decoding according to the norm G .722,
  • - Figure 8 is a scatterplot illustrating for each segment of 80 samples the correlation between the SNR signal-to-noise ratio and the signal energy, in an application to G.722 coding / decoding
  • Fig. 9 shows the signal segments (in black) where the error of the RSB quantization signal to noise ratio estimate is greater than 6 dB while the RSB ratio is less than 25 dB, in the application to a coding / decoding according to G.722,
  • FIG. 10 shows the point cloud representing, for each segment, the energy of the noise as a function of the energy of the signal, illustrating here the estimation of the noise level (line in phantom), the zone or the estimate error is less than 6 dB (dashed lines), and the delineation for which the RSB is greater than 25 dB (solid line).
  • a signal S is: coded in compression by a coder COD of known type and applying in particular a quantization operation Q to the signal S, transmitted via a transmission channel CA, then
  • the signal thus decoded, denoted S then has a quantization noise which is defined mathematically as a difference (S - S) with respect to the original signal S.
  • a quantization noise reduction processing unit TBQ is provided, in the sense of the invention, downstream of the decoder DEC to suppress or at least limit the quantization noise in the signal S .
  • the unit TBQ comprises at least one input E to receive decoder DEC INF information on the type of coding / decoding implemented, which then allows to choose a noise reduction treatment model to be implemented. artwork.
  • it is estimated from the signal received and decoded S * , and depending on the type of coding / decoding that has been implemented, the influence of the quantization noise in the received signal S.
  • a calculation module is provided to give an estimate of the quantization noise BQ, on the basis of the model chosen and as a function of the received signal S.
  • This calculation module can typically be in the form of a combination of a processor and a working memory (not shown).
  • the estimated noise BQ is simply processed by applying a conventional filtering FIL to the signal S to finally output a processed signal S T.
  • a conventional filtering FIL for example a gain function for the signal filtering
  • step S3 from the information INF received on the type of coding / decoding used (step S2), a model (step S3) of noise reduction processing is determined.
  • the quantization noise reduction model chosen may be different, for example depending on whether the signal has been coded / decoded according to the G.711 standard or coded / decoded according to the standard. G.722.
  • step S4 when the signal is received in successive blocks (or frames marked TRi in step S1), it is estimated (step S4) a quantization noise level specific to the chosen model.
  • a quantization noise level specific to the chosen model.
  • This RSB information depends on the decoded signal S * , but also on the type of coding implemented.
  • prior knowledge of the coding by obtaining the information INF allows, together with certain statistical characteristics of the signal S, to estimate here the signal-to-noise ratio RSB.
  • This step S4 therefore requires knowing a priori the type of encoder that has been used, information that can be obtained for example during a declaration procedure of the encoder called "encoder transaction", which is supposed to be acquired.
  • the type of encoder, the characteristics of its compression model and its quantizer Q make it possible to estimate an evolution of the signal-to-quantization noise ratio, as a function of certain statistical parameters of the signal, for example its variance, its spectral density of power, or others.
  • This relationship between the signal-to-quantization noise ratio and the statistical parameters of the signal involves coder-specific laws which will be described later, for some exemplary embodiments.
  • the necessary statistical parameters can be calculated by classical quantity estimators (eg variance). Based on these estimates, an estimate of the signal to noise quantization ratio can be extrapolated.
  • the estimates can be made indifferently in the time domain, frequency, or any other time-frequency domain (wavelet for example).
  • the next step S5 consists in calculating the parameters of the filter for the reduction of the quantization noise in the received signal S.
  • Knowledge of the signal-to-noise ratio makes it possible to deduce the expression of a quantization noise reduction filter, this filter being hereinafter called "post-filter” (downstream of the decoder). It is indeed possible to deduce the expression of a digital filter whose purpose is to reduce a noise whose most characteristics are known a priori (its power spectral density for example) and whose level is determined from the estimation of the quantization signal-to-noise ratio obtained at the step previous S4.
  • the calculation of the filter can be performed in the frequency domain and implement any short-term spectral attenuation technique (a spectral subtraction, a Wiener filter, or other).
  • the calculation of the post-filter in step S5 can be performed in the time domain, frequency domain, or any other time-frequency domain.
  • step S6 itself, here amounts to filtering the decoded signal S * by the post-filter calculated in step S5.
  • This step S6 can be performed in the time or frequency domain, according to the constraints related to the implementation and the estimation domain of the PAR parameters and the RSB ratio in the previous steps.
  • a TRi 'frame processed by denoising the quantization noise in step S7 is obtained.
  • the quantization signal-to-noise ratio depends on the variance ⁇ x 2 of the signal, the saturation levels Jc 1113x determined by the dynamics and of course the number of bits b used for the representation of the samples, according to an expression of the type:
  • the expression (1) is strongly dependent on the value of this parameter F.
  • the maximum signal-to-noise ratio is obtained for a full-scale signal and that it decreases rapidly if the amplitude of the signal decreases.
  • RSB umf (20 log 2> + 10 log 3 + 10 log [A / (l + In A)] - 20 log (r) [dB] RSB umf "6.02b + 4.77 + 101og [A / (l + InA )] -201og (r) [dB] (3)
  • a first increasing part corresponding to the uniform variation of the law of compression
  • - a following part constant, corresponding to the logarithmic variation of this law.
  • the implementation of the quantization noise reduction processing is based on the exploitation of this information a priori. It requires in particular to carry out a estimation of the load factor F, the parameter on which the power of the quantization noise depends, as follows.
  • the average power Pm of a current block TRi (step S52) is estimated, and hence the load factor F, varying as the inverse of the square root of the average power (step S53). It is considered that the numerator -Xmax of the load factor is here constant (at constant saturation level).
  • the found value of the load factor F is compared with that of a threshold F 8 defining the point of inflection of the compression law (FIG.
  • the signal-to-quantization noise ratio RSB can be calculated according to a linear variation as a function of the load factor derived from equation (3):
  • the gain function (step S57) is then evaluated for post-filter application (step S58).
  • a Wiener filter can be provided as gain function g (RSB).
  • noise reduction processing in particular for signals of low signal-to-quantization noise ratio, ie at low amplitude (for load factors such as -20.1og (F) ⁇ - 5OdB in FIG. 4), possibly providing for: - post-filter thresholding, and / or voice activity detector for speech signals (with lighter quantization noise reduction processing during periods of speech inactivity).
  • a variant of the treatment presented here is to reduce the quantization noise, sample by sample, rather than a treatment by successive blocks.
  • the load factor is directly given by the amplitude level of the sample (inverse of the square root of the amplitude) and the continuation of the treatment is similar to that presented above.
  • the ITU-T G.722 coding standardized in 1988 for 64 kbit / s digital audio conferencing applications, is still very widely used. It is a hierarchical coding / decoding at three rates: 64, 56 and 48 kbit / s.
  • the signal is divided into two subbands by a filter called QMF (for "Quadrature Mirror Filter”).
  • QMF for "Quadrature Mirror Filter”
  • the two bands obtained are encoded with an ADPCM encoder (for "Modulation by
  • ADPCM Adaptive Differential Pulse Code Modulation
  • the high band is coded on 2 bits per sample.
  • the difference between the three rates comes from the low band which is coded on 6 bits per sample for the highest rate, but it is possible to reserve the last or last two bits for data transmission.
  • the quality of the higher bit rate is very good, but the coding noise becomes very audible and annoying for the lowest bit rate at 48 kbit / s.
  • the reduction treatment of the Quantization noise in the sense of the invention can be advantageously applied in this case.
  • the characteristics of the quantization noise can be efficiently estimated from the decoded signal.
  • the spectrum of quantization noise (full line curve) is always flat, regardless of the signal spectrum (dotted line curve).
  • the signal to quantization noise ratio depends on the average signal strength and its nature.
  • FIG. 7 it can be observed that the signal-to-quantization noise ratio (RSB) correlates well with the average power of the signal S.
  • the RSB ratio was estimated on segments of 80 samples (5 ms for a sampling frequency of 16 kHz).
  • the cloud-like representation of FIG. 8 further illustrates the correlation between the mean signal power (abscissa) and the quantization noise-to-signal ratio (y-axis), calculated by segments of 80 samples.
  • FIG. 9 represents in black on a gray background the areas of the signal where the estimation error of the ratio RSB is greater than 6 dB, and the ratio RSB itself is less than 25 dB, i.e. the signal areas in which the estimator underestimates the quantization noise, resulting in a lower efficiency of the quantization noise reduction processing. It can nevertheless be noted that these zones correspond to unvoiced signal segments, for which the quantization noise is less troublesome because of the intrinsically noisy nature of the signal.
  • FIG. 10 shows a power diagram of the noise with respect to a signal power, in accordance with the empirical equation (5).
  • the dashed line represents the estimate of the noise power.
  • the dashed lines delimit the area where the error of the estimate is less than 6 dB. Below the solid line, the RSB is greater than 25 dB.
  • the black dots correspond to the black segments of Figure 9.
  • the estimation of the RSB ratio can be further refined by taking into account, for example, the prediction gain of the ARMA (autoregressive) filters which intervene in the G.722 decoder. Knowing the spectral shape of the quantization noise and its energy, the quantization noise reduction process of the invention can be effectively applied for this type of coding / decoding. This example is obviously valid for other types of coding / decoding of the same family as those standardized G.726 or G.727.
  • an advantageous application of the invention can for example aim to reduce the quantization noise of a standardized ITU-G.711 encoder by using the properties of the quantization law implemented. , especially according to law A in Europe. Indeed, in this application, the quantization noise is white and it is possible to estimate the quantization signal-to-noise ratio and hence a gain function that makes it possible to reduce this noise.
  • An advantageous application of the invention therefore aims to reduce quantization noise in the processing at the extended band extension of the G.711 encoder (ITU-T SG16, G.71 IWB).
  • the invention applies to any type of coding / decoding as long as its intrinsic characteristics are known.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention concerne le traitement d'un signal qui a été codé en compression (COD) selon un type de codage prédéterminé, appliquant une opération de quantification (Q), puis décodé (DEC), de sorte qu'un bruit de quantification est présent dans le signal décodé (S*). Le traitement de signal de l'invention applique une réduction du bruit de quantification (TBQ) au signal décodé (S*), préférentiellement comme suit : on obtient d'abord des informations (INF) sur le type de codage en compression; on choisit un modèle de réduction du bruit de quantification adapté à ces informations en estimant le bruit de quantification (BQ) qu'a pu générer le codage; et on applique au signal décodé (S*) un traitement de réduction du bruit de quantification (FIL) selon le modèle choisi.

Description

Post-traitement de réduction du bruit de quantification d'un codeur, au décodage
La présente invention concerne un traitement de signal, en particulier de signaux numériques dans le domaine des télécommunications, ces signaux pouvant être par exemple des signaux de parole, de musique, des signaux vidéo, ou autres.
Généralement, le débit nécessaire pour faire transiter un signal audio et/ou vidéo avec une qualité suffisante est un paramètre important en télécommunications. Afin de réduire ce paramètre et d'augmenter alors le nombre de communications possibles via un même réseau, des codeurs audio ont été développés notamment pour compresser la quantité d'informations nécessaire pour transmettre un signal.
Certains codeurs permettent d'atteindre des taux de compression de l'information particulièrement élevés. De tels codeurs utilisent en général des techniques avancées de modélisation et de quantification de l'information. Ainsi, de tels codeurs ne transmettent que des modèles ou des données partielles du signal.
Le signal décodé, bien qu'il ne soit pas identique au signal original (puisqu'une partie de l'information n'a pas été transmise du fait de l'opération de quantification), reste néanmoins très proche du signal original. La différence, du point de vue mathématique, entre le signal décodé et le signal original est alors appelée « bruit de quantification ». On peut parler aussi de « distorsion » introduite par le codage/décodage.
Les traitements en compression de signaux sont souvent conçus de manière à minimiser le bruit de quantification et, en particulier, à rendre ce bruit de quantification le moins audible possible lorsqu'il s'agit de traiter un signal audio. Il existe alors des techniques prenant en compte les caractéristiques psycho-acoustiques de l'audition, dans le but de « masquer » ce bruit. Toutefois, pour obtenir des débits les plus faibles possibles, le bruit peut demeurer audible, parfois, ce qui, dans certaines circonstances, dégrade l'intelligibilité du signal.
Afin de réduire ce bruit, deux familles de techniques sont habituellement utilisées.
II est possible, tout d'abord, d'utiliser un post-filtre perceptuel, du type utilisé par exemple dans les décodeurs de parole de type CELP (pour « Code Excited Linear Prédiction »). Il s'agit d'effectuer un filtrage qui améliore la qualité subjective au prix d'une distorsion. En effet, on applique une atténuation du signal dans les zones où le bruit de quantification est le plus audible (notamment entre les formants). Les postfiltres perceptuels actuels procurent de bons résultats pour des signaux de parole, mais de moins bons résultats pour d'autres types de signaux (signaux de musique, par exemple).
En effet, un post-filtre d'amélioration de la parole codée est décrit notamment dans le document Chen et al :
"Adaptive Postfiltering for Quality Enhancement of Coded Speech", Chen J.H., Gersho A., IEEE Trans. On Speech and Audio Pr oc, (janvier 1995). Le modèle décrit repose sur un découpage en deux sections : - une section à « long terme » renforce les harmoniques (harmoniques de la fréquence fondamentale) et creuse les vallées spectrales entre ces harmoniques, et une section à « court terme » renforce les formants et creuse également les vallées spectrales entre ces formants. Les harmoniques et les formants sont des caractéristiques spectrales bien connues de la parole mais appliquer ce type de traitement sur un autre signal que de la parole génère de fortes distorsions. Par exemple, la richesse spectrale d'un signal de musique ne peut pas être traitée avec un tel modèle simple de signal.
Ainsi, les post- filtres perceptuels peuvent générer des distorsions, du fait qu'ils reposent sur un modèle qui n'est pas assez précis. Par ailleurs, le post-filtre perceptuel est généralement inefficace dans les périodes de silence. Ces problèmes ont pu être observés expérimentalement par la Demanderesse qui a cherché dans un premier temps à intégrer ce type de post-filtres perceptuels dans des décodeurs qui ne sont pas de type CELP, par exemple dans des décodeurs au sens de la norme G.711 ou de la norme G.722.
Une autre famille de traitement vise les traitements classiques de réduction de bruit pour distinguer le signal utile des bruits parasites. Ce type de traitement permet donc de réduire le bruit lié à l'environnement de la capture du signal et il est souvent utilisé pour des signaux de parole. Toutefois, ici, il est impossible de rendre transparent le traitement vis-à-vis du bruit lié à l'environnement de la prise de son, ce qui pose problème pour du codage de signal de musique, notamment. Ainsi, en codage/décodage on peut vouloir transmettre le bruit d'ambiance et il est alors souhaitable que la réduction de bruit ne s'applique pas à ce type de bruit.
La présente invention vient améliorer la situation.
Elle propose à cet effet un procédé de traitement d'un signal qui a été codé en compression selon un type de codage prédéterminé, appliquant une opération de quantification, puis décodé.
Le procédé au sens de l'invention comporte une estimation d'un bruit de quantification introduit par le codage en compression à partir d'informations obtenues a priori sur le type de codage en compression, lesdites informations étant indépendantes des caractéristiques du signal et une détermination, à partir du bruit de quantification estimé, d'une fonction de filtrage à appliquer au signal décodé pour appliquer un traitement de réduction du bruit de quantification estimé.
On entend ici par le terme « traitement de réduction de bruit » une opération du type décrit ci-avant qui consiste à extraire le signal utile d'un signal à traiter, en filtrant les signaux parasites, par exemple en définissant une fonction de gain intervenant dans un filtre appliqué au signal décodé. Ici, le bruit de quantification est ainsi filtré.
Il s'agit donc d'un débruitage classique mais appliqué ici pour réduire le bruit de quantification. Ce débruitage ne s'apparente en aucune manière à un post-filtre perceptuel du type décrit dans Chen et al, lequel s'appuie complètement sur les caractéristiques et la dynamique du signal, tandis que le traitement de réduction de bruit au sens de l'invention s'appuie plutôt sur la détermination du bruit de quantification.
Dans une réalisation préférentielle : on choisit un modèle de réduction du bruit de quantification, à partir de des informations sur le type de codage en compression, et on applique au signal décodé un traitement de réduction du bruit de quantification selon le modèle choisi.
Plus particulièrement, une fois le modèle choisi, de préférence :
- on estime, sur la base de ce modèle, le bruit de quantification qu'a pu introduire le codage en compression, et - on détermine, à partir du bruit de quantification estimé, une fonction de filtrage (et notamment les paramètres de cette fonction de filtrage) à appliquer au signal décodé pour appliquer le traitement de réduction de bruit de quantification.
Ainsi, on prévoit un type de traitement de réduction de bruit propre à chaque type de codage en compression réalisé. La manière même d'estimer les caractéristiques du filtre de réduction de bruit (type de fonction de gain, paramètres de la fonction de gain, etc.) dépend du type de codage réalisé.
On verra en particulier dans les exemples de réalisation donnés ci-après que le bruit de quantification lui-même dépend fortement du type de codage réalisé. On verra qu'il est possible d'établir une variation du bruit de quantification en fonction d'une variation du signal décodé, et que cette variation du bruit de quantification est propre au type de codage mis en œuvre.
Ainsi, dans une mise en œuvre avantageuse : - on estime, à partir des informations sur le type de codage, une variation du bruit de quantification en fonction d'au moins un paramètre du signal décodé, et en fonction d'une valeur courante de ce paramètre dans le signal décodé, on estime le bruit de quantification pour déterminer la fonction de filtrage à appliquer au signal décodé ayant cette valeur courante de paramètre.
On comprendra donc que les informations sur le type de codage en compression sont des informations a priori, indépendantes des caractéristiques du signal et qu'avantageusement, il peut en être déduit : un modèle de variation d'un rapport signal à bruit de quantification, en fonction d'au moins un paramètre du signal décodé, et/ou une coloration spectrale du bruit de quantification (c'est-à-dire une variation spectrale du bruit de quantification en fonction des caractéristiques du signal décodé).
Dans un mode possible de réalisation, les informations a priori sur le type de codage en compression sont obtenues lors d'une procédure de déclaration du codeur.
L'invention est particulièrement adaptée au cas où le type de codage en compression est un codage selon la norme G.711.
La présente invention vise aussi un dispositif de traitement d'un signal initialement codé en compression selon un type de codage prédéterminé, puis décodé. Le dispositif comporte : des moyens d'estimation d'un bruit de quantification introduit par le codage en compression, à partir d'informations obtenues a priori sur le type de codage en compression, lesdites informations étant indépendantes des caractéristiques du signal, et des moyens de détermination, à partir du bruit de quantification estimé, d'une fonction de filtrage à appliquer au signal décodé pour appliquer un traitement de réduction du bruit de quantification estimé.
Plus généralement, le dispositif comporte avantageusement des moyens pour la mise en œuvre du procédé décrit ci-avant.
Il est avantageux qu'un tel dispositif soit intégré dans un décodeur, en aval d'une unité de décodage, comme illustré sur la figure 1 représentant un dispositif TBQ du type précité en aval de l'unité de décodage DEC. Cette figure 1 sera décrite en détail plus loin.
La présente invention vise aussi un programme informatique, destiné à être stocké en mémoire d'un dispositif de traitement du type précité, et comportant des instructions pour calculer le bruit de quantification, ainsi que des paramètres d'un filtre de réduction du bruit de quantification, lorsque ces instructions sont exécutées par un processeur du dispositif de traitement.
Une réalisation avantageuse peut consister à prévoir un jeu d'instructions pour chaque type de codage mis en œuvre et, dans chaque jeu d'instructions, définir une variation du bruit de quantification en fonction du signal décodé. Ainsi, sur réception des informations a priori, un jeu d'instructions adéquates est sélectionné. Avec ce jeu d'instructions : le bruit de quantification présent dans le signal décodé est calculé, - et les paramètres du post-filtre sont calculés en correspondance de ce bruit de quantification, pour limiter, voire supprimer, ce bruit.
Les instructions sur la variation du bruit de quantification peuvent être programmées hors ligne, sur la base d'observations (théoriques ou expérimentales d'après les exemples de réalisation qui seront décrits plus loin) faites sur le type de codage utilisé.
La manière dont sont exécutées ces instructions, elle-même, sera décrite en détail plus loin, en référence aux figures 2 et 5 qui peuvent alors constituer des organigrammes d'un programme informatique au sens de l'invention.
Ainsi, l'invention propose un post- traitement effectué après décodage et qui utilise des informations a priori sur les caractéristiques de l'opération de quantification qu'effectue le codeur. Le type de traitement (ou « modèle de traitement » selon les termes génériques ci-avant) qui sera choisi pour traiter le signal est indépendant des caractéristiques du signal lui-même. Bien entendu, le traitement en soi (notamment l'estimation de la fonction de gain) peut dépendre du signal, par exemple de son énergie ou de sa puissance. En revanche, qu'il s'agisse de traiter un signal de musique, un signal de parole ou tout autre signal (de nature harmonique, impulsive, etc.), le type de traitement est le même et ne se base, par exemple, que sur l'énergie d'une trame décodée reçue. En effet, il est possible de connaître de façon théorique les caractéristiques du bruit de quantification, notamment en fonction de différentes familles de codeurs. Au sens de l'invention, on utilise alors ces informations pour estimer des grandeurs qui sont exploitées pour définir au moins une fonction de gain d'une unité de réduction de bruit qui intervient en aval d'une unité de décodage.
Ainsi, l'invention permet de réduire le bruit de quantification (et donc la distorsion) qu'introduit habituellement un codeur en compression du signal mettant en œuvre une opération de quantification.
Selon l'un des avantages que propose la présente invention, il est possible de garder une même structure de codage/décodage sans y apporter aucune modification et d'assurer pourtant une meilleure qualité du signal décodé, et ce, sans augmenter la quantité d'informations à transmettre par le codeur.
Selon un autre avantage, l'invention permet de réduire avantageusement le bruit de quantification seul, même en période de silence, et ce, pour tout type de signal. Selon encore un autre avantage, la mise en œuvre de l'invention n'effectue pas une réduction de bruit classique et donc ne modifie pas le bruit lié à l'environnement de la capture du signal.
On retiendra en particulier que la mise en œuvre de l'invention permet de réduire, voire supprimer, le bruit de quantification, sans distordre le signal et ce, pour tout type de signal, simplement en utilisant des informations a priori sur le type de codeur utilisé (par exemple les caractéristiques du modèle de compression du codeur, les caractéristiques du quantificateur, ou autre).
La présente invention trouve une application avantageuse au domaine du traitement de la parole et de la musique, et plus généralement au traitement du signal, notamment d'images, dès lors qu'un codeur quelconque est amené à introduire un bruit de quantification.
Plus généralement, l'invention s'applique à tous les domaines où l'on cherche à réduire un bruit de quantification d'un signal.
D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels : la figure 1 illustre schématiquement la structure générale d'une unité de traitement au sens de l'invention, la figure 2 illustre schématiquement les étapes d'un procédé au sens de l'invention, la figure 3 illustre une variation de la loi de compression (dite « loi A ») des amplitudes, dans un codage selon la norme G.711 pour illustrer un exemple de réalisation de l'invention, la figure 4 illustre la variation du rapport signal à bruit de quantification RSB en fonction du facteur de charge, cette variation étant tirée de la variation illustrée sur la figure 3, - la figure 5 illustre les étapes d'un exemple de traitement dans le cas d'un codage selon la norme G.711, basé notamment sur les observations des variations des figures 3 et 4, la figure 6 illustre un exemple du spectre du signal (courbe en pointillés) et du spectre du bruit de quantification (courbe continue) pour un codage selon la norme
G.722,
- la figure 7 illustre un exemple de forme d'onde d'un signal de parole S* (courbe de dessus) et le rapport signal à bruit de quantification correspondant RSB (courbe de dessous), pour un codage/décodage selon la norme G.722, - la figure 8 est un nuage de points illustrant pour chaque segment de 80 échantillons la corrélation entre le rapport signal à bruit RSB et l'énergie du signal, dans une application à un codage/décodage selon la norme G.722, la figure 9 montre les segments de signal (en noir) où l'erreur de l'estimation du rapport signal à bruit de quantification RSB est supérieure à 6 dB tandis que le rapport RSB est inférieur à 25 dB, dans l'application à un codage/décodage selon la norme G.722,
- la figure 10 reprend le nuage de point représentant, pour chaque segment, l'énergie du bruit en fonction de l'énergie du signal, en illustrant ici l'estimation du niveau de bruit (ligne en traits mixtes), la zone ou l'erreur de l'estimation est inférieure à 6 dB (lignes en traits pointillés), et la délimitation pour laquelle le rapport RSB est supérieur 25 dB (ligne en trait plein).
On se réfère tout d'abord à la figure 1 sur laquelle un signal S est : codé en compression par un codeur COD de type connu et appliquant notamment une opération de quantification Q au signal S, transmis via un canal de transmission CA, puis
- décodé par un décodeur DEC homologue du codeur COD.
Le signal ainsi décodé, noté S , présente alors un bruit de quantification qui se définit mathématiquement comme un écart (S - S) par rapport au signal d'origine S. En référence à nouveau à la figure 1, on prévoit, au sens de l'invention, en aval du décodeur DEC, une unité de traitement de réduction du bruit de quantification TBQ pour supprimer ou au moins limiter le bruit de quantification dans le signal S .
A cet effet, l'unité TBQ comporte au moins une entrée E pour recevoir du décodeur DEC des informations INF sur le type de codage/décodage mis en œuvre, ce qui permet de choisir alors un modèle de traitement de réduction de bruit à mettre en œuvre. En particulier, on estime, à partir du signal reçu et décodé S*, et en fonction du type de codage/décodage qui a été mis en œuvre, l'influence du bruit de quantification dans le signal reçu S . A cet effet, on prévoit un module de calcul pour donner une estimation du bruit de quantification BQ, sur la base du modèle choisi et en fonction du signal reçu S . Ce module de calcul peut typiquement se présenter sous la forme d'une combinaison d'un processeur et d'une mémoire de travail (non représentés). A partir du bruit de quantification estimé BQ, on traite simplement le bruit estimé BQ en appliquant un filtrage classique FIL au signal S pour délivrer finalement un signal traité S T. Il convient d'insister encore sur le fait que les paramètres PAR du filtre FIL appliqué au signal S* (par exemple une fonction de gain pour le filtrage du signal) sont déterminés pour réduire en particulier le bruit de quantification estimé BQ.
En effet, en référence à la figure 2, à partir des informations INF reçues sur le type de codage/décodage employé (étape S2), on détermine un modèle (étape S3) de traitement de réduction de bruit. On verra dans les exemples de réalisation décrits plus loin que le modèle de réduction de bruit de quantification choisi peut être différent, par exemple selon le fait que le signal a été codé/décodé selon la norme G.711 ou codé/décodé selon la norme G.722.
Ainsi, lorsque le signal est reçu par blocs successifs (ou trames notées TRi à l'étape Sl), on estime (étape S4) un niveau du bruit de quantification propre au modèle choisi. Comme on le verra dans les exemples plus loin, il est avantageux d'estimer le niveau de bruit de quantification à partir du calcul du rapport signal à bruit de quantification (noté RSB). Cette information RSB dépend du signal décodé S*, mais aussi du type de codage mis en œuvre. Ainsi, la connaissance a priori du codage, par l'obtention des informations INF permet, conjointement avec certaines caractéristiques statistiques du signal S , d'estimer ici le rapport signal sur bruit de quantification RSB.
Cette étape S4 nécessite donc de connaître a priori le type de codeur ayant été utilisé, information qui peut être obtenue par exemple lors d'une procédure de déclaration du codeur dite « transaction du codeur », que l'on suppose acquise.
Le type de codeur, les caractéristiques de son modèle de compression et de son quantificateur Q permettent d'estimer une évolution du rapport signal à bruit de quantification, en fonction de certains paramètres statistiques du signal, comme par exemple sa variance, sa densité spectrale de puissance, ou autres. Cette relation entre le rapport signal à bruit de quantification et les paramètres statistiques du signal met en jeu des lois propres au codeur qui seront décrites plus loin, pour quelques exemples de réalisations.
Les paramètres statistiques nécessaires peuvent être calculés par des estimateurs de grandeurs classiques (par exemple la variance). En fonction de ces estimations, une estimation du rapport signal à bruit de quantification peut être extrapolée. Les estimations peuvent être réalisées indifféremment dans les domaines temporel, fréquentiel, ou tout autre domaine temps-fréquence (transformée en ondelettes par exemple).
A nouveau en référence à la figure 2, l'étape suivante S5 consiste à calculer les paramètres du filtre pour la réduction du bruit de quantification dans le signal reçu S . La connaissance du rapport signal à bruit permet d'en déduire l'expression d'un filtre de réduction du bruit de quantification, ce filtre étant appelé ci-après « post-filtre » (en aval du décodeur). Il est en effet possible de déduire l'expression d'un filtre numérique dont le but est de réduire un bruit dont la plupart des caractéristiques sont connues a priori (sa densité spectrale de puissance par exemple) et dont le niveau est déterminé à partir de l'estimation du rapport signal sur bruit de quantification obtenue à l'étape précédente S4. Par exemple, le calcul du filtre peut être réalisé dans le domaine fréquentiel et mettre en œuvre toute technique d'atténuation spectrale à court-terme (une soustraction spectrale, un filtre de Wiener, ou autre). Le calcul du post-filtre à l'étape S5 peut être effectué dans les domaines temporel, fréquentiel, ou tout autre domaine temps-fréquence.
Enfin, l'étape de traitement de réduction de bruit S6, proprement dite, revient ici à filtrer le signal décodé S* par le post-filtre calculé à l'étape S5. Cette étape S6 peut être réalisée dans le domaine temporel ou fréquentiel, selon les contraintes liées à la mise en œuvre et le domaine d'estimation des paramètres PAR et du rapport RSB dans les étapes précédentes. On obtient finalement une trame TRi' traitée par débruitage du bruit de quantification à l'étape S7.
On décrit ci-après un exemple de mise en œuvre de l'invention pour un codage/décodage selon la norme G.711 (selon la loi européenne dite « loi A »).
La représentation numérique traditionnelle des signaux monodimensionnels fait appel à une quantification uniforme des échantillons. Ainsi, en l'absence de dépassement de capacité du quantificateur, le rapport signal à bruit (RSB) de quantification dépend de la variance σx 2 du signal, des niveaux de saturation Jc1113x déterminés par la dynamique et bien entendu du nombre de bits b utilisés pour la représentation des échantillons, selon une expression du type :
2
RSB = ?>-^2lb , soit, en dB : max
RSB = 1og2)b + 101og3 -201ogr [dB] (1)
Figure imgf000014_0001
La grandeur F = -^^ représente un paramètre dit "facteur de charge", qui détermine σx la qualité d'utilisation de la dynamique du quantificateur disponible par le signal, où : jcmax est le niveau numérique d'amplitude maximum possible d'un échantillon selon le quantificateur choisi, et σx est l'écart- type du signal (la racine carrée de la variance) qui, pour un bloc complet d'échantillons (ou « trame »), peut être estimé par la racine carrée de la puissance moyenne Pm du signal sur ce bloc.
L'expression (1) est fortement dépendante de la valeur de ce paramètre F. On constate en particulier que le rapport signal à bruit maximal est obtenu pour un signal en pleine échelle et qu'il décroit rapidement si l'amplitude du signal diminue.
Les limites à bas débits de la loi de quantification uniforme ont amené à développer une loi de quantification dont le rapport signal à bruit de quantification était à peu près indépendant de la variance du signal pour une large dynamique de signaux. C'est bien ce que réalise la loi de quantification logarithmique du codage selon la norme G.711 (dite « loi A » en Europe, ou « loi μ » en Amérique du nord).
La loi A en usage en Europe est définie par une expression dépendante de la valeur x de l'échantillon quantifié, comme suit :
Figure imgf000015_0001
En référence à la figure 3, la première variation de la loi de compression
( 0 ≤ x\/ X103x < A"1 ) est linéaire, engendre une loi de quantification uniforme et est appelée ci-après « variation uniforme », tandis que la seconde variation de la loi de compression (A"1
Figure imgf000015_0002
≤ 1 ) est logarithmique, et appelée ci-après « variation logarithmique ».
La loi européenne utilise une valeur de A = 87,56 (qui satisfait numériquement l'équation A/(l + In À) = 16).
A partir de ces observations, il est possible de calculer le rapport signal à bruit de quantification pour une compression selon la loi A, comme suit. Pour les signaux de faible intensité (partie uniforme de la loi de compression), la loi A assure un rapport signal à bruit de quantification supérieur (en dB) de 101og(Λ/(l + lnΛ)) à celui obtenu par une quantification uniforme sur le même nombre de niveaux, dont l'expression est donnée par :
RSB umf = (20 log 2> + 10 log 3 + 10 log[A/(l + In A)] - 20 log(r) [dB] RSBumf « 6.02b + 4.77 + 101og[A/(l + InA)] -201og(r) [dB] (3)
RSB umf ≈ 64.97 - 20 log(r) [dB] pour b = 8
Pour les signaux de plus grande amplitude (partie logarithmique de la loi de compression), le rapport signal à bruit de quantification est constant et égale 38.16 dB (pour b = 8 bits) :
RSBlog = (20 log 2> + 10 log 3 - 20 log(l + In À) [dB]
RSBlog ≈ 6.02b - 10 [dB] (4)
RSBlog « 38.16 dB pour b = 8
La figure 4 représente l'évolution du rapport signal à bruit de quantification RSB pour une loi A avec b = 8 bits. On identifie immédiatement : une première partie croissante, correspondant à la variation uniforme de la loi de compression, et - une partie suivante, constante, correspondant à la variation logarithmique de cette loi.
Pour traiter la réduction du bruit de quantification introduit par un codage selon la norme G.711, on exploite ici deux informations : - le rapport signal à bruit de quantification qui est donné par les équations (3) et (4) précédentes, et l'information bien connue selon laquelle ce bruit est "blanc" pour ce type de codage.
La mise en œuvre du traitement de réduction de bruit de quantification repose sur l'exploitation de ces informations a priori. Elle nécessite notamment de réaliser une estimation du facteur de charge F, paramètre dont dépend la puissance du bruit de quantification, comme suit.
En référence à la figure 5, on estime la puissance moyenne Pm d'un bloc courant TRi (étape S52), et, de là, le facteur de charge F, variant comme l'inverse de la racine carrée de la puissance moyenne (étape S53). On considère en effet que le numérateur -Xmax du facteur de charge est ici constant (à niveau de saturation constant). Au test T54, la valeur trouvée du facteur de charge F est comparée à celle d'un seuil F8 définissant le point d'inflexion de la loi de compression (figure 4), comme suit : - si le facteur de charge F est tel que -20.1og(F) > -20.1og(Fs) = 38.16-64.97~=-27dB (flèche o en sortie du test T54), alors le rapport signal à bruit de quantification est constant et vaut RSBM ~= +38dB (plateau de la figure 4), comme fixé à l'étape
S55, sinon (flèche n en sortie du test T54), alors le rapport signal à bruit de quantification RSB peut être calculé selon une variation linéaire en fonction du facteur de charge tirée de l'équation (3) :
RSB =/(F) = 65 -201og(F) [dB] , comme fixé à l'étape S56.
On évalue ensuite la fonction de gain (étape S57) pour l'application du post-filtre (étape S58). A titre d'exemple purement illustratif, un filtre de Wiener peut être prévu en tant que fonction de gain g(RSB). L'expression du filtre de Wiener /w peut être donnée par la valeur du rapport signal à bruit de quantification RSB calculé précédemment, en tenant compte, bien entendu, de sa dépendance en fréquence avec : g(RSB) =/w = RSB / (RSB + 1), où, ici, la valeur RSB ne s'exprime pas en dB mais en valeur naturelle. On peut prévoir avantageusement d'alléger le traitement de réduction de bruit en particulier pour les signaux de faible rapport signal à bruit de quantification, donc à faible niveau d'amplitude (pour des facteurs de charge tels que -20.1og(F) < -5OdB sur la figure 4), en prévoyant éventuellement : - un seuillage du post-filtre, et/ou un détecteur d'activité vocale pour des signaux de parole (avec un traitement de réduction de bruit de quantification plus léger pendant les périodes d'inactivité vocale).
On indique qu'une variante du traitement présenté ici est de réduire le bruit de quantification, échantillon par échantillon, plutôt qu'un traitement par blocs successifs. Dans ce cas, le facteur de charge est directement donné par le niveau d'amplitude de l'échantillon (inverse de la racine carrée de l'amplitude) et la suite du traitement est similaire à celle présentée ci-avant.
On décrit maintenant une autre application possible de l'invention à un type de codage différent, ici le codage selon la norme G.722.
Le codage ITU-T G.722, normalisé en 1988 pour les applications d'audioconférence sur canal numérique de 64 kbit/s, est encore très largement utilisé. Il s'agit d'un codage/décodage hiérarchique à trois débits : 64, 56 et 48 kbit/s. Le signal est divisé en deux sous-bandes par un filtre dit QMF (pour « Quadrature Mirror Filter »). Les deux bandes obtenues sont codées avec un codeur MICDA (pour "Modulation par
Impulsion et Codage Différentiel Adaptatif), dit aussi ADPCM en anglais (pour « Adaptive Differential Puise Code Modulation »).
La bande haute est codée sur 2 bits par échantillon. La différence entre les trois débits vient de la bande basse qui est codée sur 6 bits par échantillon pour le plus haut débit, mais il est possible de réserver le dernier ou les deux derniers bits pour de la transmission de données.
La qualité du plus haut débit est très bonne, par contre le bruit de codage devient très audible et gênant pour le débit le plus bas à 48 kbit/s. Le traitement de réduction du bruit de quantification au sens de l'invention peut être avantageusement appliqué dans ce cas.
Déjà, les caractéristiques du bruit de quantification peuvent être efficacement estimées à partir du signal décodé. Comme l'illustre la figure 6, le spectre du bruit de quantification (courbe en trait plein) est toujours plat, indépendamment du spectre du signal (courbe en traits pointillés). Le rapport signal à bruit de quantification dépend de la puissance moyenne du signal et de sa nature. Sur la figure 7, on peut observer que le rapport signal à bruit de quantification (RSB) est bien corrélé avec la puissance moyenne du signal S . Dans l'exemple représenté, le rapport RSB a été estimé sur des segments de 80 échantillons (5 ms pour une fréquence d'échantillonnage de 16 kHz).
La représentation sous forme de nuages de points de la figure 8 illustre encore mieux la corrélation entre la puissance moyenne du signal (axe des abscisses) et le rapport signal à bruit de quantification (axe des ordonnées), calculé par segments de 80 échantillons.
On peut déduire de cette observation une première règle simple d'estimation du rapport RSB en fonction de la puissance moyenne Pmoy du segment (droite de corrélation représentée en pointillés sur la figure 8), donnée par :
RSB = Pmoy - CST [dB] (5) où CST est une constante qui vaut, dans l'exemple de la figure 8, environ 10 dB.
On comprendra de cette expression que la puissance moyenne du bruit, déterminée expérimentalement ici, est constante CST = 10 dB, et ce, indépendamment de la puissance moyenne du signal, de sorte que le rapport RSB augmente bien avec la puissance moyenne du signal.
La meilleure estimation du rapport signal à bruit de quantification RSB est obtenue pour les faibles niveaux du signal, c'est-à-dire lorsque le rapport RSB est faible (et donc lorsque le bruit est le plus audible). Cependant, certains segments ont des points situés très en dessous de la ligne en pointillés et l'utilisation de cette règle simple est alors sous-optimale. Il a été observé néanmoins que ces zones correspondent à de forts rapports RSB, où le bruit de quantification est déjà probablement masqué par le signal utile.
De manière générale, il a été observé que le traitement au sens de l'invention appliqué ici réalise néanmoins une réduction avantageuse du bruit de quantification.
Dans le cas où la règle simple de l'équation (5) est utilisée, la figure 9 représente en noir sur fond gris les zones du signal où l'erreur d'estimation du rapport RSB est supérieure à 6 dB, et le rapport RSB lui-même est inférieur à 25 dB, c'est-à-dire les zones du signal dans lesquelles l'estimateur sous-estime le bruit de quantification, ce qui entraine une plus faible efficacité du traitement de réduction du bruit de quantification. On peut néanmoins constater que ces zones correspondent à des segments de signal non-voisé, pour lesquelles le bruit de quantification est moins gênant du fait de la nature intrinsèquement bruitée du signal.
On a représenté sur la figure 10 un diagramme de puissance du bruit par rapport à une puissance du signal, conforme à l'équation empirique (5). La ligne en traits mixtes représente l'estimation de la puissance du bruit. Les lignes en traits pointillés délimitent la zone où l'erreur de l'estimation est inférieure à 6 dB. En dessous de la ligne en trait plein, le rapport RSB est supérieur à 25 dB. Les points noirs (par rapport aux autres points gris) correspondent aux segments noirs de la figure 9.
On montre ainsi qu'une estimation très simple du rapport RSB reposant uniquement sur l'énergie du signal décodé peut donner de bons résultats pour un codage/décodage de type MICDA. L'estimation du rapport RSB peut être encore affinée en tenant compte par exemple du gain de prédiction des filtres ARMA (autorégressifs) qui interviennent dans le décodeur G.722. Connaissant la forme spectrale du bruit de quantification et son énergie, on peut efficacement appliquer le traitement de réduction de bruit de quantification de l'invention pour ce type de codage/décodage. Cet exemple est bien évidemment valable pour les autres types de codage/décodage de la même famille comme ceux normalisés G.726 ou G.727.
Bien entendu, la présente invention ne se limite pas à la forme de réalisation décrite ci- avant à titre d'exemple ; elle s'étend à d'autres variantes.
Ainsi, il a été montré ci-avant qu'une application avantageuse de l'invention peut par exemple viser à réduire le bruit de quantification d'un codeur normalisé ITU-G.711 en utilisant les propriétés de la loi de quantification mise en œuvre, en particulier selon la loi A en Europe. En effet, dans cette application, le bruit de quantification est blanc et il est possible d'estimer le rapport signal à bruit de quantification et, de là, une fonction de gain qui permette de réduire ce bruit. Une application avantageuse de l'invention vise alors la réduction de bruit de quantification dans le traitement à l'extension en bande élargie du codeur G.711 (ITU-T SG16, G.71 IWB).
Toutefois, le traitement du cas de la loi A a été donné ci-avant à titre d'exemple. De façon analogue, il aurait pu être décrit l'exemple de la loi μ (partie de la norme G.711 appliquée aux Etats-Unis).
Plus généralement, l'invention s'applique à tout type de codage/décodage dès lors que ses caractéristiques intrinsèques sont connues.

Claims

Revendications
1. Procédé de traitement d'un signal, ledit signal ayant été : - codé en compression (COD) selon un type de codage prédéterminé, appliquant une opération de quantification,
- puis décodé (DEC), caractérisé en ce qu'il comporte : une estimation (S4) d'un bruit de quantification introduit par le codage en compression à partir d'informations (INF) obtenues a priori sur le type de codage en compression, lesdites informations étant indépendantes des caractéristiques du signal, et une détermination (S5), à partir du bruit de quantification estimé, d'une fonction de filtrage à appliquer au signal décodé pour appliquer (S6) un traitement de réduction du bruit de quantification estimé (TBQ).
2. Procédé selon la revendication 1, caractérisé en ce que :
- on choisit (S3) un modèle de réduction du bruit de quantification, à partir desdites informations (INF), et - on applique (S6) au signal décodé (S ) un traitement de réduction du bruit de quantification selon le modèle choisi.
3. Procédé selon la revendication 2, caractérisé en ce qu'on estime (S4), sur la base du modèle choisi (S3), ledit bruit de quantification introduit par le codage en compression.
4. Procédé selon la revendication 1, caractérisé en ce que : on estime, à partir desdites informations (INF), une variation (Fig.4) du bruit de quantification (RSB) en fonction d'au moins un paramètre (F) du signal décodé, et en fonction d'une valeur courante dudit paramètre (F) dans le signal décodé (S52, S53), on estime (S55 ; S56) le bruit de quantification pour déterminer la fonction de filtrage (S57) à appliquer (S58) au signal décodé ayant ladite valeur courante de paramètre (F).
5. Procédé selon la revendication 1, caractérisé en ce qu'il est déduit desdites informations a priori un modèle de variation (Fig.4) d'un rapport signal à bruit de quantification (RSB), en fonction d'au moins un paramètre (F) du signal décodé.
6. Procédé selon la revendication 5 , caractérisé en ce qu'une coloration spectrale du bruit de quantification est déduite desdites informations a priori, et on tient compte en outre de ladite coloration spectrale pour déterminer la fonction de filtrage à appliquer au signal décodé.
7. Procédé selon l'une des revendications 1 à 6, caractérisé en ce que lesdites informations a priori sont obtenues lors d'une procédure de déclaration du codeur.
8. Procédé selon l'une des revendications 1 à 7, caractérisé en ce que le type de codage en compression est un codage selon la norme G.711.
9. Dispositif (TBQ) de traitement d'un signal initialement codé en compression selon un type de codage prédéterminé, puis décodé, caractérisé en ce qu'il comporte : des moyens d'estimation d'un bruit de quantification (BQ) introduit par le codage en compression, à partir d'informations (INF) obtenues a priori sur le type de codage en compression, lesdites informations étant indépendantes des caractéristiques du signal, et des moyens de détermination, à partir du bruit de quantification estimé, d'une fonction de filtrage à appliquer au signal décodé pour appliquer (S6) un traitement de réduction du bruit de quantification estimé (FIL).
10. Dispositif selon la revendication 9, caractérisé en ce qu'il est intégré dans un décodeur, en aval d'une unité de décodage (DEC).
11. Programme informatique, destiné à être stocké en mémoire d'un dispositif (TBQ) de traitement d'un signal initialement codé en compression selon un type de codage prédéterminé, puis décodé, caractérisé en ce qu'il comporte des instructions pour : estimer un bruit de quantification (BQ) introduit par le codage en compression, à partir d'informations (INF) obtenues a priori sur le type de codage en compression, lesdites informations étant indépendantes des caractéristiques du signal, et - calculer des paramètres (PAR) d'un filtre (FIL) de réduction du bruit de quantification estimé, lorsque ces instructions sont exécutées par un processeur du dispositif de traitement.
PCT/FR2008/051057 2007-06-14 2008-06-13 Post-traitement de reduction du bruit de quantification d'un codeur, au decodage WO2009004225A1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
AT08805992T ATE531038T1 (de) 2007-06-14 2008-06-13 Nachbearbeitung zur reduzierung des quantifizierungsrauschens eines codierers während der decodierung
JP2010511708A JP2010529511A (ja) 2007-06-14 2008-06-13 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置
US12/663,546 US8175145B2 (en) 2007-06-14 2008-06-13 Post-processing for reducing quantization noise of an encoder during decoding
ES08805992T ES2376178T3 (es) 2007-06-14 2008-06-13 Post-tratamiento de reducción del ruido de cuantificación de un codificador en la decodificación.
EP08805992A EP2153438B1 (fr) 2007-06-14 2008-06-13 Post-traitement de reduction du bruit de quantification d'un codeur, au decodage

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0704242 2007-06-14
FR0704242 2007-06-14

Publications (1)

Publication Number Publication Date
WO2009004225A1 true WO2009004225A1 (fr) 2009-01-08

Family

ID=38990872

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2008/051057 WO2009004225A1 (fr) 2007-06-14 2008-06-13 Post-traitement de reduction du bruit de quantification d'un codeur, au decodage

Country Status (6)

Country Link
US (1) US8175145B2 (fr)
EP (1) EP2153438B1 (fr)
JP (2) JP2010529511A (fr)
AT (1) ATE531038T1 (fr)
ES (1) ES2376178T3 (fr)
WO (1) WO2009004225A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014199055A1 (fr) * 2013-06-14 2014-12-18 Orange Controle du traitement d'attenuation d'un bruit de quantification introduit par un codage en compresssion

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2715432C (fr) * 2008-03-05 2016-08-16 Voiceage Corporation Systeme et procede d'amelioration d'un signal de son tonal decode
JP5141633B2 (ja) * 2009-04-24 2013-02-13 ソニー株式会社 画像処理方法及びそれを用いた画像情報符号化装置
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
JP5898515B2 (ja) * 2012-02-15 2016-04-06 ルネサスエレクトロニクス株式会社 半導体装置及び音声通信装置
CA2898095C (fr) * 2013-03-04 2019-12-03 Voiceage Corporation Dispositif et procede de reduction du bruit de quantification dans un decodeur dans le domaine temporel
JP5816992B2 (ja) * 2013-10-31 2015-11-18 株式会社アクセル フィルタの設計方法及びそのフィルタを備えた音響再生装置
EP2887350B1 (fr) * 2013-12-19 2016-10-05 Dolby Laboratories Licensing Corporation Filtrage adaptatif du bruit de quantification de données audio décodé
US9881630B2 (en) * 2015-12-30 2018-01-30 Google Llc Acoustic keystroke transient canceler for speech communication terminals using a semi-blind adaptive filter model
JP2016105188A (ja) * 2016-01-12 2016-06-09 株式会社アクセル 音声信号圧縮装置及び音声信号圧縮方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030182104A1 (en) * 2002-03-22 2003-09-25 Sound Id Audio decoder with dynamic adjustment
WO2005041170A1 (fr) * 2003-10-24 2005-05-06 Nokia Corpration Postfiltrage dependant du bruit

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0752844B2 (ja) * 1985-11-27 1995-06-05 日本電気株式会社 雑音除去回路
JPH03116197A (ja) * 1989-09-29 1991-05-17 Matsushita Electric Ind Co Ltd 音声復号化装置
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
JP4358221B2 (ja) * 1997-12-08 2009-11-04 三菱電機株式会社 音信号加工方法及び音信号加工装置
US6128346A (en) * 1998-04-14 2000-10-03 Motorola, Inc. Method and apparatus for quantizing a signal in a digital system
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP2000269821A (ja) * 1999-03-18 2000-09-29 Oki Micro Design Co Ltd 予測符号化信号復号化装置及び雑音除去方法
WO2003063160A1 (fr) * 2002-01-25 2003-07-31 Koninklijke Philips Electronics N.V. Procede et unite pour soustraire un bruit de quantification d'un signal mic
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
CN1947407A (zh) * 2004-04-09 2007-04-11 日本电气株式会社 音频通信方法和装置
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030182104A1 (en) * 2002-03-22 2003-09-25 Sound Id Audio decoder with dynamic adjustment
WO2005041170A1 (fr) * 2003-10-24 2005-05-06 Nokia Corpration Postfiltrage dependant du bruit

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHEN J.H.; GERSHO A.: "Adaptive Postfiltering for Quality Enhancement of Coded Speech", IEEE TRANS. ON SPEECH AND AUDIO PROC., January 1995 (1995-01-01)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014199055A1 (fr) * 2013-06-14 2014-12-18 Orange Controle du traitement d'attenuation d'un bruit de quantification introduit par un codage en compresssion
FR3007184A1 (fr) * 2013-06-14 2014-12-19 France Telecom Controle du traitement d'attenuation d'un bruit de quantification introduit par un codage en compresssion

Also Published As

Publication number Publication date
ES2376178T3 (es) 2012-03-09
JP5881791B2 (ja) 2016-03-09
EP2153438B1 (fr) 2011-10-26
JP2015007805A (ja) 2015-01-15
US20100183067A1 (en) 2010-07-22
EP2153438A1 (fr) 2010-02-17
US8175145B2 (en) 2012-05-08
JP2010529511A (ja) 2010-08-26
ATE531038T1 (de) 2011-11-15

Similar Documents

Publication Publication Date Title
EP2153438B1 (fr) Post-traitement de reduction du bruit de quantification d&#39;un codeur, au decodage
EP2867893B1 (fr) Atténuation efficace de pré-échos dans un signal audionumérique
CA2436318C (fr) Procede et dispositif de reduction de bruit
EP1789956B1 (fr) Procede de traitement d&#39;un signal sonore bruite et dispositif pour la mise en oeuvre du procede
EP2104936B1 (fr) Codage par transformee, utilisant des fenetres de ponderation et a faible retard
EP0782128B1 (fr) Procédé d&#39;analyse par prédiction linéaire d&#39;un signal audiofréquence, et procédés de codage et de décodage d&#39;un signal audiofréquence en comportant application
EP2586133B1 (fr) Contrôle d&#39;une boucle de rétroaction de mise en forme de bruit dans un codeur de signal audionumérique
EP2002428B1 (fr) Procede de discrimination et d&#39;attenuation fiabilisees des echos d&#39;un signal numerique dans un decodeur et dispositif correspondant
EP2936488B1 (fr) Atténuation efficace de pré-échos dans un signal audionumérique
EP2347411B1 (fr) Attenuation de pre-echos dans un signal audionumerique
EP3192073B1 (fr) Discrimination et atténuation de pré-échos dans un signal audionumérique
WO2001011605A1 (fr) Procede et dispositif de detection d&#39;activite vocale
EP2162883B1 (fr) Limitation de distorsion introduite par un post-traitement au decodage d&#39;un signal numerique
WO2014199055A1 (fr) Controle du traitement d&#39;attenuation d&#39;un bruit de quantification introduit par un codage en compresssion
EP1383112A2 (fr) Procédé et dispositif d&#39;encodage de la parole à bande élargie, permettant en particulier une amélioration de la qualité des trames de parole voisée
FR2885462A1 (fr) Procede d&#39;attenuation des pre-et post-echos d&#39;un signal numerique audio et dispositif correspondant

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08805992

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2008805992

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 12663546

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2010511708

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE