EP3192073A1 - Discrimination et atténuation de pré-échos dans un signal audionumérique - Google Patents

Discrimination et atténuation de pré-échos dans un signal audionumérique

Info

Publication number
EP3192073A1
EP3192073A1 EP15771686.1A EP15771686A EP3192073A1 EP 3192073 A1 EP3192073 A1 EP 3192073A1 EP 15771686 A EP15771686 A EP 15771686A EP 3192073 A1 EP3192073 A1 EP 3192073A1
Authority
EP
European Patent Office
Prior art keywords
sub
echo
block
attack
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP15771686.1A
Other languages
German (de)
English (en)
Other versions
EP3192073B1 (fr
Inventor
Balazs Kovesi
Stéphane RAGOT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Publication of EP3192073A1 publication Critical patent/EP3192073A1/fr
Application granted granted Critical
Publication of EP3192073B1 publication Critical patent/EP3192073B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Definitions

  • the invention relates to a method and a device for discriminating and processing pre-echo attenuation when decoding a digital audio signal.
  • compression processes for the transmission of digital audio signals over telecommunications networks, whether for example fixed or mobile networks, or for the storage of signals, compression processes (or source coding) using coding systems which are generally of the linear coding type by linear prediction or by transform frequency coding.
  • the method and the device which are the subject of the invention, thus have as their field of application the compression of sound signals, in particular frequency-coded digital audio signals.
  • FIG. 1 represents by way of illustration, a schematic diagram of the coding and decoding of a digital audio signal by transform including an addition / overlap synthesis analysis according to the prior art.
  • Certain musical sequences such as percussion and certain segments of speech like the plosives (/ k /, lit, ...), are characterized by extremely sudden attacks which result in very fast transitions and a very strong variation of the dynamic signal within a few samples.
  • An example of transition is given in Figure 1 from sample 410.
  • the input signal is cut into blocks of samples of length L whose boundaries are represented in FIG. 1 by dotted vertical lines.
  • the input signal is denoted x (ri), where n is the index of the sample.
  • L 160 samples.
  • the division in blocks, also called frames, operated by the transform coding is totally independent of the sound signal and the transitions can therefore appear at any point in the analysis window.
  • the reconstructed signal is tainted by "noise" (or distortion) generated by the quantization (Q) - inverse quantization (Q 1 ) operation.
  • This coding noise is temporally distributed relatively uniform throughout the temporal support of the transformed block, that is to say over the entire length of the window length 2L samples (with overlap of L samples).
  • the energy of the coding noise is generally proportional to the energy of the block and is a function of the coding / decoding rate.
  • an attacking block such as block 320-480 of FIG. 1
  • the signal energy is high, so the noise is also high.
  • the level of the coding noise is typically lower than that of the signal for the high energy segments that immediately follow the transition, but the level is higher than that of the signal for the lower energy segments, especially on the part preceding the transition (samples 160 - 410 of Figure 1).
  • the signal-to-noise ratio is negative and the resulting degradation can appear very troublesome to listen.
  • Pre-echo is the coding noise prior to the transition and post-echo the noise after the transition.
  • the human ear also performs a post-masking of a longer duration, from 5 to 60 milliseconds, during the passage of high energy sequences to low energy sequences.
  • the rate or level of inconvenience acceptable for post-echoes is therefore greater than for pre-echoes.
  • MPEG AAC Advanced Audio Coding
  • MPEG AAC Advanced Audio Coding
  • Transform encoders used for conversational applications such as ITU-T G.722.1, G.722.1C or G.719, often use a 20 ms frame length and a 40 ms window at 16, 32 or 48 kHz (respectively). It should be noted that the ITU-T G.719 encoder incorporates a window switch mechanism with transient detection, however the pre-echo is not completely reduced at low bit rate (typically at 32 kbit / s).
  • Window switching has been mentioned previously; it requires transmitting auxiliary information to identify the type of windows used in the current frame.
  • Another solution is to apply adaptive filtering. In the area preceding the attack, the reconstructed signal is seen as the sum of the original signal and the quantization noise.
  • the aforementioned filtering process does not allow to find the original signal, but provides a strong reduction of pre-echo. However, it requires transmitting the additional parameters to the decoder.
  • Attenuation factors are determined by sub-block, in the sub-blocks of weak energy preceding a sub-block in which a transition or attack has been detected.
  • the attenuation factor g (k) in the k-th sub-block is calculated for example according to the ratio R (k) between the energy of the sub-block of higher energy and the energy of the k-th under -block in question:
  • the factor g (k) is set to an attenuation-inhibiting attenuation value, i.e. 1. Otherwise, the attenuation factor is between 0 and 1.
  • the frame that precedes the pre-echo frame has a homogeneous energy that corresponds to the energy of a low energy segment (typically a background noise).
  • a background noise typically a background noise
  • ⁇ im g (k) serves as a lower limit in the final calculation of the attenuation factor of the sub-block, and is therefore used as follows:
  • g (k) max (g (k), lim g (k))
  • the attenuation factors (or gains) g (k) determined by sub-blocks can then be smoothed by a sample-by-sample applied smoothing function to avoid abrupt changes in the attenuation factor at the block boundaries.
  • L ' represents the length of a sub-block.
  • u i 0
  • u 5
  • FIGS. 2 and 3 illustrate the implementation of the attenuation method as described in the patent application of the state of the art, cited above, and summarized above.
  • the signal is sampled at 32 kHz
  • a frame of an original signal sampled at 32 kHz is shown.
  • An attack (or transition) in the signal is located in the sub-block beginning at the index 320.
  • This signal has been coded by a low rate (24 kbit / s) MDCT type transform coder.
  • Part c) shows the evolution of the pre-echo attenuation factor (solid line) obtained by the method described in the aforementioned prior art patent application.
  • the dotted line represents the factor before smoothing. Note here that the position of the attack is estimated around the sample 380 (in the block delimited by the samples 320 and 400).
  • Part d) illustrates the result of decoding after application of pre-echo processing (multiplication of signal b) with signal c)).
  • pre-echo has been attenuated.
  • Figure 2 also shows that the smoothed factor does not go back to 1 at the time of the attack, which implies a decrease in the amplitude of the attack. The noticeable impact of this decrease is very small but can nevertheless be avoided.
  • FIG. 3 illustrates the same example as FIG. 2, in which, before smoothing, the attenuation factor value is forced to 1 for the few samples of the sub-block preceding the sub-block where the attack is located. Part (c) of Figure 3 gives an example of such a correction.
  • the value of factor 1 has been assigned to the last 16 samples of the sub-block preceding the attack, starting from the index 364.
  • the smoothing function progressively increases the factor to have a value close to 1 at the moment. of the attack.
  • the amplitude of the attack is then preserved, as illustrated in part d) of FIG. 3, but some pre-echo samples are not attenuated.
  • pre-echo attenuation reduction does not reduce the pre-echo to the level of the attack, because of the smoothing gain.
  • This pre-echo reduction technique is, however, perfectible for certain types of signals such as modern music signals, for example. Indeed, in some cases, a false pre-echo detection can take place.
  • FIG. 4 illustrates an example of such an original signal, which is thus uncoded without pre-echo. This is a beat of an electronic / synthetic percussion instrument. It can be observed that before the net attack to the index 1600 there is a synthetic noise which starts towards the index 1250. This synthetic noise which is therefore part of the signal would be detected as a pre-echo by detection algorithm pre-echo method described above, assuming perfect signal coding / decoding. The pre-echo attenuation processing would therefore suppress this component of the signal. This would distort the decoded signal (when the coding / decoding is perfect), which is undesirable.
  • the present invention improves the state of the art.
  • the present invention relates to a method of pre-echo discrimination and attenuation in a digital audio signal generated from a transform coding, in which, for a current frame decomposed into sub-blocks, the Low energy low sub-blocks preceding a sub-block in which a transition or attack is detected determine a pre-echo area in which a pre-echo attenuation processing is performed.
  • the method is such that, in the case where an attack is detected from the third sub-block of the current frame, it comprises the following steps:
  • the energy director coefficient calculated for the sub-blocks preceding the position of the attack makes it possible to check the tendency of increase of the energy of the signal in the pre-echo zone. This makes reliable pre-echo detection by avoiding false pre-echo detection. Indeed, by looking at Figure 1 we can see that the pre-echo has a typical characteristic: its energy has a growing tendency in approaching the attack origin of the pre-echo. The shape of the addition-overlay weighting windows explain this. Even if the pre-echo has a nearly constant energy before overlap, the signals at the input of the add-over module are multiplied by weighting windows whose weight decreases towards the past. In the case of the example signal of FIG. 4, the energy of the signal before the attack is approximately constant, which makes it possible to differentiate it from a pre-echo. Thus, verification of increasing signal energy in the pre-echo area increases the reliability of the pre-echo detection.
  • the method further comprises a step of decomposing the digital audio signal into at least two sub-signals according to a frequency criterion and in that the comparison calculation steps are performed for at least one of the subsignals.
  • the energy of two sub-blocks is used in the pre-echo zone to calculate a directional coefficient and compare it to a threshold. With only two points, only the verification for the high-frequency sub-signal in the case of two sub-signal decomposition is sufficient to detect a false pre-echo detection.
  • the method further comprises a step of decomposing the digital audio signal into at least two sub-signals as a function of a frequency criterion and in that the calculation and comparison steps are performed for each of the sub-signals, the inhibition of the pre-echo attenuation processing in the pre-echo zone of all the sub-signals performing when a calculated master coefficient is below the predefined threshold for at least one sub-signal.
  • the division into sub-signals thus makes it possible to carry out a pre-echo attenuation independently and adapted in the sub-signals.
  • the detection reliability of the pre-echo zone is enhanced for each of the sub-signals by checking the value of the respective coefficient coefficients.
  • a different threshold is defined by sub-signal.
  • the steering coefficient is calculated using a least squares estimation method.
  • This calculation method is of low complexity.
  • the steering coefficient is normalized.
  • a direction coefficient calculated for the previous frame is used for the comparison step.
  • the present invention also relates to a device for discriminating and attenuating pre-echo in a digital audio signal generated from a transform coding, comprising a transition detection or attack module, a zone discrimination module. pre-echo and a pre-echo attenuation processing module, a pre-echo attenuation processing being performed for a current sub-block decomposed frame, in the low energy sub-blocks preceding a sub-block wherein a transition or attack is detected determining a pre-echo area.
  • the device is such that, in the case where an attack is detected from the third sub-block of the current frame, it further comprises:
  • a calculation module calculating an energies directing coefficient for at least two sub-blocks of the current frame preceding the sub-block in which an attack is detected;
  • a comparator able to perform a comparison of the steering coefficient at a predefined threshold
  • a discrimination module capable of inhibiting the pre-echo attenuation processing in the pre-echo zone in the case where the calculated directing coefficient is lower than the predefined threshold.
  • the invention relates to a decoder of a digital audio signal comprising a device as described above.
  • the invention also relates to a computer program comprising code instructions for implementing the steps of the method as described above, when these instructions are executed by a processor.
  • the invention relates to a storage medium, readable by a processor, integrated or not to the processing device, optionally removable, storing a computer program implementing a method of treatment as described above.
  • FIG. 1 previously described illustrates a state-of-the-art transform coding-decoding system
  • FIG. 3 illustrates another example of a digital audio signal for which an attenuation method according to the state of the art is carried out
  • FIG. 4 previously described illustrates an example of a signal for which the state of the art technique would erroneously detect a pre-echo
  • FIG. 5 illustrates an embodiment of a method and a device for discriminating and pre-echo attenuation processing included in a decoder according to the invention
  • FIG. 6 illustrates an example of analysis windows and low-delay synthesis windows for coding and transform decoding capable of creating the pre-echo phenomenon
  • FIG. 7 illustrates an exemplary digital audio signal for which the pre-echo attenuation method according to one embodiment of the invention is implemented
  • FIG. 8 illustrates a hardware example of discrimination and attenuation processing device according to the invention.
  • a pre-echo attenuation discrimination and processing device 600 is described.
  • the attenuation processing device 600 as described below is included in a decoder comprising an inverse quantization module 610 (Q 1 ) receiving a signal S, a module 620 of inverse transform (MDCT 1 ), a module 630 of reconstruction of the addition / overlap signal (add / rec) as described with reference to FIG. 1 and delivering a reconstructed signal x rec (n) to the attenuation discrimination and processing device according to the invention.
  • MDCT inverse quantization module
  • a processed signal Sa is provided in which a pre-echo attenuation has been performed.
  • the device 600 implements a discrimination and pre-echo attenuation processing method in the decoded signal x rec (n).
  • the discrimination and attenuation processing method includes a step of detecting (E601) attacks that may generate a pre-echo, in the decoded signal x rec (n).
  • the device 600 comprises a detection module 601 able to implement a step of detecting (E601) the position of an attack in a decoded audio signal.
  • An onset is a rapid transition and a sudden change in the dynamics (or amplitude) of the signal.
  • This type of signal may be referred to by the more general term "transient”.
  • transient we will use only the terms of attack or transition to designate also transients.
  • the size of these sub-blocks is therefore identical but the invention remains valid and easily generalizable when the sub-blocks have a variable size. This can be the case for example when the length of the frame L is not divisible by the number of sub-blocks K or if the frame length is variable.
  • Special low-delay analysis-synthesis windows similar to those described in ITU-T G.718 are used for the analysis part and for the synthesis part of the MDCT transformation.
  • An example of such windows is illustrated with reference to Figure 6.
  • the delay generated by the transformation is only 280 samples unlike the delay of 640 samples in the case of use of conventional sinusoidal windows.
  • the MDCT memory with special low-delay analysis-synthesis windows contains only 140 independent samples (not folded with the current frame) unlike the 320 samples in the case of using conventional sinusoidal windows.
  • the MDCT x MDCT (n) memory is used which gives a time-folding version of the future signal.
  • Figure 1 shows that the pre-echo influences the frame that precedes the frame where the attack is located, and it is desirable to detect an attack in the future frame which is partly contained in the MDCT memory.
  • the current frame and the MDCT memory can be seen as concatenated signals forming a signal cut into ( ⁇ + ⁇ ') consecutive sub-blocks.
  • the energy in the k-th sub-block is defined as:
  • the average energy of the sub-blocks in the current frame is thus obtained as:
  • the average energy of the sub-blocks in the second part of the current frame is also defined as (assuming that K is an even number):
  • R (k) "- ° ⁇ ⁇ + ⁇ ⁇ 1 - exceeds a predefined threshold, in one of the sub-blocks considered.
  • the device 600 also comprises a pre-echo zone discrimination module 602 implementing a step of determining (E602) a pre-echo zone (ZPE) preceding the detected driving position.
  • Pre-echo zone is here called the zone covering the samples before the estimated position of the attack which are disturbed by the preecho generated by the attack and where attenuation of this pre-echo is desirable.
  • the pre-echo zone can be determined on the decoded signal.
  • In k) are concatenated in chronological order, first with the time envelope of the decoded signal, then the envelope of the signal of the next frame estimated from the memory of the MDCT transform.
  • the pre-echo presence is detected for example if the ratio R (k) exceeds a threshold, typically this threshold is 16.
  • the device 600 comprises a calculation module 603 capable of implementing a step of calculating a steering coefficient (or variation trend indicator) of the energies of the sub-blocks preceding the sub-block in which an attack has been detected.
  • the value of bi also depends on the magnitude (in absolute value) of the energies; it is indeed homogeneous with energy over time. To be able to better compare the value of bi with a threshold (for example fixed) one can suppress this dependency. For example, the value of bi can be divided by the average value of the energies to obtain the standardized guideline:
  • This alternative solution has a higher computational complexity because it requires calculating a square root.
  • the steering coefficient is calculated with at most 3 sub-blocks. This makes it possible to limit the maximum complexity of the calculation of the steering coefficient.
  • the normalized standard coefficient b ln thus obtained is then compared to the step E604 by a comparator module 604 at a predefined threshold.
  • the threshold may be predefined to a fixed value or may be variable depending for example on the classification of the signal according to a speech or music criterion. Typically this threshold is equal to 0 if we only check that the energy does not decrease or equal to 0.2 if we impose a slight increase in energy in the pre-echo zone. If the standardized guideline b in is below this threshold it is concluded that the signal in the pre-echo zone does not correspond to a typical pre-echo and pre-echo attenuation is inhibited in this zone in step E602. Thus, it is avoided that a decoded signal whose original input signal contains a low energy component before an attack is erroneously modified / altered by the pre-echo attenuation module by detecting that component as a pre-echo.
  • a pre-echo attenuation is implemented in step E607 by the attenuation module 607 for the discriminated pre-echo area.
  • the attenuation factor is for example calculated as in the application FR 08 56248. In the case where the module 604 has detected a false pre-echo detection, the attenuation factor can be forced to 1 thus inhibiting the attenuation or Well the discrimination module 602 does not discriminate this area as a pre-echo area, the attenuation module then not being solicited.
  • the device 600 further comprises a signal decomposition module 605, able to perform a step E605 of decomposing the decoded signal into at least two sub-signals according to a predetermined criterion. This method is described in particular in the application FR12 62598 which is recalled here some elements.
  • the decoded signal x rec (n) is decomposed in step E605 into two sub-signals as follows:
  • the first sub-signal x mc ssl (n) is obtained by low-pass filtering using a FIR filter (finite impulse response filter) with 3 coefficients and a null transfer function phase c (n) z ⁇ l + (l) - 2c (n)) + c (n) z with c (n) a value between 0 and 0.25, where [c (w), l-2c (n), c (n)] are the coefficients of the pass filter low; this filter is implemented with the difference equation:
  • a constant value c (n) 0.25 is used. It can be noted that the sub-signal x reC SS i (n) resulting from this filtering, therefore contains rather low-frequency components of the decoded signal.
  • the sub-signal x reCtSs2 (n) resulting from this filtering therefore contains rather high-frequency components of the decoded signal.
  • the combination of the attenuated sub-signals for obtaining the attenuated signal Sa is made by simply adding the attenuated sub-signals to the step E608 described later.
  • a step E606 for calculating pre-echo attenuation factors is implemented in the calculation module 606. This calculation is done separately for the two sub-signals.
  • Attenuation factors are obtained by sampling the pre-echo area determined in E602 as a function of the frame in which the attack was detected and the previous frame.
  • the attenuation factors are calculated by sub-block. In the method described here, they are additionally calculated separately for each sub signal. For samples preceding the detected attack, the attenuation factors g pre-ss i (n) and
  • g.sub.Ss2 ( n ) The calculation of the attenuation factor of a sub-signal (for example g.sub.Ss2 ( n )) can be similar to that described in the patent application FR 08 56248 for the signal decoded as a function of the ratio R (k) (used also for the detection of the attack) between the energy of the sub-block of higher energy and the energy of the k-th sub-block of the decoded signal.
  • R (k) used also for the detection of the attack
  • the factor is then set to a attenuation value that inhibits the attenuation, that is to say 1. Otherwise, the attenuation factor is between 0 and 1. This initialization can be common for all the sub-signals. .
  • the attenuation values are then refined by sub-signal to be able to adjust the optimal sub-signal attenuation level based on the characteristics of the decoded signal.
  • the attenuations can be limited according to the average energy of the sub-signal of the previous frame because it is not desirable that after the pre-echo attenuation processing, the signal energy becomes less than the average energy per sub-block of the signal preceding the processing zone (typically that of the previous frame or that of the second half of the previous frame).
  • n kL '
  • the average energy of the previous frame In ss2 and that of the second half of the previous frame In ss2 'which can be calculated (at the previous frame) are also known by storage as: l Kl
  • the limit value of the factor lim ⁇ ss2 (k) can be calculated in order to obtain exactly the same energy as the average energy per sub-block of the segment preceding the sub-block to be processed. This value is of course limited to a maximum of 1 since it is of interest here to the attenuation values. More precisely :
  • the pre-echo zone where the attenuation extends from the beginning of the current frame to the beginning of the sub-block in which the attack has been detected, up to the index pos where pos min (. ⁇ arg max (£> ⁇ (&))
  • pos min (. ⁇ arg max (£> ⁇ (&))
  • pos min (. ⁇ arg max (£> ⁇ (&))
  • the attenuations associated with the samples of the sub-block of the attack are all set to 1 even if attack is towards the end of this sub -block.
  • the starting position of the attack pos is refined in the sub-block of the attack, for example by cutting the sub-block into sub-sub-blocks and observing the evolution of the energy of these sub-sub-blocks.
  • the calculation of the attenuation values based on the sub-signal x rec ss1 (n) may be similar to the calculation of the attenuation values based on the decoded signal x rec (n).
  • the attenuation values can be determined based on the decoded signal x rec (n). In the case where the detection of attacks is made on the decoded signal, it is no longer necessary to recalculate energies of the sub-blocks because for this signal the energy values by sub-block are already calculated to detect the attacks.
  • the attenuation factors g pre ssi (n) and g pre ss2 (T i) determined by sub-blocks can then be smoothed by an applied smoothing function sample by sample to avoid abrupt variations of the attenuation factor at the boundaries of the blocks. .
  • This is particularly important for sub-signals containing low frequency components such as sub-signal x mc ss i (n) but not necessary for sub-signals containing only high frequency components such as sub-signal x rec ss2 [n ).
  • Figure 7 illustrates an example of applying an attenuation gain with smoothing functions represented by the L arrows.
  • This figure illustrates in a), an example of an original signal, in b), the decoded signal without pre-echo attenuation, in c), the attenuation gains for the two sub-signals obtained according to the decomposition step E605 and in d), the decoded signal with pre-echo attenuation of steps E607 and E608 (i.e. after combining the two attenuated sub-signals).
  • the attenuation gain represented in dashed line and corresponding to the gain calculated for the first sub-signal comprising low frequency components comprises smoothing functions as described above.
  • the attenuation gain represented in solid line and calculated for the second sub-signal comprising high frequency components does not include smoothing gain.
  • the signal represented in d) shows that the pre-echo has been effectively attenuated by the attenuation processing implemented.
  • the smoothing function is for example preferably defined by the following equations:
  • the pre-echo zone (the number of attenuated samples) may therefore be different for the 2 sub-signals processed separately, even if the detection of the attack is made in common on the basis of the decoded signal. .
  • the smoothed attenuation factor does not go back to 1 at the moment of the attack, which implies a decrease in the amplitude of the attack. The noticeable impact of this decrease is very small but must nevertheless be avoided.
  • the attenuation factor value can be forced to 1 for the u-1 samples preceding the index pos where the onset of the attack is. This is equivalent to advancing the pos marker of u-1 samples for the sub signal where the smoothing is applied.
  • the smoothing function gradually increases the factor to have a value 1 at the time of the attack. The amplitude of the attack is then preserved.
  • the verification of the increase of the energy of the pre-echo zone according to the invention is carried out for at least one sub-signal or for each of these sub-signals.
  • the comparison threshold used may be different depending on the sub-signals and the number of sub-blocks available before attack.
  • the normalized steering coefficient b in is lower than the threshold of this sub-signal, the pre-echo attenuation is inhibited for all the sub-signals.
  • pre-echo processing can be done for example by setting the attenuation factors to 1 or not discriminating the area as a pre-echo zone, the module of Pre-echo attenuation processing is then not requested as illustrated by way of example in the embodiment of Figure 5 by the link between the block 604 and 602.
  • the attenuation will be inhibited separately for each sub-signal as soon as the normalized steering coefficient b in is lower than the threshold of this sub-signal.
  • the inhibition may for example be implemented by setting the attenuation factors to 1 or by not soliciting the pre-echo module for the sub-signal considered.
  • the evolution of the two sub-signals is checked in both sub-signals. energy of the sub-blocks preceding the sub-block where the attack was detected, by linear regression.
  • This verification can be done according to the steps E603 and E604, at any time after the division of the decoded signal into sub-signals (E605) and before the application of the pre-echo attenuation factors (E607). Verification is possible if at least two sub-blocks precede the sub-block where the attack was detected. If the attack is detected in the first or second sub-block the verification according to the invention is not possible.
  • step E603 a simple director coefficient (without normalization) such as:
  • bi nss2 is less than 0.2, pre-echo attenuation is inhibited for this pre-echo zone, and for all the sub-signals.
  • the module 607 of the device 600 of FIG. 5 implements the pre-echo attenuation step E607 in the pre-echo zone of each of the sub-signals by application to the sub-signals of the attenuation factors thus calculated. .
  • a step E608 of the obtaining module 608 makes it possible to obtain the attenuated output signal (the decoded signal after pre-echo attenuation) by combining (in this example by simple addition) the attenuated sub-signals, according to the equation:
  • the filtering used is not associated with sub-signal decimation operations and the complexity and delay ("lookahead" or future frame) are reduced to a minimum.
  • FIG. 8 An exemplary embodiment of a discrimination and attenuation processing device according to the invention is now described with reference to FIG. 8.
  • this device 100 in the sense of the invention typically comprises a ⁇ processor cooperating with a memory block BM including a storage and / or working memory, and a memory buffer MEM mentioned above as a means for storing all data. necessary to implement the method of discrimination and attenuation processing as described with reference to Figure 5.
  • This device receives as input successive frames of the digital signal Se and delivers the signal Sa reconstructed with attenuation pre-echo in the pre-echo areas discriminated with the eventual reconstruction of the attenuated signal by combination of attenuated sub-signals.
  • the memory block BM may comprise a computer program comprising the code instructions for implementing the steps of the method according to the invention when these instructions are executed by a ⁇ processor of the device and in particular the steps of calculating a control coefficient of energies for at least two sub-blocks preceding the sub-block in which an attack is detected, comparing the steering coefficient to a predefined threshold and inhibiting the pre-echo attenuation processing in the pre-echo zone in the case where the calculated steering coefficient is below the predefined threshold.
  • Figure 5 can illustrate the algorithm of such a computer program.
  • This discrimination and attenuation processing device can be independent or integrated in a digital signal decoder.
  • a decoder can be integrated with equipment for storing or transmitting digital audio signals such as communication gateways, communication terminals or servers of a communication network.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

L'invention se rapporte à un procédé de discrimination et d'atténuation de pré -écho dans un signal audionumérique engendré à partir d'un codage par transformée, comporte les étapes suivantes: dans lequel, pour une trame courante décomposée en sous-blocs, les sous-blocs de basse énergie précédent un sous-bloc dans lequel une transition ou attaque est détectée (E601) déterminent une zone de pré -écho (E602) dans laquelle un traitement d'atténuation de pré-écho est effectué (E607). Le procédé est tel que dans le cas où une attaque est détectée à partir du troisième sous-bloc de la trame courante, il comporte les étapes suivantes: - calcul (E603) d'un coefficient directeur des énergies pour au moins deux sous-blocs de la trame courante précédant le sous-bloc dans lequel une attaque est détectée; - comparaison (E604) du coefficient directeur à un seuil prédéfini; et - inhibition (E602) du traitement d'atténuation de pré-écho dans la zone de pré -écho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini. L'invention se rapporte aussi à un dispositif de discrimination et de traitement mettant en oeuvre les étapes du procédé décrit, à un décodeur comportant un tel dispositif.

Description

Discrimination et atténuation de pré-échos dans un signal audionumérique
L'invention concerne un procédé et un dispositif de discrimination et de traitement d'atténuation des pré-échos lors du décodage d'un signal audionumérique.
Pour la transmission des signaux audionumériques sur des réseaux de télécommunications, qu'il s'agisse par exemple de réseaux fixes ou mobiles, ou pour le stockage des signaux, on fait appel à des processus de compression (ou codage source) mettant en œuvre des systèmes de codage qui sont en général du type codage temporel par prédiction linéaire ou codage fréquentiel par transformée.
Le procédé et le dispositif, objets de l'invention, ont ainsi comme domaine d'application la compression des signaux sonores, en particulier les signaux audionumériques codés par transformée fréquentielle.
La figure 1 représente à titre illustratif, un schéma de principe du codage et du décodage d'un signal audio numérique par transformée incluant une analyse-synthèse par addition/recouvrement selon l'art antérieur.
Certaines séquences musicales, telles que les percussions et certains segments de parole comme les plosives (/k/, lit, ...), sont caractérisées par des attaques extrêmement brusques qui se traduisent par des transitions très rapides et une variation très forte de la dynamique du signal en l'espace de quelques échantillons. Un exemple de transition est donné à la figure 1 à partir de l'échantillon 410.
Pour le traitement de codage/décodage, le signal d'entrée est découpé en blocs d'échantillons de longueur L dont les frontières sont représentées sur la figure 1 par des traits verticaux en pointillés. Le signal d'entrée est noté x(ri), où n est l'indice de l'échantillon. La découpe en blocs successifs (ou trames) conduit à définir les blocs XN(n) = [ x(N.L) ... x(N.L+L-l) ] = [ xN(0) ... xN(L-l)], où N est l'indice du bloc (ou de la trame), L est la longueur de la trame. A la figure 1 on a L=160 échantillons. Dans le cas de la transformée modulée en cosinus modifiée MDCT (pour "Modified Discrète Cosine Transform" en anglais), deux blocs XN(n) et XN+1(n) sont analysés conjointement pour donner un bloc de coefficients transformés associés à la trame d'indice N et la fenêtre d' analyse est sinusoïdale.
La division en blocs, aussi appelés trames, opérée par le codage par transformée est totalement indépendante du signal sonore et les transitions peuvent donc apparaître en un point quelconque de la fenêtre d'analyse. Or après décodage par transformée, le signal reconstruit est entaché de "bruit" (ou distorsion) engendré par l'opération quantification (Q)- quantification inverse (Q 1). Ce bruit de codage est réparti temporellement de façon relativement uniforme sur tout le support temporel du bloc transformé, c'est-à-dire sur toute la longueur de la fenêtre de longueur 2L d'échantillons (avec recouvrement de L échantillons). L'énergie du bruit de codage est en général proportionnelle à l'énergie du bloc et est fonction du débit de codage/décodage.
Pour un bloc comportant une attaque (comme le bloc 320-480 de la figure 1) l'énergie du signal est élevée, le bruit est donc également de niveau élevé.
En codage par transformée, le niveau du bruit de codage est typiquement inférieur à celui du signal pour les segments de forte énergie qui suivent immédiatement la transition, mais le niveau est supérieur à celui du signal pour les segments d'énergie plus faible, notamment sur la partie précédant la transition (échantillons 160 - 410 de la figure 1). Pour la partie précitée, le rapport signal à bruit est négatif et la dégradation résultante peut apparaître très gênante à l'écoute. On appelle pré -écho le bruit de codage antérieur à la transition et post-écho le bruit postérieur à la transition.
On peut observer sur la figure 1 que le pré -écho affecte la trame précédant la transition ainsi que la trame où se produit la transition.
Les expériences psycho-acoustiques ont montré que l'oreille humaine effectue un pré-masquage temporel des sons assez limité, de l'ordre de quelques millisecondes. Le bruit précédant l'attaque, ou pré-écho, est audible lorsque la durée du pré -écho est supérieure à la durée du pré-masquage.
L'oreille humaine effectue également un post-masquage d'une durée plus longue, de 5 à 60 millisecondes, lors du passage de séquences de forte énergie à des séquences de faible énergie. Le taux ou niveau de gêne acceptable pour les post-échos est donc plus important que pour les pré-échos.
Le phénomène des pré-échos, plus critique, est d'autant plus gênant que la longueur des blocs en nombre d'échantillons est importante. Or, en codage par transformée, il est bien connu que pour les signaux stationnaires plus la longueur de la transformée augmente, plus le gain de codage est important. A fréquence d'échantillonnage fixée et à débit fixé, si on augmente le nombre de points de la fenêtre (donc la longueur de la transformée) on disposera de plus de bits par trame pour coder les raies fréquentielles jugées utiles par le modèle psychoacoustique, d'où l'avantage d'utiliser des blocs de grande longueur. Le codage MPEG AAC (Advanced Audio Coding), par exemple, utilise une fenêtre de grande longueur qui contient un nombre fixe d'échantillons, 2048, soit sur une durée de 64 ms si la fréquence d'échantillonnage est de 32 kHz; le problème des pré -échos y est géré en permettant de commuter de ces fenêtres longues à 8 fenêtres courtes par le biais de fenêtres intermédiaires (dites de transition), ce qui nécessite un certain retard au codage pour détecter la présence d'une transition et adapter les fenêtres. La longueur de ces fenêtres courtes est donc de 256 échantillons (8 ms à 32 kHz). A bas débit on peut toujours avoir un pré-écho audible de quelques ms. La commutation des fenêtres permet d'atténuer le pré-écho mais pas de le supprimer. Les codeurs par transformée utilisés pour les applications conversationnelles, comme UIT-T G.722.1, G.722.1C ou G.719, utilisent souvent une longueur de trame de 20 ms et une fenêtre de durée 40 ms à 16, 32 ou 48 kHz (respectivement). On peut noter que le codeur UIT-T G.719 intègre un mécanisme de commutation de fenêtres avec détection de transitoire, cependant le pré-écho n'est pas complètement réduit à bas débit (typiquement à 32 kbit/s).
Dans le but de réduire l'effet gênant précité du phénomène des pré -échos, différentes solutions ont été proposées au niveau du codeur et/ou du décodeur.
La commutation de fenêtres a été citée précédemment ; elle nécessite de transmettre une information auxiliaire pour identifier le type de fenêtres utilisées dans la trame courante. Une autre solution consiste à appliquer un filtrage adaptatif. Dans la zone précédant l'attaque, le signal reconstruit est vu comme la somme du signal original et du bruit de quantification.
Une technique de filtrage correspondante a été décrite dans l'article intitulé High Quality Audio Transform Coding at 64 kbits, IEEE Trans. on Communications Vol 42, No. 11, November 1994, publié par Y. Mahieux et J. P. Petit.
La mise en œuvre d'un tel filtrage nécessite la connaissance de paramètres dont certains, comme les coefficients de prédiction et la variance du signal corrompu par le préécho, sont estimés au décodeur à partir des échantillons bruités. Par contre, des informations telles que l'énergie du signal d'origine ne peuvent être connues qu'au codeur et doivent par conséquent être transmises. Ceci nécessite de transmettre des informations supplémentaires, ce qui à débit contraint diminue le budget relatif alloué au codage par transformée. Lorsque le bloc reçu contient une variation brusque de dynamique, le traitement de filtrage lui est appliqué.
Le processus de filtrage précité ne permet pas de retrouver le signal d'origine, mais procure une forte réduction des pré -échos. Il nécessite toutefois de transmettre les paramètres supplémentaires au décodeur.
A la différence des solutions précédentes, différentes techniques de réduction de pré-écho sans transmission spécifique de l'information ont été proposées. Par exemple, une revue de la réduction de pré -échos dans le contexte du codage hiérarchique est présentée dans l'article B. Kôvesi, S. Ragot, M. Gartner, H. Taddei, "Pre-echo réduction in the ITU-T G.729.1 embedded coder," EUSIPCO, Lausanne, Suisse, Août 2008.
Un exemple typique de procédé d'atténuation de pré-échos sans information auxiliaire est décrit dans la demande de brevet français FR 08 56248. Dans cet exemple, on détermine des facteurs d'atténuation par sous-bloc, dans les sous-blocs de faible énergie précédant un sous-bloc dans lequel une transition ou attaque a été détectée.
Le facteur d'atténuation g (k) dans le k-ième sous-bloc est calculé par exemple en fonction du rapport R(k) entre l'énergie du sous-bloc de plus forte énergie et l'énergie du k-ième sous-bloc en question :
g {k) = f {R(k))
où / est une fonction décroissante à valeurs entre 0 et 1 et k est le numéro du sous-bloc. D'autres définitions du facteur g (k) sont possibles, par exemple en fonction de l'énergie
En k ) dans le sous-bloc courant et de l'énergie En (k— l) dans le sous-bloc précédent.
Si l'énergie des sous-blocs varie peu par rapport à l'énergie maximale dans les sous-blocs considérés à la trame courante, aucune atténuation n'est alors nécessaire ; le facteur g (k) est fixé à une valeur d'atténuation inhibant l'atténuation, c'est-à-dire 1. Sinon, le facteur d'atténuation est compris entre 0 et 1.
Dans la plupart des cas, surtout quand le pré -écho est gênant, la trame qui précède la trame de pré-écho a une énergie homogène qui correspond à l'énergie d'un segment de faible énergie (typiquement un bruit de fond). Selon l'expérience il n'est pas utile ni même souhaitable qu'après traitement d'atténuation de pré-écho l'énergie du signal devienne inférieure à l'énergie moyenne (par sous-bloc) du signal précédant la zone de traitement - typiquement celle de la trame précédente, notée En , ou celle de la deuxième moitié de la trame précédente, notée En ' .
Pour le sous-bloc d'indice k à traiter on peut calculer la valeur limite, notée
\img (k) , du facteur d'atténuation afin d'obtenir exactement la même énergie que l'énergie moyenne par sous-bloc du segment précédant le sous-bloc à traiter. Cette valeur est bien sûr limitée à un maximum de 1 puisqu'on s'intéresse ici aux valeurs d'atténuation. Plus précisément on définit ici:
où l'énergie moyenne du segment précédent est approximée par la valeur max yEn, En ' .
La valeur \img(k) ainsi obtenue sert de limite inférieure dans le calcul final du facteur d'atténuation du sous-bloc, elle est donc utilisée comme suit :
g(k) = max(g(k),limg(k))
Les facteurs d'atténuation (ou gains) g(k) déterminés par sous-blocs peuvent être ensuite lissés par une fonction de lissage appliquée échantillon par échantillon pour éviter des variations brusques du facteur d'atténuation aux frontières des blocs.
Par exemple, on peut d'abord définir le gain par échantillon comme une fonction constante par morceaux :
Spre{n) = g{k), n = kL',-,(k + ï)L'-\
où L' représente la longueur d'un sous-bloc.
La fonction est ensuite lissée suivant l'équation suivante:
8pre{n)-=O!gpre{n-l) + (l-a)gpre(n), n = 0,---,L-l avec la convention que g (—1) est le dernier facteur d'atténuation obtenu pour le dernier échantillon du sous-bloc précédent, a est le coefficient de lissage, typiquement OC=0.85.
D'autres fonctions de lissage sont également possibles comme par exemple le fondu enchaîné linéaire sur u échantillons :
1
(Λ- n = -,L-l
u i=0 où g (n) est l'atténuation non lissée et g [n)est l'atténuation lissée, g (n) avec n = -(u-l), sont les derniers u-1 facteurs d'atténuation obtenus pour les derniers échantillons du sous-bloc précédent. On peut par exemple prendre u = 5.
Une fois les facteurs g [n) ainsi calculés, l'atténuation de pré -échos est faite sur le signal reconstruit dans la trame courante, xrec (n) , en multipliant chaque échantillon par le facteur correspondant :
x rec,g ( ^n ^) = o β pre ( ^n ^)x rec ( ^n ^) ,' n = 0, '---, 'L— 1 où xrec (n) est le signal décodé et post-traité par la réduction de pré-écho.
Les figures 2 et 3 illustrent la mise en œuvre du procédé d'atténuation tel que décrit dans la demande de brevet de l'état de l'art, précitée, et résumé précédemment.
Dans ces exemples le signal est échantillonné à 32 kHz, la longueur de la trame est L=640 échantillons et chaque trame est divisée en 8 sous-blocs de K=80 échantillons.
Dans la partie a) de la figure 2, une trame d'un signal original échantillonné à 32 kHz, est représentée. Une attaque (ou transition) dans le signal est située dans le sous-bloc commençant à l'indice 320. Ce signal a été codé par un codeur par transformée de type MDCT à bas débit (24 kbit/s).
Dans la partie b) de la figure 2, le résultat du décodage sans traitement de pré-écho est illustré. On peut observer le pré -écho à partir de l'échantillon 160, dans les sous-blocs précédents celui contenant l'attaque.
La partie c) montre l'évolution du facteur d'atténuation de pré -écho (ligne continue) obtenu par le procédé décrit dans la demande de brevet de l'état de l'art précitée. La ligne pointillée représente le facteur avant lissage. On remarque ici que la position de l'attaque est estimée autour de l'échantillon 380 (dans le bloc délimité par les échantillons 320 et 400).
La partie d) illustre le résultat du décodage après application du traitement de préécho (multiplication du signal b) avec le signal c)). On voit que le pré -écho a bien été atténué. La figure 2 montre également que le facteur lissé ne remonte pas à 1 au moment de l'attaque, ce qui implique une diminution de l'amplitude de l'attaque. L'impact perceptible de cette diminution est très faible mais peut néanmoins être évité. La figure 3 illustre le même exemple que la figure 2, dans lequel, avant lissage, la valeur de facteur d'atténuation est forcée à 1 pour les quelques échantillons du sous-bloc précédant le sous-bloc où se situe l'attaque. La partie c) de la figure 3 donne un exemple d'une telle correction.
Dans cet exemple on a affecté la valeur de facteur 1 aux 16 derniers échantillons du sous-bloc précédant l'attaque, à partir de l'indice 364. Ainsi la fonction de lissage accroît progressivement le facteur pour avoir une valeur proche de 1 au moment de l'attaque. L'amplitude de l'attaque est alors préservée, comme illustré dans la partie d) de la figure 3, par contre quelques échantillons de pré-écho ne sont pas atténués.
Dans l'exemple de la figure 3 la réduction de pré -écho par atténuation ne permet pas de réduire le pré-écho jusqu'au niveau de l'attaque, à cause du lissage du gain. Cette technique de réduction des pré -échos est cependant perfectible pour certains types de signaux comme des signaux de musique moderne par exemple. En effet, dans certains cas, une fausse détection de pré -écho peut avoir lieu. La figure 4 illustre un exemple d'un tel signal original, non codé donc sans pré-écho. Il s'agit d'un battement d'un instrument de percussion électronique/synthétique. On peut y observer qu'avant l'attaque nette vers l'indice 1600 il y a un bruit synthétique qui démarre vers l'indice 1250. Ce bruit synthétique qui fait partie donc du signal serait détecté comme un pré-écho par algorithme de détection de pré -écho décrit ci-dessus, en supposant un codage/décodage parfait du signal. Le traitement d'atténuation de pré-échos supprimerait donc cette composante du signal. Ceci dénaturerait le signal décodé (quand le codage/décodage est parfait), ce qui n'est pas souhaitable.
Il existe donc un besoin d'une technique améliorée de discrimination et d'atténuation de pré -échos au décodage, qui permette de fiabiliser la détection des pré -échos et d'éviter les fausses détections sans qu'aucune information auxiliaire ne soit transmise par le codeur.
La présente invention améliore la situation de l'état de l'art.
A cet effet, la présente invention se rapporte à un procédé de discrimination et d'atténuation de pré -écho dans un signal audionumérique engendré à partir d'un codage par transformée, dans lequel, pour une trame courante décomposée en sous-blocs, les sous-blocs de basse faible énergie précédant un sous-bloc dans lequel une transition ou attaque est détectée déterminent une zone de pré-écho dans laquelle un traitement d'atténuation de préécho est effectué. Le procédé est tel que, dans le cas où une attaque est détectée à partir du troisième sous-bloc de la trame courante, il comporte les étapes suivantes:
- calcul d'un coefficient directeur des énergies pour au moins deux sous-blocs de la trame courante précédant le sous-bloc dans lequel une attaque est détectée;
- comparaison du coefficient directeur à un seuil prédéfini; et
- inhibition du traitement d'atténuation de pré -écho dans la zone de pré-écho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini.
Le coefficient directeur des énergies calculé pour les sous-blocs précédant la position de l'attaque, permet de vérifier la tendance d'augmentation de l'énergie du signal dans la zone de pré-écho. Ceci permet de fiabiliser la détection des pré -échos en évitant de fausse détection de pré -échos. En effet, en observant la figure 1 on peut voir que le pré -écho a une caractéristique typique : son énergie a une tendance croissante en approchant l'attaque origine du pré-écho. La forme des fenêtres de pondération de addition-recouvrement explique cela. Même si le pré -écho a une énergie à peu près constante avant addition- recouvrement, les signaux à l'entrée du module d'addition-recouvrement sont multipliés par des fenêtres de pondération dont le poids décroit vers le passé. Dans le cas du signal d'exemple de la figure 4, l'énergie du signal avant l'attaque est approximativement constante ce qui permet de le différencier d'un pré -écho. Ainsi, la vérification d'une énergie croissante du signal dans la zone de pré-écho permet d'augmenter la fiabilité de la détection de préécho.
Dans un mode de réalisation particulier, le procédé comporte en outre une étape de décomposition du signal audionumérique en au moins deux sous-signaux en fonction d'un critère fréquentiel et en ce que les étapes de calcul de comparaison sont effectuées pour au moins un des sous-signaux.
Lorsque la position de l'attaque est détectée dans le troisième sous-bloc de la trame courante, l'énergie de deux sous-blocs est utilisée dans la zone de pré-écho pour calculer un coefficient directeur et le comparer à un seuil. Avec seulement deux points, seule la vérification pour le sous-signal haute-fréquence dans le cas d'une décomposition en deux sous-signaux est suffisante pour détecter une fausse détection de pré -écho.
Dans le cas où le nombre de sous-blocs précédant le sous-bloc où une position d'attaque a été détecté est suffisant, le procédé comporte en outre une étape de décomposition du signal audionumérique en au moins deux sous-signaux en fonction d'un critère fréquentiel et en ce que les étapes de calcul et de comparaison sont effectuées pour chacun des sous- signaux, l'inhibition du traitement d'atténuation de pré-écho dans la zone de pré-écho de tous les sous-signaux s'effectuant quand un coefficient directeur calculé est inférieur au seuil prédéfini pour au moins un sous-signal.
La division en sous-signaux permet ainsi d'effectuer une atténuation de pré-écho de façon indépendante et adaptée dans les sous signaux. La fiabilité de détection de la zone de pré-écho est renforcée pour chacun des sous-signaux par la vérification de la valeur des coefficients directeurs respectifs.
Selon un mode de réalisation particulier, un seuil différent est défini par sous- signal.
Ceci permet d'adapter la vérification aux caractéristiques spectrales des sous- signaux.
Dans un mode de réalisation, le coefficient directeur est calculé selon une méthode d'estimation des moindres carrés.
Cette méthode de calcul est de faible complexité. Dans un mode possible de réalisation, le coefficient directeur est normalisé.
Ainsi le coefficient directeur est plus facilement comparable à un seuil lorsque celui-ci est différent de 0.
Dans un mode de réalisation possible, dans le cas où une attaque est détectée dans le premier ou deuxième sous-bloc de la trame courante, un coefficient directeur calculé pour la trame précédente est utilisé pour l'étape de comparaison.
La présente invention se rapporte également à un dispositif de discrimination et d'atténuation de pré -écho dans un signal audionumérique engendré à partir d'un codage par transformée, comportant un module de détection de transition ou attaque, un module de discrimination de zone de pré-écho et un module de traitement d'atténuation de pré -écho, un traitement d'atténuation de pré-écho étant effectué pour une trame courante décomposée en sous-blocs, dans les sous-blocs de faible énergie précédant un sous-bloc dans lequel une transition ou attaque est détectée déterminant une zone de pré -écho. Le dispositif est tel que, dans le cas où une attaque est détectée à partir du troisième sous-bloc de la trame courante, il comporte en outre:
- un module de calcul calculant un coefficient directeur des énergies pour au moins deux sous-blocs de la trame courante précédant le sous-bloc dans lequel une attaque est détectée;
- un comparateur apte à effectuer une comparaison du coefficient directeur à un seuil prédéfini; et
-un module de discrimination apte à inhiber le traitement d'atténuation de pré-écho dans la zone de pré -écho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini.
Les avantages de ce dispositif sont les mêmes que ceux décrits pour le procédé de discrimination et de traitement d'atténuation qu'il met en œuvre.
L'invention vise un décodeur d'un signal audionumérique comportant un dispositif tel que décrit précédemment.
L'invention vise aussi un programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé tel que décrit précédemment, lorsque ces instructions sont exécutées par un processeur.
Enfin, l'invention se rapporte à un support de stockage, lisible par un processeur, intégré ou non au dispositif de traitement, éventuellement amovible, mémorisant un programme informatique mettant en œuvre un procédé de traitement tel que décrit précédemment. D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels:
- la figure 1 décrite précédemment illustre un système de codage-décodage par transformée selon l'état de l'art;
- la figure 2 décrite précédemment illustre un exemple de signal audionumérique pour lequel une méthode d'atténuation selon l'état de l'art est effectuée;
- la figure 3 illustre un autre exemple de signal audionumérique pour lequel une méthode d'atténuation selon l'état de l'art est effectuée;
- la figure 4 décrite précédemment illustre un exemple d'un signal pour lequel la technique de l'état d'art détecterait à tort un pré -écho;
- la figure 5 illustre un mode de réalisation d'un procédé et d'un dispositif de discrimination et de traitement d'atténuation de pré-écho compris dans un décodeur selon l'invention;
- la figure 6 illustre un exemple de fenêtres d'analyse et de fenêtres de synthèse à faible retard pour le codage et le décodage par transformée susceptible de créer le phénomène de pré -écho;
- la figure 7 illustre un exemple de signal audionumérique pour lequel la méthode d'atténuation de pré-écho selon un mode de réalisation de l'invention est mis en œuvre;....
- la figure 8 illustre un exemple matériel de dispositif de discrimination et de traitement d'atténuation selon l'invention.
En référence à la figure 5, un dispositif 600 de discrimination et de traitement d'atténuation de pré-écho est décrit. Le dispositif de traitement d'atténuation 600 tel que décrit ci-après est compris dans un décodeur comportant un module 610 de quantification inverse (Q 1) recevant un signal S, un module 620 de transformée inverse (MDCT 1), un module 630 de reconstruction du signal par addition/recouvrement (add/rec) comme décrit en référence à la figure 1 et délivrant un signal reconstruit xrec (n) au dispositif de discrimination et de traitement d'atténuation selon l'invention. On peut noter qu'on prend ici l'exemple de la transformée MDCT qui est la plus courante en codage de parole et audio, cependant le dispositif 600 s'applique également à tout autre type de transformée (FFT, DCT, etc.).
En sortie du dispositif 600, un signal traité Sa est fourni dans lequel une atténuation de pré -écho a été effectuée. Le dispositif 600 met en œuvre une méthode de discrimination et de traitement d'atténuation des pré-échos dans le signal décodé xrec (n) .
Dans un mode de réalisation de l'invention, le procédé de discrimination et de traitement d'atténuation comporte une étape de détection (E601) des attaques qui peuvent engendrer un pré-écho, dans le signal décodé xrec (n) .
Ainsi, le dispositif 600 comporte un module de détection 601 apte à mettre en œuvre une étape de détection (E601) de la position d'une attaque dans un signal audio décodé.
Une attaque (ou onset en anglais) est une transition rapide et une variation brusque de la dynamique (ou amplitude) du signal. On peut désigner ce type de signaux par le terme plus général de "transitoire". Dans la suite et sans perte de généralité, on utilisera uniquement les termes d'attaque ou de transition pour désigner également des transitoires.
Chaque trame courante de L échantillons du signal décodé xrec [n) est divisée en
K sous-blocs de longueur L' , avec par exemple L = 640 échantillons (20 ms) à 32 kHz, L' = 80 échantillons (2.5 ms) et K = 8. De préférence la taille de ces sous-blocs est donc identique mais l'invention reste valable et facilement généralisable quand les sous-blocs ont une taille variable. Cela peut être le cas par exemple quand la longueur de la trame L n'est pas divisible par le nombre de sous-blocs K ou si la longueur de trame est variable.
Des fenêtres d'analyse-synthèse spéciales à bas retard similaires à celles décrites dans la norme UIT-T G.718 sont utilisées pour la partie analyse et pour la partie synthèse de la transformation MDCT. Un exemple de telles fenêtres est illustré en référence à la figure 6. Le retard engendré par la transformation est de seulement 280 échantillons contrairement au retard de 640 échantillons dans le cas d'utilisation des fenêtres sinusoïdales classiques. Ainsi la mémoire MDCT avec des fenêtres d'analyse-synthèse spéciales à bas retard ne contient que 140 échantillons indépendants (non repliés avec la trame actuelle) contrairement aux 320 échantillons dans le cas d'utilisation des fenêtres sinusoïdales classiques.
On peut en effet remarquer sur la figure 6 pour les fenêtres d'analyses (Ana.), que la zone de repliement est limitée par les traits en pointillés entre les échantillons 820 et 1100. La ligne de repliement est représentée en trait mixte à l'échantillon 960.
Pour la synthèse (Synth.), seuls les échantillons représentés par l'intervalle M (140 échantillons) sont nécessaires pour obtenir l'information sur la zone de repliement de l'analyse, en exploitant la symétrie. Ces échantillons contenus en mémoire sont alors utiles pour décoder cette zone de repliement en utilisant également les échantillons repliés de la fenêtre de la trame suivante. Dans le cas d'une attaque dans cette zone entre les échantillons 820 et 1100 l'énergie moyenne des échantillons représentés par l'intervalle M est nettement supérieure à l'énergie de sous-trames précédant l'échantillon 820. L'augmentation brusque de l'énergie de l'intervalle M contenue dans la mémoire MDCT peut donc signaler une attaque dans la trame suivante qui peut engendrer un pré -écho dans la trame courante.
On utilise la mémoire MDCT xMDCT (n) qui donne une version avec repliement temporel ("folding" en anglais) du signal futur. Avec les fenêtres d'analyse-synthèse spéciales à bas retard comme illustrées en figure 6, on ne retient qu'un (K'=l) bloc de longueur Lm(0)=140 qui contient tous les échantillons indépendants de la mémoire MDCT. Malgré le nombre d'échantillons supérieur dans ce sous-bloc, son énergie reste comparable avec celle des sous-blocs de la trame courante (si le signal reste stable) car la partie mémoire a été fenêtrée (donc atténuée) par la fenêtre d'analyse.
En effet, la figure 1 montre que le pré-écho influence la trame qui précède la trame où se situe l'attaque, et il est souhaitable de détecter une attaque dans la trame future qui est en partie contenue dans la mémoire MDCT.
La trame courante et la mémoire MDCT peuvent être vues comme des signaux concaténés formant un signal découpé en (Κ+Κ') sous-blocs consécutifs. Dans ces conditions, on définit l'énergie dans le k-ième sous-bloc comme :
En {k) = k = 0, ..., K -l
quand le k-ième sous-bloc se situe dans la trame courante et, comme:
2
En (k) = ∑ xMDCT {n) quand le sous-bloc est dans la mémoire MDCT (qui représente le signal disponible pour la trame future) et Lmem est la longueur du sous-bloc de la partie mémoire :
L'énergie moyenne des sous-blocs dans la trame courante s'obtient donc comme :
1 K-l
En =—∑En (k)
On définit également l'énergie moyenne des sous-blocs dans la deuxième partie de la trame courante comme (supposant que K est un nombre pair):
2 K~1
En ' =— ∑ En (k)
K k=KI2 Une attaque associée à un pré -écho est détectée si le rapport max (Era (ra))
R(k) = "-°·κ+κ ~1— dépasse un seuil prédéfini, dans un des sous-blocs considérés.
En (k )
D'autres critères de détection de pré -écho sont possibles sans changer la nature de l'invention.
Par ailleurs, on considère que la position de l'attaque est définie comme nos = min ΖΛ [ arg max (En (k)) \ , L
\ k=o,K+K -i ' /
où la limitation à L assure que la mémoire MDCT n'est jamais modifiée. D'autres méthodes d'estimation plus précise de la position de l'attaque sont également possibles.
Le dispositif 600 comporte également un module 602 de discrimination de zone de pré-écho mettant en œuvre une étape de détermination (E602) d'une zone de préécho (ZPE) précédant la position d'attaque détectée. On appelle ici zone de pré -écho la zone couvrant les échantillons avant la position estimée de l'attaque qui sont perturbés par le préécho engendré par l'attaque et où l'atténuation de ce pré -écho est souhaitable. Dans le mode de réalisation présenté la zone de pré -écho peut être déterminée sur le signal décodé.
Dans un mode de réalisation d'obtention des zones de pré-échos, les énergies
En k ) sont concaténées en ordre chronologique, avec d'abord l'enveloppe temporelle du signal décodé, puis l'enveloppe du signal de la trame suivante estimée à partir de la mémoire de la transformée MDCT. En fonction de cette enveloppe temporelle concaténée et des énergies moyennes En et En ' de la trame précédente, la présence de pré-écho est détectée par exemple si le rapport R(k) dépasse un seuil, typiquement ce seuil est 16.
Les sous-blocs dans lesquels un pré-écho a été détecté constituent ainsi une zone de pré-écho, qui en général couvre les échantillons n = 0, · · · , pos - \ , soit du début de la trame courante à la position de l'attaque ( pos ). On peut aussi noter que la zone de pré-écho peut très bien s'étendre sur toute la trame courante si l'attaque a été détectée dans la trame future.
Le dispositif 600 comporte un module 603 de calcul apte à mettre en œuvre une étape de calcul d'un coefficient directeur (ou indicateur de tendance de variation) des énergies des sous-blocs précédant le sous-bloc dans lequel une attaque a été détectée.
On définit le modèle linéaire qui représente un ensemble de n réalisations (ti; e , 0<=i<n où tj sont les indices temporels des sous-blocs et ej leurs énergies, avec l'équation e = b0 + bxt (1) Où b0 est la valeur à l'instant t=0 et bi est le coefficient directeur. Le coefficient directeur donne l'information sur la tendance (moyenne) de variation de l'énergie. Un coefficient directeur positif signale une augmentation des énergies. Une valeur proche de 0 signale une énergie constante.
On peut déterminer la valeur de bi par exemple par régression linéaire selon les moindre carrés :
Où la sommation est effectuée sur des indices i prédéterminés.
La valeur de bi dépend également de la grandeur (en valeur absolue) des énergies ; elle est en effet homogène avec l'énergie sur le temps. Pour pouvoir mieux comparer la valeur de bi à un seuil (par exemple fixe) on peut supprimer cette dépendance. Par exemple, la valeur de bi peut être divisée par la valeur moyenne des énergies pour obtenir le coefficient directeur normalisé :
De façon alternative on pourra prendre le coefficient de corrélation.
Cette solution alternative a une complexité de calcul plus élevée car elle nécessite de calculer une racine carrée.
D'autres méthodes d'estimation du coefficient directeur sont également possibles comme par exemple la méthode médiane-médiane de Tukey.
On peut également noter que lorsque le coefficient directeur doit être comparé à un seuil de valeur nulle - ce qui revient à vérifier le signe de ce coefficient - il n'est pas nécessaire de normaliser ce coefficient. Par ailleurs, au lieu de normaliser le coefficient directeur, il sera possible de rendre le seuil variable car les relations suivantes sont équivalentes : b^ n =—— < seuil
Ό < seuil.
n
Si l'attaque est détectée dans le premier ou deuxième sous-bloc la vérification selon l'invention n'est pas possible. Si l'attaque est détectée dans le troisième sous-bloc on dispose de l'énergie de 2 sous-blocs dans la zone de pré -écho, e0 et ei pour faire cette vérification (ei étant le plus proche de l'attaque). Avec 2 points l'équation (3) se simplifie ainsi :
2{e1 - eQ)
bin =——— (5)
et + e0
Si l'attaque est détectée dans le quatrième sous-bloc on dispose de l'énergie de 3 sous-blocs dans la zone de pré-écho, e0, ei et e2 pour faire cette vérification (e2 étant le plus proche de l'attaque). Avec 3 points l'équation (3) se simplifie ainsi :
3(e2 - e0)
bin = ^7————— (6)
2(e2 + e + e0)
Si on dispose de 4 ou plus de sous-blocs on peut calculer le coefficient directeur sur 4 ou plus de sous blocs. L'expérience montre que la vérification du coefficient directeur calculé sur les 3 sous-blocs précédents le sous-bloc où l'attaque a été détectée est suffisante pour éviter les fausses détections des pré-échos - cette conclusion s'applique pour le cas de 8 sous-blocs sur chaque trame de 20 ms et peut être adaptée selon la taille des sous-blocs et de la trame.
Ainsi dans le mode de réalisation privilégié, le coefficient directeur est calculé avec au plus 3 sous-blocs. Ceci permet de limiter la complexité maximale du calcul du coefficient directeur.
Selon l'invention, le coefficient directeur normalisé bln ainsi obtenu est ensuite comparé à l'étape E604 par un module comparateur 604 à un seuil prédéfini. Le seuil peut être prédéfini à une valeur fixe ou peut être variable en fonction par exemple de la classification du signal selon un critère parole ou musique. Typiquement ce seuil est égal à 0 si on vérifie uniquement que l'énergie ne diminue pas ou égale à 0.2 si on impose une légère augmentation de l'énergie dans la zone de pré-écho. Si le coefficient directeur normalisé bin est inférieur à ce seuil on conclut que le signal dans la zone de pré -écho ne correspond pas à un pré -écho typique et on inhibe l'atténuation des pré -échos dans cette zone à l'étape E602. Ainsi on évite qu'un signal décodé dont le signal d'entrée original contient un composant de faible énergie avant une attaque soit modifié/altéré par erreur par le module d'atténuation des pré-échos en détectant ce composant comme un pré-écho.
Une atténuation de pré -écho est mise en œuvre à l'étape E607 par le module d'atténuation 607 pour la zone de pré-écho discriminée. Le facteur d'atténuation est par exemple calculé comme dans la demande FR 08 56248. Dans le cas où le module 604 a détecté une fausse détection de pré-écho, le facteur d'atténuation peut être forcé à 1 inhibant ainsi l'atténuation ou bien le module de discrimination 602 ne discrimine pas cette zone comme une zone de pré -écho, le module d'atténuation n'étant alors pas sollicité.
Dans un mode de réalisation particulier, le dispositif 600 comporte en outre un module 605 de décomposition du signal, apte à effectuer une étape E605 de décomposition du signal décodé en au moins deux sous-signaux selon un critère prédéterminé. Cette méthode est notamment décrite dans la demande FR12 62598 dont on rappelle ici quelques éléments.
Dans une réalisation particulière de l'invention, le signal décodé xrec (n) est décomposé à l'étape E605 en deux sous-signaux de la manière suivante :
le premier sous-signal xmc ssl (n) est obtenu par filtrage passe bas en utilisant un filtre FIR (filtre à réponse impulsionnelle finie) à 3 coefficients et à phase nulle de fonction de transfert c(n)z~l + (l 2c(n)) + c(n)z avec c(n) une valeur comprise entre 0 et 0.25, où [c(w), l— 2c(n), c(n)] sont les coefficients du filtre passe bas ; ce filtre est mis en œuvre avec l'équation aux différences :
xrec,ssi (n) = c(n)xrec (n - \) + (\ - 2c(n)) xrec (n) + c(n)x(n + 1)
Dans un mode particulier de réalisation, on utilise une valeur constante c(n) = 0.25. On peut remarquer que le sous signal xreC SSi (n) résultant de ce filtrage, contient donc des composantes plutôt basses fréquences du signal décodé.
le deuxième sous signal xrec ss2 («) est obtenu par filtrage passe haut complémentaire en utilisant un filtre FIR à 3 coefficients et à phase nulle de fonction de transfert -c(n)z~l + 2c(n) - c(n)z , où [-c(n), 2c(n), -c(n)] sont les coefficients du filtre passe haut ; ce filtre est mis en œuvre avec l'équation aux différences : xrec,SS2 { n ) = - )¾Ε (n - l) + 2c(n)xrec (n) - c(n)x(n + 1) . Le sous signal xreCtSs2 (n) résultant de ce filtrage, contient donc des composantes plutôt hautes fréquences du signal décodé.
A noter que xrec ssl {n) + xrec ss2 (n) = xrec (n) .
Il est donc également possible d'obtenir xrec ss2 {n) en soustrayant xrec ssl {n) de xrec in) ce qui réduit la complexité des calculs : xrec ss2 (n) = xrec {n) - xrec ssl (n)
La combinaison des sous-signaux atténués pour l'obtention du signal atténué Sa est faite par simple addition des sous-signaux atténués à l'étape E608 décrite ultérieurement.
Pour ne pas utiliser de signal futur pour ces filtrages, on peut par exemple compléter le signal décodé par un échantillon à 0 à la fin du bloc. Dans le cas du signal décodé complété par un échantillon à 0 à la fin du bloc pour n=L-l le sous signal xmc ssl (n) est obtenu par :
^ (i -l) = -l)^ (i - 2) + (l-2c(L-l)) irec (L -l) , xrec ,ss2 in) est toujours calculé comme xrec ss2 (n) = xrec {n) - xrec ssl {n) .
On peut noter que les deux sous-signaux restent ici à la même fréquence d'échantillonnage que le signal décodé.
Une étape E606 de calcul de facteurs d'atténuation de pré -écho est mise en œuvre dans le module de calcul 606. Ce calcul est fait séparément pour les deux sous signaux.
Ces facteurs d'atténuation sont obtenus par échantillon de la zone de pré -écho déterminée en E602 en fonction de la trame dans laquelle l'attaque a été détectée et de la trame précédente.
On obtient alors les facteurs gpre ssl (n) et gpre ss2 (n) où n est l'indice de l'échantillon correspondant. Ces facteurs seront éventuellement lissés pour obtenir les facteurs gpre ssi (n) et gpre ss2 (n) respectivement. Ce lissage est surtout important pour les sous signaux contenant les composantes basse-fréquence (donc pour gpre ssl (n) dans cet exemple).
Un exemple de réalisation de calcul d' atténuation est décrit dans la demande de brevet FR 08 56248. Les facteurs d'atténuations sont calculés par sous-bloc. Dans le procédé décrit ici, ils sont en plus calculés séparément pour chaque sous signal. Pour les échantillons précédant l'attaque détectée, on calcule donc les facteurs d'atténuation gpre-ssi (n) et
SPre,ss2 (n) · Ensuite ces valeurs d'atténuations sont éventuellement lissées pour obtenir les valeurs d'atténuation par échantillon.
Le calcul du facteur d'atténuation d'un sous-signal (par exemple gpretSs2 (n) ) peut être similaire à celui décrit dans la demande de brevet FR 08 56248 pour le signal décodé en fonction du rapport R(k) (utilisé également pour la détection de l'attaque) entre l'énergie du sous-bloc de plus forte énergie et l'énergie du k-ième sous-bloc du signal décodé. On initialise gpre-ss2 (n) comme: gpre, (n) = g {k) = f {R(k)) , n = kL ..., {k + l) L'-l-, k = 0, ..., K -l
où /est une fonction décroissante à valeurs entre 0 et 1, par exemple f=0 si R(k) <= 16, f = 0.1 si 16 > R(k) >= 32 et f=0.01 si r(k) >32.
Si la variation de l'énergie par rapport à l'énergie maximale est faible, aucune atténuation n'est alors nécessaire. Le facteur est alors fixé à une valeur d'atténuation inhibant l'atténuation, c'est-à-dire 1. Sinon, le facteur d'atténuation est compris entre 0 et 1. Cette initialisation peut être commune pour tous les sous-signaux.
Les valeurs d'atténuation sont ensuite affinées par sous-signal pour pouvoir régler le niveau d'atténuation optimal par sous-signal en fonction des caractéristiques du signal décodé. Par exemple les atténuations peuvent être limitées en fonction de l'énergie moyenne du sous-signal de la trame précédente car il n'est pas souhaitable qu'après le traitement d'atténuation de pré-écho, l'énergie du signal devienne inférieure à l'énergie moyenne par sous-bloc du signal précédant la zone de traitement (typiquement celle de la trame précédente ou celle de la deuxième moitié de la trame précédente).
Cette limitation peut être faite de façon similaire à celle décrite dans la demande de brevet FR 08 56248. Par exemple pour le deuxième sous-signal xreC Ss2 {n) on calcule d'abord l'énergie dans les K sous-bloc de la trame courante comme :
(fc+l)i'-l
EnAk) = ∑ 2 («)2 ' k=o, ..., :-i
n=kL'
On connaît également par mémorisation l'énergie moyenne de la trame précédente Enss2 et celle de la deuxième moitié de la trame précédente Enss2 ' qui peuvent être calculés (à la trame précédente) comme : l K-l
En n =—y y / En n (k )
K k=0
et
2 K~l
En ' =— En n (k)
-^- k=K/2
où les indices de sous-bloc de 0 à K correspondent à la trame courante.
Pour le sous-bloc k à traiter on peut calculer la valeur limite du facteur lim^ ss2 (k) afin d'obtenir exactement la même énergie que l'énergie moyenne par sous-bloc du segment précédant le sous-bloc à traiter. Cette valeur est bien sûr limitée à un maximum de 1 puisqu'on 'intéresse ici aux valeurs d'atténuation. Plus précisément :
où l'énergie moyenne du segment précédent est approximée par max y Enssl , Enssi ' .
La valeur lim , (k) ainsi obtenue sert de limite inférieure dans le calcul final du facteur d'atténuation du sous-bloc :
8pre, (n) = max ( gpre (n), \img ss2 (k )^ , n = kL', ..., (k + i) L '- l; k = 0, ..., K - 1
Dans une première variante de réalisation la zone de pré -écho où l'atténuation s'étend du début de la trame courante jusqu'au début du sous-bloc dans lequel l'attaque a été détecté - jusqu'à l'indice pos où pos = min ( . ^arg max (£>ζ (& )) | , Ζ,Υ Les atténuations associées aux échantillons du sous-bloc de l'attaque sont toutes mises à 1 même si attaque se situe vers la fin de ce sous-bloc.
Dans une autre variante de réalisation la position de début de l'attaque pos est affinée dans le sous-bloc de l' attaque, par exemple en découpant le sous-bloc en sous-sous- blocs et en observant l'évolution de l'énergie de ces sous-sous-blocs. Supposons que la position du début de l'attaque est détectée dans le sous-bloc k, k>0 et le début de l'attaque raffiné pos se trouve dans ce sous-bloc, les valeurs d'atténuation pour les échantillons de ce sous-bloc qui se trouvent avant l'indice pos peuvent être initialisées en fonction de la valeur d' atténuation correspondant au dernier échantillon du sous-bloc précédent : §We,ssi (Π) = gpre, (kL' - l), n = kL ..., pos -l
Toutes les atténuations à partir de l'indice pos sont mises à 1.
Pour le premier sous-signal contenant les composantes basses fréquences du signal décodé, le calcul des valeurs d'atténuation en se basant sur le sous-signal xrec ssl (n) peut être similaire au calcul des valeurs d'atténuation en se basant sur le signal décodé xrec (n) . Ainsi, dans une variante de réalisation, par souci de réduction de complexité de calcul, les valeurs d'atténuation peuvent être déterminées en se basant sur le signal décodé xrec (n) . Dans le cas où la détection des attaques est faite sur le signal décodé il n'est donc plus nécessaire de recalculer des énergies des sous-blocs car pour ce signal les valeurs d'énergie par sous-bloc sont déjà calculées pour détecter les attaques. Comme pour la grande majorité des signaux les basses fréquences sont beaucoup plus énergétiques que les hautes fréquences, les énergies par sous-bloc du signal décodé xrec (n) et du sous signal xmc ssl [n) sont très proches, cette approximation donne un résultat très satisfaisant.
Les facteurs d'atténuation gpre ssi (n) et g pre ss2 ( TÎ ) déterminés par sous-blocs peuvent être ensuite lissés par une fonction de lissage appliquée échantillon par échantillon pour éviter des variations brusques du facteur d'atténuation aux frontières des blocs. Ceci est particulièrement important pour les sous-signaux contenant des composantes basses fréquences comme le sous-signal xmc ssi (n) mais pas nécessaire pour les sous-signaux ne contenant que des composantes hautes fréquences comme le sous signal xrec ss2 [n) .
La figure 7 illustre un exemple d'application d'un gain d'atténuation avec des fonctions de lissage représentées par les flèches L.
Cette figure illustre en a), un exemple de signal original, en b), le signal décodé sans atténuation de pré -écho, en c), les gains d'atténuation pour les deux sous-signaux obtenus selon l'étape de décomposition E605 et en d), le signal décodé avec atténuation de pré-écho des étapes E607 et E608 (c'est-à-dire après combinaison des deux sous-signaux atténués).
On peut remarquer sur cette figure que le gain d'atténuation représenté en trait pointillé et correspondant au gain calculé pour le premier sous-signal comportant des composantes basses fréquences, comporte des fonctions de lissage comme décrit ci-dessus. Le gain d'atténuation représenté en trait plein et calculé pour le deuxième sous-signal comportant des composantes hautes fréquences, ne comporte pas de gain de lissage.
Le signal représenté en d) montre bien que le pré -écho a été atténué de façon efficace par le traitement d'atténuation mis en œuvre.
La fonction de lissage est par exemple définie de préférence par les équations suivantes:
u—\
gpre,ssl («) = ~Σ§ pre (« ~ « = 0, · · · , L - 1
u ;=o
avec la convention que gpre ssl (n) n =—{u— !),■■■ ,—\ sont les derniers u-1 facteurs d'atténuation obtenus pour les derniers échantillons du sous-bloc précédent du sous-signal xrec ss\ in) · Typiquement u = 5 mais une autre valeur pourrait être utilisée. En fonction du lissage utilisé, la zone de pré-écho (le nombre des échantillons atténués) peut donc être différente pour les 2 sous-signaux traités séparément, même si la détection de l'attaque est faite en commun sur la base du signal décodé.
Le facteur d' atténuation lissé ne remonte pas à 1 au moment de l' attaque, ce qui implique une diminution de l' amplitude de l' attaque. L'impact perceptible de cette diminution est très faible mais doit néanmoins être évité. Pour pallier à ce problème la valeur de facteur d'atténuation peut être forcée à 1 pour les u-1 échantillons précédant l'indice pos où se situe le début de l'attaque. Ceci est équivalent à avancer le marqueur pos de u-1 échantillons pour le sous signal où le lissage est appliqué. Ainsi la fonction de lissage accroît progressivement le facteur pour avoir une valeur 1 au moment de l'attaque. L' amplitude de l'attaque est alors préservée.
Dans ce mode de réalisation avec décomposition du signal, la vérification de l'augmentation de l'énergie de la zone de pré -écho selon l'invention est réalisée pour au moins un sous-signal ou pour chacun de ces sous-signaux.
Le seuil de comparaison utilisé peut être différent selon les sous-signaux et selon le nombre de sous-blocs disponibles avant attaque.
Si dans au moins un sous-signal le coefficient directeur normalisé bin est inférieur au seuil de ce sous-signal, on inhibe l'atténuation des pré-échos pour l'ensemble des sous- signaux.
En cas de pré -écho dans un signal issu d'une transformée MDCT inverse l'énergie du composant pré-écho augmente ou est au moins stable dans tous les sous-signaux. L'inhibition de traitement de pré -écho peut être faite par exemple en mettant les facteurs d' atténuations à 1 ou en ne discriminant pas la zone comme zone de pré-écho, le module de traitement d'atténuation de pré-écho n'étant alors pas sollicité comme illustré à titre d'exemple dans le mode de réalisation de la figure 5 par le lien entre le bloc 604 et 602.
Dans des variantes, l'atténuation sera inhibée séparément pour chaque sous-signal dès que le coefficient directeur normalisé bin est inférieur au seuil de ce sous-signal. L'inhibition pourra être par exemple mise en œuvre en mettant les facteurs d'atténuation à 1 ou en ne sollicitant pas le module de pré -écho pour le sous-signal considéré.
Ainsi, dans le mode de réalisation particulier décrit ci-dessus avec décomposition en deux sous-signaux, si le nombre de sous-blocs avant l'attaque permet de faire cette vérification, on vérifie dans les deux sous-signaux l'évolution de l'énergie des sous-blocs précédant le sous-bloc où l'attaque a été détectée, par régression linéaire. Cette vérification peut être faite selon les étapes E603 et E604, à n'importe quel moment après la division du signal décodé en sous-signaux (E605) et avant l'application des facteurs d'atténuation des pré-échos (E607). La vérification est possible si au moins deux sous-blocs précèdent le sous- bloc où l'attaque a été détectée. Si l'attaque est détectée dans le premier ou deuxième sous- bloc la vérification selon l'invention n'est pas possible.
Dans des variantes, on pourra ré-utiliser le(s) coefficient(s) directeur(s) éventuellement calculé(s) dans la trame précédente si l'attaque est détectée dans le premier ou deuxième sous-bloc de la trame courante.
Si l'attaque est détectée dans le troisième sous-bloc on dispose alors de l'énergie de deux sous-blocs dans la zone de pré -écho pour faire cette vérification. Par expérience, avec deux points, la vérification n'est pas suffisamment fiable dans le sous-signal basse-fréquence xrec ss\ n )■ On vérifie alors uniquement le sous-signal haute-fréquence xrec ss2 {n) et uniquement que l'énergie ne diminue pas. Le coefficient directeur du sous-signal haute- fréquence xrec ss2 (n) est comparé au seuil de valeur 0. Seul son signe est important ici, il n'est pas nécessaire de faire une normalisation. Il suffit donc de calculer à l'étape E603 un coefficient directeur simple (sans normalisation) comme:
blss2 = Enss2 (ï) - Enss2 (0)
Si biss2 est inférieur à 0, l'atténuation des pré -échos pour cette zone de pré-écho est inhibé pour l'ensemble des sous-signaux. Si l'attaque est détectée dans le quatrième sous-bloc ou un sous-bloc d'indice supérieur à 4, on vérifie l'évolution de l'énergie des derniers 3 sous-blocs dans la zone de pré-écho précédant le sous-bloc où attaque a été détectée. Le coefficient directeur du sous- signal basse-fréquence xrec ssl (n) est comparé à 0, seul son signe est important et il n'est pas nécessaire de normaliser ce coefficient. Il suffit donc de calculer un coefficient directeur simple. Si l' attaque a été détectée dans le sous-bloc de l'indice id avec id >= 3 on détermine ce coefficient comme :
bissi = En(id— 1)— Enss2 (id— 3)
Si b issi est inférieur à 0 on inhibe l'atténuation des pré -échos pour cette zone de pré-écho, et pour l'ensemble des sous-signaux. Le coefficient directeur du sous-signal haute-fréquence xrec ss2 {n) est comparé à un seuil de valeur 0.2. On calcule le coefficient directeur normalisé. Si l'attaque a été détectée dans le sous-bloc de l'indice id avec id >= 3 on détermine ce coefficient comme :
3 {Enss2 (id - 1) - Enss2 id - 2) )
mss2 2{Enss2 (id— 1) + Enss2 (id— 2) + Enss2 (id— 3) )
Si binss2 est inférieur à 0.2 on inhibe l'atténuation des pré-échos pour cette zone de pré-écho, et pour l'ensemble des sous-signaux.
A noter que la condition
3 (Enss2 (id - 1) - Enss2 (id - 2) ) ^
2(Enss2 (id— 1) + Enss2 (id— 2) + Enss2 (id— 3) )
est équivalente à
1
Enss2 (id - 1) - Enss2 (id - 2) <— (Enss2 (id - 1) + Enss2 (id - 2) + Enss2 (id - 3) J évitant ainsi une opération de division pour réduire la complexité et pour faciliter la mise en œuvre sur un processeur DSP (pour "Digital Signal Processor") à arithmétique à virgule fixe.
Le module 607 du dispositif 600 de la figure 5 met en œuvre l'étape E607 d'atténuation de pré-écho dans la zone de pré-écho de chacun des sous-signaux par application aux sous-signaux des facteurs d'atténuation ainsi calculés.
L'atténuation de pré-écho est donc faite de façon indépendante dans les sous signaux. Ainsi, dans les sous signaux représentants différentes bandes de fréquence, l'atténuation peut être choisie en fonction de la répartition spectrale du pré -écho. Enfin, une étape E608 du module d'obtention 608 permet d'obtenir le signal de sortie atténué (le signal décodé après atténuation de pré-écho) par combinaison (dans cet exemple par simple addition) des sous-signaux atténués, selon l'équation:
Xrec,f in) = Spre.ssl (n)Xrec,SSl («) + S pre.ssl (n)Xrec,SS2 ( ) , Π = 0, · · · , L - 1
Contrairement à une décomposition en sous-bandes classique, on peut noter ici que les filtrages utilisés ne sont pas associés à des opérations de décimation des sous-signaux et la complexité et le retard ("lookahead" ou trame future) sont réduits au minimum.
Un exemple de réalisation d'un dispositif de discrimination et de traitement d'atténuation selon l'invention est maintenant décrit en référence à la figure 8.
Matériellement, ce dispositif 100 au sens de l'invention comporte typiquement, un processeur μΡ coopérant avec un bloc mémoire BM incluant une mémoire de stockage et/ou de travail, ainsi qu'une mémoire tampon MEM précitée en tant que moyen pour mémoriser toutes données nécessaire à la mise en œuvre du procédé de discrimination et de traitement d'atténuation tel que décrit en référence à la figure 5. Ce dispositif reçoit en entrée des trames successives du signal numérique Se et délivre le signal Sa reconstruit avec atténuation de pré-écho dans les zones de pré -écho discriminées avec le cas-échéant reconstruction du signal atténué par combinaison de sous-signaux atténués.
Le bloc mémoire BM peut comporter un programme informatique comportant les instructions de code pour la mise en œuvre des étapes du procédé selon l'invention lorsque ces instructions sont exécutées par un processeur μΡ du dispositif et notamment les étapes de calcul d'un coefficient directeur des énergies pour au moins deux sous-blocs précédant le sous-bloc dans lequel une attaque est détectée, de comparaison du coefficient directeur à un seuil prédéfini et d'inhibition du traitement d'atténuation de pré -écho dans la zone de préécho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini.
La figure 5 peut illustrer l'algorithme d'un tel programme informatique.
Ce dispositif de discrimination et de traitement d'atténuation selon l'invention peut être indépendant ou intégré dans un décodeur de signal numérique. Un tel décodeur peut être intégré à des équipements de stockage ou de transmission de signaux audionumériques tels que des passerelles de communication, des terminaux de communication ou des serveurs d'un réseau de communication.

Claims

REVENDICATIONS
Procédé de discrimination et d'atténuation de pré -écho dans un signal audionumérique engendré à partir d'un codage par transformée, dans lequel, au décodage, pour une trame courante décomposée en sous-blocs, les sous-blocs de basse énergie précédant un sous-bloc dans lequel une transition ou attaque est détectée (E601) déterminent une zone de pré -écho (E602) dans laquelle un traitement d'atténuation de pré -écho est effectué (E607), le procédé étant caractérisé en ce que, dans le cas où une attaque est détectée à partir du troisième sous-bloc de la trame courante, il comporte les étapes suivantes:
- calcul (E603) d'un coefficient directeur des énergies pour au moins deux sous-blocs de la trame courante précédant le sous-bloc dans lequel une attaque est détectée;
- comparaison (E604) du coefficient directeur à un seuil prédéfini; et
- inhibition (E602) du traitement d'atténuation de pré-écho dans la zone de pré -écho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini.
Procédé selon la revendication 1 , caractérisé en ce qu'il comporte en outre une étape de décomposition du signal audionumérique en au moins deux sous-signaux en fonction d'un critère fréquentiel et en ce que les étapes de calcul de comparaison sont effectuées pour au moins un des sous-signaux.
Procédé selon la revendication 1 , caractérisé en ce qu'il comporte en outre une étape de décomposition du signal audionumérique en au moins deux sous-signaux en fonction d'un critère fréquentiel et en ce que les étapes de calcul et de comparaison sont effectuées pour chacun des sous-signaux, l'inhibition du traitement d'atténuation de pré-écho dans la zone de pré-écho de tous les sous-signaux s'effectuant quand un coefficient directeur calculé est inférieur au seuil prédéfini pour au moins un sous-signal.
Procédé selon la revendication 3, caractérisé en ce qu'un seuil différent est défini par sous-signal.
Procédé selon l'une des revendications 1 à 4, caractérisé en ce que le coefficient directeur est calculé selon une méthode d'estimation des moindres carrés.
6. Procédé selon l'une des revendications 1 à 5, caractérisé en ce que le coefficient directeur est normalisé.
7. Procédé selon la revendication 1, caractérisé en ce que dans le cas où une attaque est détectée dans le premier ou deuxième sous-bloc de la trame courante, un coefficient directeur calculé pour la trame précédente est utilisé pour l'étape de comparaison.
8. Dispositif de discrimination et d'atténuation de pré-écho dans un signal audionumérique engendré par un codeur par transformée, le dispositif étant associé à un décodeur et comportant un module de détection (601) de transition ou attaque, un module de discrimination de zone de pré-écho (602) et un module de traitement d'atténuation de pré-écho (607), un traitement d'atténuation d'écho étant effectué pour une trame courante décomposée en sous-blocs, dans les sous-blocs de faible énergie précédant un sous-bloc dans lequel une transition ou attaque est détectée déterminant une zone de pré-écho, le dispositif étant caractérisé en ce qu'il comporte en outre:
- un module de calcul (603) calculant un coefficient directeur des énergies pour au moins deux sous-blocs de la trame courante précédant le sous-bloc dans lequel une attaque est détectée, dans le cas où une attaque est détectée à partir du troisième sous bloc de la trame courante ;
- un comparateur (604) apte à effectuer une comparaison du coefficient directeur à un seuil prédéfini; et
-un module de discrimination (602) apte à inhiber le traitement d'atténuation de pré -écho dans la zone de pré -écho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini.
9. Décodeur de signal audionumérique comportant un dispositif de discrimination et d'atténuation de pré-écho selon la revendication 8.
10. Programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé selon l'une des revendications 1 à 7, lorsque ces instructions sont exécutées par un processeur.
11. Support de stockage lisible par un dispositif de discrimination et de traitement d'atténuation de pré-écho sur lequel est enregistré un programme informatique comprenant des instructions de code pour l'exécution des étapes du procédé de discrimination et de traitement d'atténuation de pré-écho selon l'une des revendications 1
EP15771686.1A 2014-09-12 2015-09-11 Discrimination et atténuation de pré-échos dans un signal audionumérique Active EP3192073B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1458608A FR3025923A1 (fr) 2014-09-12 2014-09-12 Discrimination et attenuation de pre-echos dans un signal audionumerique
PCT/FR2015/052433 WO2016038316A1 (fr) 2014-09-12 2015-09-11 Discrimination et atténuation de pré-échos dans un signal audionumérique

Publications (2)

Publication Number Publication Date
EP3192073A1 true EP3192073A1 (fr) 2017-07-19
EP3192073B1 EP3192073B1 (fr) 2018-08-01

Family

ID=51842602

Family Applications (1)

Application Number Title Priority Date Filing Date
EP15771686.1A Active EP3192073B1 (fr) 2014-09-12 2015-09-11 Discrimination et atténuation de pré-échos dans un signal audionumérique

Country Status (8)

Country Link
US (1) US10083705B2 (fr)
EP (1) EP3192073B1 (fr)
JP (2) JP6728142B2 (fr)
KR (1) KR102000227B1 (fr)
CN (2) CN112086107B (fr)
ES (1) ES2692831T3 (fr)
FR (1) FR3025923A1 (fr)
WO (1) WO2016038316A1 (fr)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique
EP3382700A1 (fr) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil et procede de post-traitement d'un signal audio à l'aide d'une détection d'emplacements transitoires
US11100942B2 (en) * 2017-07-14 2021-08-24 Dolby Laboratories Licensing Corporation Mitigation of inaccurate echo prediction
JP7172030B2 (ja) * 2017-12-06 2022-11-16 富士フイルムビジネスイノベーション株式会社 表示装置及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL249503A (fr) 1959-03-19
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
FR2739736B1 (fr) * 1995-10-05 1997-12-05 Jean Laroche Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio
JP3660599B2 (ja) * 2001-03-09 2005-06-15 日本電信電話株式会社 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
WO2005057801A2 (fr) * 2003-12-05 2005-06-23 Plexus Networks, Inc. Annulation de d'echo/diaphonie en mode mixte faible puissance dans des communications par fils
CA2457988A1 (fr) * 2004-02-18 2005-08-18 Voiceage Corporation Methodes et dispositifs pour la compression audio basee sur le codage acelp/tcx et sur la quantification vectorielle a taux d'echantillonnage multiples
TWI275074B (en) * 2004-04-12 2007-03-01 Vivotek Inc Method for analyzing energy consistency to process data
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
JP5295372B2 (ja) 2008-09-17 2013-09-18 フランス・テレコム デジタルオーディオ信号におけるプリエコーの減衰
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
KR101405022B1 (ko) * 2009-09-18 2014-06-10 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 상기 방법을 수행하는 소프트웨어 프로그램 및 컴퓨터 프로그램 제품을 포함하는 저장 매체
US8582443B1 (en) * 2009-11-23 2013-11-12 Marvell International Ltd. Method and apparatus for virtual cable test using echo canceller coefficients
CN103325379A (zh) * 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CN103391381B (zh) * 2012-05-10 2015-05-20 中兴通讯股份有限公司 回声消除方法及装置
FR2992766A1 (fr) 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
CN103730125B (zh) * 2012-10-12 2016-12-21 华为技术有限公司 一种回声抵消方法和设备
FR3000328A1 (fr) * 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
FR3023036A1 (fr) * 2014-06-27 2016-01-01 Orange Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique

Also Published As

Publication number Publication date
JP7008756B2 (ja) 2022-01-25
CN112086107B (zh) 2024-04-02
WO2016038316A1 (fr) 2016-03-17
JP2020170187A (ja) 2020-10-15
EP3192073B1 (fr) 2018-08-01
ES2692831T3 (es) 2018-12-05
JP6728142B2 (ja) 2020-07-22
US10083705B2 (en) 2018-09-25
KR20170055515A (ko) 2017-05-19
KR102000227B1 (ko) 2019-07-15
FR3025923A1 (fr) 2016-03-18
CN106716529B (zh) 2020-09-22
CN106716529A (zh) 2017-05-24
US20170263263A1 (en) 2017-09-14
CN112086107A (zh) 2020-12-15
JP2017532595A (ja) 2017-11-02

Similar Documents

Publication Publication Date Title
EP2002428B1 (fr) Procede de discrimination et d&#39;attenuation fiabilisees des echos d&#39;un signal numerique dans un decodeur et dispositif correspondant
EP2867893B1 (fr) Atténuation efficace de pré-échos dans un signal audionumérique
EP1789956B1 (fr) Procede de traitement d&#39;un signal sonore bruite et dispositif pour la mise en oeuvre du procede
CA2436318C (fr) Procede et dispositif de reduction de bruit
EP2936488B1 (fr) Atténuation efficace de pré-échos dans un signal audionumérique
EP2586133B1 (fr) Contrôle d&#39;une boucle de rétroaction de mise en forme de bruit dans un codeur de signal audionumérique
EP2153438B1 (fr) Post-traitement de reduction du bruit de quantification d&#39;un codeur, au decodage
FR2741217A1 (fr) Procede et dispositif permettant d&#39;eliminer les bruits parasites dans un systeme de communication
EP3192073B1 (fr) Discrimination et atténuation de pré-échos dans un signal audionumérique
EP0506535B1 (fr) Procédé et système de traitement des pré-échos d&#39;un signal audio-numérique codé par transformée fréquentielle
EP2347411B1 (fr) Attenuation de pre-echos dans un signal audionumerique
WO1999014737A1 (fr) Procede de detection d&#39;activite vocale
EP1039736A1 (fr) Procédé et disposiif d&#39;identification adaptive, et annuleur d&#39;écho adaptive mettant en oeuvre un tel procédé
EP1021805B1 (fr) Procede et disposition de conditionnement d&#39;un signal de parole numerique
EP2515300A1 (fr) Procédé et système de réduction du bruit
WO2014199055A1 (fr) Controle du traitement d&#39;attenuation d&#39;un bruit de quantification introduit par un codage en compresssion

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20170404

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
REG Reference to a national code

Ref country code: DE

Ref legal event code: R079

Ref document number: 602015014397

Country of ref document: DE

Free format text: PREVIOUS MAIN CLASS: G10L0025210000

Ipc: G10L0019260000

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RIC1 Information provided on ipc code assigned before grant

Ipc: G10L 25/21 20130101ALI20180306BHEP

Ipc: G10L 19/26 20130101AFI20180306BHEP

Ipc: G10L 25/51 20130101ALI20180306BHEP

INTG Intention to grant announced

Effective date: 20180323

RIN1 Information on inventor provided before grant (corrected)

Inventor name: KOVESI, BALAZS

Inventor name: RAGOT, STEPHANE

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

Ref country code: AT

Ref legal event code: REF

Ref document number: 1025252

Country of ref document: AT

Kind code of ref document: T

Effective date: 20180815

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602015014397

Country of ref document: DE

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 4

REG Reference to a national code

Ref country code: ES

Ref legal event code: FG2A

Ref document number: 2692831

Country of ref document: ES

Kind code of ref document: T3

Effective date: 20181205

Ref country code: NL

Ref legal event code: MP

Effective date: 20180801

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 1025252

Country of ref document: AT

Kind code of ref document: T

Effective date: 20180801

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20181101

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20181201

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20181102

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20181101

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: RS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: AL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: MC

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602015014397

Country of ref document: DE

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SM

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

REG Reference to a national code

Ref country code: BE

Ref legal event code: MM

Effective date: 20180930

REG Reference to a national code

Ref country code: IE

Ref legal event code: MM4A

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20180911

26N No opposition filed

Effective date: 20190503

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20180911

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20180930

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20180930

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20180930

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20180801

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO

Effective date: 20150911

Ref country code: MK

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20180801

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20230822

Year of fee payment: 9

Ref country code: GB

Payment date: 20230823

Year of fee payment: 9

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20230822

Year of fee payment: 9

Ref country code: DE

Payment date: 20230822

Year of fee payment: 9

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: ES

Payment date: 20231002

Year of fee payment: 9