EP3192073B1 - Discrimination and attenuation of pre-echoes in a digital audio signal - Google Patents
Discrimination and attenuation of pre-echoes in a digital audio signal Download PDFInfo
- Publication number
- EP3192073B1 EP3192073B1 EP15771686.1A EP15771686A EP3192073B1 EP 3192073 B1 EP3192073 B1 EP 3192073B1 EP 15771686 A EP15771686 A EP 15771686A EP 3192073 B1 EP3192073 B1 EP 3192073B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- sub
- echo
- block
- signal
- attenuation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 22
- 238000002592 echocardiography Methods 0.000 title description 11
- 238000000034 method Methods 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 33
- 230000007704 transition Effects 0.000 claims description 21
- 238000001514 detection method Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 6
- 230000005764 inhibitory process Effects 0.000 claims description 6
- 238000003672 processing method Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 17
- 238000009499 grossing Methods 0.000 description 16
- 230000015654 memory Effects 0.000 description 15
- 238000012795 verification Methods 0.000 description 14
- 230000002238 attenuated effect Effects 0.000 description 13
- 238000001914 filtration Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 8
- 230000007423 decrease Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000009527 percussion Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000010162 Tukey test Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000012885 constant function Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Definitions
- the invention relates to a method and a device for discriminating and processing pre-echo attenuation when decoding a digital audio signal.
- compression processes for the transmission of digital audio signals over telecommunications networks, whether for example fixed or mobile networks, or for the storage of signals, compression processes (or source coding) using coding systems which are generally of the linear coding type by linear prediction or by transform frequency coding.
- the method and the device which are the subject of the invention, thus have as their field of application the compression of sound signals, in particular frequency-coded digital audio signals.
- the figure 1 represents for illustrative purposes, a block diagram of the coding and decoding of a digital audio signal by transform including an addition / overlap synthesis analysis according to the prior art.
- Certain musical sequences such as percussion and certain segments of speech like the plosives (/ k /, / t /, ...), are characterized by extremely sudden attacks which result in very fast transitions and a very strong variation signal dynamics in a few samples.
- An example of a transition is given to the figure 1 from sample 410.
- the input signal is cut into blocks of samples of length L whose boundaries are represented on the figure 1 by dotted vertical lines.
- the input signal is denoted x ( n ), where n is the index of the sample.
- L 160 samples.
- the division in blocks, also called frames, operated by the transform coding is totally independent of the sound signal and the transitions can therefore appear at any point in the analysis window. But after transform decoding, the reconstructed signal is tainted by "noise” (or distortion) generated by the quantization (Q) -quantization inverse (Q -1 ) operation.
- This coding noise is temporally distributed relatively uniform throughout the temporal support of the transformed block, that is to say over the entire length of the window length 2L samples (with overlap of L samples).
- the energy of the coding noise is generally proportional to the energy of the block and is a function of the coding / decoding rate.
- the level of the coding noise is typically lower than that of the signal for the high energy segments that immediately follow the transition, but the level is higher than that of the signal for the lower energy segments, especially on the part preceding the transition (samples 160 - 410 of the figure 1 ).
- the signal-to-noise ratio is negative and the resulting degradation can appear very troublesome to listen.
- Pre-echo is the coding noise prior to the transition and post-echo the noise after the transition.
- the human ear also performs a post-masking of a longer duration, from 5 to 60 milliseconds, during the passage of high energy sequences to low energy sequences.
- the rate or level of inconvenience acceptable for post-echoes is therefore greater than for pre-echoes.
- MPEG AAC Advanced Audio Coding
- MPEG AAC Advanced Audio Coding
- Transform encoders used for conversational applications such as ITU-T G.722.1, G.722.1C or G.719, often use a 20 ms frame length and a 40 ms window at 16, 32 or 48 kHz (respectively). It should be noted that the ITU-T G.719 encoder incorporates a window switch mechanism with transient detection, however the pre-echo is not completely reduced at low bit rate (typically at 32 kbit / s).
- Window switching has been mentioned previously; it requires transmitting auxiliary information to identify the type of windows used in the current frame.
- Another solution is to apply adaptive filtering. In the area preceding the attack, the reconstructed signal is seen as the sum of the original signal and the quantization noise.
- the aforementioned filtering process does not allow to find the original signal, but provides a strong reduction of pre-echoes. However, it requires transmitting the additional parameters to the decoder.
- Other definitions of the factor g ( k ) are possible, for example as a function of the energy En ( k ) in the current sub-block and the energy En ( k -1) in the preceding sub-block.
- the factor g ( k ) is set to an attenuation-inhibiting attenuation value, i.e. 1. Otherwise, the attenuation factor is between 0 and 1.
- the frame that precedes the pre-echo frame has a homogeneous energy that corresponds to the energy of a low energy segment (typically a background noise).
- a background noise typically a background noise
- the attenuation factors (or gains) g ( k ) determined by sub-blocks can then be smoothed by a sample-by-sample applied smoothing function to avoid abrupt changes in the attenuation factor at the block boundaries.
- L ' represents the length of a sub-block.
- g pre (-1) is the last attenuation factor obtained for the last sample of the previous sub-block
- the signal is sampled at 32 kHz
- part a) of the figure 2 a frame of an original signal sampled at 32 kHz is shown.
- An attack (or transition) in the signal is located in the sub-block beginning at the index 320.
- This signal has been coded by a low rate (24 kbit / s) MDCT type transform coder.
- part (b) of the figure 2 the result of the decoding without pre-echo processing is illustrated.
- the pre-echo can be observed from sample 160, in the preceding sub-blocks the one containing the attack.
- Part c) shows the evolution of the pre-echo attenuation factor (solid line) obtained by the method described in the aforementioned prior art patent application.
- the dotted line represents the factor before smoothing. Note here that the position of the attack is estimated around the sample 380 (in the block delimited by the samples 320 and 400).
- Part d) illustrates the result of the decoding after application of pre-echo processing (multiplication of signal b) with signal c)).
- pre-echo has been attenuated.
- the figure 2 also shows that the smoothed factor does not go back to 1 at the moment of the attack, which implies a decrease in the amplitude of the attack. The noticeable impact of this decrease is very small but can nevertheless be avoided.
- the figure 3 illustrates the same example as the figure 2 , in which, before smoothing, the attenuation factor value is forced to 1 for the few samples of the sub-block preceding the sub-block where the attack is located. Part (c) of the figure 3 give an example of such a correction.
- the value of factor 1 has been assigned to the last 16 samples of the sub-block preceding the attack, starting from the index 364.
- the smoothing function progressively increases the factor to have a value close to 1 at the moment. of the attack.
- the amplitude of the attack is then preserved, as illustrated in part d) of the figure 3 however, some pre-echo samples are not attenuated.
- Attenuation pre-echo reduction does not reduce the pre-echo to the attack level because of gain smoothing.
- This pre-echo reduction technique is however perfectible for certain types of signals such as modern music signals, for example. Indeed, in some cases, a false pre-echo detection can take place.
- the figure 4 illustrates an example of such an original signal, not coded so without pre-echo. This is a beat of an electronic / synthetic percussion instrument. It can be observed that before the net attack to the index 1600 there is a synthetic noise which starts towards the index 1250. This synthetic noise which is therefore part of the signal would be detected as a pre-echo by the algorithm pre-echo detection described above, assuming perfect signal coding / decoding. The pre-echo attenuation processing would therefore suppress this component of the signal. This would distort the decoded signal (when the coding / decoding is perfect), which is undesirable.
- the present invention improves the state of the art.
- the energy director coefficient calculated for the sub-blocks preceding the position of the attack makes it possible to check the tendency of increase of the energy of the signal in the pre-echo zone. This makes reliable detection of pre-echoes by avoiding false detection of pre-echoes.
- the pre-echo has a typical characteristic: its energy has a growing tendency in approaching the original pre-echo attack.
- the shape of the weighting windows of the addition-overlap explain this. Even if the pre-echo has a nearly constant energy before the overlap-addition, the signals at the input of the add-over module are multiplied by weighting windows whose weight decreases towards the past.
- the energy of the signal before the attack is approximately constant which makes it possible to differentiate it from a pre-echo.
- verification of increasing signal energy in the pre-echo area increases the reliability of the pre-echo detection.
- the method further comprises a step of decomposing the digital audio signal into at least two sub-signals according to a frequency criterion and in that the comparison calculation steps are performed for at least one of the subsignals.
- the energy of two sub-blocks is used in the pre-echo zone to calculate a directional coefficient and compare it to a threshold. With only two points, only the verification for the high-frequency sub-signal in the case of two sub-signal decomposition is sufficient to detect a false pre-echo detection.
- the method further comprises a step of decomposing the digital audio signal into at least two sub-signals as a function of a frequency criterion and in that the calculation and comparison steps are performed for each of the sub-signals, the inhibition of the pre-echo attenuation processing in the pre-echo zone of all the sub-signals performing when a calculated master coefficient is below the predefined threshold for at least one sub-signal.
- the division into sub-signals thus makes it possible to carry out a pre-echo attenuation independently and adapted in the sub-signals.
- the detection reliability of the pre-echo zone is enhanced for each of the sub-signals by checking the value of the respective coefficient coefficients.
- a different threshold is defined by sub-signal.
- the steering coefficient is calculated using a least squares estimation method.
- This calculation method is of low complexity.
- the steering coefficient is normalized.
- a direction coefficient calculated for the previous frame is used for the comparison step.
- the invention relates to a decoder of a digital audio signal comprising a device as described above.
- the invention also relates to a computer program comprising code instructions for implementing the steps of the method as described above, when these instructions are executed by a processor.
- the invention relates to a storage medium, readable by a processor, integrated or not to the processing device, optionally removable, storing a computer program implementing a method of treatment as described above.
- a discrimination device 600 and pre-echo reduction processing is described.
- the attenuation processing device 600 as described below is included in a decoder comprising a reverse quantization module 610 (Q -1 ) receiving a signal S, a reverse transformation module 620 (MDCT -1 ), a module 630 of addition / recap signal reconstruction as described with reference to FIG. figure 1 and delivering a reconstructed signal x rec ( n ) to the attenuation discrimination and processing device according to the invention.
- a decoder comprising a reverse quantization module 610 (Q -1 ) receiving a signal S, a reverse transformation module 620 (MDCT -1 ), a module 630 of addition / recap signal reconstruction as described with reference to FIG. figure 1 and delivering a reconstructed signal x rec ( n ) to the attenuation discrimination and processing device according to the invention.
- MDCT transform which is the most common in speech and audio coding
- the device 600 also applies to any other type of transform (F
- a processed signal Sa is provided in which a pre-echo attenuation has been performed.
- the device 600 implements a discrimination and pre-echo attenuation processing method in the decoded signal x rec ( n ) .
- the discrimination and attenuation processing method includes a step of detecting (E601) attacks that may generate a pre-echo, in the decoded signal x rec ( n ) .
- the device 600 comprises a detection module 601 able to implement a step of detecting (E601) the position of an attack in a decoded audio signal.
- An onset is a rapid transition and a sudden change in the dynamics (or amplitude) of the signal.
- This type of signal may be referred to by the more general term "transient”.
- transient we will use only the terms of attack or transition to designate also transients.
- L 640 samples (20 ms) at 32 kHz
- L' 80 samples (2.5 ms)
- K 8.
- the size of these sub-blocks is therefore identical but the invention remains valid and easily generalizable when the sub-blocks have a variable size. This can be the case for example when the length of the frame L is not divisible by the number of sub-blocks K or if the frame length is variable.
- Special low-delay analysis-synthesis windows similar to those described in ITU-T G.718 are used for the analysis part and for the synthesis part of the MDCT transformation.
- An example of such windows is illustrated with reference to the figure 6 .
- the delay generated by the transformation is only 280 samples in contrast to the delay of 640 samples in the case of use of conventional sinusoidal windows.
- the MDCT memory with special low-delay analysis-synthesis windows contains only 140 independent samples (not folded with the current frame) unlike the 320 samples in the case of using conventional sinusoidal windows.
- the MDCT x MDCT ( n ) memory is used which gives a time-folding version of the future signal.
- L m (0) 140
- the figure 1 shows that the pre-echo influences the frame that precedes the frame where the attack is located, and it is desirable to detect an attack in the future frame which is partly contained in the MDCT memory.
- the current frame and the MDCT memory can be seen as concatenated signals forming a signal cut into (K + K ') consecutive sub-blocks.
- Other pre-echo detection criteria are possible without changing the nature of the invention.
- the device 600 also comprises a pre-echo zone discrimination module 602 implementing a step of determining (E602) a pre-echo zone (ZPE) preceding the detected driving position.
- Pre-echo zone is here referred to as the zone covering the samples before the estimated position of the attack which are disturbed by the pre-echo generated by the attack and where attenuation of this pre-echo is desirable.
- the pre-echo area can be determined on the decoded signal.
- the energies En ( k ) are concatenated in chronological order, with the time envelope of the decoded signal first, then the envelope of the signal of the following estimated frame from the memory of the MDCT transform. According to this concatenated temporal envelope and mean energies In and In of the previous frame, the presence of pre-echo is detected for example if the ratio R ( k ) exceeds a threshold, typically this threshold is 16.
- the device 600 comprises a calculation module 603 capable of implementing a step of calculating a director coefficient (or variation trend indicator) of the energies of the sub-blocks preceding the sub-block in which an attack has been detected.
- the guideline gives information on the (mean) trend of energy change.
- a positive directing coefficient signals an increase in energies.
- a value close to 0 indicates constant energy.
- b 1 ⁇ t i - t ⁇ e i - e ⁇ ⁇ t i - t ⁇ 2
- This alternative solution has a higher computational complexity because it requires calculating a square root.
- the steering coefficient is calculated with at most 3 sub-blocks. This makes it possible to limit the maximum complexity of the calculation of the steering coefficient.
- the normalized standard coefficient b 1n thus obtained is then compared with the step E604 by a comparator module 604 at a predefined threshold.
- the threshold may be predefined to a fixed value or may be variable depending for example on the classification of the signal according to a speech or music criterion. Typically this threshold is equal to 0 if we only check that the energy does not decrease or equal to 0.2 if we impose a slight increase in energy in the pre-echo zone. If the standardized guideline b 1n is below this threshold it is concluded that the signal in the pre-echo zone does not correspond to a typical pre-echo and the pre-echo attenuation in this zone at step E602 is inhibited. Thus, it is avoided that a decoded signal whose original input signal contains a low energy component before an attack is erroneously modified / altered by the pre-echo attenuation module by detecting that component as a pre-echo.
- a pre-echo attenuation is implemented in step E607 by the attenuation module 607 for the discriminated pre-echo area.
- the attenuation factor is for example calculated as in the request FR 08 56248 .
- the attenuation factor can be forced to 1 thus inhibiting the attenuation or the discrimination module 602 does not discriminate this zone as a pre-echo zone. echo, the attenuation module is not requested.
- the device 600 further comprises a signal decomposition module 605, able to perform a step E605 of decomposing the decoded signal into at least two sub-signals according to a predetermined criterion.
- a signal decomposition module 605 able to perform a step E605 of decomposing the decoded signal into at least two sub-signals according to a predetermined criterion. This method is notably described in the application FR12 62598 which we recall here some elements.
- a constant value c ( n ) 0.25 is used.
- the combination of the attenuated sub-signals for obtaining the attenuated signal Sa is made by simply adding the attenuated sub-signals to the step E608 described later.
- a step E606 for calculating pre-echo attenuation factors is implemented in the calculation module 606. This calculation is done separately for the two sub-signals.
- Attenuation factors are obtained by sampling the pre-echo zone determined in E602 as a function of the frame in which the attack was detected and the previous frame.
- the attenuation factors are calculated by sub-block. In the method described here, they are additionally calculated separately for each sub signal. For samples preceding the detected attack, the attenuation factors g pre, ss 1 '( n ) and g pre, ss 2 ' ( n ) are thus calculated. Then these attenuation values are optionally smoothed to obtain the attenuation values per sample.
- g pre, ss 2 '( n ) The calculation of the attenuation factor of a sub-signal (for example g pre, ss 2 '( n )) can be similar to that described in the patent application.
- R ( k ) also used for the detection of the attack
- the factor is then set to a attenuation value that inhibits the attenuation, that is to say 1. Otherwise, the attenuation factor is between 0 and 1. This initialization can be common for all the sub-signals. .
- the attenuation values are then refined by sub-signal to be able to adjust the optimal sub-signal attenuation level based on the characteristics of the decoded signal.
- the attenuations can be limited according to the average energy of the sub-signal of the previous frame because it is not desirable that after the pre-echo attenuation processing, the signal energy becomes less than the average energy per sub-block of the signal preceding the processing zone (typically that of the previous frame or that of the second half of the previous frame).
- the limit value of lim g, ss 2 ( k ) can be calculated in order to obtain exactly the same energy as the average energy per sub-block of the segment preceding the sub-block to be processed. .
- the ' - 1 ; k 0 ... , K - 1
- the attenuations associated with the sub-block samples of the attack are all set to 1 even if the attack is towards the end of this sub-block.
- the start position of the attack pos is refined in the sub-block of the attack, for example by cutting the sub-block into sub-sub-blocks and observing the evolution of the energy of these sub-sub-blocks.
- the calculation of the attenuation values based on the sub-signal x rec, ss 1 ( n ) may be similar to the calculation of the attenuation values by based on the decoded signal x rec ( n ) .
- the attenuation values can be determined based on the decoded signal x rec ( n ) . In the case where the detection of attacks is made on the decoded signal, it is no longer necessary to recalculate energies of the sub-blocks because for this signal the energy values by sub-block are already calculated to detect the attacks.
- the attenuation factors g pre , ss1 ( n ) and g pre , ss 2 ( n ) determined by sub-blocks can then be smoothed by an applied smoothing function sample by sample to avoid abrupt changes in the attenuation factor at block boundaries. This is particularly important for sub-signals containing low frequency components such as sub-signal x rec, ss 1 ( n ) but not necessary for sub-signals containing only high frequency components such as sub-signal x rec, ss 2 ( n ) .
- the figure 7 illustrates an example of applying an attenuation gain with smoothing functions represented by the L arrows.
- This figure illustrates in a), an example of an original signal, in b), the decoded signal without pre-echo attenuation, in c), the attenuation gains for the two sub-signals obtained according to the decomposition step E605 and in d), the decoded signal with pre-echo attenuation of steps E607 and E608 (i.e. after combining the two attenuated sub-signals).
- the attenuation gain represented in dashed line and corresponding to the gain calculated for the first sub-signal comprising low frequency components comprises smoothing functions as described above.
- the attenuation gain represented in solid line and calculated for the second sub-signal comprising high frequency components does not include smoothing gain.
- the signal represented in d) clearly shows that the pre-echo has been effectively attenuated by the attenuation processing implemented.
- the pre-echo zone (the number of attenuated samples) may therefore be different for the 2 sub-signals processed separately, even if the detection of the attack is made in common on the basis of the decoded signal. .
- the smoothed attenuation factor does not go back to 1 at the time of the attack, which implies a decrease in the amplitude of the attack. The noticeable impact of this decrease is very small but must nevertheless be avoided.
- the attenuation factor value can be forced to 1 for the u-1 samples preceding the index pos where the onset of the attack is. This is equivalent to advancing the pos marker of u-1 samples for the sub signal where the smoothing is applied.
- the smoothing function gradually increases the factor to have a value 1 at the time of the attack. The amplitude of the attack is then preserved.
- the verification of the increase of the energy of the pre-echo zone according to the invention is carried out for at least one sub-signal or for each of these sub-signals.
- the comparison threshold used may be different depending on the sub-signals and the number of sub-blocks available before the attack.
- the normalized steering coefficient b 1n is less than the threshold of this sub-signal, the pre-echo attenuation is inhibited for all the sub-signals.
- pre-echo processing can be done for example by setting the attenuation factors to 1 or not discriminating the area as a pre-echo zone, the module of pre-echo attenuation processing is not then requested as illustrated by way of example in the embodiment of the figure 5 by the link between block 604 and 602.
- the attenuation will be inhibited separately for each sub-signal as soon as the normalized steering coefficient b 1n is lower than the threshold of this sub-signal.
- the inhibition may for example be implemented by setting the attenuation factors to 1 or by not soliciting the pre-echo module for the sub-signal considered.
- the evolution of the two sub-signals is checked in both sub-signals. energy of the sub-blocks preceding the sub-block where the attack was detected, by linear regression.
- This verification can be done according to the steps E603 and E604, at any time after the division of the decoded signal into sub-signals (E605) and before the application of the pre-echo attenuation factors (E607). Verification is possible if at least two sub-blocks precede the sub-block where the attack was detected. If the attack is detected in the first or second sub-block verification according to the invention is not possible.
- the attack is detected in the fourth sub-block or a sub-block of index higher than 4, one checks the evolution of the energy of the last 3 sub-blocks in the pre-echo zone preceding the sub-block block where the attack was detected.
- the direction coefficient of the high-frequency sub-signal x rec, ss 2 ( n ) is compared with a threshold of value 0.2.
- E not ss 2 id - 1 - E not ss 2 id - 2 2 E not ss 2 id - 1 + E not ss 2 id - 2 + E not ss 2 id - 3 ⁇ 0.2 is equivalent to E not ss 2 id - 1 - E not ss 2 id - 2 ⁇ 1 7.5 E not ss 2 id - 1 + E not ss 2 id - 2 + E not ss 2 id - 3 thus avoiding a division operation to reduce the complexity and to facilitate the implementation on a DSP (for "Digital Signal Processor") to fixed point arithmetic.
- DSP Digital Signal Processor
- the module 607 of the device 600 of the figure 5 implements the pre-echo attenuation step E607 in the pre-echo area of each of the sub-signals by applying to the subsignals of the thus calculated attenuation factors.
- the pre-echo attenuation is therefore done independently in the sub-signals.
- the attenuation can be chosen according to the spectral distribution of the pre-echo.
- the filtering used is not associated with sub-signal decimation operations and the complexity and delay ("lookahead" or future frame) are reduced to a minimum.
- this device 100 in the sense of the invention typically comprises a ⁇ P processor cooperating with a memory block BM including a storage and / or working memory, and a memory buffer MEM mentioned above as a means for storing all data. necessary for the implementation of the discrimination and attenuation processing method as described with reference to the figure 5 .
- This device receives as input successive frames of the digital signal Se and delivers the reconstructed signal Sa with pre-echo attenuation in the pre-echo areas discriminated with, if necessary, reconstruction of the attenuated signal by combining attenuated sub-signals.
- the memory block BM may comprise a computer program comprising the code instructions for implementing the steps of the method according to the invention when these instructions are executed by a ⁇ P processor of the device and in particular the steps of calculating a control coefficient of the energies for at least two sub-blocks preceding the sub-block in which an attack is detected, comparing the steering coefficient to a predefined threshold and inhibiting the pre-echo attenuation processing in the pre-echo area in the case where the calculated coefficient of direction is lower than the predefined threshold.
- the figure 5 can illustrate the algorithm of such a computer program.
- This discrimination and attenuation processing device can be independent or integrated in a digital signal decoder.
- a decoder can be integrated with equipment for storing or transmitting digital audio signals such as communication gateways, communication terminals or servers of a communication network.
Description
L'invention concerne un procédé et un dispositif de discrimination et de traitement d'atténuation des pré-échos lors du décodage d'un signal audionumérique.The invention relates to a method and a device for discriminating and processing pre-echo attenuation when decoding a digital audio signal.
Pour la transmission des signaux audionumériques sur des réseaux de télécommunications, qu'il s'agisse par exemple de réseaux fixes ou mobiles, ou pour le stockage des signaux, on fait appel à des processus de compression (ou codage source) mettant en oeuvre des systèmes de codage qui sont en général du type codage temporel par prédiction linéaire ou codage fréquentiel par transformée.For the transmission of digital audio signals over telecommunications networks, whether for example fixed or mobile networks, or for the storage of signals, compression processes (or source coding) using coding systems which are generally of the linear coding type by linear prediction or by transform frequency coding.
Le procédé et le dispositif, objets de l'invention, ont ainsi comme domaine d'application la compression des signaux sonores, en particulier les signaux audionumériques codés par transformée fréquentielle.The method and the device, which are the subject of the invention, thus have as their field of application the compression of sound signals, in particular frequency-coded digital audio signals.
La
Certaines séquences musicales, telles que les percussions et certains segments de parole comme les plosives (/k/, /t/, ...), sont caractérisées par des attaques extrêmement brusques qui se traduisent par des transitions très rapides et une variation très forte de la dynamique du signal en l'espace de quelques échantillons. Un exemple de transition est donné à la
Pour le traitement de codage/décodage, le signal d'entrée est découpé en blocs d'échantillons de longueur L dont les frontières sont représentées sur la
La division en blocs, aussi appelés trames, opérée par le codage par transformée est totalement indépendante du signal sonore et les transitions peuvent donc apparaître en un point quelconque de la fenêtre d'analyse. Or après décodage par transformée, le signal reconstruit est entaché de "bruit" (ou distorsion) engendré par l'opération quantification (Q)-quantification inverse (Q-1). Ce bruit de codage est réparti temporellement de façon relativement uniforme sur tout le support temporel du bloc transformé, c'est-à-dire sur toute la longueur de la fenêtre de longueur 2L d'échantillons (avec recouvrement de L échantillons). L'énergie du bruit de codage est en général proportionnelle à l'énergie du bloc et est fonction du débit de codage/décodage.The division in blocks, also called frames, operated by the transform coding is totally independent of the sound signal and the transitions can therefore appear at any point in the analysis window. But after transform decoding, the reconstructed signal is tainted by "noise" (or distortion) generated by the quantization (Q) -quantization inverse (Q -1 ) operation. This coding noise is temporally distributed relatively uniform throughout the temporal support of the transformed block, that is to say over the entire length of the window length 2L samples (with overlap of L samples). The energy of the coding noise is generally proportional to the energy of the block and is a function of the coding / decoding rate.
Pour un bloc comportant une attaque (comme le bloc 320-480 de la
En codage par transformée, le niveau du bruit de codage est typiquement inférieur à celui du signal pour les segments de forte énergie qui suivent immédiatement la transition, mais le niveau est supérieur à celui du signal pour les segments d'énergie plus faible, notamment sur la partie précédant la transition (échantillons 160 - 410 de la
On peut observer sur la
Les expériences psycho-acoustiques ont montré que l'oreille humaine effectue un pré-masquage temporel des sons assez limité, de l'ordre de quelques millisecondes. Le bruit précédant l'attaque, ou pré-écho, est audible lorsque la durée du pré-écho est supérieure à la durée du pré-masquage.Psychoacoustic experiments have shown that the human ear performs a rather limited temporal pre-masking of sounds, of the order of a few milliseconds. The noise preceding the attack, or pre-echo, is audible when the duration of the pre-echo is greater than the duration of the pre-masking.
L'oreille humaine effectue également un post-masquage d'une durée plus longue, de 5 à 60 millisecondes, lors du passage de séquences de forte énergie à des séquences de faible énergie. Le taux ou niveau de gêne acceptable pour les post-échos est donc plus important que pour les pré-échos.The human ear also performs a post-masking of a longer duration, from 5 to 60 milliseconds, during the passage of high energy sequences to low energy sequences. The rate or level of inconvenience acceptable for post-echoes is therefore greater than for pre-echoes.
Le phénomène des pré-échos, plus critique, est d'autant plus gênant que la longueur des blocs en nombre d'échantillons est importante. Or, en codage par transformée, il est bien connu que pour les signaux stationnaires plus la longueur de la transformée augmente, plus le gain de codage est important. A fréquence d'échantillonnage fixée et à débit fixé, si on augmente le nombre de points de la fenêtre (donc la longueur de la transformée) on disposera de plus de bits par trame pour coder les raies fréquentielles jugées utiles par le modèle psychoacoustique, d'où l'avantage d'utiliser des blocs de grande longueur. Le codage MPEG AAC (Advanced Audio Coding), par exemple, utilise une fenêtre de grande longueur qui contient un nombre fixe d'échantillons, 2048, soit sur une durée de 64 ms si la fréquence d'échantillonnage est de 32 kHz; le problème des pré-échos y est géré en permettant de commuter de ces fenêtres longues à 8 fenêtres courtes par le biais de fenêtres intermédiaires (dites de transition), ce qui nécessite un certain retard au codage pour détecter la présence d'une transition et adapter les fenêtres. La longueur de ces fenêtres courtes est donc de 256 échantillons (8 ms à 32 kHz). A bas débit on peut toujours avoir un pré-écho audible de quelques ms. La commutation des fenêtres permet d'atténuer le pré-écho mais pas de le supprimer. Les codeurs par transformée utilisés pour les applications conversationnelles, comme UIT-T G.722.1, G.722.1C ou G.719, utilisent souvent une longueur de trame de 20 ms et une fenêtre de durée 40 ms à 16, 32 ou 48 kHz (respectivement). On peut noter que le codeur UIT-T G.719 intègre un mécanisme de commutation de fenêtres avec détection de transitoire, cependant le pré-écho n'est pas complètement réduit à bas débit (typiquement à 32 kbit/s).The phenomenon of pre-echoes, more critical, is even more troublesome as the length of the blocks in number of samples is important. However, in transform coding, it is well known that for stationary signals plus the length of the transform increases, the higher the coding gain. At a fixed sampling rate and fixed rate, if we increase the number of points of the window (hence the length of the transform) we will have more bits per frame to code the frequency lines found useful by the psychoacoustic model, d where the advantage of using blocks of great length. MPEG AAC (Advanced Audio Coding) coding, for example, uses a long window that contains a fixed number of samples, 2048, or a duration of 64 ms if the sampling frequency is 32 kHz; the problem of pre-echoes is managed by allowing to switch from these long windows to 8 short windows through intermediate windows (called transition), which requires some delay in coding to detect the presence of a transition and adapt the windows. The length of these short windows is therefore 256 samples (8 ms at 32 kHz). At low speed you can always have an audible pre-echo of a few ms. The switching of the windows makes it possible to attenuate the pre-echo but not to suppress it. Transform encoders used for conversational applications, such as ITU-T G.722.1, G.722.1C or G.719, often use a 20 ms frame length and a 40 ms window at 16, 32 or 48 kHz (respectively). It should be noted that the ITU-T G.719 encoder incorporates a window switch mechanism with transient detection, however the pre-echo is not completely reduced at low bit rate (typically at 32 kbit / s).
Dans le but de réduire l'effet gênant précité du phénomène des pré-échos, différentes solutions ont été proposées au niveau du codeur et/ou du décodeur.In order to reduce the aforementioned annoying effect of the pre-echo phenomenon, various solutions have been proposed at the encoder and / or the decoder.
La commutation de fenêtres a été citée précédemment ; elle nécessite de transmettre une information auxiliaire pour identifier le type de fenêtres utilisées dans la trame courante. Une autre solution consiste à appliquer un filtrage adaptatif. Dans la zone précédant l'attaque, le signal reconstruit est vu comme la somme du signal original et du bruit de quantification.Window switching has been mentioned previously; it requires transmitting auxiliary information to identify the type of windows used in the current frame. Another solution is to apply adaptive filtering. In the area preceding the attack, the reconstructed signal is seen as the sum of the original signal and the quantization noise.
Une technique de filtrage correspondante a été décrite dans l'article intitulé
La mise en oeuvre d'un tel filtrage nécessite la connaissance de paramètres dont certains, comme les coefficients de prédiction et la variance du signal corrompu par le pré-écho, sont estimés au décodeur à partir des échantillons bruités. Par contre, des informations telles que l'énergie du signal d'origine ne peuvent être connues qu'au codeur et doivent par conséquent être transmises. Ceci nécessite de transmettre des informations supplémentaires, ce qui à débit contraint diminue le budget relatif alloué au codage par transformée. Lorsque le bloc reçu contient une variation brusque de dynamique, le traitement de filtrage lui est appliqué.The implementation of such a filtering requires the knowledge of parameters some of which, like the prediction coefficients and the variance of the signal corrupted by the pre-echo, are estimated at the decoder from the noisy samples. On the other hand, information such as the energy of the original signal can only be known to the encoder and must therefore be transmitted. This requires additional information to be transmitted, which constrains the relative budget allocated to the transform coding. When the received block contains a sudden variation of dynamics, the filtering treatment is applied to it.
Le processus de filtrage précité ne permet pas de retrouver le signal d'origine, mais procure une forte réduction des pré-échos. Il nécessite toutefois de transmettre les paramètres supplémentaires au décodeur.The aforementioned filtering process does not allow to find the original signal, but provides a strong reduction of pre-echoes. However, it requires transmitting the additional parameters to the decoder.
A la différence des solutions précédentes, différentes techniques de réduction de pré-écho sans transmission spécifique de l'information ont été proposées. Par exemple, une revue de la réduction de pré-échos dans le contexte du codage hiérarchique est présentée dans l'article
Un exemple typique de procédé d'atténuation de pré-échos sans information auxiliaire est décrit dans la demande de brevet français
Le facteur d'atténuation g(k) dans le k-ième sous-bloc est calculé par exemple en fonction du rapport R(k) entre l'énergie du sous-bloc de plus forte énergie et l'énergie du k-ième sous-bloc en question :
Si l'énergie des sous-blocs varie peu par rapport à l'énergie maximale dans les sous-blocs considérés à la trame courante, aucune atténuation n'est alors nécessaire ; le facteur g(k) est fixé à une valeur d'atténuation inhibant l'atténuation, c'est-à-dire 1. Sinon, le facteur d'atténuation est compris entre 0 et 1.If the energy of the sub-blocks varies little with respect to the maximum energy in the sub-blocks considered at the current frame, no attenuation is then necessary; the factor g ( k ) is set to an attenuation-inhibiting attenuation value, i.e. 1. Otherwise, the attenuation factor is between 0 and 1.
Dans la plupart des cas, surtout quand le pré-écho est gênant, la trame qui précède la trame de pré-écho a une énergie homogène qui correspond à l'énergie d'un segment de faible énergie (typiquement un bruit de fond). Selon l'expérience il n'est pas utile ni même souhaitable qu'après traitement d'atténuation de pré-écho l'énergie du signal devienne inférieure à l'énergie moyenne (par sous-bloc) du signal précédant la zone de traitement - typiquement celle de la trame précédente, notée
Pour le sous-bloc d'indice k à traiter on peut calculer la valeur limite, notée lim g (k), du facteur d'atténuation afin d'obtenir exactement la même énergie que l'énergie moyenne par sous-bloc du segment précédant le sous-bloc à traiter. Cette valeur est bien sûr limitée à un maximum de 1 puisqu'on s'intéresse ici aux valeurs d'atténuation. Plus précisément on définit ici:
La valeur lim g (k) ainsi obtenue sert de limite inférieure dans le calcul final du facteur d'atténuation du sous-bloc, elle est donc utilisée comme suit :
Les facteurs d'atténuation (ou gains) g(k) déterminés par sous-blocs peuvent être ensuite lissés par une fonction de lissage appliquée échantillon par échantillon pour éviter des variations brusques du facteur d'atténuation aux frontières des blocs.The attenuation factors (or gains) g ( k ) determined by sub-blocks can then be smoothed by a sample-by-sample applied smoothing function to avoid abrupt changes in the attenuation factor at the block boundaries.
Par exemple, on peut d'abord définir le gain par échantillon comme une fonction constante par morceaux :
La fonction est ensuite lissée suivant l'équation suivante:
The function is then smoothed according to the following equation:
D'autres fonctions de lissage sont également possibles comme par exemple le fondu enchainé linéaire sur u échantillons :
Une fois les facteurs gpre (n) ainsi calculés, l'atténuation de pré-échos est faite sur le signal reconstruit dans la trame courante, xrec (n), en multipliant chaque échantillon par le facteur correspondant :
Les
Dans ces exemples le signal est échantillonné à 32 kHz, la longueur de la trame est L=640 échantillons et chaque trame est divisée en 8 sous-blocs de K=80 échantillons.In these examples the signal is sampled at 32 kHz, the length of the frame is L = 640 samples and each frame is divided into 8 sub-blocks of K = 80 samples.
Dans la partie a) de la
Dans la partie b) de la
La partie c) montre l'évolution du facteur d'atténuation de pré-écho (ligne continue) obtenu par le procédé décrit dans la demande de brevet de l'état de l'art précitée. La ligne pointillée représente le facteur avant lissage. On remarque ici que la position de l'attaque est estimée autour de l'échantillon 380 (dans le bloc délimité par les échantillons 320 et 400).Part c) shows the evolution of the pre-echo attenuation factor (solid line) obtained by the method described in the aforementioned prior art patent application. The dotted line represents the factor before smoothing. Note here that the position of the attack is estimated around the sample 380 (in the block delimited by the
La partie d) illustre le résultat du décodage après application du traitement de pré-écho (multiplication du signal b) avec le signal c)). On voit que le pré-écho a bien été atténué. La
Dans cet exemple on a affecté la valeur de facteur 1 aux 16 derniers échantillons du sous-bloc précédant l'attaque, à partir de l'indice 364. Ainsi la fonction de lissage accroît progressivement le facteur pour avoir une valeur proche de 1 au moment de l'attaque. L'amplitude de l'attaque est alors préservée, comme illustré dans la partie d) de la
Dans l'exemple de la
Cette technique de réduction des pré-échos est cependant perfectible pour certains types de signaux comme des signaux de musique moderne par exemple. En effet, dans certains cas, une fausse détection de pré-écho peut avoir lieu. La
Il existe donc un besoin d'une technique améliorée de discrimination et d'atténuation de pré-échos au décodage, qui permette de fiabiliser la détection des pré-échos et d'éviter les fausses détections sans qu'aucune information auxiliaire ne soit transmise par le codeur.There is therefore a need for an improved decoding pre-echo discrimination and attenuation technique which makes it possible to make pre-echo detection reliable and to avoid false detections without any auxiliary information being transmitted by the encoder.
La présente invention améliore la situation de l'état de l'art.The present invention improves the state of the art.
A cet effet, la présente invention se rapporte à un procédé de discrimination et d'atténuation de pré-écho dans un signal audionumérique engendré à partir d'un codage par transformée, dans lequel, pour une trame courante décomposée en sous-blocs, les sous-blocs de basse faible énergie précédant un sous-bloc dans lequel une transition ou attaque est détectée déterminent une zone de pré-écho dans laquelle un traitement d'atténuation de pré-écho est effectué. Le procédé est tel que, dans le cas où une attaque est détectée à partir du troisième sous-bloc de la trame courante, il comporte les étapes suivantes:
- calcul d'un coefficient directeur des énergies pour au moins deux sous-blocs de la trame courante précédant le sous-bloc dans lequel une attaque est détectée;
- comparaison du coefficient directeur à un seuil prédéfini; et
- inhibition du traitement d'atténuation de pré-écho dans la zone de pré-écho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini.
- calculating an energies directing coefficient for at least two sub-blocks of the current frame preceding the sub-block in which an attack is detected;
- comparing the guideline with a predefined threshold; and
- inhibiting the pre-echo attenuation processing in the pre-echo zone in the case where the calculated master coefficient is lower than the predefined threshold.
Le coefficient directeur des énergies calculé pour les sous-blocs précédant la position de l'attaque, permet de vérifier la tendance d'augmentation de l'énergie du signal dans la zone de pré-écho. Ceci permet de fiabiliser la détection des pré-échos en évitant de fausse détection de pré-échos. En effet, en observant la
Dans un mode de réalisation particulier, le procédé comporte en outre une étape de décomposition du signal audionumérique en au moins deux sous-signaux en fonction d'un critère fréquentiel et en ce que les étapes de calcul de comparaison sont effectuées pour au moins un des sous-signaux.In a particular embodiment, the method further comprises a step of decomposing the digital audio signal into at least two sub-signals according to a frequency criterion and in that the comparison calculation steps are performed for at least one of the subsignals.
Lorsque la position de l'attaque est détectée dans le troisième sous-bloc de la trame courante, l'énergie de deux sous-blocs est utilisée dans la zone de pré-écho pour calculer un coefficient directeur et le comparer à un seuil. Avec seulement deux points, seule la vérification pour le sous-signal haute-fréquence dans le cas d'une décomposition en deux sous-signaux est suffisante pour détecter une fausse détection de pré-écho.When the position of the attack is detected in the third sub-block of the current frame, the energy of two sub-blocks is used in the pre-echo zone to calculate a directional coefficient and compare it to a threshold. With only two points, only the verification for the high-frequency sub-signal in the case of two sub-signal decomposition is sufficient to detect a false pre-echo detection.
Dans le cas où le nombre de sous-blocs précédant le sous-bloc où une position d'attaque a été détecté est suffisant, le procédé comporte en outre une étape de décomposition du signal audionumérique en au moins deux sous-signaux en fonction d'un critère fréquentiel et en ce que les étapes de calcul et de comparaison sont effectuées pour chacun des sous-signaux, l'inhibition du traitement d'atténuation de pré-écho dans la zone de pré-écho de tous les sous-signaux s'effectuant quand un coefficient directeur calculé est inférieur au seuil prédéfini pour au moins un sous-signal.In the case where the number of sub-blocks preceding the sub-block where a driving position has been detected is sufficient, the method further comprises a step of decomposing the digital audio signal into at least two sub-signals as a function of a frequency criterion and in that the calculation and comparison steps are performed for each of the sub-signals, the inhibition of the pre-echo attenuation processing in the pre-echo zone of all the sub-signals performing when a calculated master coefficient is below the predefined threshold for at least one sub-signal.
La division en sous-signaux permet ainsi d'effectuer une atténuation de pré-écho de façon indépendante et adaptée dans les sous signaux. La fiabilité de détection de la zone de pré-écho est renforcée pour chacun des sous-signaux par la vérification de la valeur des coefficients directeurs respectifs.The division into sub-signals thus makes it possible to carry out a pre-echo attenuation independently and adapted in the sub-signals. The detection reliability of the pre-echo zone is enhanced for each of the sub-signals by checking the value of the respective coefficient coefficients.
Selon un mode de réalisation particulier, un seuil différent est défini par sous-signal.According to a particular embodiment, a different threshold is defined by sub-signal.
Ceci permet d'adapter la vérification aux caractéristiques spectrales des sous-signaux.This makes it possible to adapt the verification to the spectral characteristics of the sub-signals.
Dans un mode de réalisation, le coefficient directeur est calculé selon une méthode d'estimation des moindres carrés.In one embodiment, the steering coefficient is calculated using a least squares estimation method.
Cette méthode de calcul est de faible complexité.This calculation method is of low complexity.
Dans un mode possible de réalisation, le coefficient directeur est normalisé.In one possible embodiment, the steering coefficient is normalized.
Ainsi le coefficient directeur est plus facilement comparable à un seuil lorsque celui-ci est différent de 0.Thus the steering coefficient is more easily comparable to a threshold when it is different from 0.
Dans un mode de réalisation possible, dans le cas où une attaque est détectée dans le premier ou deuxième sous-bloc de la trame courante, un coefficient directeur calculé pour la trame précédente est utilisé pour l'étape de comparaison.In a possible embodiment, in the case where an attack is detected in the first or second sub-block of the current frame, a direction coefficient calculated for the previous frame is used for the comparison step.
La présente invention se rapporte également à un dispositif de discrimination et d'atténuation de pré-écho dans un signal audionumérique engendré à partir d'un codage par transformée, comportant un module de détection de transition ou attaque, un module de discrimination de zone de pré-écho et un module de traitement d'atténuation de pré-écho, un traitement d'atténuation de pré-écho étant effectué pour une trame courante décomposée en sous-blocs, dans les sous-blocs de faible énergie précédant un sous-bloc dans lequel une transition ou attaque est détectée déterminant une zone de pré-écho. Le dispositif est tel que, dans le cas où une attaque est détectée à partir du troisième sous-bloc de la trame courante, il comporte en outre:
- un module de calcul calculant un coefficient directeur des énergies pour au moins deux sous-blocs de la trame courante précédant le sous-bloc dans lequel une attaque est détectée;
- un comparateur apte à effectuer une comparaison du coefficient directeur à un seuil prédéfini; et
- un module de discrimination apte à inhiber le traitement d'atténuation de pré-écho dans la zone de pré-écho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini.
- a calculation module calculating an energies directing coefficient for at least two sub-blocks of the current frame preceding the sub-block in which an attack is detected;
- a comparator capable of making a comparison of the steering coefficient with a predefined threshold; and
- a discrimination module capable of inhibiting the pre-echo attenuation processing in the pre-echo zone in the case where the calculated directing coefficient is lower than the predefined threshold.
Les avantages de ce dispositif sont les mêmes que ceux décrits pour le procédé de discrimination et de traitement d'atténuation qu'il met en oeuvre.The advantages of this device are the same as those described for the method of discrimination and attenuation processing that it implements.
L'invention vise un décodeur d'un signal audionumérique comportant un dispositif tel que décrit précédemment.The invention relates to a decoder of a digital audio signal comprising a device as described above.
L'invention vise aussi un programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé tel que décrit précédemment, lorsque ces instructions sont exécutées par un processeur.The invention also relates to a computer program comprising code instructions for implementing the steps of the method as described above, when these instructions are executed by a processor.
Enfin, l'invention se rapporte à un support de stockage, lisible par un processeur, intégré ou non au dispositif de traitement, éventuellement amovible, mémorisant un programme informatique mettant en oeuvre un procédé de traitement tel que décrit précédemment.Finally, the invention relates to a storage medium, readable by a processor, integrated or not to the processing device, optionally removable, storing a computer program implementing a method of treatment as described above.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels:
- la
figure 1 décrite précédemment illustre un système de codage-décodage par transformée selon l'état de l'art; - la
figure 2 décrite précédemment illustre un exemple de signal audionumérique pour lequel une méthode d'atténuation selon l'état de l'art est effectuée; - la
figure 3 illustre un autre exemple de signal audionumérique pour lequel une méthode d'atténuation selon l'état de l'art est effectuée; - la
figure 4 décrite précédemment illustre un exemple d'un signal pour lequel la technique de l'état d'art détecterait à tort un pré-écho; - la
figure 5 illustre un mode de réalisation d'un procédé et d'un dispositif de discrimination et de traitement d'atténuation de pré-écho compris dans un décodeur selon l'invention; - la
figure 6 illustre un exemple de fenêtres d'analyse et de fenêtres de synthèse à faible retard pour le codage et le décodage par transformée susceptible de créer le phénomène de pré-écho; - la
figure 7 illustre un exemple de signal audionumérique pour lequel la méthode d'atténuation de pré-écho selon un mode de réalisation de l'invention est mis en oeuvre;.... - la
figure 8 illustre un exemple matériel de dispositif de discrimination et de traitement d'atténuation selon l'invention.
- the
figure 1 previously described illustrates a state-of-the-art transform coding-decoding system; - the
figure 2 described above illustrates an example of a digital audio signal for which a mitigation method according to the state of the art is performed; - the
figure 3 illustrates another example of a digital audio signal for which an attenuation method according to the state of the art is performed; - the
figure 4 described above illustrates an example of a signal for which the state of the art technique would erroneously detect a pre-echo; - the
figure 5 illustrates an embodiment of a method and a device for discriminating and pre-echo attenuation processing included in a decoder according to the invention; - the
figure 6 illustrates an example of low-delay analysis windows and synthesis windows for transform coding and decoding that can create the pre-echo phenomenon; - the
figure 7 illustrates an example of a digital audio signal for which the pre-echo attenuation method according to one embodiment of the invention is implemented; - the
figure 8 illustrates a hardware example of discrimination device and attenuation processing according to the invention.
En référence à la
En sortie du dispositif 600, un signal traité Sa est fourni dans lequel une atténuation de pré-écho a été effectuée.At the output of the
Le dispositif 600 met en oeuvre une méthode de discrimination et de traitement d'atténuation des pré-échos dans le signal décodé xrec (n). The
Dans un mode de réalisation de l'invention, le procédé de discrimination et de traitement d'atténuation comporte une étape de détection (E601) des attaques qui peuvent engendrer un pré-écho, dans le signal décodé xrec (n). In one embodiment of the invention, the discrimination and attenuation processing method includes a step of detecting (E601) attacks that may generate a pre-echo, in the decoded signal x rec ( n ) .
Ainsi, le dispositif 600 comporte un module de détection 601 apte à mettre en oeuvre une étape de détection (E601) de la position d'une attaque dans un signal audio décodé.Thus, the
Une attaque (ou onset en anglais) est une transition rapide et une variation brusque de la dynamique (ou amplitude) du signal. On peut désigner ce type de signaux par le terme plus général de "transitoire". Dans la suite et sans perte de généralité, on utilisera uniquement les termes d'attaque ou de transition pour désigner également des transitoires.An onset (or onset ) is a rapid transition and a sudden change in the dynamics (or amplitude) of the signal. This type of signal may be referred to by the more general term "transient". In the following and without loss of generality, we will use only the terms of attack or transition to designate also transients.
Chaque trame courante de L échantillons du signal décodé xrec (n) est divisée en K sous-blocs de longueur L', avec par exemple L = 640 échantillons (20 ms) à 32 kHz, L' = 80 échantillons (2.5 ms) et K = 8. De préférence la taille de ces sous-blocs est donc identique mais l'invention reste valable et facilement généralisable quand les sous-blocs ont une taille variable. Cela peut être le cas par exemple quand la longueur de la trame L n'est pas divisible par le nombre de sous-blocs K ou si la longueur de trame est variable.Each current frame of L samples of the decoded signal x rec ( n ) is divided into K sub-blocks of length L ', with for example L = 640 samples (20 ms) at 32 kHz, L' = 80 samples (2.5 ms) and K = 8. Preferably the size of these sub-blocks is therefore identical but the invention remains valid and easily generalizable when the sub-blocks have a variable size. This can be the case for example when the length of the frame L is not divisible by the number of sub-blocks K or if the frame length is variable.
Des fenêtres d'analyse-synthèse spéciales à bas retard similaires à celles décrites dans la norme UIT-T G.718 sont utilisées pour la partie analyse et pour la partie synthèse de la transformation MDCT. Un exemple de telles fenêtres est illustré en référence à la
On peut en effet remarquer sur la
Pour la synthèse (Synth.), seuls les échantillons représentés par l'intervalle M (140 échantillons) sont nécessaires pour obtenir l'information sur la zone de repliement de l'analyse, en exploitant la symétrie. Ces échantillons contenus en mémoire sont alors utiles pour décoder cette zone de repliement en utilisant également les échantillons repliés de la fenêtre de la trame suivante. Dans le cas d'une attaque dans cette zone entre les échantillons 820 et 1100 l'énergie moyenne des échantillons représentés par l'intervalle M est nettement supérieure à l'énergie de sous-trames précédant l'échantillon 820. L'augmentation brusque de l'énergie de l'intervalle M contenue dans la mémoire MDCT peut donc signaler une attaque dans la trame suivante qui peut engendrer un pré-écho dans la trame courante.For the synthesis (Synth.), Only the samples represented by the interval M (140 samples) are necessary to obtain the information on the folding area of the analysis, exploiting the symmetry. These samples contained in memory are then useful for decoding this folding zone by also using the folded samples of the window of the next frame. In the case of an attack in this zone between the
On utilise la mémoire MDCT xMDCT (n) qui donne une version avec repliement temporel ("folding" en anglais) du signal futur. Avec les fenêtres d'analyse-synthèse spéciales à bas retard comme illustrées en
En effet, la
La trame courante et la mémoire MDCT peuvent être vues comme des signaux concaténés formant un signal découpé en (K+K') sous-blocs consécutifs. Dans ces conditions, on définit l'énergie dans le k-ième sous-bloc comme :
L'énergie moyenne des sous-blocs dans la trame courante s'obtient donc comme :
The average energy of the sub-blocks in the current frame is thus obtained as:
Une attaque associée à un pré-écho est détectée si le rapport
Par ailleurs, on considère que la position de l'attaque est définie comme
Moreover, we consider that the position of the attack is defined as
Le dispositif 600 comporte également un module 602 de discrimination de zone de pré-écho mettant en oeuvre une étape de détermination (E602) d'une zone de pré-écho (ZPE) précédant la position d'attaque détectée. On appelle ici zone de pré-écho la zone couvrant les échantillons avant la position estimée de l'attaque qui sont perturbés par le pré-écho engendré par l'attaque et où l'atténuation de ce pré-écho est souhaitable. Dans le mode de réalisation présenté la zone de pré-écho peut être déterminée sur le signal décodé.The
Dans un mode de réalisation d'obtention des zones de pré-échos, les énergies En(k) sont concaténées en ordre chronologique, avec d'abord l'enveloppe temporelle du signal décodé, puis l'enveloppe du signal de la trame suivante estimée à partir de la mémoire de la transformée MDCT. En fonction de cette enveloppe temporelle concaténée et des énergies moyennes
Les sous-blocs dans lesquels un pré-écho a été détecté constituent ainsi une zone de pré-écho, qui en général couvre les échantillons n = 0,···, pos-1, soit du début de la trame courante à la position de l'attaque (pos). On peut aussi noter que la zone de pré-écho peut très bien s'étendre sur toute la trame courante si l'attaque a été détectée dans la trame future.The sub-blocks in which a pre-echo has been detected thus constitute a pre-echo zone, which in general covers the samples n = 0, ···, pos -1, ie from the beginning of the current frame to the position of the attack ( pos ) . It can also be noted that the pre-echo zone may well extend over the entire current frame if the attack has been detected in the future frame.
Le dispositif 600 comporte un module 603 de calcul apte à mettre en oeuvre une étape de calcul d'un coefficient directeur (ou indicateur de tendance de variation) des énergies des sous-blocs précédant le sous-bloc dans lequel une attaque a été détectée.The
On définit le modèle linéaire qui représente un ensemble de n réalisations (ti, ei), 0<=i<n où ti sont les indices temporels des sous-blocs et ei leurs énergies, avec l'équation
Où b0 est la valeur à l'instant t=0 et b1 est le coefficient directeur. Le coefficient directeur donne l'information sur la tendance (moyenne) de variation de l'énergie. Un coefficient directeur positif signale une augmentation des énergies. Une valeur proche de 0 signale une énergie constante.Where b 0 is the value at time t = 0 and b 1 is the coefficient of direction. The guideline gives information on the (mean) trend of energy change. A positive directing coefficient signals an increase in energies. A value close to 0 indicates constant energy.
On peut déterminer la valeur de b1 par exemple par régression linéaire selon les moindre carrés :
Où la sommation est effectuée sur des indices i prédéterminés.Where the summation is performed on predetermined indices i.
La valeur de b1 dépend également de la grandeur (en valeur absolue) des énergies ; elle est en effet homogène avec l'énergie sur le temps. Pour pouvoir mieux comparer la valeur de b1 à un seuil (par exemple fixe) on peut supprimer cette dépendance. Par exemple, la valeur de b1 peut être divisée par la valeur moyenne des énergies pour obtenir le coefficient directeur normalisé :
De façon alternative on pourra prendre le coefficient de corrélation.
Cette solution alternative a une complexité de calcul plus élevée car elle nécessite de calculer une racine carrée.This alternative solution has a higher computational complexity because it requires calculating a square root.
D'autres méthodes d'estimation du coefficient directeur sont également possibles comme par exemple la méthode médiane-médiane de Tukey.Other methods of estimating the directing coefficient are also possible, such as the median-median Tukey method.
On peut également noter que lorsque le coefficient directeur doit être comparé à un seuil de valeur nulle - ce qui revient à vérifier le signe de ce coefficient - il n'est pas nécessaire de normaliser ce coefficient.It can also be noted that when the reference coefficient has to be compared with a threshold of zero value - which amounts to verifying the sign of this coefficient - it is not necessary to standardize this coefficient.
Par ailleurs, au lieu de normaliser le coefficient directeur, il sera possible de rendre le seuil variable car les relations suivantes sont équivalentes :
Si l'attaque est détectée dans le premier ou deuxième sous-bloc la vérification selon l'invention n'est pas possible. Si l'attaque est détectée dans le troisième sous-bloc on dispose de l'énergie de 2 sous-blocs dans la zone de pré-écho, e0 et e1 pour faire cette vérification (e1 étant le plus proche de l'attaque). Avec 2 points l'équation (3) se simplifie ainsi :
Si l'attaque est détectée dans le quatrième sous-bloc on dispose de l'énergie de 3 sous-blocs dans la zone de pré-écho, e0, e1 et e2 pour faire cette vérification (e2 étant le plus proche de l'attaque). Avec 3 points l'équation (3) se simplifie ainsi :
Si on dispose de 4 ou plus de sous-blocs on peut calculer le coefficient directeur sur 4 ou plus de sous blocs. L'expérience montre que la vérification du coefficient directeur calculé sur les 3 sous-blocs précédents le sous-bloc où l'attaque a été détectée est suffisante pour éviter les fausses détections des pré-échos - cette conclusion s'applique pour le cas de 8 sous-blocs sur chaque trame de 20 ms et peut être adaptée selon la taille des sous-blocs et de la trame.If we have 4 or more sub-blocks we can calculate the guideline on 4 or more sub-blocks. Experience shows that the verification of the coefficient calculated on the 3 sub-blocks preceding the sub-block where the attack was detected is sufficient to avoid false detections of the pre-echoes - this conclusion applies for the case of 8 sub-blocks on each frame of 20 ms and can be adapted according to the size of the sub-blocks and the frame.
Ainsi dans le mode de réalisation privilégié, le coefficient directeur est calculé avec au plus 3 sous-blocs. Ceci permet de limiter la complexité maximale du calcul du coefficient directeur.Thus, in the preferred embodiment, the steering coefficient is calculated with at most 3 sub-blocks. This makes it possible to limit the maximum complexity of the calculation of the steering coefficient.
Selon l'invention, le coefficient directeur normalisé b1n ainsi obtenu est ensuite comparé à l'étape E604 par un module comparateur 604 à un seuil prédéfini. Le seuil peut être prédéfini à une valeur fixe ou peut être variable en fonction par exemple de la classification du signal selon un critère parole ou musique. Typiquement ce seuil est égal à 0 si on vérifie uniquement que l'énergie ne diminue pas ou égale à 0.2 si on impose une légère augmentation de l'énergie dans la zone de pré-écho. Si le coefficient directeur normalisé b1n est inférieur à ce seuil on conclut que le signal dans la zone de pré-écho ne correspond pas à un pré-écho typique et on inhibe l'atténuation des pré-échos dans cette zone à l'étape E602. Ainsi on évite qu'un signal décodé dont le signal d'entrée original contient un composant de faible énergie avant une attaque soit modifié/altéré par erreur par le module d'atténuation des pré-échos en détectant ce composant comme un pré-écho.According to the invention, the normalized standard coefficient b 1n thus obtained is then compared with the step E604 by a
Une atténuation de pré-écho est mise en oeuvre à l'étape E607 par le module d'atténuation 607 pour la zone de pré-écho discriminée. Le facteur d'atténuation est par exemple calculé comme dans la demande
Dans un mode de réalisation particulier, le dispositif 600 comporte en outre un module 605 de décomposition du signal, apte à effectuer une étape E605 de décomposition du signal décodé en au moins deux sous-signaux selon un critère prédéterminé. Cette méthode est notamment décrite dans la demande
Dans une réalisation particulière de l'invention, le signal décodé xrec (n) est décomposé à l'étape E605 en deux sous-signaux de la manière suivante :
- le premier sous-signal x rec,ss1(n) est obtenu par filtrage passe bas en utilisant un filtre FIR (filtre à réponse impulsionnelle finie) à 3 coefficients et à phase nulle de fonction de transfert c(n)z -1+(1-2c(n))+c(n)z avec c(n) une valeur comprise
entre 0 et 0.25, où [c(n),1-2c(n),c(n)] sont les coefficients du filtre passe bas ; ce filtre est mis en oeuvre avec l'équation aux différences :
- the first sub-signal x rec, ss 1 ( n ) is obtained by low-pass filtering using a FIR filter (finite impulse response filter) with 3 coefficients and a null transfer function phase c ( n ) z -1 + (1- 2c ( n )) + c ( n ) z with c ( n ) a value between 0 and 0.25, where [ c ( n ) , 1-2 c ( n ) , c ( n )] are the coefficients the low pass filter; this filter is implemented with the difference equation:
Dans un mode particulier de réalisation, on utilise une valeur constante c(n) = 0.25.In a particular embodiment, a constant value c ( n ) = 0.25 is used.
On peut remarquer que le sous signal x rec,ss1(n) résultant de ce filtrage, contient donc des composantes plutôt basses fréquences du signal décodé.
- le deuxième sous signal x rec,ss2(n) est obtenu par filtrage passe haut complémentaire en utilisant un filtre FIR à 3 coefficients et à phase nulle de fonction de transfert -c(n)z -1+2c(n)-c(n)z, où [-c(n),2c(n),-c(n)] sont les coefficients du filtre passe haut ; ce filtre est mis en oeuvre avec l'équation aux différences : x rec,ss2(n)=-c(n)xrec (n-1)+2c(n)xrec (n)-c(n)x(n+1). Le sous signal x rec,ss2(n) résultant de ce filtrage, contient donc des composantes plutôt hautes fréquences du signal décodé.
- the second sub-signal x rec, ss 2 ( n ) is obtained by complementary high-pass filtering using a FIR filter with 3 coefficients and with a zero transfer function phase -c ( n ) z -1 + 2 c ( n ) - c ( n ) z , where [- c ( n ) , 2c ( n ), - c ( n )] are the coefficients of the high pass filter; this filter is implemented with the difference equation: x rec, ss 2 ( n ) = -c ( n ) x rec ( n -1) + 2 c ( n ) x rec ( n ) -c ( n ) x ( n +1). The sub-signal x rec, ss 2 ( n ) resulting from this filtering, therefore contains rather high-frequency components of the decoded signal.
A noter que x rec,ss1(n)+x rec,ss2(n) = xrec (n).Note that x rec, ss 1 ( n ) + x rec, ss 2 ( n ) = x rec ( n ).
Il est donc également possible d'obtenir x rec,ss2(n) en soustrayant x rec,ss1(n) de xrec (n) ce qui réduit la complexité des calculs : x rec,ss2(n) = xrec (n)-x rec,ss1(n)It is therefore also possible to obtain x rec, ss 2 ( n ) by subtracting x rec, ss 1 ( n ) from x rec ( n ), which reduces the computational complexity: x rec, ss 2 ( n ) = x rec ( n ) - x rec, ss 1 ( n )
La combinaison des sous-signaux atténués pour l'obtention du signal atténué Sa est faite par simple addition des sous-signaux atténués à l'étape E608 décrite ultérieurement.The combination of the attenuated sub-signals for obtaining the attenuated signal Sa is made by simply adding the attenuated sub-signals to the step E608 described later.
Pour ne pas utiliser de signal futur pour ces filtrages, on peut par exemple compléter le signal décodé par un échantillon à 0 à la fin du bloc. Dans le cas du signal décodé complété par un échantillon à 0 à la fin du bloc pour n=L-1 le sous signal x rec,ss1(n) est obtenu par :
On peut noter que les deux sous-signaux restent ici à la même fréquence d'échantillonnage que le signal décodé.It can be noted that the two sub-signals remain here at the same sampling frequency as the decoded signal.
Une étape E606 de calcul de facteurs d'atténuation de pré-écho est mise en oeuvre dans le module de calcul 606. Ce calcul est fait séparément pour les deux sous signaux.A step E606 for calculating pre-echo attenuation factors is implemented in the
Ces facteurs d'atténuation sont obtenus par échantillon de la zone de pré-écho déterminée en E602 en fonction de la trame dans laquelle l'attaque a été détectée et de la trame précédente.These attenuation factors are obtained by sampling the pre-echo zone determined in E602 as a function of the frame in which the attack was detected and the previous frame.
On obtient alors les facteurs g press1'(n) et g pre,ss2'(n) où n est l'indice de l'échantillon correspondant. Ces facteurs seront éventuellement lissés pour obtenir les facteurs g pre,ss1(n) et g pre,ss2(n) respectivement. Ce lissage est surtout important pour les sous signaux contenant les composantes basse-fréquence (donc pour g pre,ss1'(n) dans cet exemple).We then obtain the factors g press 1 '( n ) and g pre, ss 2 ' ( n ) where n is the index of the corresponding sample. These factors will eventually be smoothed to obtain the factors g pre, ss 1 ( n ) and g pre, ss 2 ( n ) respectively. This smoothing is especially important for sub-signals containing the low-frequency components (so for g pre, ss 1 '( n ) in this example).
Un exemple de réalisation de calcul d'atténuation est décrit dans la demande de brevet
Le calcul du facteur d'atténuation d'un sous-signal (par exemple g pre,ss2'(n)) peut être similaire à celui décrit dans la demande de brevet
Si la variation de l'énergie par rapport à l'énergie maximale est faible, aucune atténuation n'est alors nécessaire. Le facteur est alors fixé à une valeur d'atténuation inhibant l'atténuation, c'est-à-dire 1. Sinon, le facteur d'atténuation est compris entre 0 et 1. Cette initialisation peut être commune pour tous les sous-signaux.If the variation of the energy with respect to the maximum energy is small, then no attenuation is necessary. The factor is then set to a attenuation value that inhibits the attenuation, that is to say 1. Otherwise, the attenuation factor is between 0 and 1. This initialization can be common for all the sub-signals. .
Les valeurs d'atténuation sont ensuite affinées par sous-signal pour pouvoir régler le niveau d'atténuation optimal par sous-signal en fonction des caractéristiques du signal décodé. Par exemple les atténuations peuvent être limitées en fonction de l'énergie moyenne du sous-signal de la trame précédente car il n'est pas souhaitable qu'après le traitement d'atténuation de pré-écho, l'énergie du signal devienne inférieure à l'énergie moyenne par sous-bloc du signal précédant la zone de traitement (typiquement celle de la trame précédente ou celle de la deuxième moitié de la trame précédente).The attenuation values are then refined by sub-signal to be able to adjust the optimal sub-signal attenuation level based on the characteristics of the decoded signal. For example, the attenuations can be limited according to the average energy of the sub-signal of the previous frame because it is not desirable that after the pre-echo attenuation processing, the signal energy becomes less than the average energy per sub-block of the signal preceding the processing zone (typically that of the previous frame or that of the second half of the previous frame).
Cette limitation peut être faite de façon similaire à celle décrite dans la demande de brevet
Pour le sous-bloc k à traiter on peut calculer la valeur limite du facteur lim g,ss2(k) afin d'obtenir exactement la même énergie que l'énergie moyenne par sous-bloc du segment précédant le sous-bloc à traiter. Cette valeur est bien sûr limitée à un maximum de 1 puisqu'on s'intéresse ici aux valeurs d'atténuation. Plus précisément :
La valeur lim g,ss2(k) ainsi obtenue sert de limite inférieure dans le calcul final du facteur d'atténuation du sous-bloc :
Dans une première variante de réalisation la zone de pré-écho où l'atténuation s'étend du début de la trame courante jusqu'au début du sous-bloc dans lequel l'attaque a été détecté - jusqu'à l'indice pos où
Dans une autre variante de réalisation la position de début de l'attaque pos est affinée dans le sous-bloc de l'attaque, par exemple en découpant le sous-bloc en sous-sous-blocs et en observant l'évolution de l'énergie de ces sous-sous-blocs. Supposons que la position du début de l'attaque est détectée dans le sous-bloc k, k>0 et le début de l'attaque raffiné pos se trouve dans ce sous-bloc, les valeurs d'atténuation pour les échantillons de ce sous-bloc qui se trouvent avant l'indice pos peuvent être initialisées en fonction de la valeur d'atténuation correspondant au dernier échantillon du sous-bloc précédent :
Toutes les atténuations à partir de l'indice pos sont mises à 1.All attenuations from the index pos are set to 1.
Pour le premier sous-signal contenant les composantes basses fréquences du signal décodé, le calcul des valeurs d'atténuation en se basant sur le sous-signal x rec,ss1(n) peut être similaire au calcul des valeurs d'atténuation en se basant sur le signal décodé xrec (n). Ainsi, dans une variante de réalisation, par souci de réduction de complexité de calcul, les valeurs d'atténuation peuvent être déterminées en se basant sur le signal décodé xrec (n). Dans le cas où la détection des attaques est faite sur le signal décodé il n'est donc plus nécessaire de recalculer des énergies des sous-blocs car pour ce signal les valeurs d'énergie par sous-bloc sont déjà calculées pour détecter les attaques. Comme pour la grande majorité des signaux les basses fréquences sont beaucoup plus énergétiques que les hautes fréquences, les énergies par sous-bloc du signal décodé xrec (n) et du sous signal x rec,ss1(n) sont très proches, cette approximation donne un résultat très satisfaisant.For the first sub-signal containing the low frequency components of the decoded signal, the calculation of the attenuation values based on the sub-signal x rec, ss 1 ( n ) may be similar to the calculation of the attenuation values by based on the decoded signal x rec ( n ) . Thus, in an alternative embodiment, for the sake of reducing calculation complexity, the attenuation values can be determined based on the decoded signal x rec ( n ) . In the case where the detection of attacks is made on the decoded signal, it is no longer necessary to recalculate energies of the sub-blocks because for this signal the energy values by sub-block are already calculated to detect the attacks. As for the great majority of the signals the low frequencies are much more energetic than the high frequencies, the energies by sub-block of the decoded signal x rec ( n ) and of the sub-signal x rec, ss 1 ( n ) are very close, this approximation gives a very satisfactory result.
Les facteurs d'atténuation g pre,ss1(n) et g pre,ss2(n) déterminés par sous-blocs peuvent être ensuite lissés par une fonction de lissage appliquée échantillon par échantillon pour éviter des variations brusques du facteur d'atténuation aux frontières des blocs. Ceci est particulièrement important pour les sous-signaux contenant des composantes basses fréquences comme le sous-signal x rec,ss1(n) mais pas nécessaire pour les sous-signaux ne contenant que des composantes hautes fréquences comme le sous signal x rec,ss2(n). The attenuation factors g pre , ss1 ( n ) and g pre , ss 2 ( n ) determined by sub-blocks can then be smoothed by an applied smoothing function sample by sample to avoid abrupt changes in the attenuation factor at block boundaries. This is particularly important for sub-signals containing low frequency components such as sub-signal x rec, ss 1 ( n ) but not necessary for sub-signals containing only high frequency components such as sub-signal x rec, ss 2 ( n ) .
La
Cette figure illustre en a), un exemple de signal original, en b), le signal décodé sans atténuation de pré-écho, en c), les gains d'atténuation pour les deux sous-signaux obtenus selon l'étape de décomposition E605 et en d), le signal décodé avec atténuation de pré-écho des étapes E607 et E608 (c'est-à-dire après combinaison des deux sous-signaux atténués).This figure illustrates in a), an example of an original signal, in b), the decoded signal without pre-echo attenuation, in c), the attenuation gains for the two sub-signals obtained according to the decomposition step E605 and in d), the decoded signal with pre-echo attenuation of steps E607 and E608 (i.e. after combining the two attenuated sub-signals).
On peut remarquer sur cette figure que le gain d'atténuation représenté en trait pointillé et correspondant au gain calculé pour le premier sous-signal comportant des composantes basses fréquences, comporte des fonctions de lissage comme décrit ci-dessus. Le gain d'atténuation représenté en trait plein et calculé pour le deuxième sous-signal comportant des composantes hautes fréquences, ne comporte pas de gain de lissage.It may be noted in this figure that the attenuation gain represented in dashed line and corresponding to the gain calculated for the first sub-signal comprising low frequency components, comprises smoothing functions as described above. The attenuation gain represented in solid line and calculated for the second sub-signal comprising high frequency components, does not include smoothing gain.
Le signal représenté en d) montre bien que le pré-écho a été atténué de façon efficace par le traitement d'atténuation mis en oeuvre.
La fonction de lissage est par exemple définie de préférence par les équations suivantes:
The smoothing function is for example preferably defined by the following equations:
Le facteur d'atténuation lissé ne remonte pas à 1 au moment de l'attaque, ce qui implique une diminution de l'amplitude de l'attaque. L'impact perceptible de cette diminution est très faible mais doit néanmoins être évité. Pour pallier à ce problème la valeur de facteur d'atténuation peut être forcée à 1 pour les u-1 échantillons précédant l'indice pos où se situe le début de l'attaque. Ceci est équivalent à avancer le marqueur pos de u-1 échantillons pour le sous signal où le lissage est appliqué. Ainsi la fonction de lissage accroît progressivement le facteur pour avoir une valeur 1 au moment de l'attaque. L'amplitude de l'attaque est alors préservée.The smoothed attenuation factor does not go back to 1 at the time of the attack, which implies a decrease in the amplitude of the attack. The noticeable impact of this decrease is very small but must nevertheless be avoided. To alleviate this problem the attenuation factor value can be forced to 1 for the u-1 samples preceding the index pos where the onset of the attack is. This is equivalent to advancing the pos marker of u-1 samples for the sub signal where the smoothing is applied. Thus the smoothing function gradually increases the factor to have a
Dans ce mode de réalisation avec décomposition du signal, la vérification de l'augmentation de l'énergie de la zone de pré-écho selon l'invention est réalisée pour au moins un sous-signal ou pour chacun de ces sous-signaux.In this embodiment with signal decomposition, the verification of the increase of the energy of the pre-echo zone according to the invention is carried out for at least one sub-signal or for each of these sub-signals.
Le seuil de comparaison utilisé peut être différent selon les sous-signaux et selon le nombre de sous-blocs disponibles avant l'attaque.The comparison threshold used may be different depending on the sub-signals and the number of sub-blocks available before the attack.
Si dans au moins un sous-signal le coefficient directeur normalisé b1n est inférieur au seuil de ce sous-signal, on inhibe l'atténuation des pré-échos pour l'ensemble des sous-signaux.If, in at least one sub-signal, the normalized steering coefficient b 1n is less than the threshold of this sub-signal, the pre-echo attenuation is inhibited for all the sub-signals.
En cas de pré-écho dans un signal issu d'une transformée MDCT inverse l'énergie du composant pré-écho augmente ou est au moins stable dans tous les sous-signaux. L'inhibition de traitement de pré-écho peut être faite par exemple en mettant les facteurs d'atténuations à 1 ou en ne discriminant pas la zone comme zone de pré-écho, le module de traitement d'atténuation de pré-écho n'étant alors pas sollicité comme illustré à titre d'exemple dans le mode de réalisation de la
Dans des variantes, l'atténuation sera inhibée séparément pour chaque sous-signal dès que le coefficient directeur normalisé b1n est inférieur au seuil de ce sous-signal. L'inhibition pourra être par exemple mise en oeuvre en mettant les facteurs d'atténuation à 1 ou en ne sollicitant pas le module de pré-écho pour le sous-signal considéré.In variants, the attenuation will be inhibited separately for each sub-signal as soon as the normalized steering coefficient b 1n is lower than the threshold of this sub-signal. The inhibition may for example be implemented by setting the attenuation factors to 1 or by not soliciting the pre-echo module for the sub-signal considered.
Ainsi, dans le mode de réalisation particulier décrit ci-dessus avec décomposition en deux sous-signaux, si le nombre de sous-blocs avant l'attaque permet de faire cette vérification, on vérifie dans les deux sous-signaux l'évolution de l'énergie des sous-blocs précédant le sous-bloc où l'attaque a été détectée, par régression linéaire. Cette vérification peut être faite selon les étapes E603 et E604, à n'importe quel moment après la division du signal décodé en sous-signaux (E605) et avant l'application des facteurs d'atténuation des pré-échos (E607). La vérification est possible si au moins deux sous-blocs précèdent le sous-bloc où l'attaque a été détectée. Si l'attaque est détectée dans le premier ou deuxième sous-bloc la vérification selon l'invention n'est pas possible.Thus, in the particular embodiment described above with decomposition into two sub-signals, if the number of sub-blocks before the attack makes it possible to carry out this verification, the evolution of the two sub-signals is checked in both sub-signals. energy of the sub-blocks preceding the sub-block where the attack was detected, by linear regression. This verification can be done according to the steps E603 and E604, at any time after the division of the decoded signal into sub-signals (E605) and before the application of the pre-echo attenuation factors (E607). Verification is possible if at least two sub-blocks precede the sub-block where the attack was detected. If the attack is detected in the first or second sub-block verification according to the invention is not possible.
Dans des variantes, on pourra ré-utiliser le(s) coefficient(s) directeur(s) éventuellement calculé(s) dans la trame précédente si l'attaque est détectée dans le premier ou deuxième sous-bloc de la trame courante.In variants, it will be possible to re-use the coefficient (s) director (s) possibly calculated (s) in the previous frame if the attack is detected in the first or second sub-block of the current frame.
Si l'attaque est détectée dans le troisième sous-bloc on dispose alors de l'énergie de deux sous-blocs dans la zone de pré-écho pour faire cette vérification. Par expérience, avec deux points, la vérification n'est pas suffisamment fiable dans le sous-signal basse-fréquence x rec,ss1(n). On vérifie alors uniquement le sous-signal haute-fréquence x rec,ss2(n) et uniquement que l'énergie ne diminue pas. Le coefficient directeur du sous-signal haute-fréquence x rec,ss2(n) est comparé au seuil de valeur 0. Seul son signe est important ici, il n'est pas nécessaire de faire une normalisation. Il suffit donc de calculer à l'étape E603 un coefficient directeur simple (sans normalisation) comme:
Si b1ss2 est inférieur à 0, l'atténuation des pré-échos pour cette zone de pré-écho est inhibé pour l'ensemble des sous-signaux.If b 1ss2 is less than 0, the attenuation of pre-echoes for this pre-echo zone is inhibited for all the sub-signals.
Si l'attaque est détectée dans le quatrième sous-bloc ou un sous-bloc d'indice supérieur à 4, on vérifie l'évolution de l'énergie des derniers 3 sous-blocs dans la zone de pré-écho précédant le sous-bloc où l'attaque a été détectée. Le coefficient directeur du sous-signal basse-fréquence x rec,ss1(n) est comparé à 0, seul son signe est important et il n'est pas nécessaire de normaliser ce coefficient. Il suffit donc de calculer un coefficient directeur simple. Si l'attaque a été détectée dans le sous-bloc de l'indice id avec id >= 3 on détermine ce coefficient comme :
Si b1ss1 est inférieur à 0 on inhibe l'atténuation des pré-échos pour cette zone de pré-écho, et pour l'ensemble des sous-signaux.If b 1ss1 is less than 0, pre-echo attenuation is inhibited for this pre-echo zone, and for all the sub-signals.
Le coefficient directeur du sous-signal haute-fréquence x rec,ss2(n) est comparé à un seuil de valeur 0.2. On calcule le coefficient directeur normalisé. Si l'attaque a été détectée dans le sous-bloc de l'indice id avec id >= 3 on détermine ce coefficient comme :
Si b1nss2 est inférieur à 0.2 on inhibe l'atténuation des pré-échos pour cette zone de pré-écho, et pour l'ensemble des sous-signaux.If b 1nss2 is less than 0.2, pre-echo attenuation is inhibited for this pre-echo zone, and for all the sub-signals.
A noter que la condition
Le module 607 du dispositif 600 de la
L'atténuation de pré-écho est donc faite de façon indépendante dans les sous signaux. Ainsi, dans les sous signaux représentants différentes bandes de fréquence, l'atténuation peut être choisie en fonction de la répartition spectrale du pré-écho.The pre-echo attenuation is therefore done independently in the sub-signals. Thus, in the sub-signals representing different frequency bands, the attenuation can be chosen according to the spectral distribution of the pre-echo.
Enfin, une étape E608 du module d'obtention 608 permet d'obtenir le signal de sortie atténué (le signal décodé après atténuation de pré-écho) par combinaison (dans cet exemple par simple addition) des sous-signaux atténués, selon l'équation:
Contrairement à une décomposition en sous-bandes classique, on peut noter ici que les filtrages utilisés ne sont pas associés à des opérations de décimation des sous-signaux et la complexité et le retard ("lookahead" ou trame future) sont réduits au minimum.Unlike a conventional subband decomposition, it can be noted here that the filtering used is not associated with sub-signal decimation operations and the complexity and delay ("lookahead" or future frame) are reduced to a minimum.
Un exemple de réalisation d'un dispositif de discrimination et de traitement d'atténuation selon l'invention est maintenant décrit en référence à la
Matériellement, ce dispositif 100 au sens de l'invention comporte typiquement, un processeur µP coopérant avec un bloc mémoire BM incluant une mémoire de stockage et/ou de travail, ainsi qu'une mémoire tampon MEM précitée en tant que moyen pour mémoriser toutes données nécessaire à la mise en oeuvre du procédé de discrimination et de traitement d'atténuation tel que décrit en référence à la
Le bloc mémoire BM peut comporter un programme informatique comportant les instructions de code pour la mise en oeuvre des étapes du procédé selon l'invention lorsque ces instructions sont exécutées par un processeur µP du dispositif et notamment les étapes de calcul d'un coefficient directeur des énergies pour au moins deux sous-blocs précédant le sous-bloc dans lequel une attaque est détectée, de comparaison du coefficient directeur à un seuil prédéfini et d'inhibition du traitement d'atténuation de pré-écho dans la zone de pré-écho dans le cas où le coefficient directeur calculé est inférieur au seuil prédéfini.
La
The
Ce dispositif de discrimination et de traitement d'atténuation selon l'invention peut être indépendant ou intégré dans un décodeur de signal numérique. Un tel décodeur peut être intégré à des équipements de stockage ou de transmission de signaux audionumériques tels que des passerelles de communication, des terminaux de communication ou des serveurs d'un réseau de communication.This discrimination and attenuation processing device according to the invention can be independent or integrated in a digital signal decoder. Such a decoder can be integrated with equipment for storing or transmitting digital audio signals such as communication gateways, communication terminals or servers of a communication network.
Claims (11)
- Method for discriminating and attenuating pre-echo in a digital audio signal generated from a transform coding, in which, upon decoding, for a current frame decomposed into sub-blocks, the low-energy sub-blocks preceding a sub-block in which a transition or onset is detected (E601) determine a pre-echo zone (E602) in which a pre-echo attenuation processing is carried out (E607), the method being characterized in that, in the case where an onset is detected from the third sub-block of the current frame, it comprises the following steps:- calculation (E603) of a leading coefficient of the energies for at least two sub-blocks of the current frame preceding the sub-block in which an onset is detected;- comparison (E604) of the leading coefficient to a predefined threshold; and- inhibition (E602) of the pre-echo attenuation processing in the pre-echo zone in the case where the calculated leading coefficient is below the predefined threshold.
- Method according to Claim 1, characterized in that it further comprises a step of decomposition of the digital audio signal into at least two sub-signals as a function of a frequency criterion and in that the comparison calculation steps are performed for at least one of the sub-signals.
- Method according to Claim 1, characterized in that it further comprises a step of decomposition of the digital audio signal into at least two sub-signals as a function of a frequency criterion and in that the computation and comparison steps are performed for each of the sub-signals, the inhibition of the pre-echo attenuation processing in the pre-echo zone of all the sub-signals being performed when a calculated leading coefficient is below the predefined threshold for at least one sub-signal.
- Method according to Claim 3, characterized in that a different threshold is defined for each sub-signal.
- Method according to one of Claims 1 to 4, characterized in that the leading coefficient is calculated according to a least squares estimation method.
- Method according to one of Claims 1 to 5, characterized in that the leading coefficient is normalized.
- Method according to Claim 1, characterized in that, in the case where an onset is detected in the first or second sub-block of the current frame, a leading coefficient calculated for the preceding frame is used for the comparison step.
- Device for discriminating and attenuating pre-echo in a digital audio signal generated by a transform coder, the device being associated with a decoder and comprising a transition or onset detection module (601), a pre-echo zone discrimination module (602) and a pre-echo attenuation processing module (607), an echo attenuation processing being performed for a current frame decomposed into sub-blocks, in the low-energy sub-blocks preceding a sub-block in which a transition or onset is detected determining a pre-echo zone, the device being characterized in that it further comprises:- a computation module (603) calculating a leading coefficient of the energies for at least two sub-blocks of the current frame preceding the sub-block in which an onset is detected, in the case where an onset is detected from the third sub-block of the current frame;- a comparator (604) capable of performing a comparison of the leading coefficient to a predefined threshold; and- a discrimination module (602) capable of inhibiting the pre-echo attenuation processing in the pre-echo zone in the case where the calculated leading coefficient is below the predefined threshold.
- Digital audio signal decoder comprising a pre-echo discrimination and attenuation device according to Claim 8.
- Computer program comprising code instructions for implementing the steps of the method according to one of Claims 1 to 7, when these instructions are executed by a processor.
- Storage medium that can be read by a pre-echo discrimination and attenuation processing device on which is stored a computer program comprising code instructions for executing the steps of the pre-echo discrimination and attenuation processing method according to one of Claims 1 to 7, when said storage medium runs on a computer.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1458608A FR3025923A1 (en) | 2014-09-12 | 2014-09-12 | DISCRIMINATION AND ATTENUATION OF PRE-ECHO IN AUDIONUMERIC SIGNAL |
PCT/FR2015/052433 WO2016038316A1 (en) | 2014-09-12 | 2015-09-11 | Discrimination and attenuation of pre-echoes in a digital audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
EP3192073A1 EP3192073A1 (en) | 2017-07-19 |
EP3192073B1 true EP3192073B1 (en) | 2018-08-01 |
Family
ID=51842602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP15771686.1A Active EP3192073B1 (en) | 2014-09-12 | 2015-09-11 | Discrimination and attenuation of pre-echoes in a digital audio signal |
Country Status (8)
Country | Link |
---|---|
US (1) | US10083705B2 (en) |
EP (1) | EP3192073B1 (en) |
JP (2) | JP6728142B2 (en) |
KR (1) | KR102000227B1 (en) |
CN (2) | CN106716529B (en) |
ES (1) | ES2692831T3 (en) |
FR (1) | FR3025923A1 (en) |
WO (1) | WO2016038316A1 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3025923A1 (en) * | 2014-09-12 | 2016-03-18 | Orange | DISCRIMINATION AND ATTENUATION OF PRE-ECHO IN AUDIONUMERIC SIGNAL |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
US11100942B2 (en) * | 2017-07-14 | 2021-08-24 | Dolby Laboratories Licensing Corporation | Mitigation of inaccurate echo prediction |
JP7172030B2 (en) * | 2017-12-06 | 2022-11-16 | 富士フイルムビジネスイノベーション株式会社 | Display device and program |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL249503A (en) | 1959-03-19 | |||
JP3104400B2 (en) * | 1992-04-27 | 2000-10-30 | ソニー株式会社 | Audio signal encoding apparatus and method |
FR2739736B1 (en) * | 1995-10-05 | 1997-12-05 | Jean Laroche | PRE-ECHO OR POST-ECHO REDUCTION METHOD AFFECTING AUDIO RECORDINGS |
JP3660599B2 (en) * | 2001-03-09 | 2005-06-15 | 日本電信電話株式会社 | Rising and falling detection method and apparatus for acoustic signal, program and recording medium |
US7583724B2 (en) * | 2003-12-05 | 2009-09-01 | Aquantia Corporation | Low-power mixed-mode echo/crosstalk cancellation in wireline communications |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
TWI275074B (en) * | 2004-04-12 | 2007-03-01 | Vivotek Inc | Method for analyzing energy consistency to process data |
FR2897733A1 (en) | 2006-02-20 | 2007-08-24 | France Telecom | Echo discriminating and attenuating method for hierarchical coder-decoder, involves attenuating echoes based on initial processing in discriminated low energy zone, and inhibiting attenuation of echoes in false alarm zone |
WO2010031951A1 (en) * | 2008-09-17 | 2010-03-25 | France Telecom | Pre-echo attenuation in a digital audio signal |
KR20110001130A (en) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | Apparatus and method for encoding and decoding audio signals using weighted linear prediction transform |
CN103559891B (en) * | 2009-09-18 | 2016-05-11 | 杜比国际公司 | Improved harmonic wave transposition |
US8582443B1 (en) * | 2009-11-23 | 2013-11-12 | Marvell International Ltd. | Method and apparatus for virtual cable test using echo canceller coefficients |
CN103325379A (en) * | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | Method and device used for acoustic echo control |
CN103391381B (en) * | 2012-05-10 | 2015-05-20 | 中兴通讯股份有限公司 | Method and device for canceling echo |
FR2992766A1 (en) | 2012-06-29 | 2014-01-03 | France Telecom | EFFECTIVE MITIGATION OF PRE-ECHO IN AUDIONUMERIC SIGNAL |
CN103730125B (en) * | 2012-10-12 | 2016-12-21 | 华为技术有限公司 | A kind of echo cancelltion method and equipment |
FR3000328A1 (en) * | 2012-12-21 | 2014-06-27 | France Telecom | EFFECTIVE MITIGATION OF PRE-ECHO IN AUDIONUMERIC SIGNAL |
FR3011408A1 (en) * | 2013-09-30 | 2015-04-03 | Orange | RE-SAMPLING AN AUDIO SIGNAL FOR LOW DELAY CODING / DECODING |
FR3015754A1 (en) * | 2013-12-20 | 2015-06-26 | Orange | RE-SAMPLING A CADENCE AUDIO SIGNAL AT A VARIABLE SAMPLING FREQUENCY ACCORDING TO THE FRAME |
FR3023036A1 (en) * | 2014-06-27 | 2016-01-01 | Orange | RE-SAMPLING BY INTERPOLATION OF AUDIO SIGNAL FOR LOW-LATER CODING / DECODING |
FR3025923A1 (en) * | 2014-09-12 | 2016-03-18 | Orange | DISCRIMINATION AND ATTENUATION OF PRE-ECHO IN AUDIONUMERIC SIGNAL |
-
2014
- 2014-09-12 FR FR1458608A patent/FR3025923A1/en active Pending
-
2015
- 2015-09-11 CN CN201580048998.5A patent/CN106716529B/en active Active
- 2015-09-11 KR KR1020177009719A patent/KR102000227B1/en active IP Right Grant
- 2015-09-11 JP JP2017513524A patent/JP6728142B2/en active Active
- 2015-09-11 US US15/510,831 patent/US10083705B2/en active Active
- 2015-09-11 EP EP15771686.1A patent/EP3192073B1/en active Active
- 2015-09-11 CN CN202010861715.1A patent/CN112086107B/en active Active
- 2015-09-11 ES ES15771686.1T patent/ES2692831T3/en active Active
- 2015-09-11 WO PCT/FR2015/052433 patent/WO2016038316A1/en active Application Filing
-
2020
- 2020-06-30 JP JP2020112837A patent/JP7008756B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN112086107A (en) | 2020-12-15 |
FR3025923A1 (en) | 2016-03-18 |
CN112086107B (en) | 2024-04-02 |
KR20170055515A (en) | 2017-05-19 |
EP3192073A1 (en) | 2017-07-19 |
WO2016038316A1 (en) | 2016-03-17 |
ES2692831T3 (en) | 2018-12-05 |
JP2020170187A (en) | 2020-10-15 |
US20170263263A1 (en) | 2017-09-14 |
KR102000227B1 (en) | 2019-07-15 |
JP2017532595A (en) | 2017-11-02 |
JP6728142B2 (en) | 2020-07-22 |
JP7008756B2 (en) | 2022-01-25 |
US10083705B2 (en) | 2018-09-25 |
CN106716529A (en) | 2017-05-24 |
CN106716529B (en) | 2020-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2002428B1 (en) | Method for trained discrimination and attenuation of echoes of a digital signal in a decoder and corresponding device | |
EP2867893B1 (en) | Effective pre-echo attenuation in a digital audio signal | |
EP1789956B1 (en) | Method of processing a noisy sound signal and device for implementing said method | |
CA2436318C (en) | Noise reduction method and device | |
EP2936488B1 (en) | Effective attenuation of pre-echos in a digital audio signal | |
EP2586133B1 (en) | Controlling a noise-shaping feedback loop in a digital audio signal encoder | |
EP2153438B1 (en) | Post-processing for reducing quantification noise of an encoder during decoding | |
FR2741217A1 (en) | METHOD AND DEVICE FOR REMOVING PARASITE NOISE IN A COMMUNICATION SYSTEM | |
EP3192073B1 (en) | Discrimination and attenuation of pre-echoes in a digital audio signal | |
FR2907586A1 (en) | Digital audio signal e.g. speech signal, synthesizing method for adaptive differential pulse code modulation type decoder, involves correcting samples of repetition period to limit amplitude of signal, and copying samples in replacing block | |
EP2347411B1 (en) | Pre-echo attenuation in a digital audio signal | |
EP1016071B1 (en) | Method and apparatus for detecting speech activity | |
EP0506535B1 (en) | Method and system for processing of pre-echos of a frequency transform coded digital audio signal | |
WO2001011605A1 (en) | Method and device for detecting voice activity | |
EP1021805B1 (en) | Method and apparatus for conditioning a digital speech signal | |
EP2515300B1 (en) | Method and system for noise reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20170404 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
AX | Request for extension of the european patent |
Extension state: BA ME |
|
DAV | Request for validation of the european patent (deleted) | ||
DAX | Request for extension of the european patent (deleted) | ||
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R079 Ref document number: 602015014397 Country of ref document: DE Free format text: PREVIOUS MAIN CLASS: G10L0025210000 Ipc: G10L0019260000 |
|
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
RIC1 | Information provided on ipc code assigned before grant |
Ipc: G10L 25/21 20130101ALI20180306BHEP Ipc: G10L 19/26 20130101AFI20180306BHEP Ipc: G10L 25/51 20130101ALI20180306BHEP |
|
INTG | Intention to grant announced |
Effective date: 20180323 |
|
RIN1 | Information on inventor provided before grant (corrected) |
Inventor name: KOVESI, BALAZS Inventor name: RAGOT, STEPHANE |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP Ref country code: AT Ref legal event code: REF Ref document number: 1025252 Country of ref document: AT Kind code of ref document: T Effective date: 20180815 |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: LANGUAGE OF EP DOCUMENT: FRENCH |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R096 Ref document number: 602015014397 Country of ref document: DE |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 4 |
|
REG | Reference to a national code |
Ref country code: ES Ref legal event code: FG2A Ref document number: 2692831 Country of ref document: ES Kind code of ref document: T3 Effective date: 20181205 Ref country code: NL Ref legal event code: MP Effective date: 20180801 |
|
REG | Reference to a national code |
Ref country code: LT Ref legal event code: MG4D |
|
REG | Reference to a national code |
Ref country code: AT Ref legal event code: MK05 Ref document number: 1025252 Country of ref document: AT Kind code of ref document: T Effective date: 20180801 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: FI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: PL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: AT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: SE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: BG Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20181101 Ref country code: NL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: IS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20181201 Ref country code: GR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20181102 Ref country code: NO Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20181101 Ref country code: LT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: RS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: HR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: LV Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: AL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: CZ Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: EE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: RO Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: MC Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: PL |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R097 Ref document number: 602015014397 Country of ref document: DE |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SM Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: DK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: SK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
REG | Reference to a national code |
Ref country code: BE Ref legal event code: MM Effective date: 20180930 |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: MM4A |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: LU Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180911 |
|
26N | No opposition filed |
Effective date: 20190503 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180911 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: BE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180930 Ref country code: LI Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180930 Ref country code: CH Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180930 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: MT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: TR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: PT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: CY Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20180801 Ref country code: HU Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO Effective date: 20150911 Ref country code: MK Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20180801 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: IT Payment date: 20230822 Year of fee payment: 9 Ref country code: GB Payment date: 20230823 Year of fee payment: 9 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20230822 Year of fee payment: 9 Ref country code: DE Payment date: 20230822 Year of fee payment: 9 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: ES Payment date: 20231002 Year of fee payment: 9 |