EP3391370A1 - Adaptive channel-reduction processing for encoding a multi-channel audio signal - Google Patents

Adaptive channel-reduction processing for encoding a multi-channel audio signal

Info

Publication number
EP3391370A1
EP3391370A1 EP16825835.8A EP16825835A EP3391370A1 EP 3391370 A1 EP3391370 A1 EP 3391370A1 EP 16825835 A EP16825835 A EP 16825835A EP 3391370 A1 EP3391370 A1 EP 3391370A1
Authority
EP
European Patent Office
Prior art keywords
signal
multichannel
channels
reduction processing
indicator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
EP16825835.8A
Other languages
German (de)
French (fr)
Inventor
Bertrand FATUS
Stéphane RAGOT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Publication of EP3391370A1 publication Critical patent/EP3391370A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Definitions

  • the present invention relates to the field of coding / decoding of digital signals.
  • the coding and decoding according to the invention is particularly suitable for the transmission and / or storage of digital signals such as audio-frequency signals (speech, music or other).
  • the present invention relates to parametric encoding or processing of multichannel audio signals, e.g. stereophonic signals hereinafter referred to as stereo signals.
  • This type of coding is based on the extraction of spatial information parameters so that at decoding, these spatial characteristics can be reconstructed for the listener, in order to recreate the same spatial image as in the original signal.
  • Such a parametric coding / decoding technique is for example described in the document by J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, titled "Parametric Coding of Stereo Audio” in EURASIP Journal on Applied Signal Processing 2005 : 9, pp. 1305-1322. This example is repeated with reference to FIGS. 1 and 2 respectively describing an encoder and a parametric stereo decoder.
  • Figure 1 describes a stereo encoder receiving two audio channels, a left channel (denoted L for Left in English) and a right channel (noted R for Right in English).
  • the time signals L (n) and R (n), where n is the entire index of the samples, are processed by the blocks 101, 102, 103 and 104 which perform a short-term Fourier analysis.
  • the transformed signals L [k] and R [k], where k is the integer index of the frequency coefficients, are thus obtained.
  • Block 105 performs a channel reduction processing or "downmix" in English to obtain in the frequency domain from the left and right signals, a monophonic signal hereinafter called mono signal.
  • Extraction of spatial information parameters is also performed in block 105.
  • the extracted parameters are as follows.
  • the ICLD InterChannel Level Difference
  • interchannel intensity differences characterize the energy ratios per frequency subband between the left and right channels.
  • each frequency band of index b comprises the frequency lines in the interval [k b , k b + 1 - 1 ] and the symbol * indicates the complex conjugate.
  • ICTD InterChannel Time Difference
  • the ICC for "InterChannel Coherence" parameters represent the inter-channel correlation (or coherence) and are associated with the spatial width of the data. sound sources; their definition is not recalled here, but it is noted in the article by Breebart et al. that the ICC parameters are not necessary in the subbands reduced to a single frequency coefficient - in fact the amplitude and phase differences completely describe the spatialization in this "degenerate" case.
  • ICLD, ICPD and ICC are extracted by analysis of the stereo signals, by the block 105. If the parameters ICTD or ITD were also coded, these could also be extracted by subband from the spectra L [k] and R [k]; however, the extraction of the ITD parameters is in general simplified by assuming an identical inter-channel time shift for each sub-band and in this case a parameter can be extracted from the time channels L (n) and R (n) through inter-correlations.
  • the mono signal M [k] is transformed in the time domain (blocks 106 to 108) after short-term Fourier synthesis (inverse FFT, windowing and OverLap-Add or overlay) and a mono coding (block 109) is then realized.
  • the stereo parameters are quantized and coded in block 110.
  • the spectrum of the signals (L [k], R [k]) is divided according to a nonlinear frequency scale of ERB (equivalent Rectangular Bandwidth) or Bark type, with a number of subbands typically ranging from 20 to 34. for a sampled signal from 16 to 48 kHz according to the Bark scale. This scale defines the values of k b and k b + 1 for each subband b.
  • the parameters (ICLD, ICPD, ICC, ITD) are encoded by scalar quantization possibly followed by entropy coding and / or differential coding.
  • the ICLD is encoded by a non-uniform quantizer (ranging from from -50 to +50 dB) with differential entropy coding.
  • the non-uniform quantization step exploits the fact that the higher the value of the ICLD, the lower the auditory sensitivity to variations of this parameter.
  • coding For the coding of the mono signal (block 109), several quantification techniques with or without memory are possible, for example coding with “Coded Pulse Modulation” (MIC), its version with adaptive prediction called “Adapted differential pulse coded modulation”. "(ADPCM) or more advanced techniques such as transform perceptual coding or Code Excited Linear Prediction (CELP) coding or multi-mode coding.
  • MIC Coded Pulse Modulation
  • ADPCM Adapted differential pulse coded modulation
  • CELP Code Excited Linear Prediction
  • EVS Enhanced Voice Services
  • the input signal of the EVS codec is sampled at the frequency of 8, 16, 32 or 48 kHz and the codec may represent audio telephony bands (narrowband, NB), wideband (WB), super-wideband (superband) wideband, SWB) or full band (fullband, FB).
  • the rates of the EVS codec are divided into two modes:
  • VBR Variable rate mode
  • DTX discontinuous transmission mode
  • SID frames SID Primary or SID AMR-WB IO
  • the mono signal is decoded (block 201), a de-correlator is used (block 202) to produce two versions M (n) and M '(n) of the decoded mono signal.
  • This decorrelation necessary only when the ICC parameter is used, makes it possible to increase the spatial width of the mono source (n).
  • These two signals M (n) and M '(n) are passed in the frequency domain (blocks 203 to 206) and the decoded stereo parameters (block 207) are used by the stereo synthesis (or formatting) (block 208) to reconstruct the left and right channels in the frequency domain. These channels are finally reconstructed in the time domain (blocks 209 to 214).
  • the block 105 performs a channel reduction processing or "downmix” by combining the stereo channels (left, right) to obtain a mono signal which is then encoded by a mono encoder.
  • the spatial parameters ICLD, ICPD, ICC, (7) are extracted from the stereo channels and transmitted in addition to the bitstream from the mono encoder.
  • the passive "downmix" which corresponds to a direct matrixing of the stereo channels to combine them in a single signal - the coefficients of the matrix of donwmix are generally real and of predetermined values (fixed);
  • M [k] Y [k] L [k] + 2 R [k] (5)
  • k corresponds to the index of a frequency coefficient (Fourier coefficient for example representing a frequency subband).
  • the phase of the channel L for each frequency sub-band is chosen as the reference phase
  • the channel R is aligned according to the phase of the channel L for each sub-band by the following formula:
  • An ideal conversion of a stereo signal to a mono signal should avoid attenuation problems for all frequency components of the signal.
  • This "downmix" operation is important for parametric stereo coding because the decoded stereo signal is only a spatial shaping of the decoded mono signal.
  • the downmix technique in the frequency domain described above retains the energy level of the stereo signal in the mono signal by aligning the R channel and the L channel before processing. This phase alignment avoids situations where the channels are in phase opposition.
  • the amplitude of M [k] is the average of the amplitudes of the L and R channels.
  • the phase of M [k] is given by the phase of the signal summing the two stereo channels (L + R).
  • the method of Hoang et al. preserves the energy of the mono signal like the Samsudin et al. method, and it avoids the problem of total dependence of one of the stereo channels (L or R) for the phase calculation z [/ c].
  • L or R stereo channels
  • it presents a disadvantage when the canals L and R are in quasi-phase opposition in some subbands (with the extreme case L -R). Under these conditions, the resulting mono signal will be of poor quality.
  • this method does not directly take into account the phase changes that can appear in successive frames which can possibly cause phase jumps.
  • the invention improves the situation of the state of the art.
  • the method makes it possible to obtain a channel reduction processing that is adequate for the multichannel signal to be coded, especially when the channels of this signal are in opposition to each other. phase.
  • the adaptation of the downmix being performed per frequency unit, that is to say by frequency sub-band or by frequency line, this makes it possible to adapt to the fluctuations of the multichannel signal of a frame to the 'other.
  • the method furthermore comprises the determination of a phase indicator, representative of a measurement of degree of phase opposition between the channels of the multichannel signal, and that one of the modes of processing of channel reduction of said set depends on the value of the phase indicator.
  • a particular downmix processing is thus performed for the signals whose channels are in phase opposition.
  • This treatment is implemented in a manner adapted to the fluctuation of the signal over time.
  • the set of channel reduction processing modes includes a plurality of processing in the following list:
  • phase-indicator-type hybrid channel reduction processing representative of a phase opposition degree measurement between the multichannel signal channels
  • the indicator characterizing the channels of the multichannel audio signal is a correlation measurement indicator between the channels of the multichannel audio signal.
  • This indicator makes it possible to adapt the channel reduction processing to the channel correlation characteristics of the multichannel audio signal.
  • the determination of this indicator is simple to implement and the quality of the downmix is improved.
  • the indicator characterizing the channels of the multichannel audio signal is a phase indicator, representative of a measure of degree of phase opposition between the multichannel signal channels.
  • This indicator makes it possible to adapt the channel reduction processing to the phase characteristics of the channels of the multichannel audio signal and in particular to the signals which have channels in phase opposition.
  • the invention relates to a device for parametric coding of a multichannel digital audio signal comprising an encoder able to encode a mono signal coming from a channel reduction processing module applied to the multichannel signal and a quantization module for encoding spatialisation information of the multichannel signal.
  • the device is remarkable in that the channel reduction processing module comprises:
  • an extraction module capable of obtaining at least one indicator characterizing the channels of the multichannel digital audio signal, per spectral unit of the multichannel signal
  • a selection module capable of selecting, by spectral unit of the multichannel signal, from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator characterizing the channels; multichannel audio signal.
  • the invention also applies to a method of processing a decoded multichannel audio signal comprising channel reduction processing to obtain a mono signal to be restored.
  • the method is remarkable in that the channel reduction processing comprises the following steps, implemented per spectral unit of the multichannel signal:
  • the method makes it possible to carry out a downmix processing adapted to the signal received, in a simple manner.
  • the processing method further comprises determining a phase indicator representative of a phase opposition degree measurement between the channels of the multichannel signal and that one of the modes of channel reduction processing of said set depends on the value of the phase indicator.
  • a particular downmix processing is thus performed for the decoded signals whose channels are in phase opposition.
  • This treatment is implemented in a manner adapted to the fluctuation of the signal over time.
  • the set of channel reduction processing modes includes a plurality of processing in the following list:
  • phase-indicator-type hybrid channel reduction processing representative of a phase opposition degree measurement between the multichannel signal channels
  • the indicator characterizing the channels of the multichannel audio signal is a correlation measurement indicator between the channels of the multichannel audio signal.
  • This indicator is used to adapt the channel reduction processing to the channel correlation characteristics of the decoded multichannel audio signal.
  • the determination of this indicator is simple to implement and the quality of the downmix is improved.
  • the indicator characterizing the channels of the multichannel audio signal is a phase indicator, representative of a measure of degree of phase opposition between the multichannel signal channels.
  • This indicator makes it possible to adapt the channel reduction processing to the phase characteristics of the channels of the multichannel audio signal and in particular to the signals which have channels in phase opposition.
  • the invention also relates to a device for processing a decoded multichannel audio signal comprising a channel reduction processing module for obtaining a mono signal to be reproduced, which is remarkable in that the channel reduction processing module comprises:
  • an extraction module able to obtain at least one indicator characterizing the channels of the multichannel digital audio signal, per spectral unit of the multichannel signal
  • a selection module capable of selecting, by spectral unit of the multichannel signal, from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator characterizing the channels; multichannel audio signal.
  • This device has the same advantages as the method described above that it implements.
  • the invention relates to a computer program comprising code instructions for implementing the steps of an encoding method according to the invention, when these instructions are executed by a processor.
  • the invention finally relates to a storage medium readable by a processor on which is recorded a computer program comprising code instructions for performing the steps of the method as described.
  • FIG. 1 illustrates an encoder implementing a parametric coding known from the state of the art and previously described
  • FIG. 2 illustrates a decoder implementing a parametric decoding known from the state of the art and previously described
  • FIG. 3 illustrates a stereo parametric encoder according to one embodiment of the invention
  • FIGS. 4a, 4b, 4c, 4d, 4e and 4f illustrate in flowchart form the steps of the channel reduction processing according to different embodiments of the invention
  • FIG. 5 illustrates an example of evolution of an indicator characterizing the channels of a given multichannel signal used according to one embodiment of the invention, for a given signal
  • FIG. 6 illustrates an example of possible weightings as a function of the value of an indicator characterizing the channels of a signal according to one embodiment of the invention
  • FIG. 7 illustrates a stereo parametric decoder implementing a decoding adapted to the signals coded according to the coding method of the invention
  • FIG. 8 illustrates a device for processing a decoded audio signal in which a channel reduction processing according to the invention is carried out
  • FIG. 9 illustrates a hardware example of a device incorporating an encoder able to implement the coding method, according to one embodiment of the invention.
  • This figure shows both the entities, hardware modules or software driven by a processor of the coding device and the steps implemented by the coding method according to one embodiment of the invention.
  • the invention applies similarly to other types of mono coding (eg IETF OPUS, ITU-T G.722) operating at identical or different sampling rates.
  • mono coding eg IETF OPUS, ITU-T G.722
  • Each time channel (L (n) and R (n)) sampled at 16 kHz is first pre-filtered by a High Pass Filter (HPF) typically eliminating components below 50 Hz ( blocks 301 and 302).
  • HPF High Pass Filter
  • This pre-filtering is optional, but it can be used to avoid DC bias in estimating parameters such as ICTD or ICC.
  • the channels L '(n) and ff' (n) coming from pre-filtering blocks are analyzed in frequencies by discrete Fourier transform with overlapping sinusoidal windowing of 50% length 40 ms or 640 samples (blocks 303 to 306) .
  • the 40ms analysis window covers the current frame and the future frame.
  • the future frame corresponds to a "future" signal segment commonly called "lookahead" of 20 ms.
  • other windows may be used, for example an asymmetrical low-delay window called "ALDO" in the EVS codec.
  • the analysis windowing can be made adaptive according to the current frame, in order to use an analysis with a long window on stationary segments and an analysis with short windows on transitional / non-transitory segments. stationary, possibly with transition windows between long and short windows.
  • the coefficients of index 0 ⁇ k ⁇ 160 are complex and correspond to a 25 Hz sub-band centered on the frequency of k.
  • the spectra L [k] and R [k] are combined in the block 307 described later to obtain a mono (downmix) signal M [k] in the frequency domain.
  • This signal is converted in time by inverse FFT and windowing-recovery with the "lookahead" part of the previous frame (blocks 308 to 310).
  • the lookahead for the calculation of the mono signal (20 ms) and the mono coding / decoding delay to which is added the delay T to align the mono synthesis (20 ms) correspond to an additional delay of 2 frames (40 ms) compared to the current frame.
  • the shifted mono signal is then coded (block 312) by the mono EVS encoder, for example at a rate of 13.2, 16.4 or 24.4 kbit / s.
  • the coding may be performed directly on the non-shifted signal; in this case the shift can be performed after decoding.
  • the block 313 introduces a delay of two frames on the spectra L [k], R [k] and M [k] in order to obtain the spectra L bU f [k], R bU f [k] and M bU f [k].
  • the coding of the stereo spatial information is implemented in the blocks 314 to 317.
  • the stereo parameters are extracted (block 314) and coded (blocks 315 to 317) from the spectrums L [k], R [k] and M [k] offset by two frames: L bU f [k], R bU f [k] and M bU f [k].
  • the channel reduction processing block 307 or "downmix" is now described in more detail.
  • This processing unit 307 comprises a module for obtaining 307a of at least one indicator characterizing the channels of the multichannel signal, here the stereo signal.
  • the indicator may for example be an interchannel correlation type indicator or an indicator of degree of phase opposition between channels. Obtaining these indicators will be described later.
  • the selection block 307b from among a set of downmix processing modes, selects a downmix processing mode which is applied at 307c to the input signals, here to the stereo signal L [ k], R [k] to give a mono signal [/ c].
  • FIGS 4a to 4f illustrate various embodiments implemented by the processing block 307.
  • the parameter ICPD [k] is calculated in the current frame for each frequency line k according to the formula:
  • This parameter corresponds to the phase difference between the L and R channels. It is used here to define the ICCr parameter.
  • N FFT the length of the FFT
  • the complex module may not be applied, but in this case the use of the ICCp parameter (or its derivatives) must take into account the signed value of this parameter.
  • This parameter may optionally be smoothed to mitigate temporal variations. If the current frame is of index m, this smoothing can be calculated with a filter MA (at Adjusted Average) of order 2:
  • the ICCr parameter will be used to designate ICCr [m] (without mentioning the index of the current frame); if the smoothing is not applied, the ICCr parameter will correspond directly to ICCp.
  • other smoothing methods may be implemented, for example using an AR (autoregressive) filter, smoothing the signals.
  • the ICCr parameter quantifies the level of correlation between the L and R channels when the phase differences between these channels are ignored.
  • the parameter ICCp can be defined by subband simply by changing the bounds of the sums, as follows:
  • k b ... k b + 1 - 1 represent the indices of the frequency lines in the subband of index b.
  • the ICCp [b] parameter can be smoothed and in this case the invention will be implemented in the following way: instead of having a single comparison to ICCr [m], there will be as many comparisons to ICCp [b] that there are subbands of index b.
  • the dominant channel is also identified for use as a phase reference.
  • this dominant channel can be determined via an SGN sign parameter calculated for the current frame as the sign of the difference in channel levels.
  • the condition for authorizing a phase reference switching can be defined by frequency line and depend on the type of downmix used to the current frame (of index m) and the type of downmix used to the previous frame (of index m-1); indeed, if the dowmix for the line of index k in the frame m-1 was of the passive type (with compensation of gain) and if the downmix selected at the frame m is a downmix with alignment on an adaptive phase reference, in this case it will be possible to authorize a phase reference switching.
  • the phase reference switch is forbidden for the index line k as long as the downmix explicitly uses the phase reference corresponding to the parameter SGN.
  • the SGN sign parameter [m] therefore only changes its value when ICCr is below a threshold (in the preferred embodiment). This precaution avoids changing the phase reference in areas where the channels are highly correlated and potentially in phase opposition.
  • another criterion may be used to define the phase reference switching conditions.
  • the binary decision associated with the calculation of SGN d may be stabilized to avoid potentially rapid fluctuations. It will thus be possible to define a tolerance, for example of +/- 3 dB, on the value of the level of the channels L and R, in order to implement a hysteresis preventing the change of reference of phase if the tolerance is not exceeded. It will also be possible to apply inter-frame smoothing on the value of the signal level.
  • the parameter SGN d can be calculated with another definition of the level of the channels, for example:
  • the ISD value becomes arbitrarily large.
  • the division in the calculation of the ISD parameter can be avoided because ISD is then compared to a threshold; it is common to add a non-zero low value to the denominator to avoid a division by zero, this precaution is here unnecessary because in the embodiments of the invention this division is not implemented.
  • the comparison ISD [k]> thO is equivalent to the comparison ⁇ L [k] - R [k] ⁇ > thO. ⁇ L [k] + R [k] ⁇ , which makes the downmix mode selection process attractive in terms of complexity.
  • FIG. 4a illustrates the steps implemented for the channel reduction processing of block 307.
  • an indicator characterizing the channels of the multichannel audio signal is obtained.
  • it is the ICCr parameter as defined above, calculated from the ICPD parameter.
  • the ICCr indicator corresponds to a correlation measurement between the channels of the multichannel signal, in the particular case here between the channels of the stereo signal.
  • the choice of the downmix depends mainly on the ICCr [m] indicator calculated as previously explained from the L and R channels of the current frame and of any smoothing.
  • the choice between downmix processing modes is based on the value of the ICCr [m] indicator.
  • This downmix - / c] is defined as a sum sign with equalization of energy in the form:
  • This downmix is effective for stereo signals (and their frequency decompositions by line or subbands) whose channels are not highly correlated and do not have a complex phase relationship. Since it is not used for problematic signals where the gain y [k] could take large arbitrary values, no limitation of the gain is used here, however in variants a limitation of the amplification could be implemented.
  • this equalization by the gain y [k] may be different. For example it would be possible to take the already quoted value:
  • the advantage of the gain y [k] is that it provides the same level of amplitude for the downmix - / c] as for the other downmixes used. It is therefore preferable to adjust the gain y [k] to ensure a level of amplitude or homogeneous energy between the different downmixes.
  • phase of this downmix can also be expressed in an equivalent way as:
  • This downmix is similar to the downmix proposed by the above Samsudin method, however here the reference phase is not given by the L channel and the phase is determined line by line and not at a frequency band.
  • the phase is here set according to the dominant channel identified by the parameter SGN.
  • This downmix is interesting for highly correlated signals, for example for sound signals with AB or binaural type microphones. It may also happen that independent channels have a fairly strong correlation even if it is not the same signal recorded in the L and R channels; to avoid inadvertent switching of the phase reference, it is preferable to allow such switching only when the signals do not present a risk of generating audio artifacts when this downmix is used. This explains the constraint ICCr [m] ⁇ 0.4 in the SGN [m] parameter calculation when the phase reference switching condition uses this criterion. 3. Hybrid downmix between a passive downmix (with gain compensation) and a dowmix with alignment on an adaptive phase reference, depending on an indicator of degree of phase opposition between the channels (ISD [k], such as defined above).
  • This downmix is applied here in cases where the signals are moderately correlated and where they are potentially in phase opposition.
  • the ISD parameter [k] is used here to detect a phase relation close to the phase opposition, and in this case it is preferable to select the downmix with alignment on an adaptive phase reference M 3 [k]; in the opposite case the passive dowmix with gain compensation M [k] is sufficient.
  • the downmix M 2 [k] corresponds to either M [k] or M 3 [k], depending on the value of the ISD parameter [k]. It will be understood that in variants of the invention, it will therefore be possible not to explicitly define this downmix M 2 [k] but to combine the decisions on the downmix selection and the criterion on ISD [k]. Such an example is given in Figure 4c however it is clear that this example applies of course to all embodiments presented here.
  • step E401 if in step E401, the indicator is lower than a first threshold th1, then a first downmix processing mode M1 is implemented in step E402.
  • step E403 If in step E403, the indicator is less than a second threshold th2, then a second downmix processing mode according to M1 and M2 is implemented in step E404.
  • step E405 the indicator is greater than the third threshold th3, then a fourth downmix processing mode M3 is implemented in step E407.
  • the threshold values th1, th2, th3 may be set to other values; the values given here typically correspond to a frame length of 20 ms.
  • weighting of the functions of combinations fl. ,. ) and 2 (.,.) are shown in Figure 6. These combination functions perform a "cross-fade" between different downmixes to avoid threshold effects, that is, too steep transitions between them. respective downmix from one frame to another for a given line. Any weighting functions having complementary values between 0 and 1 are suitable within the defined range, but in the embodiment these functions are derived from the function:
  • the parameter ICCr [m] is here defined at the level of the current frame; in variants this parameter can be estimated by frequency band (for example according to the ERB or Bark scale).
  • FIG. 4b illustrates the steps implemented for the channel reduction processing of block 307.
  • This variant embodiment is intended to simplify the decision on the downmix method to be used and to reduce the complexity. by not fading between two downmix methods.
  • Steps E400, E401, E402, E405 and E407 are identical to those described with reference to FIG. 4a.
  • step E401 if in step E401, the indicator is lower than a first threshold th1, then a first downmix processing mode M1 is implemented in step E402.
  • step E405 If in step E405, the indicator is below a threshold th3, then a second downmix processing mode M2 is implemented in step E410.
  • step E405 the indicator is greater than threshold th3, then a third downmix M3 processing mode is implemented in step E407.
  • downmix M1, M2 and M3 are for example those described above.
  • the downmix M2 is a hybrid downmix between the downmix Ml and M3 which involves another decision criterion on another indicator ISD as defined above.
  • FIG. 4c A strictly identical embodiment in terms of the result of FIG. 4b is shown in FIG. 4c.
  • the evaluation of the selection parameters (block E450) and the downmix selection decisions (block E451) are gathered.
  • FIG. 4d illustrates the steps implemented for the channel reduction processing of block 307.
  • This variant embodiment is intended to simplify the decision on the downmix method to be used, this time by not using passive downmix - ⁇ / c]. Indeed, this passive downmix is in fact already included in the hybrid downmix M 2 [k]; moreover, we can consider that the hybrid downmix is a more robust variant than the downmix M [k] because it makes it possible to avoid the problems of phase opposition.
  • step E403 If in step E403, the indicator is below a threshold th2, then downmix processing M2 is implemented in step E410.
  • step E405 If in step E405, the indicator is below a threshold th3, then a downmix processing mode according to M2 and M3 is implemented in step E406.
  • step E405 the indicator is greater than threshold th3, then a downmix processing mode M3 is implemented in step E407.
  • FIG. 4d is strictly equivalent to that of FIG. 4b by setting th1 to a value ⁇ 0.
  • FIG. 4e illustrates the steps implemented for the block reduction processing of block 307.
  • the indicator characterizing the channels of the multichannel digital audio signal is the ISD phase indicator. representative of a phase opposition degree measurement of the multichannel signal channels.
  • step E420 For a stereo signal, this parameter is as defined in equation (18) for a spectral line calculation.
  • step E421 if in step E421, the indicator ISD [k] is greater than a threshold thO, then a first downmix processing mode is implemented in step E422.
  • step E421 If in step E421, the ISD indicator [k] is below thO threshold, then a second downmix processing mode is implemented in step E423.
  • the main criterion for selecting the downmix mode is defined as the ISD parameter as in FIG. 4e, however this parameter is this time defined by subband in step E430, ISD [b] where b is the index of the frequency subband (typically ERB or Bark).
  • ISD the index of the frequency subband
  • the selected downmix mode is this time. This is similar to the method defined in Annex D of G.722 but more directly, without the use of full-band IPD.
  • step E431 if in step E431, the ISD indicator [b] is greater than a threshold thO, then a first downmix processing mode is implemented in step E432.
  • step E431 If in step E431, the ISD flag [b] is below thO threshold, then a second downmix processing mode is implemented in step E433.
  • the multichannel signal channels such as the ICCr parameter or the ISD parameter (on the frame, by subband, or by line).
  • a cross fade could be applied in the embodiment where the criterion is the ISD indicator.
  • M [k] pl. - / c] + p2.
  • M 3 [k] could also be chosen.
  • the weights p1, p2 and p3 are then adapted according to the selection criteria.
  • FIG. 5 gives an example of the evolution of the parameter ICCr for a given signal with the decision thresholds th3 and th1 set at 0.4 and 0.6 as described in the embodiment of FIG. 4b. Note that these predetermined values are especially valid for a frame of 20 ms and they can be modified if the frame length is different.
  • This figure shows the fluctuation of this ICCr indicator and the SGN indicator. It is therefore wise to adapt the downmix treatment as best as possible to the evolution of this indicator. Indeed, a significant correlation of the signals for the frames from 100 to 300 for example, can allow an adaptive downmix with alignment on a reference of phase.
  • the ICCr indicator is between the thresholds th1 and th3, this means that the signal channels are moderately correlated and potentially out of phase.
  • the downmix to be applied depends on an indicator indicating a phase opposition between the channels. If the indicator reveals a phase opposition, then it is preferable to select the downmix with alignment on an adaptive phase reference defined above by M 3 [k]. In the opposite case, the passive downmix with gain compensation defined above by M- ⁇ [k] is sufficient.
  • the value of the parameter SGN which is also represented in FIG. 5 serves to choose the right phase reference in the case where the correlation indicator is under a threshold, for example 0.4.
  • the phase reference therefore passes from L to R around the frame 500.
  • the spectra L bU f [k] and R bU f [k] are divided into 35 sub-frequency bands. These subbands are defined by the following boundaries:
  • ICLD [b] 10. log w ⁇ (21) where a [b] and ⁇ [b] represent the energy of the left channel ⁇ L bU f [k]) and the right channel (R buf [k]) :
  • the ICLD parameters are coded by differential non-uniform scalar quantization (block 315). This quantification will not be detailed here because it goes beyond the scope of the invention.
  • ICPD and ICC parameters are encoded by methods known to those skilled in the art, for example with uniform scalar quantization over the appropriate interval.
  • This decoder comprises a demultiplexer 501 in which the coded mono signal is extracted to be decoded at 502 by a mono EVS decoder in this example.
  • the part of the bitstream corresponding to the EVS mono encoder is decoded according to the bit rate used at the encoder. It is assumed here that there is no loss of frames or bit errors on the bit stream to simplify the description, however, known frame loss correction techniques can obviously be implemented in the decoder.
  • the decoded mono signal corresponds to (n) in the absence of channel errors.
  • a short-term discrete Fourier transform analysis with the same windowing as the encoder is performed on M (n) (blocks 503 and 504) to obtain the spectrum M [k]. It is considered here that a decorrelation in the frequency domain (block 520) is also applied.
  • the part of the bit stream associated with the stereo extension is also de-multiplexed.
  • the ICLD, ICPD, ICC parameters are decoded to obtain ICLD q [b], ICPD q [b] and ICC q [b] (blocks 505 to 507).
  • the decoded mono signal may be decorrelated for example in the frequency domain (block 520).
  • the implementation details of block 508 are not presented here because they go beyond the scope of the invention, but conventional techniques known to those skilled in the art can be used.
  • the spectra L [k] and R [k] are thus calculated and then converted in the time domain by inverse FFT, windowing, addition and overlap (blocks 509 to 514) to obtain the synthesized channels L (n) and R (n). .
  • the encoder presented with reference to FIG. 3 and the decoder presented with reference to FIG. 7 have been described in the case of a particular application of stereo coding and decoding.
  • the invention has been described from a decomposition of stereo channels by discrete Fourier transform.
  • the invention is also applicable to other complex representations, such as for example the Modulated Complex Lapped Transform (MCLT) decomposition.
  • MCLT Modulated Complex Lapped Transform
  • MDCT discrete modified cosine transform
  • MDST discrete modified sinus transform
  • PQMF Pseudo-Quadrature Mirror Filter
  • the downmix that is the subject of the invention may be used not only for coding but also for decoding in order to generate a mono signal at the output of a decoder or stereo receiver, in order to ensure compatibility with equipment only. mono. This can be the case for example when going from a sound reproduction to the headphones to a return to a speaker.
  • FIG. 8 illustrates this embodiment, for example a stereo signal is decoded (L (n), R (n)). It is transformed by the respective blocks 601, 602 and 603, 604 to obtain the left and right spectrums (L [k] and R [k]).
  • This processing block 605 comprises a obtaining module 605a of at least one indicator characterizing the channels of the multichannel stereo signal received, here the stereo signal.
  • the indicator may for example be an interchannel correlation type indicator or an indicator of degree of phase opposition between channels.
  • the selection block 605b from among a set of downmix processing modes, selects a downmix processing mode that applies at 605c to the input signals, here to the stereo signal L [ k], R [k] to give a mono signal [/ c].
  • the encoders and decoders as described with reference to FIGS. 3, 7 and 8 may be integrated in multimedia equipment of the set-top box type or audio or video content player. They can also be integrated into communication equipment of the mobile phone or communication gateway type.
  • the case of a downmix of 5.1 channels to a stereo signal is considered.
  • a 5.1 type surround signal defined as a set of 6 channels: L (Front Left), C (Center), R (Front Right), Ls (Left Surround or Rear Left), Rs (Right Surround or Rear Right), LFE (Low Frequency Effects or Subwoofer).
  • two downmix variants of 5.1 stereo can be applied according to the invention:
  • the C and LFE channels can be combined by passive downmix and the result can be combined separately to the L and R channels by applying the embodiments of downmix from 2 channels (stereo) to 1 channel (mono) to obtain channels L 'and R' respectively. Then, the channels L 'and R' can also be combined with respectively Ls and Rs by applying the downmix embodiments of 2 channels (stereo) to 1 channel (mono) to obtain respectively L "and R" channels which are the result of the downmix.
  • This implementation therefore calls "hierarchically" (in successive steps) to an elementary downmix type 2 to 1 previously described according to different variants.
  • the invention can be generalized to simultaneously combine 3 channels on one side L, Ls, C + LFE and on the other side R, Rs, C + LFE where
  • C + LFE is the result of a simple passive downmix to directly obtain two L "and R" channels.
  • downmix we can define several downmix as in the case of stereo: a passive downmix M [k] of 3 signals with gain compensation, a downmix M 3 [k] of 3 signals with adaptive alignment of the phase on an adaptive reference (the dominant signal among the 3).
  • the downmix is obtained according to the generalization:
  • M [k] piyCCrlZ ⁇ CCrlS CCrZS ⁇ . M ⁇ k]
  • weights p1 and p3 are multivariate functions, for example the ICCrij correlation between each pair of channels i and j (for example, L, Ls, C + LFE) taken in pairs.
  • the number of input and output channels of the downmix may be different from the stereo to mono or 5.1 to stereo cases illustrated here.
  • FIG. 9 represents an exemplary embodiment of such an equipment in which an encoder as described with reference to FIG. 3 or a processing device as described with reference to FIG. 8, according to the invention is integrated.
  • This device comprises a PROC processor cooperating with a memory block BM having a storage and / or working memory MEM.
  • the memory block can advantageously comprise a computer program comprising code instructions for implementing the steps of the coding method in the sense of the invention, or the processing method when these instructions are executed by the processor PROC, and especially the steps of extracting at least one indicator characterizing the channels of the multichannel digital audio signal and selecting, from a set of channel reduction processing modes, a mode of processing of channel reduction according to the value of the at least one indicator characterizing the multichannel audio signal channels.
  • These instructions are executed for channel reduction processing when encoding a multichannel signal or processing a decoded multichannel signal.
  • the program may include the steps implemented to code the information adapted to this treatment.
  • the memory MEM can store the various downmix processing modes to be selected according to the method of the invention.
  • FIGS. 3, 4a to 4f show the steps of an algorithm of such a computer program.
  • the computer program can also be stored on a memory medium readable by a reader of the device or equipment or downloadable in the memory space thereof.
  • Such equipment or encoder comprises an input module capable of receiving a multichannel signal, for example a stereo signal comprising the R and L channels for right and left, either by a communication network, or by reading a content stored on a terminal. storage medium.
  • This multimedia equipment may also include means for capturing such a stereo signal.
  • the device comprises an output module adapted to transmit a mono signal M from the selected channel reduction processing according to the invention and in the case of a coding device, the coded spatial information parameters P c .

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

The invention relates to a method for parametric encoding of a multi-channel digital audio signal, including a step of encoding (312) a mono signal (M) from channel-reduction processing (307) applied to the multi-channel signal and of encoding spatialisation information (315, 316) of the multi-channel signal. Said method is characterised in that the channel-reduction processing includes the following steps, implemented by a spectral unit of the multi-channel signal: extracting (307a) at least one indicator characterising the channels of the multi-channel digital audio signal; selecting (307b), from a set of channel-reduction processing modes, a channel-reduction processing mode in accordance with the value of the at least one indicator characterising the channels of the multi-channel audio signal. The invention likewise relates to a corresponding encoding device and to a processing method which comprises channel-reduction processing as described.

Description

Traitement de réduction de canaux adaptatif pour le codage d'un signal audio multicanal  Adaptive Channel Reduction Processing for Encoding a Multichannel Audio Signal
La présente invention concerne le domaine du codage/décodage des signaux numériques. The present invention relates to the field of coding / decoding of digital signals.
Le codage et le décodage selon l'invention est adapté notamment pour la transmission et/ou le stockage de signaux numériques tels que des signaux audiofréquences (parole, musique ou autres).  The coding and decoding according to the invention is particularly suitable for the transmission and / or storage of digital signals such as audio-frequency signals (speech, music or other).
Plus particulièrement, la présente invention se rapporte au codage paramétrique ou au traitement de signaux audio multicanaux, par exemple de signaux stéréophoniques ci-après nommés signaux stéréo.  More particularly, the present invention relates to parametric encoding or processing of multichannel audio signals, e.g. stereophonic signals hereinafter referred to as stereo signals.
Ce type de codage se base sur l'extraction de paramètres d'information spatiale pour qu'au décodage, ces caractéristiques spatiales puissent être reconstituées pour l'auditeur, afin de recréer la même image spatiale que dans le signal original.  This type of coding is based on the extraction of spatial information parameters so that at decoding, these spatial characteristics can be reconstructed for the listener, in order to recreate the same spatial image as in the original signal.
Une telle technique de codage/décodage paramétrique est par exemple décrite dans le document de J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, intitulé "Parametric Coding of Stereo Audio" dans EURASIP Journal on Applied Signal Processing 2005:9, pp. 1305-1322. Cet exemple est repris en référence aux figures 1 et 2 décrivant respectivement un codeur et un décodeur stéréo paramétrique.  Such a parametric coding / decoding technique is for example described in the document by J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, titled "Parametric Coding of Stereo Audio" in EURASIP Journal on Applied Signal Processing 2005 : 9, pp. 1305-1322. This example is repeated with reference to FIGS. 1 and 2 respectively describing an encoder and a parametric stereo decoder.
Ainsi, la figure 1 décrit un codeur stéréo recevant deux canaux audio, un canal gauche (noté L pour Left en anglais) et un canal droit (noté R pour Right en anglais).  Thus, Figure 1 describes a stereo encoder receiving two audio channels, a left channel (denoted L for Left in English) and a right channel (noted R for Right in English).
Les signaux temporels L(n) et R(n), où n est l'indice entier des échantillons, sont traités par les blocs 101, 102, 103 et 104 qui effectuent une analyse de Fourier court-terme. Les signaux transformés L[k] et R [k] , où k est l'indice entier des coefficients fréquentiels, sont ainsi obtenus.  The time signals L (n) and R (n), where n is the entire index of the samples, are processed by the blocks 101, 102, 103 and 104 which perform a short-term Fourier analysis. The transformed signals L [k] and R [k], where k is the integer index of the frequency coefficients, are thus obtained.
Le bloc 105 effectue un traitement de réduction de canaux ou "downmix" en anglais pour obtenir dans le domaine fréquentiel à partir des signaux gauche et droit, un signal monophonique ci-après nommé signal mono.  Block 105 performs a channel reduction processing or "downmix" in English to obtain in the frequency domain from the left and right signals, a monophonic signal hereinafter called mono signal.
Une extraction de paramètres d'information spatiale est également effectuée dans le bloc 105. Les paramètres extraits sont les suivants.  Extraction of spatial information parameters is also performed in block 105. The extracted parameters are as follows.
Les paramètres ICLD (pour " InterChannel Level Différence" en anglais), encore appelés différences d'intensité intercanal, caractérisent les ratios d'énergie par sous-bande fréquentielle entre les canaux gauche et droit. Ces paramètres permettent de positionner des sources sonores dans le plan horizontal stéréo par "panning". Ils sont définis en dB par la formule suivante: The ICLD (InterChannel Level Difference) parameters, also called interchannel intensity differences, characterize the energy ratios per frequency subband between the left and right channels. These parameters make it possible to position sound sources in the stereo horizontal plane by panning. They are defined in dB by the following formula:
où L[k] et ff [/c] correspondent aux coefficients spectraux (complexes) des canaux L et R, chaque bande de fréquence d'indice b comprend les raies fréquentielles dans l'intervalle [kb, kb+1— 1] et le symbole * indique le conjugué complexe. where L [k] and ff [/ c] correspond to the spectral (complex) coefficients of the L and R channels, each frequency band of index b comprises the frequency lines in the interval [k b , k b + 1 - 1 ] and the symbol * indicates the complex conjugate.
Les paramètres ICPD (pour " InterChannel Phase Différence" en anglais), encore appelés t la relation suivante:  The ICPD parameters (for "InterChannel Phase Difference" in English), also called t the following relation:
(2) (2)
où Z. indique l'argument (la phase) de l'opérande complexe. where Z. indicates the argument (phase) of the complex operand.
On peut également définir de façon équivalente à l'ICPD, un décalage temporel intercanal appelé ICTD (pour "InterChannel Time Différence" en anglais) et dont la définition connue de l'homme de l'art n'est pas rappelée ici.  It is also possible to define, in a manner equivalent to ICPD, an interchannel time shift called ICTD (for "InterChannel Time Difference" in English), the definition of which is known to those skilled in the art is not recalled here.
A la différence des paramètres ICLD, ICPD et ICTD qui sont des paramètres de localisation, les paramètres ICC (pour "InterChannel Cohérence" en anglais) représentent quant à eux la corrélation (ou cohérence) inter-canal et sont associés à la largeur spatiale des sources sonores; leur définition n'est pas rappelée ici, mais il est noté dans l'article de Breebart et al. que les paramètres ICC ne sont pas nécessaires dans les sous-bandes réduites à un seul coefficient fréquentiel - en effet les différences d'amplitude et de phase décrivent complètement la spatialisation dans ce cas "dégénéré".  Unlike the ICLD, ICPD and ICTD parameters which are location parameters, the ICC (for "InterChannel Coherence") parameters represent the inter-channel correlation (or coherence) and are associated with the spatial width of the data. sound sources; their definition is not recalled here, but it is noted in the article by Breebart et al. that the ICC parameters are not necessary in the subbands reduced to a single frequency coefficient - in fact the amplitude and phase differences completely describe the spatialization in this "degenerate" case.
Ces paramètres ICLD, ICPD et ICC sont extraits par analyse des signaux stéréo, par le bloc 105. Si les paramètres ICTD ou ITD étaient également codés, ceux-ci pourraient également être extraits par sous-bande à partir des spectres L [k] et R[k] ; cependant l'extraction des paramètres ITD est en général simplifiée en supposant un décalage temporel intercanal identique pour chaque sous-bande et dans ce cas un paramètre peut être extrait à partir des canaux temporels L(n) et R(n) par le biais d'inter-corrélations.  These parameters ICLD, ICPD and ICC are extracted by analysis of the stereo signals, by the block 105. If the parameters ICTD or ITD were also coded, these could also be extracted by subband from the spectra L [k] and R [k]; however, the extraction of the ITD parameters is in general simplified by assuming an identical inter-channel time shift for each sub-band and in this case a parameter can be extracted from the time channels L (n) and R (n) through inter-correlations.
Le signal mono M[k] est transformé dans le domaine temporel (blocs 106 à 108) après synthèse de Fourier court-terme (FFT inverse, fenêtrage et addition-recouvrement dite OverLap-Add ou OLA en anglais) et un codage mono (bloc 109) est ensuite réalisé. En parallèle les paramètres stéréo sont quantifiés et codés dans le bloc 110.  The mono signal M [k] is transformed in the time domain (blocks 106 to 108) after short-term Fourier synthesis (inverse FFT, windowing and OverLap-Add or overlay) and a mono coding (block 109) is then realized. In parallel, the stereo parameters are quantized and coded in block 110.
En général le spectre des signaux ( L [k] , R [k] ) est divisé suivant une échelle fréquentielle non-linéaire de type ERB (Equivalent Rectangular Bandwidth) ou Bark, avec un nombre de sous-bandes allant typiquement de 20 à 34 pour un signal échantillonné de 16 à 48 kHz selon l'échelle Bark. Cette échelle définit les valeurs de kb et kb+1 pour chaque sous- bande b . Les paramètres (ICLD, ICPD, ICC, ITD) sont codés par quantification scalaire éventuellement suivie d'un codage entropique et/ou d'un codage différentiel. Par exemple, dans l'article précédemment cité, l'ICLD est codée par un quantificateur non-uniforme (allant de -50 à +50 dB) avec codage entropique différentiel. Le pas de quantification non-uniforme exploite le fait que plus la valeur de l'ICLD est grande plus la sensibilité auditive aux variations de ce paramètre est faible. In general, the spectrum of the signals (L [k], R [k]) is divided according to a nonlinear frequency scale of ERB (equivalent Rectangular Bandwidth) or Bark type, with a number of subbands typically ranging from 20 to 34. for a sampled signal from 16 to 48 kHz according to the Bark scale. This scale defines the values of k b and k b + 1 for each subband b. The parameters (ICLD, ICPD, ICC, ITD) are encoded by scalar quantization possibly followed by entropy coding and / or differential coding. For example, in the article cited above, the ICLD is encoded by a non-uniform quantizer (ranging from from -50 to +50 dB) with differential entropy coding. The non-uniform quantization step exploits the fact that the higher the value of the ICLD, the lower the auditory sensitivity to variations of this parameter.
Pour le codage du signal mono (bloc 109), plusieurs techniques de quantification avec ou sans mémoire sont possibles, par exemple le codage à "Modulation par Impulsions Codées" (MIC), sa version avec prédiction adaptative dite "Modulation par Impulsions Codées Différentielle Adaptative" (MICDA) ou des techniques plus évoluées comme le codage perceptuel par transformée ou le codage "Code Excited Linear Prédiction" (CELP) ou un codage multi-modes.  For the coding of the mono signal (block 109), several quantification techniques with or without memory are possible, for example coding with "Coded Pulse Modulation" (MIC), its version with adaptive prediction called "Adapted differential pulse coded modulation". "(ADPCM) or more advanced techniques such as transform perceptual coding or Code Excited Linear Prediction (CELP) coding or multi-mode coding.
On s'intéresse ici plus particulièrement à la recommandation 3GPP EVS (Pour We are interested here more particularly in the recommendation 3GPP EVS (For
« Enhanced Voice Services ») qui utilise un codage multi-modes. Les détails algorithmiques du codée EVS sont fournis dans les spécifications 3GPP TS 26.441 à 26.451 et ils ne sont donc pas repris ici. Par la suite, on fera référence à ces spécifications par la dénomination EVS. "Enhanced Voice Services") that uses multi-mode encoding. The algorithmic details of the EVS codec are provided in 3GPP specifications TS 26.441 to 26.451 and are therefore not included here. Subsequently, these specifications will be referred to as EVS.
Le signal d'entrée du codée EVS est échantillonné à la fréquence de 8, 16, 32 ou 48 kHz et le codée peut représenter des bandes audio téléphoniques (narrowband, NB), élargie (wideband, WB), super-élargie (super-wideband, SWB) ou pleine bande (fullband, FB). Les débits du codée EVS sont divisés en deux modes:  The input signal of the EVS codec is sampled at the frequency of 8, 16, 32 or 48 kHz and the codec may represent audio telephony bands (narrowband, NB), wideband (WB), super-wideband (superband) wideband, SWB) or full band (fullband, FB). The rates of the EVS codec are divided into two modes:
o "EVS Primary" :  o "EVS Primary":
o débits fixes: 7.2, 8, 9.6, 13.2, 16.4, 24.4, 32, 48, 64, 96, 128 o mode à débit variable (VBR) avec un débit moyen proche de 5.9 kbit/s pour la parole active  o Fixed rates: 7.2, 8, 9.6, 13.2, 16.4, 24.4, 32, 48, 64, 96, 128 o Variable rate mode (VBR) with average bit rate close to 5.9 kbit / s for active speech
o mode "channel-aware" à 13.2 en WB et SWB uniquement o "EVS AMR-WB IO" dont les débits sont identiques au codée 3GPP AMR- WB (9 modes)  o "channel-aware" mode at 13.2 in WB and SWB only o "EVS AMR-WB IO" whose bit rates are identical to the 3GPP AMR-WB codec (9 modes)
A cela s'ajoute le mode de transmission discontinue (DTX) dans lequel les trames détectées comme inactives sont remplacées par des trames SID (SID Primary ou SID AMR- WB IO) qui sont transmises de façon intermittente, environ une fois toutes les 8 trames.  Added to this is the discontinuous transmission mode (DTX) in which the frames detected as inactive are replaced by SID frames (SID Primary or SID AMR-WB IO) which are transmitted intermittently, approximately once every 8 frames. .
Au décodeur 200, en référence à la figure 2, le signal mono est décodé (bloc 201), un dé-corrélateur est utilisé (bloc 202) pour produire deux versions M(n) et M'(n) du signal mono décodé. Cette décorrélation, nécessaire uniquement lorsque le paramètre ICC est utilisé, permet d'augmenter la largeur spatiale de la source mono (n). Ces deux signaux M(n) et M'(n) sont passés dans le domaine fréquentiel (blocs 203 à 206) et les paramètres stéréo décodés (bloc 207) sont utilisés par la synthèse (ou mise en forme) stéréo (bloc 208) pour reconstruire les canaux gauche et droit dans le domaine fréquentiel. Ces canaux sont enfin reconstruits dans le domaine temporel (blocs 209 à 214). Ainsi, comme mentionné pour le codeur, le bloc 105 effectue un traitement de réduction des canaux ou "downmix" en combinant les canaux stéréo (gauche, droit) pour obtenir un signal mono qui est ensuite codé par un codeur mono. Les paramètres spatiaux (ICLD, ICPD, ICC, ...) sont extraits à partir des canaux stéréo et transmis en plus du train binaire issu du codeur mono. At the decoder 200, with reference to FIG. 2, the mono signal is decoded (block 201), a de-correlator is used (block 202) to produce two versions M (n) and M '(n) of the decoded mono signal. This decorrelation, necessary only when the ICC parameter is used, makes it possible to increase the spatial width of the mono source (n). These two signals M (n) and M '(n) are passed in the frequency domain (blocks 203 to 206) and the decoded stereo parameters (block 207) are used by the stereo synthesis (or formatting) (block 208) to reconstruct the left and right channels in the frequency domain. These channels are finally reconstructed in the time domain (blocks 209 to 214). Thus, as mentioned for the encoder, the block 105 performs a channel reduction processing or "downmix" by combining the stereo channels (left, right) to obtain a mono signal which is then encoded by a mono encoder. The spatial parameters (ICLD, ICPD, ICC, ...) are extracted from the stereo channels and transmitted in addition to the bitstream from the mono encoder.
Plusieurs techniques ont été développées pour le traitement de réduction des canaux ou "downmix" stéréo à mono. Ce "downmix" peut être effectué dans le domaine temporel ou fréquentiel. On distingue en général deux types de "downmix":  Several techniques have been developed for channel reduction processing or stereo downmix to mono. This "downmix" can be performed in the time or frequency domain. There are usually two types of "downmix":
- Le "downmix" passif qui correspond à un matriçage direct des canaux stéréo pour les combiner en un seul signal - les coefficients de la matrice de donwmix sont en général réels et de valeurs prédéterminées (fixes);  - The passive "downmix" which corresponds to a direct matrixing of the stereo channels to combine them in a single signal - the coefficients of the matrix of donwmix are generally real and of predetermined values (fixed);
- Le "downmix" actif (adaptatif) qui inclut un contrôle de l'énergie et/ou de la phase en plus de la combinaison des deux canaux stéréo.  - Active (adaptive) downmix that includes energy and / or phase control in addition to the combination of the two stereo channels.
L'exemple le plus simple de "downmix" passif est donné par le matriçage temporel suivant:  The simplest example of passive downmix is given by the following time stamping:
1/2 0 L(n)  1/2 0 L (n)
M (ri) = (L(n) + ff (n)) =  M (ri) = (L (n) + ff (n)) =
0 1/2 (3) 0 1/2 (3)
Ce type de "downmix" a cependant l'inconvénient de ne pas bien conserver l'énergie des signaux après la conversion stéréo à mono lorsque les canaux L et R ne sont pas en phase: dans le cas extrême où L(n) =—R(n), le signal mono est nul, ce qui n'est pas souhaitable. This type of "downmix" however has the disadvantage of not conserving the energy of the signals after the stereo to mono conversion when the L and R channels are not in phase: in the extreme case where L (n) = - R (n), the mono signal is zero, which is not desirable.
Un mécanisme de "downmix" actif améliorant la situation est donné par l'équation suivante: An active downmix mechanism that improves the situation is given by the following equation:
où y(n) est un facteur qui vient compenser une éventuelle perte d'énergie. where y (n) is a factor that compensates for a possible loss of energy.
Cependant, le fait de combiner les signaux L(n) et R(n) dans le domaine temporel ne permet pas de contrôler finement (avec suffisamment de résolution fréquentielle) les différences de phase éventuelles entre canaux L et R; lorsque les canaux L et R ont des amplitudes comparables et de phases quasiment opposées, des phénomènes d' "effacement " ou "atténuation" (perte d' "énergie") sur le signal mono peuvent être observés par sous-bandes fréquentielles par rapport aux canaux stéréo.  However, the fact of combining the signals L (n) and R (n) in the time domain does not make it possible to finely control (with sufficient frequency resolution) any phase differences between channels L and R; when the L and R channels have comparable amplitudes and almost opposite phases, phenomena of "erasure" or "attenuation" (loss of "energy") on the mono signal can be observed by frequency subbands with respect to stereo channels.
C'est pourquoi il est souvent plus avantageux en termes de qualité de réaliser le That is why it is often more advantageous in terms of quality to achieve the
"downmix" dans le domaine fréquentiel, même si cela implique de calculer des transformées temps/fréquence et induit un retard et une complexité additionnels par rapport à un "downmix" temporel. "downmix" in the frequency domain, even if it involves calculating time / frequency transforms and induces additional delay and complexity compared to a time "downmix".
On peut ainsi transposer le "downmix" actif précédent avec les spectres des canaux gauche et droit, de la façon suivante: M[k] = Y[k] L[k] + 2 R [k] (5) où k correspond à l'indice d'un coefficient fréquentiel (coefficient de Fourier par exemple représentant une sous-bande fréquentielle). On peut fixer le paramètre de compensation, comme suit: v\ k \ = max \ 2, ——— Γ Ί ι_ , (6) We can thus transpose the previous active downmix with the spectra of the left and right channels, as follows: M [k] = Y [k] L [k] + 2 R [k] (5) where k corresponds to the index of a frequency coefficient (Fourier coefficient for example representing a frequency subband). The compensation parameter can be set as follows: v \ k \ = max \ 2, --- Γ Ί ι _, (6)
-\| |i.[fe] +R [fe] |2/2 J '- \ | | i. [fe] + R [fe] | 2/2 I
On s'assure ainsi que l'énergie globale du "downmix" est la somme des énergies des canaux gauche et droit. Le facteur y[/c]est ici saturé à une amplification de 6dB. This ensures that the overall energy of the "downmix" is the sum of the energies of the left and right channels. The y factor [/ c] is saturated here with an amplification of 6dB.
La technique de "downmix" stéréo à mono du document de Breebaart et al. cité précédemment est effectuée dans le domaine fréquentiel. Le signal mono M [k] est obtenu par une combinaison linéaire des canaux L et R suivant l'équation:  Stereo to mono "downmix" technique of Breebaart et al. cited above is performed in the frequency domain. The mono signal M [k] is obtained by a linear combination of the L and R channels according to the equation:
M[k\ = w1L[k\ + w2R[k\ (7) où Μ ΐ 5 w2 sont des gains à valeur complexe. Si w = w2 = 0,5, le signal mono est considéré comme une moyenne des deux canaux L et R. Les gains w , w2 sont en général adaptés en fonction du signal court-terme en particulier pour aligner les phases. M [k \ = w 1 L [k \ + w 2 R [k \ (7) where Μ ΐ 5 w 2 are complex value gains. If w = w 2 = 0.5, the mono signal is considered as an average of the two L and R channels. The gains w, w 2 are generally adapted according to the short-term signal, in particular to align the phases.
Un cas particulier de cette technique de "downmix" fréquentiel est proposé dans le document intitulé "A stereo to mono downmixing scheme for MPEG-4 parametric stereo encoder" par Samsudin, E. Kurniawati, N. Boon Poh, F. Sattar, S. George, dans Proc. A particular case of this frequency downmix technique is proposed in the document entitled "A stereo to mono downmixing scheme for MPEG-4 parametric stereo encoder" by Samsudin, E. Kurniawati, N. Boon Poh, F. Sattar, S. George, in Proc.
ICASSP, 2006. Dans ce document, les canaux L et R sont alignés en phase avant d'effectuer le traitement de réduction des canaux. ICASSP, 2006. In this document, the L and R channels are aligned in phase prior to performing channel reduction processing.
Plus précisément, la phase du canal L pour chaque sous-bande fréquentielle est choisie comme la phase de référence, le canal R est aligné selon la phase du canal L pour chaque sous-bande par la formule suivante:  More precisely, the phase of the channel L for each frequency sub-band is chosen as the reference phase, the channel R is aligned according to the phase of the channel L for each sub-band by the following formula:
R'[k] = ej 'CPD [b]R[k] (8) où j = — 1 , R'[k] est le canal R aligné, k est l'indice d'un coefficient dans la bieme sous- bande fréquentielle, ICPD [b] est la différence de phase inter-canal dans la ôieme sous-bande fréquentielle donnée par à l'équation (1). R '[k] = e j CPD [b] R [k] (8) where j = - 1, R' [k] is the channel aligned R, k is the index of a coefficient in the b th Frequency subband, ICPD [b] is the inter-channel phase difference in the sixth frequency subband given by Equation (1).
A noter que lorsque la sous-bande d'indice b est réduite à un coefficient fréquentiel, on trouve:  Note that when the subband of index b is reduced to a frequency coefficient, we find:
R' [k] = \R [k] \. e^L [k] (9) Finalement le signal mono obtenu par le "downmix" du document de Samsudin et al. cité précédemment est calculé en moyennant le canal L et le canal R' aligné, selon l'équation suivante: R '[k] = \ R [k] \. e ^ L [k] (9) Finally the mono signal obtained by the "downmix" of the document of Samsudin et al. cited above is calculated by averaging the L channel and the aligned R 'channel, according to the following equation:
M [k] = _LM1R!M (10) L'alignement en phase permet donc de conserver l'énergie et d'éviter les problèmes d'atténuation en éliminant l'influence de la phase. Ce "downmix" correspond au "downmix" décrit dans le document de Breebart et al. où: M [k] = _LM 1 R ! M (10) Phase alignment therefore conserves energy and avoids attenuation problems by eliminating the influence of the phase. This "downmix" corresponds to the "downmix" described in the document by Breebart et al. or:
M[k] = w^ik] + w2R[k] (11) M [k] = w ^ ik] + w 2 R [k] (11)
ej.ICPD[b]  ej.ICPD [b]
avec w = 0,5 et w2 = dans le cas où la sous-bande d'indice b ne comporte qu'une valeur fréquentielle d'indice k. with w = 0.5 and w 2 = in the case where the subband of index b has only a frequency value of index k.
Une conversion idéale d'un signal stéréo à un signal mono doit éviter les problèmes d'atténuation pour toutes les composantes fréquentielles du signal.  An ideal conversion of a stereo signal to a mono signal should avoid attenuation problems for all frequency components of the signal.
Cette opération de "downmix" est importante pour le codage stéréo paramétrique car le signal stéréo décodé n'est qu'une mise en forme spatiale du signal mono décodé.  This "downmix" operation is important for parametric stereo coding because the decoded stereo signal is only a spatial shaping of the decoded mono signal.
La technique de "downmix" dans le domaine fréquentiel décrite précédemment conserve bien le niveau d'énergie du signal stéréo dans le signal mono en alignant le canal R et le canal L avant d'effectuer le traitement. Cet alignement de phase permet d'éviter les situations où les canaux sont en opposition de phase.  The downmix technique in the frequency domain described above retains the energy level of the stereo signal in the mono signal by aligning the R channel and the L channel before processing. This phase alignment avoids situations where the channels are in phase opposition.
La méthode décrite dans le document de Samsudin référencé ci-dessus repose cependant sur une dépendance totale du traitement de "downmix" au canal (L ou R) choisi pour fixer la phase de référence.  The method described in the Samsudin document referred to above, however, relies on a total dependence of the "downmix" treatment on the channel (L or R) chosen to set the reference phase.
Dans les cas extrêmes, si le canal de référence est nul (silence "total") et que l'autre canal est non nul, la phase du signal mono après "downmix" devient constante, et le signal mono résultant sera en général de mauvaise qualité ; de même, si le canal de référence est un signal aléatoire (bruit ambiant, etc .), la phase du signal mono peut devenir aléatoire ou être mal conditionnée avec là encore un signal mono qui sera en général de mauvaise qualité. Une technique de downmix fréquentiel alternative a été proposée dans le document intitulé "Parametric stereo extension of ITU-T G.722 based on a new downmixing scheme" par T.M.N Hoang, S. Ragot, B. Kovësi, P. Scalart, Proc. IEEE MMSP, 4-6 Oct. 2010. Ce document propose une technique de "downmix" qui résout des inconvénients du "downmix" proposé par Samsudin et al.. Selon ce document, le signal mono M[k] est calculé à partir des canaux stéréo L [k] et R[k] par la décomposition polaire M[k] = \M[k] \. ei AM^ , où l'amplitude \M[k] | et la phase z [/c] pour chaque sous-bande sont définis par: In extreme cases, if the reference channel is zero ("total" silence) and the other channel is non-zero, the phase of the mono signal after "downmix" becomes constant, and the resulting mono signal will generally be bad. quality; similarly, if the reference channel is a random signal (ambient noise, etc.), the phase of the mono signal may become random or be poorly conditioned with again a mono signal which will generally be of poor quality. An alternative frequency downmix technique has been proposed in the document entitled "Parametric stereo extension of ITU-T G.722 based on a new downmixing scheme" by TMN Hoang, S. Ragot, B. Kovessi, P. Scalart, Proc. IEEE MMSP, 4-6 Oct. 2010. This document proposes a technique of "downmix" which solves the disadvantages of the "downmix" proposed by Samsudin et al .. According to this document, the mono signal M [k] is calculated from the stereo channels L [k] and R [k] by the polar decomposition M [k] = \ M [k] \. ei AM ^, where the amplitude \ M [k] | and the phase z [/ c] for each sub-band are defined by:
( \ Μ \! \ = Ι^ΜΗ^ΜΙ  (\ Μ \! \ = Ι ^ ΜΗ ^ ΜΙ
1 L J l 2 (12) [/C] = (zL [/c] + Zff [/c]) 1 LJ l 2 (12) [/ C] = (zL [/ c] + Zff [/ c])
L'amplitude de M[k] est la moyenne des amplitudes des canaux L et R. La phase de M[k] est donnée par la phase du signal sommant les deux canaux stéréo (L+R).  The amplitude of M [k] is the average of the amplitudes of the L and R channels. The phase of M [k] is given by the phase of the signal summing the two stereo channels (L + R).
La méthode de Hoang et al. préserve l'énergie du signal mono comme la méthode de Samsudin et al., et elle évite le problème de dépendance totale d'un des canaux stéréo (L ou R) pour le calcul de phase z [/c]. Cependant, elle présente un désavantage quand les canaux L et R sont en quasi-opposition de phase dans certaines sous-bandes (avec comme cas extrême L = -R). Dans ces conditions, le signal mono résultant sera de mauvaise qualité. The method of Hoang et al. preserves the energy of the mono signal like the Samsudin et al. method, and it avoids the problem of total dependence of one of the stereo channels (L or R) for the phase calculation z [/ c]. However, it presents a disadvantage when the canals L and R are in quasi-phase opposition in some subbands (with the extreme case L = -R). Under these conditions, the resulting mono signal will be of poor quality.
Dans le codée UIT-T G.722 Annexe D et dans l'article "Parametric stereo coding scheme with a new downmix method and whole band inter channel time/phase différences" par W. Wu, L. Miao, Y. Lang, D. Virette, Proc. ICASSP, 2013 une autre méthode permettant de gérer l'opposition de phase des signaux stéréo a été décrite. La méthode repose en particulier sur l'estimation d'un paramètre de phase pleine bande. On peut vérifier expérimentalement que la qualité de cette méthode n'est pas satisfaisante pour des signaux stéréo où la relation de phase entre canaux est complexe ou pour des signaux stéréo de parole avec prise de son de type AB (utilisant deux microphones omnidirectionnels espacés). En effet, cette méthode consiste à calculer la phase du signal downmix à partir des phases des signaux L et R, et ce calcul peut résulter en des artéfacts audio pour certains signaux car la phase défini par analyse FFT court-terme est un paramètre délicat à interpréter et manipuler.  In the ITU-T G.722 Appendix D codec and in the article "Parametric stereo coding scheme with a new downmix method and a whole band inter channel time / phase differences" by W. Wu, L. Miao, Y. Lang, D Virette, Proc. ICASSP, 2013 another method for managing the phase opposition of stereo signals has been described. The method relies in particular on estimating a full-band phase parameter. It can be verified experimentally that the quality of this method is unsatisfactory for stereo signals where the phase relationship between channels is complex or for stereo speech signals with AB-type sound recording (using two spaced omnidirectional microphones). Indeed, this method consists of calculating the phase of the downmix signal from the phases of the L and R signals, and this calculation can result in audio artifacts for certain signals because the phase defined by short-term FFT analysis is a delicate parameter to interpret and manipulate.
De plus, cette méthode ne prend pas en compte directement les évolutions de phase qui peuvent apparaître dans des trames successives ce qui peut éventuellement occasionner des sauts de phase.  In addition, this method does not directly take into account the phase changes that can appear in successive frames which can possibly cause phase jumps.
Il existe ainsi un besoin d'une méthode de codage/décodage de complexité limitée qui permette de combiner des canaux avec une qualité "robuste", c'est-à-dire une bonne qualité quel que soit le type de signal multicanal, tout en gérant les signaux en opposition de phase, les signaux dont la phase est mal conditionnée (ex : un canal nul ou un canal ne contenant que du bruit), ou les signaux dont les canaux présentent des relations de phase complexes qu'il vaut mieux ne pas « manipuler », pour éviter les problèmes de qualité que ces signaux peuvent créer.  Thus, there is a need for a coding / decoding method of limited complexity which makes it possible to combine channels with a "robust" quality, that is to say a good quality whatever the type of multichannel signal, while managing signals in phase opposition, signals whose phase is poorly conditioned (eg a null channel or a channel containing only noise), or signals whose channels have complex phase relationships that are better not not "manipulate", to avoid the quality problems that these signals can create.
L'invention vient améliorer la situation de l'état de l'art.  The invention improves the situation of the state of the art.
A cet effet, elle propose un procédé de codage paramétrique d'un signal audionumérique multicanal comportant une étape de codage d'un signal mono issu d'un traitement de réduction de canaux appliqué au signal multicanal et de codage d'informations de spatialisation du signal multicanal. Le procédé est remarquable en ce que le traitement de réduction de canaux comporte les étapes suivantes, mises en œuvre par unité spectrale du signal multicanal:  For this purpose, it proposes a method of parametric coding of a multichannel digital audio signal comprising a step of coding a mono signal resulting from a channel reduction processing applied to the multichannel signal and coding signal spatialization information. multichannel. The method is remarkable in that the channel reduction processing comprises the following steps, implemented per spectral unit of the multichannel signal:
-extraction d'au moins un indicateur caractérisant les canaux du signal audionumérique multicanal ;  extracting at least one indicator characterizing the channels of the multichannel digital audio signal;
-sélection, parmi un ensemble de modes de traitement de réduction de canaux, d'un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal.  selecting, from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator characterizing the channels of the multichannel audio signal.
Ainsi, la méthode permet d'obtenir un traitement de réduction de canaux adéquate au signal multicanal à coder, notamment lorsque les canaux de ce signal sont en opposition de phase. De plus, l'adaptation du downmix s'effectuant par unité fréquentielle, c'est-à-dire par sous-bande de fréquence ou par raie fréquentielle, cela permet de s'adapter aux fluctuations du signal multicanal d'une trame à l'autre. Thus, the method makes it possible to obtain a channel reduction processing that is adequate for the multichannel signal to be coded, especially when the channels of this signal are in opposition to each other. phase. In addition, the adaptation of the downmix being performed per frequency unit, that is to say by frequency sub-band or by frequency line, this makes it possible to adapt to the fluctuations of the multichannel signal of a frame to the 'other.
Selon un mode de réalisation particulier, le procédé comprend en outre la détermination d'un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal et en ce qu'un des modes de traitement de réduction de canaux dudit ensemble dépend de la valeur de l'indicateur de phase.  According to a particular embodiment, the method furthermore comprises the determination of a phase indicator, representative of a measurement of degree of phase opposition between the channels of the multichannel signal, and that one of the modes of processing of channel reduction of said set depends on the value of the phase indicator.
Un traitement downmix particulier est ainsi effectué pour les signaux dont les canaux sont en opposition de phase. Ce traitement est mis en œuvre de façon adapté à la fluctuation du signal dans le temps.  A particular downmix processing is thus performed for the signals whose channels are in phase opposition. This treatment is implemented in a manner adapted to the fluctuation of the signal over time.
Dans un exemple de réalisation, l'ensemble de modes de traitement de réduction de canaux comprend une pluralité de traitement dans la liste suivante :  In an exemplary embodiment, the set of channel reduction processing modes includes a plurality of processing in the following list:
- traitement de réduction de canaux de type passif avec ou sans compensation de gain ;  - passive channel reduction processing with or without gain compensation;
- traitement de réduction des canaux de type adaptatif avec alignement de la phase sur une référence et/ou un contrôle d'énergie ;  adaptive-type channel reduction processing with phase alignment on a reference and / or energy control;
- traitement de réduction de canaux de type hybride dépendant d'un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal;  phase-indicator-type hybrid channel reduction processing, representative of a phase opposition degree measurement between the multichannel signal channels;
- combinaison d'au moins deux modes de traitement passif, adaptatif ou hybride. - combination of at least two modes of passive, adaptive or hybrid processing.
Plusieurs types de traitement downmix sont ainsi possibles pour une meilleure adaptation au signal multicanal. Several types of downmix processing are thus possible for better adaptation to the multichannel signal.
Dans un mode de réalisation particulier, l'indicateur caractérisant les canaux du signal audio multicanal est un indicateur de mesure de corrélation entre les canaux du signal audio multicanal.  In a particular embodiment, the indicator characterizing the channels of the multichannel audio signal is a correlation measurement indicator between the channels of the multichannel audio signal.
Cet indicateur permet d'adapter le traitement de réduction de canaux aux caractéristiques de corrélations des canaux du signal audio multicanal. La détermination de cet indicateur est simple à mettre en œuvre et la qualité du downmix en est amélioré.  This indicator makes it possible to adapt the channel reduction processing to the channel correlation characteristics of the multichannel audio signal. The determination of this indicator is simple to implement and the quality of the downmix is improved.
Dans un autre mode de réalisation, l'indicateur caractérisant les canaux du signal audio multicanal est un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal.  In another embodiment, the indicator characterizing the channels of the multichannel audio signal is a phase indicator, representative of a measure of degree of phase opposition between the multichannel signal channels.
Cet indicateur permet d'adapter le traitement de réduction de canaux aux caractéristiques de phase des canaux du signal audio multicanal et notamment aux signaux qui ont des canaux en opposition de phase.  This indicator makes it possible to adapt the channel reduction processing to the phase characteristics of the channels of the multichannel audio signal and in particular to the signals which have channels in phase opposition.
L'invention se rapporte à un dispositif de codage paramétrique d'un signal audionumérique multicanal comportant un codeur apte à coder un signal mono issu d'un module de traitement de réduction de canaux appliqué au signal multicanal et un module de quantification pour coder des informations de spatialisation du signal multicanal. Le dispositif est remarquable en ce que le module de traitement de réduction de canaux comporte : The invention relates to a device for parametric coding of a multichannel digital audio signal comprising an encoder able to encode a mono signal coming from a channel reduction processing module applied to the multichannel signal and a quantization module for encoding spatialisation information of the multichannel signal. The device is remarkable in that the channel reduction processing module comprises:
- un module d'extraction apte à obtenir au moins un indicateur caractérisant les canaux du signal audionumérique multicanal, par unité spectrale du signal multicanal;  an extraction module capable of obtaining at least one indicator characterizing the channels of the multichannel digital audio signal, per spectral unit of the multichannel signal;
-un module de sélection, apte à sélectionner, par unité spectrale du signal multicanal, parmi un ensemble de modes de traitement de réduction de canaux, un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal.  a selection module capable of selecting, by spectral unit of the multichannel signal, from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator characterizing the channels; multichannel audio signal.
Ce dispositif présente les mêmes avantages que le procédé qu'il met en œuvre. L'invention s'applique également à un procédé de traitement d'un signal audio multicanal décodé comportant un traitement de réduction de canaux pour obtenir un signal mono à restituer. Le procédé est remarquable en ce que le traitement de réduction de canaux comporte les étapes suivantes, mises en œuvre par unité spectrale du signal multicanal:  This device has the same advantages as the method it implements. The invention also applies to a method of processing a decoded multichannel audio signal comprising channel reduction processing to obtain a mono signal to be restored. The method is remarkable in that the channel reduction processing comprises the following steps, implemented per spectral unit of the multichannel signal:
-extraction d'au moins un indicateur caractérisant les canaux du signal audionumérique multicanal ;  extracting at least one indicator characterizing the channels of the multichannel digital audio signal;
-sélection, parmi un ensemble de modes de traitement de réduction de canaux, d'un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal.  selecting, from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator characterizing the channels of the multichannel audio signal.
Ainsi, il est possible d'obtenir un signal mono avec une bonne qualité auditive, à partir d'un signal audio multicanal déjà décodé. La méthode permet d'effectuer un traitement de downmix adapté au signal reçu, de façon simple.  Thus, it is possible to obtain a mono signal with a good hearing quality, from a multichannel audio signal already decoded. The method makes it possible to carry out a downmix processing adapted to the signal received, in a simple manner.
Selon un mode de réalisation particulier, le procédé de traitement comprend en outre la détermination d'un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal et en ce qu'un des modes de traitement de réduction de canaux dudit ensemble dépend de la valeur de l'indicateur de phase.  According to a particular embodiment, the processing method further comprises determining a phase indicator representative of a phase opposition degree measurement between the channels of the multichannel signal and that one of the modes of channel reduction processing of said set depends on the value of the phase indicator.
Un traitement downmix particulier est ainsi effectué pour les signaux décodés dont les canaux sont en opposition de phase. Ce traitement est mis en œuvre de façon adapté à la fluctuation du signal dans le temps.  A particular downmix processing is thus performed for the decoded signals whose channels are in phase opposition. This treatment is implemented in a manner adapted to the fluctuation of the signal over time.
Dans un exemple de réalisation, l'ensemble de modes de traitement de réduction de canaux comprend une pluralité de traitement dans la liste suivante :  In an exemplary embodiment, the set of channel reduction processing modes includes a plurality of processing in the following list:
- traitement de réduction de canaux de type passif avec ou sans compensation de gain ; - traitement de réduction des canaux de type adaptatif avec alignement de la phase sur une référence et/ou un contrôle d'énergie ; - passive channel reduction processing with or without gain compensation; adaptive-type channel reduction processing with phase alignment on a reference and / or energy control;
- traitement de réduction de canaux de type hybride dépendant d'un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal;  phase-indicator-type hybrid channel reduction processing, representative of a phase opposition degree measurement between the multichannel signal channels;
- combinaison d'au moins deux modes de traitement passif, adaptatif ou hybride. Plusieurs types de traitement downmix sont ainsi possibles pour une meilleure adaptation au signal multicanal.  - combination of at least two modes of passive, adaptive or hybrid processing. Several types of downmix processing are thus possible for better adaptation to the multichannel signal.
Dans un mode de réalisation particulier, l'indicateur caractérisant les canaux du signal audio multicanal est un indicateur de mesure de corrélation entre les canaux du signal audio multicanal.  In a particular embodiment, the indicator characterizing the channels of the multichannel audio signal is a correlation measurement indicator between the channels of the multichannel audio signal.
Cet indicateur permet d'adapter le traitement de réduction de canaux aux caractéristiques de corrélations des canaux du signal audio multicanal décodé. La détermination de cet indicateur est simple à mettre en œuvre et la qualité du downmix en est amélioré.  This indicator is used to adapt the channel reduction processing to the channel correlation characteristics of the decoded multichannel audio signal. The determination of this indicator is simple to implement and the quality of the downmix is improved.
Dans un autre mode de réalisation, l'indicateur caractérisant les canaux du signal audio multicanal est un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal.  In another embodiment, the indicator characterizing the channels of the multichannel audio signal is a phase indicator, representative of a measure of degree of phase opposition between the multichannel signal channels.
Cet indicateur permet d'adapter le traitement de réduction de canaux aux caractéristiques de phase des canaux du signal audio multicanal et notamment aux signaux qui ont des canaux en opposition de phase.  This indicator makes it possible to adapt the channel reduction processing to the phase characteristics of the channels of the multichannel audio signal and in particular to the signals which have channels in phase opposition.
L'invention se rapporte également à un dispositif de traitement d'un signal audio multicanal décodé comportant un module de traitement de réduction de canaux pour obtenir un signal mono à restituer, remarquable en ce que le module de traitement de réduction de canaux comprend :  The invention also relates to a device for processing a decoded multichannel audio signal comprising a channel reduction processing module for obtaining a mono signal to be reproduced, which is remarkable in that the channel reduction processing module comprises:
-un module d'extraction apte à obtenir au moins un indicateur caractérisant les canaux du signal audionumérique multicanal, par unité spectrale du signal multicanal ;  an extraction module able to obtain at least one indicator characterizing the channels of the multichannel digital audio signal, per spectral unit of the multichannel signal;
-un module de sélection, apte à sélectionner, par unité spectrale du signal multicanal, parmi un ensemble de modes de traitement de réduction de canaux, un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal.  a selection module capable of selecting, by spectral unit of the multichannel signal, from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator characterizing the channels; multichannel audio signal.
Ce dispositif présente les mêmes avantages que le procédé décrit ci-dessus qu'il met en œuvre.  This device has the same advantages as the method described above that it implements.
Enfin, l'invention se rapporte à un programme informatique comprenant des instructions de code pour la mise en œuvre des étapes d'un procédé de codage selon l'invention, lorsque ces instructions sont exécutées par un processeur. L'invention se rapporte enfin à support de stockage lisible par un processeur sur lequel est enregistré un programme informatique comprenant des instructions de code pour l'exécution des étapes du procédé tel que décrit. Finally, the invention relates to a computer program comprising code instructions for implementing the steps of an encoding method according to the invention, when these instructions are executed by a processor. The invention finally relates to a storage medium readable by a processor on which is recorded a computer program comprising code instructions for performing the steps of the method as described.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels:  Other features and advantages of the invention will appear more clearly on reading the following description, given solely by way of nonlimiting example, and with reference to the appended drawings, in which:
- la figure 1 illustre un codeur mettant en œuvre un codage paramétrique connu de l'état de l'art et précédemment décrit;  FIG. 1 illustrates an encoder implementing a parametric coding known from the state of the art and previously described;
- la figure 2 illustre un décodeur mettant en œuvre un décodage paramétrique connu de l'état de l'art et précédemment décrit;  FIG. 2 illustrates a decoder implementing a parametric decoding known from the state of the art and previously described;
- la figure 3 illustre un codeur paramétrique stéréo selon un mode de réalisation de l'invention;  FIG. 3 illustrates a stereo parametric encoder according to one embodiment of the invention;
- les figures 4a, 4b, 4c, 4d, 4e et 4f illustrent sous forme d'organigramme les étapes du traitement de réduction de canaux selon différents modes de réalisation de l'invention;  FIGS. 4a, 4b, 4c, 4d, 4e and 4f illustrate in flowchart form the steps of the channel reduction processing according to different embodiments of the invention;
- la figure 5 illustre un exemple d'évolution d'un indicateur caractérisant les canaux d'un signal multicanal donné utilisé selon un mode de réalisation de l'invention, pour un signal donné ;  FIG. 5 illustrates an example of evolution of an indicator characterizing the channels of a given multichannel signal used according to one embodiment of the invention, for a given signal;
- la figure 6 illustre un exemple de pondérations possibles en fonction de la valeur d'un indicateur caractérisant les canaux d'un signal selon un mode de réalisation de l'invention ;  FIG. 6 illustrates an example of possible weightings as a function of the value of an indicator characterizing the channels of a signal according to one embodiment of the invention;
- la figure 7 illustre un décodeur paramétrique stéréo mettant en œuvre un décodage adapté aux signaux codés selon le procédé de codage de l'invention ;  FIG. 7 illustrates a stereo parametric decoder implementing a decoding adapted to the signals coded according to the coding method of the invention;
- la figure 8 illustre un dispositif de traitement d'un signal audio décodé dans lequel un traitement de réduction de canaux selon l'invention est effectué ;et  FIG. 8 illustrates a device for processing a decoded audio signal in which a channel reduction processing according to the invention is carried out, and
- la figure 9 illustre un exemple matériel d'un équipement incorporant un codeur apte à mettre en œuvre le procédé de codage, selon un mode de réalisation de l'invention.  FIG. 9 illustrates a hardware example of a device incorporating an encoder able to implement the coding method, according to one embodiment of the invention.
En référence à la figure 3, un codeur paramétrique de signaux stéréo selon un mode de réalisation de l'invention, délivrant à la fois un signal mono et des paramètres d'information spatiale du signal stéréo est maintenant décrit. With reference to FIG. 3, a parametric encoder of stereo signals according to an embodiment of the invention, delivering both a mono signal and spatial information parameters of the stereo signal is now described.
Cette figure présente à la fois les entités, modules hardwares ou logiciels pilotés par un processeur du dispositif de codage et les étapes mises en œuvre par le procédé de codage selon un mode de réalisation de l'invention.  This figure shows both the entities, hardware modules or software driven by a processor of the coding device and the steps implemented by the coding method according to one embodiment of the invention.
On décrit ici le cas d'un signal stéréo. L'invention s'applique également au cas d'un signal multicanal avec un nombre de canaux supérieur à 2.  Here we describe the case of a stereo signal. The invention also applies to the case of a multichannel signal with a number of channels greater than 2.
Ce codeur stéréo paramétrique tel qu'illustré utilise un codage mono de type normalisé EVS, il fonctionne avec des signaux stéréo échantillonnés à la fréquence d'échantillonnage Fs de 8, 16, 32 et 48 kHz, avec des trames de 20 ms. Par la suite, sans perte de généralité, la description est principalement donnée pour le cas Fs =16 kHz. This parametric stereo encoder as shown uses a standard EVS type mono coding, it works with stereo signals sampled at the frequency sampling F s 8, 16, 32 and 48 kHz, with 20 ms frames. Subsequently, without loss of generality, the description is mainly given for the case F s = 16 kHz.
Il est à noter que le choix d'une longueur de trames de 20 ms n'est en aucun cas restrictif dans l'invention qui s'applique pareillement dans des variantes du mode de réalisation où la longueur de trames est différente, par exemple de 5 ou 10 ms, avec un autre codée qu'EVS.  It should be noted that the choice of a frame length of 20 ms is in no way restrictive in the invention which applies equally in variants of the embodiment where the frame length is different, for example from 5 or 10 ms, with another code than EVS.
Par ailleurs, l'invention s'applique pareillement à d'autres types de codage mono (ex : IETF OPUS, UIT-T G.722) opérant à des fréquences d'échantillonnage identiques ou non.  Moreover, the invention applies similarly to other types of mono coding (eg IETF OPUS, ITU-T G.722) operating at identical or different sampling rates.
Chaque canal temporel (L(n) et R(n)) échantillonné à 16 kHz est d'abord pré-filtré par un filtre passe-haut (HPF pour High Pass Filter en anglais) éliminant typiquement les composantes en dessous de 50 Hz (blocs 301 et 302). Ce pré-filtrage est optionnel, mais il peut être utilisé pour éviter le biais dû à la composante continue (DC) dans l'estimation de paramètres comme l'ICTD ou l'ICC.  Each time channel (L (n) and R (n)) sampled at 16 kHz is first pre-filtered by a High Pass Filter (HPF) typically eliminating components below 50 Hz ( blocks 301 and 302). This pre-filtering is optional, but it can be used to avoid DC bias in estimating parameters such as ICTD or ICC.
Les canaux L'(n) et ff'(n) issus des blocs de pré -filtrage sont analysés en fréquences par transformée de Fourier discrète avec fenêtrage sinusoïdal à recouvrement de 50% de longueur 40 ms soit 640 échantillons (blocs 303 à 306). Pour chaque trame, le signal (L'(n), ff'(n)) est donc pondéré par une fenêtre d'analyse symétrique couvrant 2 trames de 20 ms soit 40 ms (soit 640 échantillons pour s=16 kHz). La fenêtre d'analyse de 40 ms couvre la trame courante et la trame future. La trame future correspond à un segment de signal "futur" communément appelé "lookahead" de 20 ms. Dans des variantes de l'invention, d'autres fenêtres pourront être utilisées, par exemple une fenêtre asymétrique à bas retard appelée "ALDO" dans le codée EVS. De plus, dans des variantes, le fenêtrage d'analyse pourra être rendu adaptatif en fonction de la trame courante, afin d'utiliser une analyse avec une fenêtre longue sur des segments stationnaires et une analyse avec des fenêtres courtes sur des segments transitoires/non stationnaires, avec éventuellement des fenêtres de transition entre fenêtres longue et courte. The channels L '(n) and ff' (n) coming from pre-filtering blocks are analyzed in frequencies by discrete Fourier transform with overlapping sinusoidal windowing of 50% length 40 ms or 640 samples (blocks 303 to 306) . For each frame, the signal (L '(n), ff' (n)) is weighted by a symmetric analysis window covering 2 frames of 20 ms or 40 ms (ie 640 samples for s = 16 kHz). The 40ms analysis window covers the current frame and the future frame. The future frame corresponds to a "future" signal segment commonly called "lookahead" of 20 ms. In variants of the invention, other windows may be used, for example an asymmetrical low-delay window called "ALDO" in the EVS codec. In addition, in variants, the analysis windowing can be made adaptive according to the current frame, in order to use an analysis with a long window on stationary segments and an analysis with short windows on transitional / non-transitory segments. stationary, possibly with transition windows between long and short windows.
Pour la trame courante de 320 échantillons (20 ms à s =16 kHz), les spectres obtenus, L [k] et R [k] ( /c =0...320), comprennent 321 coefficients complexes, avec une résolution de 25 Hz par coefficient fréquentiel. Le coefficient d'indice k=0 correspond à la composante continue (0 Hz), il est réel. Le coefficient d'indice /c =320 correspond à la fréquence de Nyquist (8000 Hz pour s=16 kHz), il est aussi réel. Les coefficients d'indice 0 < k <160 sont complexes et correspondent à une sous-bande de largeur 25 Hz centrée sur la fréquence de k. For the current frame of 320 samples (20 ms at s = 16 kHz), the obtained spectra, L [k] and R [k] (/ c = 0 ... 320), comprise 321 complex coefficients, with a resolution of 25 Hz by frequency coefficient. The coefficient of index k = 0 corresponds to the DC component (0 Hz), it is real. The coefficient of index / c = 320 corresponds to the frequency of Nyquist (8000 Hz for s = 16 kHz), it is also real. The coefficients of index 0 <k <160 are complex and correspond to a 25 Hz sub-band centered on the frequency of k.
Les spectres L [k] et R [k] sont combinés dans le bloc 307 décrit ultérieurement pour obtenir un signal mono (downmix) M[k] dans le domaine fréquentiel. Ce signal est converti en temps par FFT inverse et fenêtrage -recouvrement avec la partie "lookahead" de la trame précédente (blocs 308 à 310). The spectra L [k] and R [k] are combined in the block 307 described later to obtain a mono (downmix) signal M [k] in the frequency domain. This signal is converted in time by inverse FFT and windowing-recovery with the "lookahead" part of the previous frame (blocks 308 to 310).
Le retard algorithmique du codée EVS est de 30,9375 ms à s=8 kHz et 32 ms pour les autres fréquences FS=16, 32 ou 48 kHz. Ce retard inclut la trame courante de 20 ms, le retard supplémentaire par rapport à la longueur de trame est donc de 10,9375 ms à s=8 kHz et 12 ms pour les autres fréquences (soit 192 échantillons a Fs =16 kHz), le signal mono est retardé (bloc 311) de T= 320-192= 128 échantillons pour que le retard accumulé entre le signal mono décodé par EVS et les canaux stéréo originaux devienne un multiple de la longueur de trames (320 échantillons). Par suite, pour synchroniser l'extraction de paramètres stéréo (bloc 314) et la synthèse spatiale à partir du signal mono effectué au décodeur, le lookahead pour le calcul du signal mono (20 ms) et le retard de codage/décodage mono auquel est ajouté le retard T pour aligner la synthèse mono (20 ms) correspondent à un retard supplémentaire de 2 trames (40 ms) par rapport à la trame courante. Ce retard de 2 trames est spécifique à la mise en œuvre détaillée ici, en particulier il est lié aux fenêtres symétriques sinusoïdales de 20 ms. Ce retard pourrait être différent. Dans une variante de réalisation, on pourrait obtenir un retard d'une trame avec une fenêtre optimisée avec un recouvrement plus faible entre fenêtres adjacentes avec un bloc 311 n'introduisant pas de retard (Γ=0). The algorithmic delay of the EVS codec is 30.9375 ms at s = 8 kHz and 32 ms for the other frequencies F S = 16, 32 or 48 kHz. This delay includes the current frame of 20 ms, the additional delay with respect to the frame length is therefore 10.9375 ms at s = 8 kHz and 12 ms for the other frequencies (ie 192 samples at F s = 16 kHz) , the mono signal is delayed (block 311) of T = 320-192 = 128 samples so that the accumulated delay between the mono signal decoded by EVS and the original stereo channels becomes a multiple of the frame length (320 samples). As a result, to synchronize the extraction of stereo parameters (block 314) and the spatial synthesis from the mono signal made at the decoder, the lookahead for the calculation of the mono signal (20 ms) and the mono coding / decoding delay to which is added the delay T to align the mono synthesis (20 ms) correspond to an additional delay of 2 frames (40 ms) compared to the current frame. This delay of 2 frames is specific to the detailed implementation here, in particular it is related to symmetrical sinusoidal windows of 20 ms. This delay could be different. In an alternative embodiment, it would be possible to obtain a delay of one frame with an optimized window with a lower overlap between adjacent windows with a block 311 not introducing a delay (Γ = 0).
Le signal mono décalé est ensuite codé (bloc 312) par le codeur EVS mono par exemple à un débit de 13,2, 16,4 ou 24,4 kbit/s. Dans des variantes, le codage pourra être effectué directement sur le signal non décalé ; dans ce cas le décalage pourra être effectué après décodage.  The shifted mono signal is then coded (block 312) by the mono EVS encoder, for example at a rate of 13.2, 16.4 or 24.4 kbit / s. In variants, the coding may be performed directly on the non-shifted signal; in this case the shift can be performed after decoding.
On considère dans un mode particulier de réalisation de l'invention, illustré ici à la figure 3, que le bloc 313 introduit un retard de deux trames sur les spectres L [k] , R [k] et M[k] afin d'obtenir les spectres LbUf [k] , RbUf [k] et MbUf [k]. It is considered in a particular embodiment of the invention, illustrated here in FIG. 3, that the block 313 introduces a delay of two frames on the spectra L [k], R [k] and M [k] in order to obtain the spectra L bU f [k], R bU f [k] and M bU f [k].
On pourrait de façon plus avantageuse en termes de quantité de données à stocker, décaler les sorties du bloc 314 d'extraction des paramètres ou encore les sorties des blocs de quantification 315, 316 et 317. On pourrait également introduire ce décalage au décodeur à la réception des couches d'amélioration stéréo.  One could more advantageously in terms of the amount of data to be stored, shift the outputs of the parameter extraction block 314 or the outputs of the quantization blocks 315, 316 and 317. It could also be introduced to the decoder at the same time. receiving stereo enhancement layers.
Parallèlement au codage mono, le codage de l'information spatiale stéréo est mis en œuvre dans les blocs 314 à 317.  In parallel with the mono coding, the coding of the stereo spatial information is implemented in the blocks 314 to 317.
Les paramètres stéréo sont extraits (bloc 314) et codés (blocs 315 à 317) à partir des spectres L [k] , R [k] et M[k] décalés de deux trames: LbUf [k], RbUf [k] et MbUf [k] . The stereo parameters are extracted (block 314) and coded (blocks 315 to 317) from the spectrums L [k], R [k] and M [k] offset by two frames: L bU f [k], R bU f [k] and M bU f [k].
Le bloc de traitement de réduction de canaux 307 ou "downmix" est maintenant décrit plus en détails.  The channel reduction processing block 307 or "downmix" is now described in more detail.
Celui-ci réalise selon un mode de réalisation de l'invention, un "downmix" dans le domaine fréquentiel pour obtenir un signal mono [/c]. Ce bloc de traitement 307 comprend un module d'obtention 307a d'au moins un indicateur caractérisant les canaux du signal multicanal, ici le signal stéréo. L'indicateur peut par exemple être un indicateur de type corrélation intercanale ou un indicateur de mesure de degré d'opposition de phase entre canaux. L'obtention de ces indicateurs sera décrite ultérieurement. The latter, according to one embodiment of the invention, performs a "downmix" in the frequency domain to obtain a mono signal [/ c]. This processing unit 307 comprises a module for obtaining 307a of at least one indicator characterizing the channels of the multichannel signal, here the stereo signal. The indicator may for example be an interchannel correlation type indicator or an indicator of degree of phase opposition between channels. Obtaining these indicators will be described later.
En fonction de la valeur de cet indicateur, le bloc de sélection 307b, sélectionne, parmi un ensemble de modes de traitement « downmix », un mode de traitement downmix qui s' applique en 307c aux signaux en entrée, ici au signal stéréo L [k] , R [k] pour donner un signal mono [/c] .  According to the value of this indicator, the selection block 307b, from among a set of downmix processing modes, selects a downmix processing mode which is applied at 307c to the input signals, here to the stereo signal L [ k], R [k] to give a mono signal [/ c].
Les figures 4a à 4f illustrent différents modes de réalisation mis en œuvre par le bloc de traitement 307. Figures 4a to 4f illustrate various embodiments implemented by the processing block 307.
Pour présenter ces figures et simplifier leurs descriptions, plusieurs paramètres sont d' abord définis : · Paramètre ICPD [k]  To present these figures and to simplify their descriptions, several parameters are first defined: · ICPD parameter [k]
Le paramètre ICPD [k] est calculé dans la trame courante pour chaque raie fréquentielle k selon la formule:  The parameter ICPD [k] is calculated in the current frame for each frequency line k according to the formula:
ICPD [k] = (L [k]. R* [k]) (13)  ICPD [k] = (L [k] .R * [k]) (13)
Ce paramètre correspond à la différence de phase entre les canaux L et R. Il est ici utilisé pour définir le paramètre ICCr. This parameter corresponds to the phase difference between the L and R channels. It is used here to define the ICCr parameter.
• Paramètre ICCr [m] • ICCr parameter [m]
Un paramètre de corrélation est calculé pour la trame courante comme suit où NFFT est la longueur de la FFT (ici NFFT=640 pour FS=16 kHz). Dans des variantes le module complexe pourra ne pas être appliqué, mais dans ce cas l'utilisation du paramètre ICCp (ou de ses dérivés) devra prendre en compte la valeur signée de ce paramètre. A correlation parameter is calculated for the current frame as follows where N FFT is the length of the FFT (here N FFT = 640 for F S = 16 kHz). In variants, the complex module may not be applied, but in this case the use of the ICCp parameter (or its derivatives) must take into account the signed value of this parameter.
Il est à noter que la division dans le calcul du paramètre ICCp peut être évitée car ICCp (lissée selon l'équation (16) ci-dessous) est comparée ensuite à un seuil ; il est courant d'ajouter une valeur faible e non nulle au dénominateur pour éviter une division par zéro, cette précaution est en fait inutile et on pourra fixer e=0 en pratique si on calcule séparément le numérateur et le dénominateur. Dans les réalisations de l'invention cette division n'est pas nécessaire car le paramètre ICCp (ou sa version éventuellement lissée ICCr définie ci- dessous) est comparé un seuil ; l'absence de division dans la mise en œuvre est avantageuse en termes de complexité. Cependant, pour simplifier la description qui suit, on garde la notation impliquant une division. It should be noted that the division in the calculation of the ICCp parameter can be avoided because ICCp (smoothed according to equation (16) below) is then compared to a threshold; It is common to add a low non-zero value to the denominator to avoid a division by zero, this precaution is in fact useless and we can set e = 0 in practice if we calculate separately the numerator and the denominator. In the embodiments of the invention this division is not necessary because the parameter ICCp (or its optionally smoothed version ICCr defined below) is compared a threshold; the lack of division in the implementation is advantageous in terms of complexity. However, to simplify the description that follows, we keep the notation involving a division.
Ce paramètre peut de façon optionnelle être lissé pour en atténuer les variations temporelles. Si la trame courante est d'indice m, ce lissage peut être calculé avec un filtre MA (à Moyenne Ajustée) d'ordre 2:  This parameter may optionally be smoothed to mitigate temporal variations. If the current frame is of index m, this smoothing can be calculated with a filter MA (at Adjusted Average) of order 2:
ICCr[m] = 0,5. ICCp[m] + 0,25. ICCp [m - 1] + 0,25. ICCp[m - 2] (15) En pratique, comme la division dans la définition de ICCr[m] n'a pas à être explicitement calculée, ce filtre MA sera avantageusement appliqué séparément aux valeurs du numérateur et du dénominateur.  ICCr [m] = 0.5. ICCp [m] + 0.25. ICCp [m-1] + 0.25. ICCp [m-2] (15) In practice, since the division in the definition of ICCr [m] does not have to be explicitly calculated, this MA filter will advantageously be applied separately to the numerator and denominator values.
Par la suite, le paramètre ICCr sera utilisé pour désigner ICCr[m] (sans mentionner l'indice de la trame courante) ; si le lissage n'est pas appliqué, le paramètre ICCr correspondra directement à ICCp. Dans des variantes d'autres méthodes de lissage pourront être mises en œuvre, par exemple en utilisant un filtre AR (Autorégressif), en lissant les signaux.  Subsequently, the ICCr parameter will be used to designate ICCr [m] (without mentioning the index of the current frame); if the smoothing is not applied, the ICCr parameter will correspond directly to ICCp. In variants of other smoothing methods may be implemented, for example using an AR (autoregressive) filter, smoothing the signals.
Le paramètre ICCr permet de quantifier le niveau de corrélation entre les canaux L et R lorsque les différences de phase entre ces canaux sont ignorées.  The ICCr parameter quantifies the level of correlation between the L and R channels when the phase differences between these channels are ignored.
Dans des variantes, le paramètre ICCp pourra être défini par sous-bande en changeant simplement les bornes des sommes, comme suit :  In variants, the parameter ICCp can be defined by subband simply by changing the bounds of the sums, as follows:
∑ l1→ L[k].R* [k]ej-,CPDW Σ l 1 → L [k] .R * [k] ej- , CPD W
|(∑¾-1 LM.L* M)(∑¾-1 RM.R * M)H | (Σ¾- 1 LM.L * M ) (Σ¾- 1 R M. R * M) H
où kb ... kb+1— 1 représentent les indices des raies fréquentielles dans la sous-bandes d'indice b . Là encore, le paramètre ICCp[b] pourra être lissé et dans ce cas l'invention sera mise en œuvre de la façon suivante : au lieu d'avoir une seule comparaison à ICCr [m], il y aura autant de comparaisons à ICCp[b] qu'il y a de sous-bandes d'indice b . where k b ... k b + 1 - 1 represent the indices of the frequency lines in the subband of index b. Again, the ICCp [b] parameter can be smoothed and in this case the invention will be implemented in the following way: instead of having a single comparison to ICCr [m], there will be as many comparisons to ICCp [b] that there are subbands of index b.
• Paramètre SGN[m] • SGN parameter [m]
Le canal dominant est également identifié afin de l'utiliser comme référence de phase. Par exemple, ce canal dominant peut être déterminé par l'intermédiaire d'un paramètre de signe SGN calculé pour la trame courante comme le signe de la différence des niveaux des canaux The dominant channel is also identified for use as a phase reference. For example, this dominant channel can be determined via an SGN sign parameter calculated for the current frame as the sign of the difference in channel levels.
où la fonction sign ) prend comme valeur 1 ou -1 si son opérande est respectivement >0 ou <0. where the function sign) takes as value 1 or -1 if its operand is respectively> 0 or <0.
Il est important de noter que le changement de référence (L ou R) pour l'alignement du signal mono (issu du downmix) sur la phase de L ou de R ne se fait que sous certaines conditions. Cela permet d'éviter des problèmes de phase lors de l'opération de recouvrement- addition après transformée inverse, quand la référence de phase passe arbitrairement de L à R ou vice versa. It is important to note that the reference change (L or R) for the alignment of the mono signal (from the downmix) on the L or R phase is only under certain conditions. This avoids phase problems during the recovery operation. addition after inverse transform, when the phase reference passes arbitrarily from L to R or vice versa.
Dans le mode de réalisation privilégié, on définit que la commutation n'est autorisée que lorsque le signal est faiblement corrélé et que cette phase n'est pas utilisée dans la trame courante car le downmix est dans ce cas de type passif (voir plus loin les détails les différents downmix utilisés). Ainsi, la valeur de SGNd dans la trame courante sera ignorée si cette condition n'est pas remplie ; la commutation de référence de phase ne sera autorisée que lorsque la valeur de ICCr dans la trame courante est inférieure à un seuil prédéterminé, par exemple ICCr <0,4. In the preferred embodiment, it is defined that switching is allowed only when the signal is weakly correlated and that this phase is not used in the current frame because the downmix is in this case passive type (see below). the details the different downmix used). Thus, the value of SGN d in the current frame will be ignored if this condition is not fulfilled; the phase reference switching will only be allowed when the value of ICCr in the current frame is below a predetermined threshold, for example ICCr <0.4.
On posera donc : We will ask:
Si = 1 , SGN[m] = 1 (choix initial arbitrairement fixé au canal L)  Si = 1, SGN [m] = 1 (initial choice arbitrarily fixed to the L channel)
Sinon  If not
Si ICCr[m] <0,4  If ICCr [m] <0.4
SGN[m] = SGNd SGN [m] = SGN d
Fin si  End if
Fin si  End if
Dans des variantes la valeur de 0,4 pourra être modifiée, cependant elle correspond ici au seuil thl =0,4 utilisé plus loin..  In variants, the value of 0.4 may be modified, however it corresponds here to the threshold th1 = 0.4 used later.
Dans des variantes, le choix initial SGN[1] pourra être modifié en SGN[1] = SGNd po r s'assurer que la référence de phase correspond au signal dominant dans la première trame, même si celle-ci ne comprend par définition que 20 ms de signal sur 40 ms utilisé (pour la taille de trame utilisée ici de façon préférentielle). In variants, the initial choice SGN [1] can be modified in SGN [1] = SGN to ensure that the phase reference corresponds to the dominant signal in the first frame, even if it does not include by definition 20 ms of signal over 40 ms used (for the frame size used here preferentially).
Dans des variantes, la condition pour autoriser une commutation de référence de phase pourra être définie par raie fréquentielle et dépendre du type de downmix utilisé à la trame courante (d'indice m) et du type de downmix utilisé à la trame précédente (d'indice m— 1) ; en effet, si le dowmix pour la raie d'indice k dans la trame m— 1 était de type passif (avec compensation de gain) et si le downmix sélectionné à la trame m est un downmix avec alignement sur une référence de phase adaptative, dans ce cas il sera possible d' autoriser une commutation de référence de phase. Autrement dit, la commutation de référence de phase est interdite pour la raie d'indice k tant que le downmix utilise explicitement la référence de phase correspondant au paramètre SGN.  In variants, the condition for authorizing a phase reference switching can be defined by frequency line and depend on the type of downmix used to the current frame (of index m) and the type of downmix used to the previous frame (of index m-1); indeed, if the dowmix for the line of index k in the frame m-1 was of the passive type (with compensation of gain) and if the downmix selected at the frame m is a downmix with alignment on an adaptive phase reference, in this case it will be possible to authorize a phase reference switching. In other words, the phase reference switch is forbidden for the index line k as long as the downmix explicitly uses the phase reference corresponding to the parameter SGN.
Le paramètre de signe SGN [m] ne change donc de valeur que lorsque ICCr est sous un seuil (dans le mode de réalisation privilégié). Cette précaution évite de changer de référence de phase dans des zones où les canaux sont très corrélés et potentiellement en opposition de phase. Dans des variantes, un autre critère pourra être utilisé pour définir les conditions de commutation de référence de phase. Dans des variantes de l'invention, la décision binaire associée au calcul de SGNd pourra être stabilisée pour éviter des fluctuations potentiellement rapide. On pourra ainsi définir une tolérance, par exemple de +/-3 dB, sur la valeur du niveau des canaux L et R, afin de mettre en œuvre un hystérésis empêchant le changement de référence de phase si la tolérance n'est pas dépassée. On pourra aussi appliquer un lissage inter-trames sur la valeur du niveau du signal. The SGN sign parameter [m] therefore only changes its value when ICCr is below a threshold (in the preferred embodiment). This precaution avoids changing the phase reference in areas where the channels are highly correlated and potentially in phase opposition. In variants, another criterion may be used to define the phase reference switching conditions. In variants of the invention, the binary decision associated with the calculation of SGN d may be stabilized to avoid potentially rapid fluctuations. It will thus be possible to define a tolerance, for example of +/- 3 dB, on the value of the level of the channels L and R, in order to implement a hysteresis preventing the change of reference of phase if the tolerance is not exceeded. It will also be possible to apply inter-frame smoothing on the value of the signal level.
Dans d' autres variantes, le paramètre SGNd pourra être calculé avec une autre définition du niveau des canaux, par exemple :In other variants, the parameter SGN d can be calculated with another definition of the level of the channels, for example:
SGNd = sign (17) ou encore à partir des paramètres ICLD sous la forme suivante : SGN d = sign (17) or from the ICLD parameters in the following form:
SGNd = sign(∑ =1 20iC™M 10 - B) (18) où B est le nombre de sous-bandes, ou de façon non équivalente SGN d = sign (Σ = 1 iC ™ M 10 - B) (18) where B is the number of subbands, or non-equivalent
SGNd = sign(∑ =1 ICPD [k]) (19) Dans d' autres variantes, on pourra calculer le niveau des différents canaux dans le domaine temporel. SGN d = sign (Σ = 1 ICPD [k]) (19) In other variants, the level of the different channels in the time domain can be calculated.
Dans des variantes de l'invention, le calcul explicite de SGNd ne sera pas effectué et on calculera séparément un paramètre représentant le niveau de chaque canal (L ou R). Au moment d'utiliser SGNd on effectuera une simple comparaison entre ces niveaux respectifs. La mise en œuvre est en fait strictement équivalente mais elle évite de calculer explicitement un signe. · Paramètre ISD [k] In variants of the invention, the explicit calculation of SGN d will not be performed and a parameter representing the level of each channel (L or R) will be calculated separately. When using one of SGN perform a simple comparison between these respective levels. The implementation is in fact strictly equivalent but it avoids explicitly calculating a sign. · ISD parameter [k]
Un paramètre ISD [k] défini pour chaque raie de la trame courante et permettant de détecter une opposition de phase est aussi calculé: An ISD parameter [k] defined for each line of the current frame and making it possible to detect a phase opposition is also calculated:
ISDW = |¾ | (20) ISD W = | ¾ | (20)
Quand les canaux L et R sont de phase opposée, la valeur ISD devient arbitrairement grande.  When the L and R channels are of opposite phase, the ISD value becomes arbitrarily large.
Il est à noter que la division dans le calcul du paramètre ISD peut être évitée car ISD est comparée ensuite à un seuil ; il est courant d' ajouter une valeur faible non nulle au dénominateur pour éviter une division par zéro, cette précaution est ici inutile car dans les réalisations de l'invention cette division n'est pas mise en œuvre. En effet la comparaison ISD [k]>thO est équivalent à la comparaison \L[k]— R [k] \>thO. \L[k] + R [k] \, ce qui rend le processus de sélection de mode de downmix attractif en termes de complexité. It should be noted that the division in the calculation of the ISD parameter can be avoided because ISD is then compared to a threshold; it is common to add a non-zero low value to the denominator to avoid a division by zero, this precaution is here unnecessary because in the embodiments of the invention this division is not implemented. Indeed the comparison ISD [k]> thO is equivalent to the comparison \ L [k] - R [k] \> thO. \ L [k] + R [k] \, which makes the downmix mode selection process attractive in terms of complexity.
Dans un premier mode de réalisation, la figure 4a illustre les étapes mises en œuvre pour le traitement de réduction de canaux du bloc 307. In a first embodiment, FIG. 4a illustrates the steps implemented for the channel reduction processing of block 307.
A l'étape E400, un indicateur caractérisant les canaux du signal audio multicanal est obtenu. Dans l'exemple illustré ici, il s'agit du paramètre ICCr tel que défini ci-dessus, calculé à partir du paramètre ICPD. L'indicateur ICCr correspond à une mesure de corrélation entre les canaux du signal multicanal, dans le cas particulier ici entre les canaux du signal stéréo.  In step E400, an indicator characterizing the channels of the multichannel audio signal is obtained. In the example illustrated here, it is the ICCr parameter as defined above, calculated from the ICPD parameter. The ICCr indicator corresponds to a correlation measurement between the channels of the multichannel signal, in the particular case here between the channels of the stereo signal.
Comme illustré sur cette figure 4a, le choix du downmix dépend principalement de l'indicateur ICCr [m] calculé comme expliqué précédemment à partir des canaux L et R de la trame courante et d'un lissage éventuel.  As illustrated in this FIG. 4a, the choice of the downmix depends mainly on the ICCr [m] indicator calculated as previously explained from the L and R channels of the current frame and of any smoothing.
Le choix entre modes de traitement downmix se fait en fonction de la valeur de l'indicateur ICCr [m].  The choice between downmix processing modes is based on the value of the ICCr [m] indicator.
Plusieurs modes de traitement de downmix sont prévus et font partie d'un ensemble de modes de traitement de réduction de canaux (downmix).  Several downmix processing modes are provided and are part of a set of downmix processing modes.
Le calcul du signal de downmix se fait raie par raie de la façon suivante, en utilisant trois downmix potentiels qui sont listés ci-dessous : The calculation of the downmix signal is done by line as follows, using three potential downmixes which are listed below:
1. Downmix de type passif (avec compensation de gain) . 1. Downmix of passive type (with gain compensation).
Ce downmix - /c] est défini comme un signe somme avec égalisation de l'énergie sous la forme :  This downmix - / c] is defined as a sum sign with equalization of energy in the form:
L[k] + R [k]  L [k] + R [k]
M1 [k] = . Y[k] M 1 [k] =. Y [k]
où y[k] est défini de sorte que M1 [k] soit équivalent à : where y [k] is defined so that M 1 [k] is equivalent to:
' . .„„, . \L [k] \ + \R[k] \ . . "",. \ L [k] \ + \ R [k] \
\M [k] \ =  \ M [k] \ =
^ j/c] = z(L[/c] + R [k )  ^ j / c] = z (L [/ c] + R [k)
On définit :  We define :
\L[k] \ + \R [k] \  \ L [k] \ + \ R [k] \
Y[k] = Y [K] =
\L[k] + R [k] \  \ L [k] + R [k] \
Ce downmix est efficace pour les signaux stéréo (et leurs décompositions fréquentielles par raie ou sous-bandes) dont les canaux ne sont pas très corrélés et n'ont pas une relation de phase complexe. Comme il n'est pas utilisé pour des signaux problématiques où le gain y[k] pourrait prendre des valeurs arbitraires grandes, aucune limitation du gain n'est ici utilisée, cependant dans des variantes une limitation de l'amplification pourrait être mise en œuvre. This downmix is effective for stereo signals (and their frequency decompositions by line or subbands) whose channels are not highly correlated and do not have a complex phase relationship. Since it is not used for problematic signals where the gain y [k] could take large arbitrary values, no limitation of the gain is used here, however in variants a limitation of the amplification could be implemented.
Dans des variantes, cette égalisation par le gain y[k] pourra être différente. Par exemple il serait possible de prendre la valeur déjà citée: In variants, this equalization by the gain y [k] may be different. For example it would be possible to take the already quoted value:
L'intérêt du gain y[k] tient ici à ce qu'il assure le même niveau d'amplitude pour le downmix - /c] que pour les autres downmix utilisés. Il est donc préférable d' ajuster le gain y[k] pour assurer un niveau d'amplitude ou d'énergie homogène entre les différents downmix.  The advantage of the gain y [k] is that it provides the same level of amplitude for the downmix - / c] as for the other downmixes used. It is therefore preferable to adjust the gain y [k] to ensure a level of amplitude or homogeneous energy between the different downmixes.
2. Downmix avec alignement sur une référence de phase adaptative 2. Downmix with alignment to an adaptive phase reference
Ce downmix M3 [k] est défini comme suit : This downmix M 3 [k] is defined as follows:
où la valeur de SGN est à comprendre comme étant la valeur SGN[m] dans la trame courante, mais pour alléger les notations l'indice de la trame n'est pas mentionné ici. where the value of SGN is to be understood as the value SGN [m] in the current frame, but to lighten the notations the index of the frame is not mentioned here.
Comme expliqué précédemment, la phase de ce downmix peut également s'exprimer de façon équivalente comme : As explained above, the phase of this downmix can also be expressed in an equivalent way as:
Ce downmix est similaire au downmix proposé par la méthode Samsudin précitée, cependant ici la phase de référence n'est pas donnée par le canal L et la phase est déterminée raie par raie et non au niveau d'une bande fréquentielle.  This downmix is similar to the downmix proposed by the above Samsudin method, however here the reference phase is not given by the L channel and the phase is determined line by line and not at a frequency band.
La phase est ici fixée en fonction du canal dominant identifié par le paramètre SGN. The phase is here set according to the dominant channel identified by the parameter SGN.
Ce downmix est intéressant pour les signaux très corrélés par exemple pour les signaux avec prise de son avec microphones de type AB ou binaurale. Il peut aussi arriver que des canaux indépendants aient une corrélation assez forte même s'il ne s'agit pas du même signal enregistré dans les canaux L et R ; pour éviter une commutation intempestive de la référence de phase, il est préférable de n'autoriser une telle commutation que lorsque les signaux ne présentent pas de risque de génération d'artéfacts audio quand ce downmix est utilisé. Ceci explique la contrainte ICCr[m] <0,4 dans le calcul du paramètre SGN [m] quand la condition de commutation de référence de phase utilise ce critère. 3. Downmix hybride entre un downmix passif (avec compensation de gain) et un dowmix avec alignement sur un référence de phase adaptative, dépendant d'un indicateur de mesure de degré d'opposition de phase entre les canaux (ISD[k] , tel que défini ci-dessus). This downmix is interesting for highly correlated signals, for example for sound signals with AB or binaural type microphones. It may also happen that independent channels have a fairly strong correlation even if it is not the same signal recorded in the L and R channels; to avoid inadvertent switching of the phase reference, it is preferable to allow such switching only when the signals do not present a risk of generating audio artifacts when this downmix is used. This explains the constraint ICCr [m] <0.4 in the SGN [m] parameter calculation when the phase reference switching condition uses this criterion. 3. Hybrid downmix between a passive downmix (with gain compensation) and a dowmix with alignment on an adaptive phase reference, depending on an indicator of degree of phase opposition between the channels (ISD [k], such as defined above).
Ce downmix M2 [k] est défini comme suit : This downmix M 2 [k] is defined as follows:
Si ISD [k] >thO (th0=1.3),  If ISD [k]> thO (th0 = 1.3),
M2 [k] = M3 [k] M 2 [k] = M 3 [k]
Sinon  If not
M2 [k] = M1 [k] M 2 [k] = M 1 [k]
Fin si  End if
Ce downmix est appliqué ici dans les cas où les signaux sont moyennement corrélés et où ils sont potentiellement en opposition de phase. Le paramètre ISD [k] sert ici à détecter une relation de phase proche de l'opposition de phase, et dans ce cas il est préférable de sélectionner le downmix avec alignement sur une référence de phase adaptative M3 [k] ; dans le cas contraire le dowmix passif avec compensation de gain M [k] est suffisant. This downmix is applied here in cases where the signals are moderately correlated and where they are potentially in phase opposition. The ISD parameter [k] is used here to detect a phase relation close to the phase opposition, and in this case it is preferable to select the downmix with alignment on an adaptive phase reference M 3 [k]; in the opposite case the passive dowmix with gain compensation M [k] is sufficient.
Dans des variantes le seuil th0=l,3 appliqué à ISD [k] pourra prendre d'autres valeurs.  In variants the threshold th0 = l, 3 applied to ISD [k] may take other values.
On notera que le downmix M2 [k] correspond soit à M [k] soit à M3 [k] , selon la valeur du paramètre ISD [k] . On comprendra que dans des variantes de l'invention, il sera donc possible de ne pas définir explicitement ce downmix M2 [k] mais de combiner les décisions sur la sélection du downmix et le critère sur ISD [k] . Un tel exemple est donné à la figure 4c cependant il est clair que cet exemple s'applique bien sûr à tous les modes de réalisation présentés ici. It should be noted that the downmix M 2 [k] corresponds to either M [k] or M 3 [k], depending on the value of the ISD parameter [k]. It will be understood that in variants of the invention, it will therefore be possible not to explicitly define this downmix M 2 [k] but to combine the decisions on the downmix selection and the criterion on ISD [k]. Such an example is given in Figure 4c however it is clear that this example applies of course to all embodiments presented here.
Ainsi, selon la figure 4a, si à l'étape E401, l'indicateur est inférieur à un premier seuil thl, alors un premier mode de traitement downmix Ml est mis en œuvre à l'étape E402. Thus, according to FIG. 4a, if in step E401, the indicator is lower than a first threshold th1, then a first downmix processing mode M1 is implemented in step E402.
Si ICCr[m] <0,4 (étape E401 avec thl=0,4)  If ICCr [m] <0.4 (step E401 with thl = 0.4)
M[k] = Mt [k] M [k] = M t [k]
Si à l'étape E403, l'indicateur est inférieur à un deuxième seuil th2, alors un deuxième mode de traitement downmix fonction de Ml et M2 est mis en œuvre à l'étape E404.  If in step E403, the indicator is less than a second threshold th2, then a second downmix processing mode according to M1 and M2 is implemented in step E404.
Si 0,4< ICCr[m] <0,5 (Etape E403 avec th2=0,5)  If 0.4 <ICCr [m] <0.5 (Step E403 with th2 = 0.5)
M[k] = fl(M1 [k], M2 [k]) M [k] = fl (M 1 [k], M 2 [k])
Si à l'étape E405, l'indicateur est inférieur à un troisième seuil th3, alors un troisième mode de traitement downmix fonction de M2 et M3 est mis en œuvre à l'étape E406. Si 0,5< ICCr[m] <0,6 (Etape E405 avec th3 = 0,6) If in step E405, the indicator is less than a third threshold th3, then a third downmix processing mode according to M2 and M3 is implemented in step E406. If 0.5 <ICCr [m] <0.6 (Step E405 with th3 = 0.6)
M[k] = f2(M2 [k], M3 [k]) M [k] = f2 (M 2 [k], M 3 [k])
Enfin, si à l'étape E405, l'indicateur est supérieur au troisième seuil th3, alors un quatrième mode de traitement downmix M3 est mis en œuvre à l'étape E407.  Finally, if in step E405, the indicator is greater than the third threshold th3, then a fourth downmix processing mode M3 is implemented in step E407.
Si ICCr[m] >0,6 (Etape E405, N)  If ICCr [m]> 0.6 (Step E405, N)
M[k] = M3 [k] M [k] = M 3 [k]
Dans des variantes de l'invention, les valeurs des seuils thl, th2, th3 pourront être fixées à d'autres valeurs ; les valeurs données ici correspondent typiquement à une longueur de trame de 20 ms.  In variants of the invention, the threshold values th1, th2, th3 may be set to other values; the values given here typically correspond to a frame length of 20 ms.
Les fonctions de pondération des fonctions de combinaisons fl . , . ) et 2(. , . ) sont illustrées à la figure 6. Ces fonctions de combinaisons réalisent un « fondu enchaîné » entre downmix différents afin d'éviter les effets de seuil, c'est-à-dire des transitions trop abruptes entres les downmix respectifs d'une trame à l'autre pour une raie donnée. N'importe quelles fonctions de pondération ayant des valeurs complémentaires entre 0 et 1 conviennent dans l'intervalle défini, mais dans le mode de réalisation ces fonctions sont dérivées de la fonction : The functions of weighting of the functions of combinations fl. ,. ) and 2 (.,.) are shown in Figure 6. These combination functions perform a "cross-fade" between different downmixes to avoid threshold effects, that is, too steep transitions between them. respective downmix from one frame to another for a given line. Any weighting functions having complementary values between 0 and 1 are suitable within the defined range, but in the embodiment these functions are derived from the function:
avec  with
A ( i [k], M2 [k]) = (1 - p). M1 [k] + p. M2 [k] et A (i [k], M 2 [k]) = (1 - p). M 1 [k] + p. M 2 [k] and
/2( 2 [k], M3 [k]) = (1 - p). M3 [k] + p. M2 [k] / 2 ( 2 [k], M 3 [k]) = (1 - p). M 3 [k] + p. M 2 [k]
On notera que le paramètre ICCr[m] est ici défini au niveau de la trame courante ; dans des variantes ce paramètre pourra être estimé par bande fréquentielle (par exemple selon l'échelle ERB ou Bark). It should be noted that the parameter ICCr [m] is here defined at the level of the current frame; in variants this parameter can be estimated by frequency band (for example according to the ERB or Bark scale).
Dans un deuxième mode de réalisation, la figure 4b illustre les étapes mises en œuvre pour le traitement de réduction de canaux du bloc 307. Cette variante de réalisation a pour but de simplifier la décision sur la méthode de downmix à utiliser et à réduire la complexité en ne mettant pas en œuvre le fondu enchaîné entre deux méthodes de downmix. In a second embodiment, FIG. 4b illustrates the steps implemented for the channel reduction processing of block 307. This variant embodiment is intended to simplify the decision on the downmix method to be used and to reduce the complexity. by not fading between two downmix methods.
Les étapes E400, E401, E402, E405 et E407 sont identiques à celles décrites en référence à la figure 4a.  Steps E400, E401, E402, E405 and E407 are identical to those described with reference to FIG. 4a.
Ainsi, selon la figure 4b, si à l'étape E401, l'indicateur est inférieur à un premier seuil thl, alors un premier mode de traitement downmix Ml est mis en œuvre à l'étape E402.  Thus, according to FIG. 4b, if in step E401, the indicator is lower than a first threshold th1, then a first downmix processing mode M1 is implemented in step E402.
Si ICCr[m] <0,4 (étape E401 avec thl=0,4)  If ICCr [m] <0.4 (step E401 with thl = 0.4)
M[k] = fc] Si à l'étape E405, l'indicateur est inférieur à un seuil th3, alors un deuxième mode de traitement downmix M2 est mis en œuvre à l'étape E410. M [k] = fc] If in step E405, the indicator is below a threshold th3, then a second downmix processing mode M2 is implemented in step E410.
Si 0,4< ICCr[m] <0,6 (Etape E405 avec th3 = 0,6)  If 0.4 <ICCr [m] <0.6 (Step E405 with th3 = 0.6)
M[k] = M2 [k] M [k] = M 2 [k]
Enfin, si à l'étape E405, l'indicateur est supérieur au seuil th3, alors un troisième mode de traitement downmix M3 est mis en œuvre à l'étape E407.  Finally, if in step E405, the indicator is greater than threshold th3, then a third downmix M3 processing mode is implemented in step E407.
Si ICCr[m] >0,6 (Etape E405, N)  If ICCr [m]> 0.6 (Step E405, N)
M[k] = M3 [k] M [k] = M 3 [k]
Les méthodes de downmix Ml, M2 et M3 sont par exemple ceux décrits précédemment. A noter que le downmix M2 est un downmix hybride entre le downmix Ml et M3 qui fait intervenir un autre critère de décision sur un autre indicateur ISD tel que défini précédemment.  The methods of downmix M1, M2 and M3 are for example those described above. Note that the downmix M2 is a hybrid downmix between the downmix Ml and M3 which involves another decision criterion on another indicator ISD as defined above.
Une réalisation strictement identique en termes de résultat de la figure 4b est montrée à la figure 4c. Dans cette variante, l'évaluation des paramètres de sélection (bloc E450) et les décisions de sélection de downmix (bloc E451) sont rassemblées. Dans un troisième mode de réalisation, la figure 4d illustre les étapes mises en œuvre pour le traitement de réduction de canaux du bloc 307. Cette variante de réalisation a pour but de simplifier la décision sur la méthode de downmix à utiliser, cette fois-ci en n'utilisant pas le downmix passif -^/c]. En effet ce downmix passif est en fait déjà inclut dans le downmix hybride M2 [k] ; de plus, on peut considérer que le downmix hybride est une variante plus robuste que le downmix M [k] car il permet d'éviter les problèmes d'opposition de phase. A strictly identical embodiment in terms of the result of FIG. 4b is shown in FIG. 4c. In this variant, the evaluation of the selection parameters (block E450) and the downmix selection decisions (block E451) are gathered. In a third embodiment, FIG. 4d illustrates the steps implemented for the channel reduction processing of block 307. This variant embodiment is intended to simplify the decision on the downmix method to be used, this time by not using passive downmix - ^ / c]. Indeed, this passive downmix is in fact already included in the hybrid downmix M 2 [k]; moreover, we can consider that the hybrid downmix is a more robust variant than the downmix M [k] because it makes it possible to avoid the problems of phase opposition.
Le downmix à la figure 4d est calculé comme suit :  The downmix in Figure 4d is calculated as follows:
Si à l'étape E403, l'indicateur est inférieur à un seuil th2, alors le traitement downmix M2 est mis en œuvre à l'étape E410.  If in step E403, the indicator is below a threshold th2, then downmix processing M2 is implemented in step E410.
Si ICCr[m] <0,5 (Etape E403 avec th2=0,5)  If ICCr [m] <0.5 (Step E403 with th2 = 0.5)
M[k] = M2 [k] M [k] = M 2 [k]
Si à l'étape E405, l'indicateur est inférieur à un seuil th3, alors un mode de traitement downmix fonction de M2 et M3 est mis en œuvre à l'étape E406.  If in step E405, the indicator is below a threshold th3, then a downmix processing mode according to M2 and M3 is implemented in step E406.
Si 0,5< ICCr[m] <0,6 (Etape E405 avec th3 = 0,6)  If 0.5 <ICCr [m] <0.6 (Step E405 with th3 = 0.6)
M[k] = f2(M2 [k], M3 [k]) M [k] = f2 (M 2 [k], M 3 [k])
Enfin, si à l'étape E405, l'indicateur est supérieur au seuil th3, alors un mode de traitement downmix M3 est mis en œuvre à l'étape E407.  Finally, if in step E405, the indicator is greater than threshold th3, then a downmix processing mode M3 is implemented in step E407.
Si ICCr[m] >0,6 (Etape E405, N)  If ICCr [m]> 0.6 (Step E405, N)
M[k] = M3 [k] Dans une variante non représentée ici, on pourra ne pas utiliser de fondu enchaîné et ainsi éliminer la décision E405 à la figure 4d. M [k] = M 3 [k] In a variant not shown here, we can not use cross-fade and thus eliminate the decision E405 in Figure 4d.
On notera que le mode de réalisation de la figure 4d est strictement équivalent à celui de la figure 4b en fixant thl à une valeur <0.  It will be noted that the embodiment of FIG. 4d is strictly equivalent to that of FIG. 4b by setting th1 to a value <0.
Dans un quatrième mode de réalisation, la figure 4e illustre les étapes mises en œuvre pour le traitement de réduction de canaux du bloc 307. Dans ce mode de réalisation, l'indicateur caractérisant les canaux du signal audionumérique multicanal est l'indicateur de phase ISD représentatif d'une mesure de degré d'opposition de phase des canaux du signal multicanal. In a fourth embodiment, FIG. 4e illustrates the steps implemented for the block reduction processing of block 307. In this embodiment, the indicator characterizing the channels of the multichannel digital audio signal is the ISD phase indicator. representative of a phase opposition degree measurement of the multichannel signal channels.
Il est déterminé à l'étape E420. Pour un signal stéréo, ce paramètre est tel que défini à l'équation (18) pour un calcul par raie spectrale.  It is determined in step E420. For a stereo signal, this parameter is as defined in equation (18) for a spectral line calculation.
Ainsi, selon la figure 4e, si à l'étape E421 , l'indicateur ISD [k] est supérieur à un seuil thO, alors un premier mode de traitement downmix est mis en œuvre à l'étape E422.  Thus, according to FIG. 4e, if in step E421, the indicator ISD [k] is greater than a threshold thO, then a first downmix processing mode is implemented in step E422.
Si ISD [k] >1 ,3 (O de l'étape E421 avec th0=l ,3)  If ISD [k]> 1, 3 (O of step E421 with th0 = 1.3)
alors le traitement de downmix est défini comme suit :  then the downmix processing is defined as follows:
ZM [k] = ZL [k]  ZM [k] = ZL [k]
\L [k] \ + \R [k] \  \ L [k] \ + \ R [k] \
|M[fc] | = ' 2 ' | M [fc] | = ' 2 '
Si à l'étape E421 , l'indicateur ISD[k] est inférieur au seuil thO, alors un deuxième mode de traitement downmix est mis en œuvre à l'étape E423.  If in step E421, the ISD indicator [k] is below thO threshold, then a second downmix processing mode is implemented in step E423.
Si ISD [k] <1 ,3 (N de l'étape E421 avec th0=l ,3)  If ISD [k] <1, 3 (N of step E421 with th0 = 1.3)
alors le traitement de downmix Ml [k] est appliqué. Il est défini comme suit :  then the downmix processing Ml [k] is applied. It is defined as follows:
L [k] + R [k]  L [k] + R [k]
M[k] = 2 Y[k] M [k] = 2 Y [k]
Enfin, une variante de la détermination du signal de dowmix de la figure 4e est présentée à la figure 4f. Dans cette variante, le critère principal de sélection du mode de downmix est défini comme étant le paramètre ISD comme à la figure 4e, cependant ce paramètre est cette fois-ci défini par sous-bande à l'étape E430, ISD [b] où b est l'indice de la sous-bande fréquentielle (typiquement ERB ou Bark). Dans cette variante, quand la relation de phase entre les canaux L et R est proche de l'opposition de phase (seuil ISD [b] >1 ,3), à l'étape E431 , le mode de downmix sélectionné est cette fois-ci similaire à la méthode définie dans l'annexe D de G.722 mais de façon plus directe, sans utiliser d'IPD pleine bande.  Finally, a variant of the determination of the dowmix signal of FIG. 4e is presented in FIG. 4f. In this variant, the main criterion for selecting the downmix mode is defined as the ISD parameter as in FIG. 4e, however this parameter is this time defined by subband in step E430, ISD [b] where b is the index of the frequency subband (typically ERB or Bark). In this variant, when the phase relationship between the L and R channels is close to the phase opposition (ISD threshold [b]> 1, 3), in step E431, the selected downmix mode is this time. This is similar to the method defined in Annex D of G.722 but more directly, without the use of full-band IPD.
Ainsi, selon la figure 4f, si à l'étape E431 , l'indicateur ISD [b] est supérieur à un seuil thO, alors un premier mode de traitement downmix est mis en œuvre à l'étape E432.  Thus, according to FIG. 4f, if in step E431, the ISD indicator [b] is greater than a threshold thO, then a first downmix processing mode is implemented in step E432.
Si ISD [k] >1 ,3 (O de l'étape E431 avec th0=l ,3) alors le traitement de downmix est défini comme suit (downmix avec alignement sur une référence de phase adaptative, M3) : If ISD [k]> 1, 3 (O of step E431 with th0 = 1.3) then the downmix processing is defined as follows (downmix with alignment to an adaptive phase reference, M3):
pour/c = kb ... kb+1 — 1 for / c = k b ... k b + 1 - 1
ZL[k]. \L [k] \ + ZR[k]. \R [k] \  ZL [k]. \ L [k] \ + ZR [k]. \ R [k] \
ZM[k] =  ZM [k] =
\L [k] \ + \R[k] \  \ L [k] \ + \ R [k] \
\L[k] \ + \R[k] \  \ L [k] \ + \ R [k] \
\M[k] \ =  \ M [k] \ =
2  2
Si à l'étape E431, l'indicateur ISD [b] est inférieur au seuil thO, alors un deuxième mode de traitement downmix est mis en œuvre à l'étape E433.  If in step E431, the ISD flag [b] is below thO threshold, then a second downmix processing mode is implemented in step E433.
Si ISD [b] <1,3 (N de l'étape E431 avec th0=l,3)  If ISD [b] <1.3 (N of step E431 with th0 = 1.3)
alors le traitement de downmix est défini comme suit (downmix passif avec compensation de gain, Ml) :  then the downmix processing is defined as follows (passive downmix with gain compensation, Ml):
pour k = kb ... kb+1 — 1 for k = k b ... k b + 1 - 1
L[k] + R[k] L [k] + R [k]
M[k] = 2 Y[k] M [k] = 2 Y [k]
Dans des variantes supplémentaires, on pourra rajouter des critères de classification / décision supplémentaires afin d'affiner plus finement le choix du downmix, cependant on gardera au moins une décision entre au moins deux modes de downmix selon la valeur d'au moins un indicateur caractérisant les canaux du signal multicanal comme par exemple le paramètre ICCr ou le paramètre ISD (sur la trame, par sous-bande, ou par raie).  In additional variants, it will be possible to add additional classification / decision criteria in order to refine the choice of the downmix more finely, but at least one decision will be kept between at least two downmix modes depending on the value of at least one characterizing indicator. the multichannel signal channels such as the ICCr parameter or the ISD parameter (on the frame, by subband, or by line).
Les exemples de sélection de downmix illustrés aux figures 4a à 4f ne sont pas limitatifs. D'autres combinaisons ou applications de critères peuvent être envisagés.  The examples of downmix selection illustrated in FIGS. 4a to 4f are not limiting. Other combinations or applications of criteria may be considered.
Par exemple, un fondu enchaîné pourrait être appliqué dans le mode de réalisation où le critère est l'indicateur ISD.  For example, a cross fade could be applied in the embodiment where the criterion is the ISD indicator.
Un downmix combinant 3 types de downmix avec pondérations adaptatives, de type A downmix combining 3 types of downmix with adaptive weights, type
M[k] = pl. - /c] + p2. M2 [k] + p3. M3 [k] pourrait aussi être choisi. Les pondérations pl, p2 et p3 étant alors adaptés en fonction des critères de sélection. M [k] = pl. - / c] + p2. M 2 [k] + p3. M 3 [k] could also be chosen. The weights p1, p2 and p3 are then adapted according to the selection criteria.
La figure 5 donne un exemple d'évolution du paramètre ICCr pour un signal donné avec les seuils de décision th3 et thl fixés à 0,4 et 0,6 tel décrit dans l'exemple de réalisation de la figure 4b. On notera que ces valeurs prédéterminées sont surtout valables pour une trame de 20 ms et elles pourront être modifiées si la longueur de trame est différente. FIG. 5 gives an example of the evolution of the parameter ICCr for a given signal with the decision thresholds th3 and th1 set at 0.4 and 0.6 as described in the embodiment of FIG. 4b. Note that these predetermined values are especially valid for a frame of 20 ms and they can be modified if the frame length is different.
Cette figure montre la fluctuation de cet indicateur ICCr et de l'indicateur SGN. Il est donc judicieux d'adapter au mieux le traitement de downmix en fonction de l'évolution de cet indicateur. En effet, une corrélation importante des signaux pour les trames de 100 à 300 par exemple, peut permettre un downmix adaptatif avec alignement sur une référence de phase. Lorsque l'indicateur ICCr se trouve entre les seuils thl et th3, cela veut dire que les canaux du signal sont moyennement corrélés et qu'ils sont potentiellement en opposition de phase. Dans ce cas, le downmix à appliquer dépend d'un indicateur révélateur d'une opposition de phase entre les canaux. Si l'indicateur révèle une opposition de phase, alors il est préférable de sélectionner le downmix avec alignement sur une référence de phase adaptative définit ci-dessus par M3 [k] . Dans le cas contraire, le downmix passif avec compensation de gain définit ci-dessus par M-^ [k] est suffisant. This figure shows the fluctuation of this ICCr indicator and the SGN indicator. It is therefore wise to adapt the downmix treatment as best as possible to the evolution of this indicator. Indeed, a significant correlation of the signals for the frames from 100 to 300 for example, can allow an adaptive downmix with alignment on a reference of phase. When the ICCr indicator is between the thresholds th1 and th3, this means that the signal channels are moderately correlated and potentially out of phase. In this case, the downmix to be applied depends on an indicator indicating a phase opposition between the channels. If the indicator reveals a phase opposition, then it is preferable to select the downmix with alignment on an adaptive phase reference defined above by M 3 [k]. In the opposite case, the passive downmix with gain compensation defined above by M- ^ [k] is sufficient.
La valeur du paramètre SGN qui est également représentée à la figure 5 sert à choisir la bonne référence de phase dans le cas où l'indicateur de corrélation est sous un seuil par exemple 0,4. Dans l'exemple de la figure 5 la référence de phase passe donc de L à R aux alentours de la trame 500.  The value of the parameter SGN which is also represented in FIG. 5 serves to choose the right phase reference in the case where the correlation indicator is under a threshold, for example 0.4. In the example of FIG. 5, the phase reference therefore passes from L to R around the frame 500.
Nous revenons à présent à la figure 3. Pour adapter les paramètres de spatialisation au signal mono tel qu'obtenu par les traitements de "downmix" décrit ci-dessus, une extraction particulière des paramètres par le bloc 314 est maintenant décrite. We will now return to FIG. 3. To adapt the spatialization parameters to the mono signal as obtained by the "downmix" processing described above, a particular extraction of the parameters by the block 314 is now described.
Pour adapter les paramètres de spatialisation au signal mono tel qu'obtenu par le traitement de "downmix" décrit ci-dessus, une extraction particulière des paramètres par le bloc 314 est maintenant décrite en référence à la figure 3.  To adapt the spatialization parameters to the mono signal as obtained by the "downmix" processing described above, a particular extraction of the parameters by the block 314 is now described with reference to FIG.
Pour l'extraction des paramètres ICLD (bloc 314), les spectres LbUf [k] et RbUf [k] sont découpés en 35 sous-bandes de fréquences. Ces sous-bandes sont définies par les frontières suivantes : For the extraction of ICLD parameters (block 314), the spectra L bU f [k] and R bU f [k] are divided into 35 sub-frequency bands. These subbands are defined by the following boundaries:
2 3 4 6 7 9 11 13 15 18 21 24 28 32 36 41 47 53 59 67 75 84 94 105 118 131 146 163 182 202 225 250 278 308 321]  2 3 4 6 7 9 11 13 15 18 21 24 28 32 36 41 47 53 59 67 75 84 94 105 118 131 146 163 182 202 225 250 278 308 321]
Le tableau ci-dessus délimite (en nombre de coefficients de Fourier) les sous-bandes fréquentielles d'indice b = 0 à 34. Par exemple la première sous-bande (b=0) va du coefficient kb=Q à kb+1— 1 = 0; elle est donc réduite à un seul coefficient qui représente 25 Hz. De même, la dernière sous-bande (k=34) va du coefficient kb =30& à kb+1— 1 = 320, elle comprend 12 coefficients (300 Hz). La raie fréquentielle d'indice k =321 qui correspond à la fréquence de Nyquist n'est pas prise en compte ici. The table above delimits (in number of Fourier coefficients) the frequency subbands of index b = 0 to 34. For example the first subband (b = 0) goes from the coefficient k b = Q to k b +1 - 1 = 0; it is thus reduced to a single coefficient which represents 25 Hz. Similarly, the last subband (k = 34) goes from the coefficient k b = 30 & to k b + 1 - 1 = 320, it comprises 12 coefficients (300 Hz ). The frequency line of index k = 321 which corresponds to the frequency of Nyquist is not taken into account here.
Pour chaque trame, l'ICLD de la sous-bande b =0, ...,34 est calculée suivant l'équation:  For each frame, the ICLD of the sub-band b = 0, ..., 34 is calculated according to the equation:
ICLD [b] = 10. logw ^ (21) où a [b] et σ [b] représentent respectivement l'énergie du canal gauche {LbUf [k]) et du canal droit (Rbuf [k]): ICLD [b] = 10. log w ^ (21) where a [b] and σ [b] represent the energy of the left channel {L bU f [k]) and the right channel (R buf [k]) :
Selon un mode de réalisation particulier, les paramètres ICLD sont codés par une quantification scalaire non-uniforme différentielle (bloc 315). Cette quantification ne sera pas détaillée ici car elle dépasse le cadre de l'invention.  According to a particular embodiment, the ICLD parameters are coded by differential non-uniform scalar quantization (block 315). This quantification will not be detailed here because it goes beyond the scope of the invention.
De manière similaire, les paramètres ICPD et ICC sont codés par des méthodes connues par l'homme de l'art, par exemple avec une quantification scalaire uniforme sur l'intervalle adéquat.  Similarly, the ICPD and ICC parameters are encoded by methods known to those skilled in the art, for example with uniform scalar quantization over the appropriate interval.
En référence à la figure 7 un décodeur selon un mode de réalisation de l'invention est maintenant décrit. Referring to Figure 7 a decoder according to an embodiment of the invention is now described.
Ce décodeur comporte un démultiplexeur 501 dans lequel le signal mono codé est extrait pour être décodé en 502 par un décodeur EVS mono dans cet exemple. La partie du train binaire correspondant au codeur EVS mono est décodée selon le débit utilisé au codeur. On suppose ici qu'il n'y a pas de perte de trames ni d'erreurs binaires sur le train binaire pour simplifier la description, cependant des techniques connues de correction de perte de trames peuvent bien évidemment être mises en œuvre dans le décodeur.  This decoder comprises a demultiplexer 501 in which the coded mono signal is extracted to be decoded at 502 by a mono EVS decoder in this example. The part of the bitstream corresponding to the EVS mono encoder is decoded according to the bit rate used at the encoder. It is assumed here that there is no loss of frames or bit errors on the bit stream to simplify the description, however, known frame loss correction techniques can obviously be implemented in the decoder.
Le signal mono décodé correspond à (n) en l'absence d'erreurs de canal. Une analyse par transformée de Fourier discrète à court-terme avec le même fenêtrage qu'au codeur est réalisée sur M (n) (blocs 503 et 504) pour obtenir le spectre M [k] . On considère ici qu'une décorrélation dans le domaine fréquentiel (bloc 520) est également appliquée.  The decoded mono signal corresponds to (n) in the absence of channel errors. A short-term discrete Fourier transform analysis with the same windowing as the encoder is performed on M (n) (blocks 503 and 504) to obtain the spectrum M [k]. It is considered here that a decorrelation in the frequency domain (block 520) is also applied.
La partie du train binaire associée à l'extension stéréo est aussi dé-multiplexée. Les paramètres ICLD, ICPD, ICC sont décodés pour obtenir ICLDq [b] , ICPDq [b] et ICCq [b] (blocs 505 à 507). De plus, le signal mono décodé pourra être décorrélé par exemple dans le domaine fréquentiel (bloc 520). Les détails de mise en œuvre du bloc 508 ne sont pas présentés ici car ils dépassent le cadre de l'invention, mais les techniques classiques connues de l'homme de l'art pourront être utilisées. The part of the bit stream associated with the stereo extension is also de-multiplexed. The ICLD, ICPD, ICC parameters are decoded to obtain ICLD q [b], ICPD q [b] and ICC q [b] (blocks 505 to 507). In addition, the decoded mono signal may be decorrelated for example in the frequency domain (block 520). The implementation details of block 508 are not presented here because they go beyond the scope of the invention, but conventional techniques known to those skilled in the art can be used.
Les spectres L [k] et R [k] sont ainsi calculés et ensuite convertis dans le domaine temporel par FFT inverse, fenêtrage, addition et recouvrement (blocs 509 à 514) pour obtenir les canaux synthétisés L(n) et R (n).  The spectra L [k] and R [k] are thus calculated and then converted in the time domain by inverse FFT, windowing, addition and overlap (blocks 509 to 514) to obtain the synthesized channels L (n) and R (n). .
Le codeur présenté en référence à la figure 3 et le décodeur présenté en référence à la figure 7 ont été décrits dans le cas d'application particulière de codage et décodage stéréo. L'invention a été décrite à partir d'une décomposition des canaux stéréo par transformée de Fourier discrète. L'invention s'applique également à d'autres représentations complexes, comme par exemple la décomposition MCLT (Modulated Complex Lapped Transform) combinant une transformée discrète en cosinus modifiée (MDCT) et transformée discrète en sinus modifiée (MDST), ainsi qu'au cas de bancs de filtres de type Pseudo-Quadrature Mirror Filter (PQMF). Ainsi le terme de "coefficient fréquentiel" utilisé dans la description détaillé peut être étendu à la notion de "sous-bande" ou de "bande de fréquence", sans changer la nature de l'invention. The encoder presented with reference to FIG. 3 and the decoder presented with reference to FIG. 7 have been described in the case of a particular application of stereo coding and decoding. The invention has been described from a decomposition of stereo channels by discrete Fourier transform. The invention is also applicable to other complex representations, such as for example the Modulated Complex Lapped Transform (MCLT) decomposition. combining a discrete modified cosine transform (MDCT) and a discrete modified sinus transform (MDST), as well as the case of Pseudo-Quadrature Mirror Filter (PQMF) filter banks. Thus the term "frequency coefficient" used in the detailed description can be extended to the concept of "sub-band" or "frequency band", without changing the nature of the invention.
Enfin, le downmix faisant l'objet de l'invention pourra être utilisé non seulement au codage mais aussi au décodage afin de générer un signal mono à la sortie d'un décodeur ou récepteur stéréo, afin d'assurer une compatibilité avec des équipements uniquement mono. Cela peut être le cas par exemple lorsqu'on passe d'une restitution sonore au casque à une restitution à un haut parleur.  Finally, the downmix that is the subject of the invention may be used not only for coding but also for decoding in order to generate a mono signal at the output of a decoder or stereo receiver, in order to ensure compatibility with equipment only. mono. This can be the case for example when going from a sound reproduction to the headphones to a return to a speaker.
La figure 8 illustre ce mode de réalisation, un signal stéréo par exemple est reçu décodé (L(n), R(n)). Il est transformé par les blocs respectifs 601, 602 et 603, 604 pour obtenir les spectres gauche et droit (L[k] et R [k]).  FIG. 8 illustrates this embodiment, for example a stereo signal is decoded (L (n), R (n)). It is transformed by the respective blocks 601, 602 and 603, 604 to obtain the left and right spectrums (L [k] and R [k]).
Une des méthodes telles que décrites en référence aux figures 4a à 4f est alors mise en œuvre dans le bloc de traitement 605, de la même façon que pour le bloc de traitement 307 de la figure 3.  One of the methods as described with reference to FIGS. 4a to 4f is then implemented in the processing block 605, in the same way as for the processing block 307 of FIG. 3.
Ce bloc de traitement 605 comprend un module d'obtention 605a d'au moins un indicateur caractérisant les canaux du signal stéréo multicanal reçu, ici le signal stéréo. L'indicateur peut par exemple être un indicateur de type corrélation intercanale ou un indicateur de mesure de degré d'opposition de phase entre canaux.  This processing block 605 comprises a obtaining module 605a of at least one indicator characterizing the channels of the multichannel stereo signal received, here the stereo signal. The indicator may for example be an interchannel correlation type indicator or an indicator of degree of phase opposition between channels.
En fonction de la valeur de cet indicateur, le bloc de sélection 605b, sélectionne, parmi un ensemble de modes de traitement « downmix », un mode de traitement downmix qui s'applique en 605c aux signaux en entrée, ici au signal stéréo L[k] , R [k] pour donner un signal mono [/c].  According to the value of this indicator, the selection block 605b, from among a set of downmix processing modes, selects a downmix processing mode that applies at 605c to the input signals, here to the stereo signal L [ k], R [k] to give a mono signal [/ c].
Les codeurs et décodeurs tels que décrits en référence aux figures 3,7 et 8 peuvent être intégrés dans des équipements multimédia de type décodeur de salon, "set top box" ou lecteur de contenu audio ou vidéo. Ils peuvent également être intégré dans des équipements de communication de type téléphone mobile ou passerelle de communication.  The encoders and decoders as described with reference to FIGS. 3, 7 and 8 may be integrated in multimedia equipment of the set-top box type or audio or video content player. They can also be integrated into communication equipment of the mobile phone or communication gateway type.
Dans des variantes, on considère le cas d'un downmix de 5.1 canaux à un signal stéréo. Au lieu de 2 canaux en entrée du downmix, on considère le cas d'un signal surround de type 5.1 défini comme un ensemble de 6 canaux : L (Front Left), C (Center), R (Front Right), Ls (Left Surround ou Rear Left), Rs (Right Surround ou Rear Right), LFE (Low Frequency effects ou subwoofer). Dans ce cas deux variantes de downmix de 5.1 stéréo peuvent être appliquées selon d'invention :  In variants, the case of a downmix of 5.1 channels to a stereo signal is considered. Instead of 2 channels at the input of the downmix, we consider the case of a 5.1 type surround signal defined as a set of 6 channels: L (Front Left), C (Center), R (Front Right), Ls (Left Surround or Rear Left), Rs (Right Surround or Rear Right), LFE (Low Frequency Effects or Subwoofer). In this case, two downmix variants of 5.1 stereo can be applied according to the invention:
· Les canaux C et LFE peuvent être combinés par downmix passif et le résultat peut être combiné séparément aux canaux L et R en appliquant les modes de réalisation de downmix de 2 canaux (stéréo) vers 1 canal (mono) pour obtenir respectivement des canaux L' et R' . Ensuite, les canaux L' et R' peuvent être également combinés avec respectivement Ls et Rs en appliquant les modes de réalisation de downmix de 2 canaux (stéréo) vers 1 canal (mono) pour obtenir respectivement des canaux L" et R' ' qui constituent le résultat du downmix. · The C and LFE channels can be combined by passive downmix and the result can be combined separately to the L and R channels by applying the embodiments of downmix from 2 channels (stereo) to 1 channel (mono) to obtain channels L 'and R' respectively. Then, the channels L 'and R' can also be combined with respectively Ls and Rs by applying the downmix embodiments of 2 channels (stereo) to 1 channel (mono) to obtain respectively L "and R" channels which are the result of the downmix.
Cette mise en œuvre fait donc appel de façon « hiérarchique » (par étapes successives) à un downmix élémentaire de type 2 vers 1 décrit précédemment selon différentes variantes.  This implementation therefore calls "hierarchically" (in successive steps) to an elementary downmix type 2 to 1 previously described according to different variants.
• Dans une variante plus générale, l'invention pourra être généralisée pour combiner simultanément 3 canaux d'un côté L, Ls, C+LFE et d'un autre coté R, Rs, C+LFE où • In a more general variant, the invention can be generalized to simultaneously combine 3 channels on one side L, Ls, C + LFE and on the other side R, Rs, C + LFE where
C+LFE est le résultat d'un downmix passif simple pour obtenir directement deux canaux L" et R" . C + LFE is the result of a simple passive downmix to directly obtain two L "and R" channels.
Dans ce cas, on pourra définir plusieurs downmix comme dans le cas stéréo : un downmix M [k] passif des 3 signaux avec compensation de gain, un downmix M3 [k] des 3 signaux avec alignement adaptatif de la phase sur une référence adaptative (le signal dominant parmi les 3). Dans ce cas, le downmix est obtenu selon la généralisation : In this case, we can define several downmix as in the case of stereo: a passive downmix M [k] of 3 signals with gain compensation, a downmix M 3 [k] of 3 signals with adaptive alignment of the phase on an adaptive reference (the dominant signal among the 3). In this case, the downmix is obtained according to the generalization:
M[k] = piyCCrlZ^CCrlS CCrZS^. M^k]  M [k] = piyCCrlZ ^ CCrlS CCrZS ^. M ^ k]
+ p3(ICCrl2, ICCrl3, 7CCV23). M3 [k] + p3 (ICCrl2, ICCrl3, 7CCV23). M 3 [k]
où les pondérations pl et p3 sont des fonctions à plusieurs variables, par exemple la corrélation ICCrij entre chaque couple de canaux i et j (par exemple, L, Ls, C+LFE) respectifs pris deux à deux.  where the weights p1 and p3 are multivariate functions, for example the ICCrij correlation between each pair of channels i and j (for example, L, Ls, C + LFE) taken in pairs.
Dans d'autres variantes de l'invention le nombre de canaux en entrée et en sortie du downmix pourra être différent des cas stéréo vers mono ou 5.1 vers stéréo illustrés ici.  In other variants of the invention, the number of input and output channels of the downmix may be different from the stereo to mono or 5.1 to stereo cases illustrated here.
La figure 9 représente un exemple de réalisation d'un tel équipement dans lequel un codeur tel que décrit en référence à la figure 3 ou un dispositif de traitement tel que décrit en référence à la figure 8, selon l'invention est intégré. Ce dispositif comporte un processeur PROC coopérant avec un bloc mémoire BM comportant une mémoire de stockage et/ou de travail MEM.  FIG. 9 represents an exemplary embodiment of such an equipment in which an encoder as described with reference to FIG. 3 or a processing device as described with reference to FIG. 8, according to the invention is integrated. This device comprises a PROC processor cooperating with a memory block BM having a storage and / or working memory MEM.
Le bloc mémoire peut avantageusement comporter un programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé de codage au sens de l'invention, ou du procédé de traitement lorsque ces instructions sont exécutées par le processeur PROC, et notamment les étapes d'extraction d'au moins un indicateur caractérisant les canaux du signal audionumérique multicanal et de sélection, parmi un ensemble de modes de traitement de réduction de canaux, d'un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal. The memory block can advantageously comprise a computer program comprising code instructions for implementing the steps of the coding method in the sense of the invention, or the processing method when these instructions are executed by the processor PROC, and especially the steps of extracting at least one indicator characterizing the channels of the multichannel digital audio signal and selecting, from a set of channel reduction processing modes, a mode of processing of channel reduction according to the value of the at least one indicator characterizing the multichannel audio signal channels.
Ces instructions sont exécutées pour un traitement de réduction de canaux lors d'un codage d'un signal multicanal ou d'un traitement d'un signal multicanal décodé.  These instructions are executed for channel reduction processing when encoding a multichannel signal or processing a decoded multichannel signal.
Le programme peut comporter les étapes mises en œuvre pour coder les informations adaptées à ce traitement.  The program may include the steps implemented to code the information adapted to this treatment.
La mémoire MEM peut stocker les différents modes de traitement de downmix à sélectionner selon le procédé de l'invention.  The memory MEM can store the various downmix processing modes to be selected according to the method of the invention.
Typiquement, les descriptions des figures 3, 4a à 4f reprennent les étapes d'un algorithme d'un tel programme informatique. Le programme informatique peut également être stocké sur un support mémoire lisible par un lecteur du dispositif ou équipement ou téléchargeable dans l'espace mémoire de celui-ci.  Typically, the descriptions of FIGS. 3, 4a to 4f show the steps of an algorithm of such a computer program. The computer program can also be stored on a memory medium readable by a reader of the device or equipment or downloadable in the memory space thereof.
Un tel équipement ou codeur comporte un module d'entrée apte à recevoir un signal multicanal par exemple un signal stéréo comportant les canaux R et L pour droit et gauche, soit par un réseau de communication, soit par lecture d'un contenu stocké sur un support de stockage. Cet équipement multimédia peut également comporter des moyens de capture d'un tel signal stéréo.  Such equipment or encoder comprises an input module capable of receiving a multichannel signal, for example a stereo signal comprising the R and L channels for right and left, either by a communication network, or by reading a content stored on a terminal. storage medium. This multimedia equipment may also include means for capturing such a stereo signal.
Le dispositif comporte un module de sortie apte à transmettre un signal mono M issus du traitement de réduction de canaux sélectionné selon l'invention et dans le cas d'un dispositif de codage, les paramètres d'informations spatiales codées Pc. The device comprises an output module adapted to transmit a mono signal M from the selected channel reduction processing according to the invention and in the case of a coding device, the coded spatial information parameters P c .

Claims

REVENDICATIONS
1. Procédé de codage paramétrique d'un signal audionumérique multicanal comportant une étape de codage (312) d'un signal mono (M) issu d'un traitement de réduction de canaux (307) appliqué au signal multicanal et de codage d'informations de spatialisation (315,316, 317) du signal multicanal, A method of parametric coding of a multi-channel digital audio signal comprising a step of encoding (312) a mono signal (M) from channel reduction processing (307) applied to the multichannel signal and encoding information spatialization (315, 316, 317) of the multichannel signal,
caractérisé en ce que le traitement de réduction de canaux comporte les étapes suivantes, mises en œuvre par unité spectrale du signal multicanal:  characterized in that the channel reduction processing comprises the following steps, implemented per spectral unit of the multichannel signal:
-extraction (307a) d'au moins un indicateur caractérisant les canaux du signal audionumérique multicanal ;  -extracting (307a) at least one indicator characterizing the channels of the multichannel digital audio signal;
-sélection (307b), parmi un ensemble de modes de traitement de réduction de canaux, d'un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal.  selecting (307b), from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator characterizing the channels of the multichannel audio signal.
2. Procédé selon la revendication 1, caractérisé en ce qu'il comprend en outre la détermination d'un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal et en ce qu'un des modes de traitement de réduction de canaux dudit ensemble dépend de la valeur de l'indicateur de phase. 2. Method according to claim 1, characterized in that it further comprises the determination of a phase indicator, representative of a measurement of degree of phase opposition between the channels of the multichannel signal and that a channel reduction processing modes of said set depends on the value of the phase indicator.
3. Procédé selon l'une des revendications 1 ou 2, caractérisé en ce que l'ensemble de modes de traitement de réduction de canaux comprend une pluralité de traitement dans la liste suivante : 3. Method according to one of claims 1 or 2, characterized in that the set of channel reduction processing modes comprises a plurality of processing in the following list:
- traitement de réduction de canaux de type passif avec ou sans compensation de gain ;  - passive channel reduction processing with or without gain compensation;
- traitement de réduction des canaux de type adaptatif avec alignement de la phase sur une référence et/ou un contrôle d'énergie ;  adaptive-type channel reduction processing with phase alignment on a reference and / or energy control;
- traitement de réduction de canaux de type hybride dépendant d'un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal;  phase-indicator-type hybrid channel reduction processing, representative of a phase opposition degree measurement between the multichannel signal channels;
- combinaison d'au moins deux modes de traitement passif, adaptatif ou hybride.  - combination of at least two modes of passive, adaptive or hybrid processing.
4. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'indicateur caractérisant les canaux du signal audio multicanal est un indicateur de mesure de corrélation entre les canaux du signal audio multicanal. 4. Method according to one of the preceding claims, characterized in that the indicator characterizing the channels of the multichannel audio signal is a correlation measurement indicator between the channels of the multichannel audio signal.
5. Procédé selon la revendication 1, caractérisé en ce que l'indicateur caractérisant les canaux du signal audio multicanal est un indicateur de phase, représentatif d'une mesure de degré d'opposition de phase entre les canaux du signal multicanal. 5. Method according to claim 1, characterized in that the indicator characterizing the channels of the multichannel audio signal is a phase indicator, representative of a measurement of degree of phase opposition between the channels of the multichannel signal.
6. Dispositif de codage paramétrique d'un signal audionumérique multicanal comportant un codeur (312) apte à coder un signal mono (M) issu d'un module de traitement de réduction de canaux (307) appliqué au signal multicanal et un module de quantification (315,316, 317) pour coder des informations de spatialisation du signal multicanal, Parametric coding device for a multichannel digital audio signal comprising an encoder 312 capable of coding a mono signal M from a channel reduction processing module 307 applied to the multichannel signal and a quantization module (315, 316, 317) for encoding spatialization information of the multichannel signal,
caractérisé en ce que le module de traitement de réduction de canaux comporte : - un module d'extraction (307a) apte à obtenir au moins un indicateur caractérisant les canaux du signal audionumérique multicanal, par unité spectrale du signal multicanal;  characterized in that the channel reduction processing module comprises: - an extraction module (307a) capable of obtaining at least one indicator characterizing the channels of the multichannel digital audio signal, per spectral unit of the multichannel signal;
-un module de sélection (307b), apte à sélectionner, par unité spectrale du signal multicanal, parmi un ensemble de modes de traitement de réduction de canaux, un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal.  a selection module (307b) capable of selecting, by spectral unit of the multichannel signal, from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator; characterizing the channels of the multichannel audio signal.
7. Procédé de traitement d'un signal audio multicanal décodé comportant un traitement de réduction de canaux pour obtenir un signal mono à restituer, caractérisé en ce que le traitement de réduction de canaux comporte les étapes suivantes, mises en œuvre par unité spectrale du signal multicanal: 7. A method for processing a decoded multichannel audio signal comprising channel reduction processing to obtain a mono signal to be restored, characterized in that the channel reduction processing comprises the following steps, implemented per spectral unit of the signal. multichannel:
-extraction (605a) d'au moins un indicateur caractérisant les canaux du signal audionumérique multicanal ;  -extracting (605a) at least one indicator characterizing the channels of the multichannel digital audio signal;
-sélection (605b), parmi un ensemble de modes de traitement de réduction de canaux, d'un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal.  selecting (605b), from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator characterizing the channels of the multichannel audio signal.
8. Dispositif de traitement d'un signal audio multicanal décodé comportant un module de traitement de réduction de canaux pour obtenir un signal mono à restituer, caractérisé en ce que le module de traitement de réduction de canaux comprend : A device for processing a decoded multichannel audio signal comprising a channel reduction processing module for obtaining a mono signal to be reproduced, characterized in that the channel reduction processing module comprises:
-un module d'extraction (605a) apte à obtenir au moins un indicateur caractérisant les canaux du signal audionumérique multicanal, par unité spectrale du signal multicanal ;  an extraction module (605a) able to obtain at least one indicator characterizing the channels of the multichannel digital audio signal, per spectral unit of the multichannel signal;
-un module de sélection (605b), apte à sélectionner, par unité spectrale du signal multicanal, parmi un ensemble de modes de traitement de réduction de canaux, un mode de traitement de réduction de canaux en fonction de la valeur du au moins un indicateur caractérisant les canaux du signal audio multicanal. a selection module (605b) capable of selecting, by spectral unit of the multichannel signal, from among a set of channel reduction processing modes, a channel reduction processing mode according to the value of the at least one indicator; characterizing the channels of the multichannel audio signal.
9. Programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé selon l'une des revendications 1 à 5, lorsque ces instructions sont exécutées par un processeur. 9. Computer program comprising code instructions for implementing the steps of the method according to one of claims 1 to 5, when these instructions are executed by a processor.
10. Support de stockage lisible par un processeur sur lequel est enregistré un programme informatique comprenant des instructions de code pour l'exécution des étapes du procédé selon l'une des revendications 1 à 5. 10. A processor-readable storage medium on which is stored a computer program comprising code instructions for performing the steps of the method according to one of claims 1 to 5.
EP16825835.8A 2015-12-16 2016-12-13 Adaptive channel-reduction processing for encoding a multi-channel audio signal Pending EP3391370A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1562485A FR3045915A1 (en) 2015-12-16 2015-12-16 ADAPTIVE CHANNEL REDUCTION PROCESSING FOR ENCODING A MULTICANAL AUDIO SIGNAL
PCT/FR2016/053353 WO2017103418A1 (en) 2015-12-16 2016-12-13 Adaptive channel-reduction processing for encoding a multi-channel audio signal

Publications (1)

Publication Number Publication Date
EP3391370A1 true EP3391370A1 (en) 2018-10-24

Family

ID=55646738

Family Applications (1)

Application Number Title Priority Date Filing Date
EP16825835.8A Pending EP3391370A1 (en) 2015-12-16 2016-12-13 Adaptive channel-reduction processing for encoding a multi-channel audio signal

Country Status (5)

Country Link
US (1) US10553223B2 (en)
EP (1) EP3391370A1 (en)
CN (1) CN108369810B (en)
FR (1) FR3045915A1 (en)
WO (1) WO2017103418A1 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269577B (en) * 2016-12-30 2019-10-22 华为技术有限公司 Stereo encoding method and stereophonic encoder
CN109427337B (en) * 2017-08-23 2021-03-30 华为技术有限公司 Method and device for reconstructing a signal during coding of a stereo signal
GB201718341D0 (en) 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN111332197B (en) * 2020-03-09 2021-08-03 湖北亿咖通科技有限公司 Light control method and device of vehicle-mounted entertainment system and vehicle-mounted entertainment system
EP4120250A4 (en) * 2020-03-09 2024-03-27 Nippon Telegraph & Telephone Sound signal downmixing method, sound signal coding method, sound signal downmixing device, sound signal coding device, program, and recording medium

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004042819A1 (en) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a coded multi-channel signal and apparatus and method for decoding a coded multi-channel signal
MX2011009660A (en) * 2009-03-17 2011-09-30 Dolby Int Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding.
KR101756838B1 (en) * 2010-10-13 2017-07-11 삼성전자주식회사 Method and apparatus for down-mixing multi channel audio signals
FR2966634A1 (en) * 2010-10-22 2012-04-27 France Telecom ENHANCED STEREO PARAMETRIC ENCODING / DECODING FOR PHASE OPPOSITION CHANNELS
CN102446507B (en) * 2011-09-27 2013-04-17 华为技术有限公司 Down-mixing signal generating and reducing method and device
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal

Also Published As

Publication number Publication date
CN108369810B (en) 2024-04-02
WO2017103418A1 (en) 2017-06-22
CN108369810A (en) 2018-08-03
US20190156841A1 (en) 2019-05-23
FR3045915A1 (en) 2017-06-23
US10553223B2 (en) 2020-02-04

Similar Documents

Publication Publication Date Title
EP3391370A1 (en) Adaptive channel-reduction processing for encoding a multi-channel audio signal
EP2374123B1 (en) Improved encoding of multichannel digital audio signals
EP3427260B1 (en) Optimized coding and decoding of spatialization information for the parametric coding and decoding of a multichannel audio signal
EP2374124B1 (en) Advanced encoding of multi-channel digital audio signals
EP2656342A1 (en) Improved stereo parametric encoding/decoding for channels in phase opposition
EP2489039B1 (en) Optimized low-throughput parametric coding/decoding
EP2002424B1 (en) Device and method for scalable encoding of a multichannel audio signal based on a principal component analysis
EP2691952B1 (en) Allocation, by sub-bands, of bits for quantifying spatial information parameters for parametric encoding
EP2005420B1 (en) Device and method for encoding by principal component analysis a multichannel audio signal
EP2042001B1 (en) Binaural spatialization of compression-encoded sound data
WO2007093726A2 (en) Device for perceptual weighting in audio encoding/decoding
EP2304721A1 (en) Spatial synthesis of multichannel audio signals
FR3049084A1 (en)
WO2011073600A1 (en) Parametric stereo encoding/decoding having downmix optimisation
EP2126905B1 (en) Methods and devices for audio signals encoding and decoding, encoded audio signal
EP2489040A1 (en) Optimized parametric stereo decoding
EP4042418B1 (en) Determining corrections to be applied to a multichannel audio signal, associated coding and decoding
WO2023232823A1 (en) Title: spatialized audio encoding with configuration of a decorrelation processing operation
FR2857552A1 (en) Signal decoding process for sound scene reconstruction, involves generating two frequency spectrums from signal and canceling imaginary part of continuous components and at half of sample frequency of spectrum
FR2853804A1 (en) Audio signal decoding process, involves constructing uncorrelated signal from audio signals based on audio signal frequency transformation, and joining audio and uncorrelated signals to generate signal representing acoustic scene
FR2980620A1 (en) Method for processing decoded audio frequency signal, e.g. coded voice signal including music, involves performing spectral attenuation of residue, and combining residue and attenuated signal from spectrum of tonal components

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20180709

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: ORANGE

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

17Q First examination report despatched

Effective date: 20201215

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

RAP3 Party data changed (applicant data changed or rights of an application transferred)

Owner name: ORANGE