EP3014611A1 - Improved frequency band extension in an audio signal decoder - Google Patents

Improved frequency band extension in an audio signal decoder

Info

Publication number
EP3014611A1
EP3014611A1 EP14742262.0A EP14742262A EP3014611A1 EP 3014611 A1 EP3014611 A1 EP 3014611A1 EP 14742262 A EP14742262 A EP 14742262A EP 3014611 A1 EP3014611 A1 EP 3014611A1
Authority
EP
European Patent Office
Prior art keywords
signal
band
frequency band
extended
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP14742262.0A
Other languages
German (de)
French (fr)
Other versions
EP3014611B1 (en
Inventor
Magdalena KANIEWSKA
Stéphane RAGOT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Publication of EP3014611A1 publication Critical patent/EP3014611A1/en
Application granted granted Critical
Publication of EP3014611B1 publication Critical patent/EP3014611B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Definitions

  • the present invention relates to the field of coding / decoding and audio-frequency signal processing (such as speech, music or other signals) for their transmission or storage.
  • the invention relates to a method and a device for extending the frequency band in a decoder or a processor performing an audio-frequency signal improvement.
  • state of the art audio signal coding (mono) consists of perceptual encoding by transform or subband, with parametric coding of high frequencies by tape replication.
  • 3GPP AMR-WB Adaptive Multi-Rate Wideband
  • codec and decoder which operates at an input / output frequency of 16 kHz and in which the signal is divided into two sub-bands, the low band (0-6.4 kHz) which is sampled at 12.8 kHz and coded by CELP model and the high band (6.4-7 kHz) which is parametrically reconstructed by "band extension" ( or BWE for "Bandwidth Extension” with or without additional information depending on the mode of the current frame.
  • BWE Bandwidth Extension
  • the limitation of the coded band of the AMR-WB codec at 7 kHz is essentially related to the fact that the transmission frequency response of the broadband terminals has been approximated at the time of standardization (ETSI / 3GPP then ITU-T T) according to the frequency mask defined in the ITU-T P.341 standard and more precisely by using a so-called "P341" filter defined in the ITU-T G.191 standard which cuts frequencies above 7 kHz (this filter respects the mask defined in P.341).
  • a signal sampled at 16 kHz may have a defined audio band of 0 to 8000 Hz; the AMR-WB codec thus introduces a limitation of the high band in comparison with the theoretical bandwidth of 8 kHz.
  • the 3GPP AMR-WB speech codec was standardized in 2001 mainly for circuit-mode (CS) telephony applications on GSM (2G) and UMTS (3G). This same codec was also standardized in 2003 in ITU-T as Recommendation G.722.2 "Wideband coding speech at around 16kbit / s using Adaptive Multi-Rate Wideband (AMR-WB)".
  • AMR-WB coding and decoding algorithm The details of the AMR-WB coding and decoding algorithm are not repeated here, a detailed description of this codec is found in the 3GPP specifications (TS 26.190, 26.191, 26.192, 26.193, 26.194, 26.204) and ITU-TG .722.2 (and the corresponding Appendices and Appendix) and in the article by B. Bessette et al. entitled "The adaptive multirate broadband speech coded (AMR-WB)", IEEE Transactions on Speech and Audio Processing, vol. 10, no. 8, 2002, pp. 620-636 and associated 3GPP and ITU-T standard source codes.
  • AMR-WB adaptive multirate broadband speech coded
  • the principle of band extension in the AMR-WB codec is rather rudimentary. Indeed, the high band (6.4-7 kHz) is generated by formatting a white noise through a temporal envelope (applied in the form of gains per subframe) and frequency (by the application of a linear prediction synthesis filter or LPC for "Linear Predictive Coding").
  • This band extension technique is illustrated in Figure 1.
  • a white noise, u HB1 (n), n 0, ⁇ ⁇ ⁇ , 79, is generated at 16 kHz per 5 ms subframe per linear congruent generator (block 100).
  • This noise u HB1 (n) is shaped in time by applying gains per subframe; this operation is broken down into two processing steps (blocks 102, 106 or 109):
  • u HB (n) g HB u HB2 (n)
  • SHB W SPSSP + ( 1 - W SP) SBG
  • w sp is a weighting function that depends on Voice Activity Detection (VAD).
  • VAD Voice Activity Detection
  • correction information is transmitted by the encoder AMR-WB and decoded (blocks 107, 108) in order to refine the estimated gain per subframe (4 bits every 5ms, ie 0.8 kbit / s) .
  • the artificial excitation u HB (n) is then filtered (block 111) by a transfer function function LPC (block 111) synthesis filter 1 / A HB (z) and operating at the sampling frequency of 16 kHz.
  • LPC transfer function function
  • the filter 1 / A HB (z) is of order 16 and simply corresponds to:
  • a low-pass filter also FIR type (block 113) is added to the treatment to further attenuate frequencies above 7 kHz.
  • the synthesis at high frequencies (HF) is finally added (block 130) to the low frequency synthesis (BF) obtained with the blocks 120 to 123 and resampled at 16 kHz (block 123).
  • HF high frequencies
  • BF low frequency synthesis
  • the signal in the high band is white noise formatted (by temporal gains per subframe, filtering by 1 / A HB (z) and bandpass filtering), which is not a good general model signal in the band 6.4-7 kHz.
  • white noise formatted by temporal gains per subframe, filtering by 1 / A HB (z) and bandpass filtering
  • bandpass filtering which is not a good general model signal in the band 6.4-7 kHz.
  • there are very harmonic music signals for which the 6.4-7 kHz band contains sinusoidal components (or tones) and no noise (or little noise) for these signals the band extension of the AMR-WB coding degrades. strongly the quality.
  • the 7 kHz low-pass filter (block 113) introduces an offset of nearly 1 ms between the low and high bands, which can potentially degrade the quality of some signals by slightly desynchronizing the two bands at 23.85 kbit / s - this Desynchronization can also be a problem when switching from 23.85 kbit / s to other modes.
  • the estimate of gains per subframe (block 101, 103 to 105) is not optimal. In part, it is based on an equalization of the "absolute" energy per sub-frame (block 101) between signals at different frequencies: the artificial excitation at 16 kHz
  • the AMR-WB decoding algorithm has been improved in part with the development of the ITU-T G.718 scalable codec which was standardized in 2008.
  • ITU-T G.718 includes an interoperable mode, for which core coding is compatible with 12.65 kbit / s G.722.2 (AMR-WB) coding; in addition, the G.718 decoder has the particularity of being able to decode a bit stream AMR-WB / G.722.2 at all possible bit rates of the AMR-WB codec (from 6.6 to 23.85 kbit / s).
  • the G.718 interoperable decoder in low delay mode (G.718-LD) is illustrated in FIG. 2.
  • G.718-LD low delay mode
  • the band extension (described in clause 7.13.1 of Recommendation G.718, block 206) is identical to that of the AMR-WB decoder, except that the 6-7 kHz band-pass filter and the filter Synthesis 1 / A HB (z) (Blocks 111 and 112) are in reverse order.
  • the 4 bits transmitted by AMR-WB encoder subframes are not used in the interoperable G.718 decoder; the synthesis of high frequencies (HF) at 23.85 kbit / s is therefore identical to 23.05 kbit / s which avoids the known problem of quality of AMR-WB decoding at 23.85 kbit / s.
  • the low-pass filter at 7 kHz (block 113) is not used, and the specific decoding mode 23.85 kbit / s is omitted (blocks 107 to 109).
  • a post-processing of the 16 kHz synthesis is implemented in G.718 by "noise facede” in block 208 (to “improve” the quality of the silences by reducing the level ), high-pass filtering (block 209), low-frequency post-filter (so-called “bass posfilter”) in block 210 attenuating interharmonic noise at low frequencies, and conversion to 16-bit integers with saturation control (with control of gain or AGC) in block 211.
  • the present invention improves the situation.
  • the invention proposes a method of extending the frequency band of an audiofrequency signal during a decoding or improvement process comprising a decoding or extraction step, in a so-called first frequency band. low band, an excitation signal and the coefficients of a linear prediction filter.
  • the method is such that it comprises the following steps:
  • the excitation signal (resulting from the decoding of the low band or from a low band signal extraction) makes it possible to carry out the band extension with a signal model that is more suitable for certain types of band. signals like music signals.
  • the excitation signal decoded or estimated in the low band has in some cases harmonics, which when they exist, can be transposed in high frequency so that it ensures a certain level of harmonicity in the high band reconstructed.
  • the band extension according to the method thus makes it possible to improve the quality for this type of signal.
  • the band extension according to the method is performed by first extending an excitation signal and then applying a synthesis filtering step; this approach exploits the fact that the decoded excitation in the low band is a signal whose spectrum is relatively flat, which avoids the decoded signal whitening treatments that may exist in the known methods of band extension in the frequency domain in the state of the art.
  • first frequency band the energy at the current frame and that of the subframe in the low band signal
  • second frequency band the energy per frame in the high band
  • This makes it possible to keep in the high band the same ratio of energy between subframe and frame as in the low band, which is particularly beneficial when the energy of the subframes varies greatly, for example in the case of transient sounds. , of attacks.
  • the method further includes an adaptive bandpass filtering step based on the decoding rate of the current frame.
  • This adaptive filtering makes it possible to optimize the extended bandwidth as a function of the bit rate, and therefore the quality of the reconstructed signal after band extension. Indeed, for low bit rates (typically 6.6 and 8.85 kbit / s for AMR-WB), the overall quality of the decoded signal in low band (by AMR-WB codec or an interoperable version) not being very good, it is better not to extend the decoded band too much and thus to limit the band extension by adapting the frequency response of the filter bandpass associated to cover for example an approximate band of 6 to 7 kHz; this limitation is all the more advantageous that the excitation signal itself is relatively poorly coded and it is preferable not to use a sub-band too wide for the extension of high frequencies.
  • the quality can be improved with HF synthesis covering a wider band, for example approximately 6 to 7.7 kHz.
  • the high limit of 7.7 kHz (instead of 8 kHz) is an example embodiment, which can be adjusted to values close to 7.7 kHz. This limitation is here justified by the fact that the extension is made in the invention without auxiliary information and that an extension up to 8 kHz (although theoretically possible) could result in artifacts for particular signals.
  • this limitation at 7.7 kHz takes into account the fact that typically the anti-aliasing filters in analog / digital conversion and resampling filters between 16 kHz and other frequencies are not perfect and they typically introduce a rejection at frequencies below 8 kHz.
  • the method comprises a step of transforming the time-frequency of the excitation signal, the step of obtaining an extended signal then taking place in the frequency domain and a reverse time-frequency transforming step. of the extended signal before the scaling and filtering steps.
  • the implementation of the band extension (of the excitation signal) in the frequency domain makes it possible to obtain a fineness of frequency analysis which is not available with a temporal approach, and also makes it possible to have a resolution Frequency sufficient to detect harmonics and transpose high harmonics of the signal (in the low band) to improve quality while respecting the structure of the signal.
  • the step of generating an oversampled and extended excitation signal is performed according to the following equation:
  • this function includes a resampling of the excitation signal by adding samples to the spectrum of this signal.
  • the original spectrum is conserved, in order to be able to apply a progressive attenuation response of the high-pass filter in this frequency band and also to not introduce defects. audible during the step of adding the low frequency synthesis to the high frequency synthesis.
  • the method comprises a de-emphasis filtering step of the extended signal at least in the second frequency band.
  • the signal in the second frequency band is brought into a domain coherent with the signal in the first frequency band.
  • the method further comprises a step of generating a noise signal at least in the second frequency band, the extended signal being obtained by combining the extended excitation signal and the noise signal.
  • the combining step is performed by adaptive additive mixing with a level equalization gain between the extended excitation signal and the noise signal.
  • this equalization gain allows the combining step to adapt to the characteristics of the signal to optimize the relative proportion of noise in the mixture.
  • the present invention also aims at a frequency band extension device for an audio frequency signal comprising a decoding or extraction stage, in a first so-called low band frequency band, of an excitation signal and of the transmission coefficients.
  • a linear prediction filter is such that it comprises:
  • a filtering module (510) of said extended signal scaled by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter.
  • This device has the same advantages as the method described above, which it implements.
  • the invention relates to a decoder comprising a device as described. It is directed to a computer program comprising code instructions for implementing the steps of the tape extension method as described, when these instructions are executed by a processor.
  • the invention relates to a storage medium, readable by a processor, integrated or not to the band expansion device, possibly removable, storing a computer program implementing a band extension method as described above.
  • FIG. 1 illustrates a part of an AMR-WB decoder implementing frequency band extension steps of the state of the art and as previously described;
  • FIG. 2 illustrates a decoder of the interoperable type G.718-LD at 16 kHz according to the state of the art and as described previously;
  • FIG. 3 illustrates an interoperable decoder with the AMR-WB coding and integrating a band extension device according to one embodiment of the invention
  • FIG. 4 illustrates in flowchart form the main steps of a band extension method according to one embodiment of the invention
  • FIG. 5 illustrates a first embodiment in the frequency domain of a band extension device according to the invention
  • FIG. 6 illustrates an example of frequency response of a bandpass filter used in a particular embodiment of the invention
  • FIG. 7 illustrates a second embodiment in the time domain of a band extension device according to the invention.
  • FIG. 8 illustrates a hardware embodiment of a band extension device according to the invention.
  • FIG. 3 illustrates an exemplary decoder, compatible with the AMR-WB / G.722.2 standard, in which there is a postprocessing similar to that introduced in G.718 and described with reference to FIG. 2 and an improved band extension according to the extension method of the invention, implemented by the band extension device illustrated by block 309.
  • the CELP decoding (BF for low frequencies) always operates at the internal frequency of 12.8 kHz, as in AMR-WB and G.718, and the band extension (HF for high frequencies) being the subject of the invention operates at the frequency of 16 kHz
  • the synthesis BF and HF are combined (block 312) at the frequency fs after adequate resampling (block 306 and internal processing block 311).
  • the combination of the low and high bands can be done at 16 kHz, after resampling the low band of 12.8 to 16 kHz, before resampling the extended signal at the frequency fs.
  • the decoding according to FIG. 3 depends on the mode (or bit rate) AMR-WB associated with the current frame received.
  • the decoding of the low band CELP part comprises the following steps:
  • the post-treatments applied to the excitation can be modified (for example, the phase dispersion can be improved) or these post
  • the treatments may be extended (for example, interharmonic noise reduction may be implemented) without affecting the nature of the band extension method of the invention.
  • the decoding of the low band described above assumes a current frame called "active" with a rate between 6.6 and 23.85 kbit / s.
  • active a current frame
  • some frames can be coded as "inactive” and in this case you can either transmit a silence descriptor (on 35 bits) or not transmit anything.
  • SID frame describes several parameters: ISF parameters averaged over 8 frames, average energy over 8 frames, dithering flag for the non-stationary noise reconstruction.
  • the decoder makes it possible to extend the decoded low band (50-6400 Hz while taking into account the 50 Hz high-pass filtering at the decoder, 0-6400 Hz in the decoder. the general case) to an extended band whose width varies, ranging from approximately 50-6900 Hz to 50-7700 Hz depending on the mode implemented in the current frame.
  • the extension of the excitation is carried out in the frequency domain in a band of 5000 to 8000 Hz, to allow bandpass filtering of width 6000 to 6900 or 7700 Hz.
  • the gain correction information HF (0.8 kbit / s) transmitted at 23.85 kbit / s is here ignored.
  • FIG. 3 no specific block at 23.85 kbit / s is used.
  • the high band decoding part is produced in the block 309 representing the band extension device according to the invention and which is detailed in FIG. 5 in a first embodiment and in FIG. 7 in a second embodiment.
  • This device comprises at least one module for obtaining an extended signal in at least one second frequency band greater than the first frequency band from an oversampled excitation signal and extended in at least a second band.
  • of frequency U H Bi (k)
  • a delay (block 310) is introduced in the first embodiment to synchronize the outputs of the blocks 306 and 307 and the high band synthesized at 16 kHz is resampled from 16 kHz to the frequency fs (block output 311).
  • the delay ⁇ 30 samples, which corresponds to the resampling delay of 12.8 to 16 kHz of 15 samples + delay of the low frequency post-processing of 15 samples.
  • the extension method of the invention implemented in block 309 according to the first embodiment introduces preferentially no additional delay with respect to the low band reconstructed at 12.8 kHz; however, in variants of the invention (for example using a time / frequency transformation with overlap), a delay may be introduced.
  • the value of in block 310 will have to be adjusted according to the specific implementation.
  • T is reduced to compensate for the delay introduced by the post-processing of the low frequencies (block 306) if it is used.
  • the low and high bands are then combined (added) in block 312 and the resulting synthesis is post-processed by high-order 50 Hz (type IIR) high-pass filtering whose coefficients depend on the frequency fs (block 313) and output post-processing with optional noise gate application similar to G.718 (block 314).
  • the band extension device according to the invention illustrated by block 309 according to the embodiment of the decoder of FIG. 3, implements a band extension method described now with reference to FIG. 4.
  • This extension device may also be independent of the decoder and may implement the method described in FIG. 4 to perform a band extension of an existing audio signal stored or transmitted to the device, with an analysis of the audio signal to extract it an excitation and an LPC filter.
  • This device receives as input an excitation signal in a first so-called low-band frequency band u (n) in the case of an implementation in the time domain or U (k) in the case of an implementation. in the frequency domain for which a time-frequency transform step is then applied.
  • this received excitation signal is a decoded signal.
  • the low band excitation signal is extracted by analysis of the audio signal.
  • the low band audio signal is resampled before the excitation extraction step, so that the excitation extracted from the audio signal by linear prediction estimated from the low band signal (or parameters LPC associated with the low band) is already resampled.
  • An exemplary embodiment in this case consists in taking a sampled low band signal at 12.8 kHz, which has a low-band LPC filter describing the short-term spectral envelope for the current frame, oversampling it at 16 kHz, and filter it by an LPC prediction filter obtained by extrapolating the LPC filter.
  • Another embodiment is to take a low band signal sampled at 12.8 kHz which is not available LPC model, the oversampler at 16 kHz, perform an LPC analysis on this signal at 16 kHz, and filter this signal by a LPC prediction filter obtained by this analysis.
  • a step E401 for generating an extended oversampled excitation signal (e xt (n) or U HB1 (k)) in a second frequency band greater than the first frequency band is performed.
  • This generation step may comprise both a resampling step and an extension step or simply an extension step depending on the excitation signal obtained at the input.
  • This step is detailed later in the embodiments described with reference to FIGS. 5 and 7.
  • This extended oversampled excitation signal is used to obtain an extended signal (U H B2 (k)) in a second frequency band.
  • This extended signal then has a signal model adapted to certain types of signals thanks to the characteristics of the extended excitation signal.
  • This extended signal can be obtained after combining the oversampled and extended excitation signal with another signal, for example a noise signal.
  • a step E402 for generating a noise signal (u HB (n) or U HB (k)) at least in the second frequency band is performed.
  • the second frequency band is for example a high frequency band ranging from 6000 to 8000 Hz.
  • this noise can be generated pseudo-randomly by a linear congruential generator.
  • this noise generation can be replaced by other methods, for example a signal of constant amplitude (of arbitrary value such as 1) could be defined and random signs applied to each frequency line. generated.
  • the extended excitation signal is then combined with the noise signal in step E403 to obtain the extended signal which may also be called a combined signal (u HB1 (n) or U HB2 (k)) in the frequency band range corresponding to the entire frequency band including the first and the second frequency band.
  • a combined signal u HB1 (n) or U HB2 (k)
  • the combination of these two types of signals makes it possible to obtain a combined signal with characteristics more adapted to certain types of signals such as musical signals.
  • the decoded or estimated excitation signal in the low band in some cases has harmonics closer to the musical signals than the noise signal alone.
  • Low-frequency harmonics if they exist, can thus be transposed into high frequency so that their mixing with noise makes it possible to ensure a certain level of harmonicity or relative level of noise or spectral flatness ("spectral flatness"). in English) in the reconstructed high band.
  • the band extension according to the method improves the quality for this type of signals compared to AMR-WB.
  • the combined (or extended) signal is then filtered at E404 by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter (((z)) decoded or obtained by analysis and extraction from the low band signal or an oversampled version of it.
  • the band extension according to the method is therefore achieved by first extending an excitation signal and then applying a linear prediction synthesis filtering step (LPC); this approach exploits the fact that the LPC decoded excitation in the low band is a signal whose spectrum is relatively flat, which avoids additional processing of whitening of the decoded signal in the band extension.
  • the coefficients of this filter can for example be obtained from the decoded parameters of the linear band prediction filter (LPC).
  • the LPC filter used in the high sampled 16 kHz band is of the form ⁇ l A ⁇ zl ⁇ ), where 1 / ⁇ (z) is the low band decoded filter, and ⁇ is a weighting factor, the frequency response of the IIA filter (zl ⁇ ) corresponds to a spread of the frequency response of the decoded low band filter.
  • the filter 1 / A (z) can be extended to a higher order (as to 6.6 kbit / s in the block 111) to avoid such spreading.
  • additional steps of adaptive bandpass filtering at E405 and / or scaling at E406 and E407 can be performed to improve the quality of the extension signal according to the bit rate. decoding and on the other hand to ensure to keep the same energy ratio between a subframe and a combined signal frame as in the low frequency band.
  • the band extension device is described now with reference to FIG. 5. This device implements the band extension method described above with reference to FIG. 4.
  • a low band excitation signal decoded or estimated by analysis is received (u (n)).
  • the band extension uses the decoded excitation at 12.8 kHz (exc2 or u (n)) at the output of block 302.
  • the generation of the oversampled and extended excitation is carried out in a frequency band ranging from 5 to 8 kHz including a second frequency band (6.4-8kHz) greater than the first band of frequency (0-6.4 kHz).
  • the generation of the extended excitation signal is effected at least on the second frequency band but also on a part of the first frequency band.
  • this signal is transformed to obtain an excitation signal spectrum U (k) by the time-frequency transformation module 500.
  • the DCT-IV transformation is implemented by FFT according to the "Evolved ZXT (EDCT)" algorithm described in the article by D. M. Zhang, HT. Li, A Low Complexity Transform - Evolved DCT, IEEE 14th International Conference on Computational Science and Engineering (CSE), Aug. 2011, pp. 144-149, and implemented in ITU-T G.718 Annex B and G.729.1 Annex E.
  • EDCT Evolved ZXT
  • the DCT-IV transformation may be replaced by other short-term time-frequency transformations of the same length and in the field of excitation, such as an FFT (for Fast Fourier Transform "in English) or DCT-II (Discrete Cosine Transform - Type II).
  • FFT Fast Fourier Transform
  • DCT-II Discrete Cosine Transform - Type II
  • MDCT for "Modified Discrete Cosine Tranform"
  • This approach preserves the original spectrum in this band and avoids introducing distortions in the 5000-6000 Hz band during the addition of HF synthesis with BF synthesis - particularly the signal phase (implicitly represented in the DCT-IV domain) in this band is preserved.
  • the 6000-8000 Hz band of U HB1 (k) is here defined by copying the 4000-6000 Hz band of U (k) since the value of start_band is preferably fixed at 160.
  • the value of start_band can be made adaptive around the value of 160, without changing the nature of the invention.
  • the details of the adaptation of the value start_band are not described here because they go beyond the scope of the invention without changing the scope.
  • the noise in the 6000-8000 Hz band
  • the noise is generated pseudo-randomly with a 16-bit linear congruent generator
  • the combination block 503 can be realized in different ways. In a privileged way, we consider an adaptive additive mix of the form:
  • G HBN is a normalization factor for equalizing the energy level between the two signals
  • the coefficient (between 0 and 1) is adjusted according to parameters estimated from the decoded low band and the coefficient ⁇ (between 0 and 1) depends on a.
  • the energy of the noise is calculated in three bands: 2000-4000 Hz, 4000-6000 Hz and 6000-8000 Hz, with
  • N ( ⁇ , ⁇ 2 ) is the set of indices k for which the index coefficient est is classified as being associated with noise. This set can be obtained for example by detecting the local peaks in U and in whereas these lines are not associated with noise, ie (by applying the negation of the previous condition):
  • N (a, b) ⁇ a ⁇ k ⁇ b ⁇ U + 1)
  • the calculation of a may be replaced by other methods.
  • the linear regression could for example be estimated in a supervised manner by estimating the factor a by giving itself the original high band in a learning base. Note that the calculation method does not limit the nature of the invention.
  • the factors ⁇ and a may be adapted to take account of the fact that noise injected into a given band of the signal is generally perceived as stronger than a harmonic signal at the same energy in the same band.
  • the block 503 realizes the equivalent of the block 101 of FIG. 1 to normalize the white noise as a function of an excitation which is on the other hand here in the frequency domain, already extended at the rate of 16 kHz; in addition, the mix is limited to the band 6000-8000 Hz.
  • the block 504 optionally carries out a dual operation of application of bandpass filter frequency response and deemphasis filtering (or deemphasis) in the frequency domain.
  • the deemphasis filtering may be performed in the time domain, after block 505 or even before block 500; however, in this case, bandpass filtering performed in block 504 may leave some low frequency components of very low levels which are amplified by de-emphasis, which may slightly discern the decoded low band. For this reason, it is preferred here to perform the deemphasis in the frequency domain.
  • G deem ⁇ (k) is the frequency response of the filter l / (l - 0.68z _1 ) over a restricted discrete frequency band. Taking into account the discrete (odd) frequencies of the DCT-IV, we define here G deem ⁇ (k) as:
  • the definition of 6 k can be adjusted (for example for even frequencies).
  • the HF synthesis is not de-emphasized.
  • the high frequency signal is on the contrary de-emphasized so as to bring it back to a domain coherent with the low frequency signal (0-6.4 kHz) coming out of block 305. This is important for the estimation and the subsequent adjustment of the energy of the HF synthesis.
  • the de-emphasis can be performed in an equivalent way in the time domain after inverse DCT.
  • Such an embodiment is implemented in Figure 7 described below.
  • band-pass filtering is applied with two separate parts: one fixed high-pass, the other adaptive low-pass (flow-rate function).
  • the 3 dB cutoff frequencies are 6000 Hz for the low part and for the high part approximately 6900, 7300, 7600 Hz at 6.6, 8.86 and at rates greater than 8.85 kbit / s (respectively).
  • the partial low-pass filter response in the frequency domain is calculated as follows:
  • G hp (k) may be modified while keeping a gradual attenuation.
  • the variable bandwidth low-pass filtering, G lp (k) may be adjusted with different values or frequency support, without changing the principle of this filtering step.
  • the bandpass filtering example illustrated in FIG. 6 can be adapted by defining a single filtering step combining the high-pass and low-pass filterings.
  • the bandpass filtering may be performed equivalently in the time domain (as in block 112 of FIG. 1) with different filter coefficients according to the bit rate, after an inverse DCT step.
  • Such an embodiment is implemented in Figure 7 described below.
  • it is advantageous to carry out this step directly in the frequency domain because the filtering is carried out in the field of LPC excitation and therefore the problems of circular convolution and edge effects are very limited in this field. .
  • the inverse transform block 505 performs an inverse DCT on 320 samples to find the high frequency excitation sampled at 16 kHz. Its implementation is identical to block 500, because the DCT-IV is orthonormed, except that the length of the transform is 320 instead of 256, and we obtain:
  • This excitation sampled at 16 kHz is then optionally scaled by gains defined by subframe of 80 samples (block 507).
  • a gain g H Bi (m) per subframe is first calculated (block 506) by energy ratios of the subframes such that in each subframe the frame common:
  • Block 507 scales the combined (or extended) signal (step E406 of FIG. 4) according to the following equation:
  • the embodiment of the block 506 differs from that of the block 101 of Figure 1, because the energy at the current frame is taken into account in addition to that of the subframe. This makes it possible to have the ratio of the energy of each sub-frame with respect to the energy of the frame. Energy ratios (or relative energies) are compared rather than the absolute energies between low band and high band.
  • this scaling step makes it possible to keep in the high band the energy ratio between the subframe and the frame in the same way as in the low band.
  • block 509 then scales the signal (step E407 of FIG. 4) according to the following equation:
  • the gain g HB2 (m) is obtained from the block 508 by executing the blocks 103, 104 and 105 of the AMR-WB coding (the input of the block 103 being the decoded excitation in the low band, u (n)) .
  • Blocks 508 and 509 are useful for adjusting the level of the LPC synthesis filter (block 510), here depending on the tilt of the signal. Other methods of calculating the gain g HB2 (m) are possible without changing the nature of the invention.
  • this filtering can be done in the same way as described for the block 111 of FIG. 1 of the AMR-WB decoder, however the order of the filter goes to 20 at the rate of 6.6, which does not change. not significantly the quality of the synthesized signal.
  • the coding of the low band (0-6.4 kHz) may be replaced by a CELP coder other than that used in AMR-WB, for example the CELP coder in G.718 to 8. kbit / s.
  • a CELP coder other than that used in AMR-WB, for example the CELP coder in G.718 to 8. kbit / s.
  • other encoders in wide band or operating at frequencies higher than 16 kHz in which the coding of the low band operates at an internal frequency at 12.8 kHz could be used.
  • the invention can be obviously adapted to other sampling frequencies than 12.8 kHz, when a low frequency encoder operates at a sampling frequency lower than that of the original or reconstructed signal.
  • the low band decoding does not use a linear prediction, it does not have an excitation signal to be extended, in this case it will be possible to carry out an LPC analysis of the reconstructed signal in the current frame and calculate an LPC excitation. so as to be able to apply the invention.
  • the excitation (u (n)) is resampled, for example by linear interpolation or cubic "spline", from 12.8 to 16 kHz before transformation (for example DCT-IV) of length 320.
  • This variant has the defect of being more complex, because the transform (DCT-IV) of the excitation is then calculated over a greater length and the resampling is not carried out in the field of the transform.
  • all the calculations necessary for the estimation of the gains ⁇ G HBN , g HB1 (m), g HB2 (m), g HBN , ...) can be carried out in a field logarithmic.
  • the combination block 704 can be realized in different ways.
  • a privileged way we consider an adaptive additive mix by subframe of the form:
  • the block 704 realizes the equivalent of the block 101 of FIG. 1.
  • the calculation of the factor obliges to calculate the transform of the decoded excitation signal (or the decoded signal itself according to the domain of FIG. calculation of the relative level of noise or flatness spectral flatness "spectral flatness" in English) in low band if this calculation rests on the spectral flatness; in variants, including the use of a linear regression described above, such a transform is not necessary.
  • An exemplary embodiment of such type FIR adaptive bandpass filtering is given in the tables below defining the impulse response of the FIR filter according to the bit rate.
  • the scaling step (E407 in FIG. 4) is performed by blocks 508 and 509 identical to FIG.
  • the filtering step (E404 of FIG. 4) is performed by the filtering module (block 510) identical to that described with reference to FIG. 5.
  • the low band excitation u (n) and the LPC 1 / ⁇ filter (z) will be estimated per frame, by LPC analysis of a low band signal whose band must be extended.
  • the low band excitation signal is then extracted by analyzing the audio signal.
  • the low band audio signal is resampled before the excitation extraction step, so that the excitation extracted from the audio signal (by linear prediction) is already resolved. sampled.
  • the invention illustrated in FIG. 5, or alternatively in FIG. 7, applies in this case to a low band which is not decoded but analyzed.
  • FIG. 8 represents an exemplary hardware embodiment of a band extension device 800 according to the invention. This may be an integral part of an audio-frequency signal decoder or equipment receiving decoded or non-decoded audio signals.
  • This type of device comprises a PROC processor cooperating with a memory block
  • BM having a memory storage and / or working MEM.
  • Such a device comprises an input module E able to receive a decoded or extracted excitation audio signal in a first so-called low band frequency band (u (n) or U (k)) and the parameters of a filter of linear prediction synthesis (A (z)). It comprises an output module S adapted to transmit the synthesized high frequency signal (HF_syn) for example to a delay application module such as block 310 of FIG. 3 or to a resampling module such as module 311 .
  • a delay application module such as block 310 of FIG. 3
  • a resampling module such as module 311 .
  • the memory block may advantageously comprise a computer program comprising code instructions for implementing the steps of the band extension method in the sense of the invention, when these instructions are executed by the processor PROC, and in particular the steps for obtaining an extended signal in at least a second frequency band greater than the first frequency band from an oversampled and extended excitation signal in at least a second frequency band, scaling of the signal extended by a subframe defined gain based on a frame and subframe energy ratio and filtering said extended signal scaled by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter.
  • the description of FIG. 4 repeats the steps of an algorithm of such a computer program.
  • the computer program can also be stored on a memory medium readable by a reader of the device or downloadable in the memory space thereof.
  • the memory MEM generally records all the data necessary for the implementation of the method.
  • the device thus described may also comprise the low band decoding functions and other processing functions described for example in FIG. 3 in addition to the band extension functions according to the invention.

Abstract

The invention relates to a method for extending the frequency band of an audio signal during a decoding or improvement process comprising a step of decoding or extracting, in a first so-called low frequency band, an excitation signal and coefficients of a linear prediction filter. The method comprises the following steps: - obtaining a signal (UHB2(k), E403)) extended in at least a second frequency band higher than the first frequency band from an oversampled excitation signal extended in at least a second frequency band (UHB1(k), E401);- scaling (E406) the extended signal by means of a gain defined by subframe on the basis of an energy ratio of a frame and of a subframe; - filtering (E404) said scaled extended signal with a linear prediction filter of which the coefficients are derived from the coefficients of the low frequency band filter. The invention also relates to a frequency band extension device implementing the described method and a decoder comprising such a device.

Description

Extension améliorée de bande de fréquence dans un décodeur de signaux audiofréquences  Improved frequency band extension in an audio-frequency decoder
La présente invention se rapporte au domaine du codage/décodage et du traitement de signaux audiofréquences (comme des signaux de parole, de musique ou autres) pour leur transmission ou leur stockage. The present invention relates to the field of coding / decoding and audio-frequency signal processing (such as speech, music or other signals) for their transmission or storage.
Plus particulièrement, l'invention concerne un procédé et un dispositif d'extension de bande de fréquence dans un décodeur ou un processeur réalisant une amélioration de signal audiofréquence.  More particularly, the invention relates to a method and a device for extending the frequency band in a decoder or a processor performing an audio-frequency signal improvement.
De nombreuses techniques existent pour compresser (avec perte) un signal audiofréquence comme la parole ou la musique.  Many techniques exist to compress (with loss) an audiofrequency signal such as speech or music.
Les méthodes classiques de codage pour les applications conversationnelles sont en général classifiées en codage de forme d'onde (MIC pour "Modulation par Impulsion et codage", MICDA pour "Modulation par Impulsion et Codage Différentiel Adaptatif, codage par transformée...), codage paramétrique (LPC pour "Linear Prédictive Coding" en anglais, codage sinusoïdal...) et codage hybride paramétrique avec une quantification des paramètres par "analyse par synthèse" dont le codage CELP (pour "Code Excited Linear Prédiction" en anglais) est l'exemple le plus connu.  Conventional methods of coding for conversational applications are generally classified in waveform coding (MIC for "pulse modulation and coding", ADPCM for "Pulse Modulation and Adaptive Differential Coding, transform coding, etc.), parametric coding (LPC for "Linear Predictive Coding" in English, sinus coding ...) and parametric hybrid coding with a quantification of the parameters by "analysis by synthesis" whose coding CELP (for "Code Excited Linear Prediction" in English) is the best known example.
Pour les applications non conversationnelles, l'état de l'art en codage de signal audio (mono) est constitué par le codage perceptuel par transformée ou en sous-bandes, avec un codage paramétrique des hautes fréquences par réplication de bande.  For non-conversational applications, state of the art audio signal coding (mono) consists of perceptual encoding by transform or subband, with parametric coding of high frequencies by tape replication.
Une revue des méthodes classiques de codage de parole et audio se trouve dans les ouvrages W.B. Kleijn and K.K. Paliwal (Eds.), Speech Coding and Synthesis, Elsevier, 1995 ; A review of conventional speech and audio coding methods can be found in W. B. Kleijn and K. K. Paliwal (Eds.), Speech Coding and Synthesis, Elsevier, 1995;
M. Bosi, R.E. Goldberg, Introduction to Digital Audio Coding and Standards, Springer 2002 ; J. Benesty, M. M. Sondhi, Y. Huang (Eds.), Handbook of Speech Processing, Springer 2008. M. Bosi, R. E. Goldberg, Introduction to Digital Audio Coding and Standards, Springer 2002; J. Benesty, M. Sondhi M., Y. Huang (Eds.), Handbook of Speech Processing, Springer 2008.
On s'intéresse ici plus particulièrement au codée (codeur et décodeur) normalisé 3GPP AMR-WB (pour "Adaptive Multi-Rate Wideband" en anglais) qui fonctionne à une fréquence d'entrée/sortie de 16 kHz et dans lequel le signal est divisé en deux sous-bandes, la bande basse (0-6.4 kHz) qui est échantillonnée à 12.8 kHz et codée par modèle CELP et la bande haute (6.4-7 kHz) qui est reconstruite de façon paramétrique par « extension de bande » (ou BWE pour "Bandwidth Extension" en anglais) avec ou sans information supplémentaire selon le mode de la trame courante. On peut noter ici que la limitation de la bande codée du codée AMR-WB à 7kHz est essentiellement liée au fait que la réponse en fréquence en émission des terminaux en bande élargie a été approximée au moment de la normalisation (ETSI/3GPP puis UIT-T) selon le masque fréquentiel défini dans la norme UIT-T P.341 et plus précisément en utilisant un filtre dit « P341 » défini dans la norme UIT-T G.191 qui coupe les fréquences au-dessus de 7 kHz (ce filtre respecte le masque défini dans P.341). Cependant, en théorie, il est bien connu qu'un signal échantillonné à 16 kHz peut avoir une bande audio définie de 0 à 8000 Hz ; le codée AMR-WB introduit donc une limitation de la bande haute en comparaison à la largeur de bande théorique de 8 kHz. Of particular interest here is the 3GPP AMR-WB ("Adaptive Multi-Rate Wideband") codec and decoder, which operates at an input / output frequency of 16 kHz and in which the signal is divided into two sub-bands, the low band (0-6.4 kHz) which is sampled at 12.8 kHz and coded by CELP model and the high band (6.4-7 kHz) which is parametrically reconstructed by "band extension" ( or BWE for "Bandwidth Extension" with or without additional information depending on the mode of the current frame. It can be noted here that the limitation of the coded band of the AMR-WB codec at 7 kHz is essentially related to the fact that the transmission frequency response of the broadband terminals has been approximated at the time of standardization (ETSI / 3GPP then ITU-T T) according to the frequency mask defined in the ITU-T P.341 standard and more precisely by using a so-called "P341" filter defined in the ITU-T G.191 standard which cuts frequencies above 7 kHz (this filter respects the mask defined in P.341). However, in theory, it is well known that a signal sampled at 16 kHz may have a defined audio band of 0 to 8000 Hz; the AMR-WB codec thus introduces a limitation of the high band in comparison with the theoretical bandwidth of 8 kHz.
Le codée de parole 3GPP AMR-WB a été normalisé en 2001 principalement pour les applications de téléphonie en mode circuit (CS) sur GSM (2G) et UMTS (3G). Ce même codée a été aussi normalisé en 2003 à l'UIT-T en tant que recommandation G.722.2 "Wideband coding speech at around 16kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)".  The 3GPP AMR-WB speech codec was standardized in 2001 mainly for circuit-mode (CS) telephony applications on GSM (2G) and UMTS (3G). This same codec was also standardized in 2003 in ITU-T as Recommendation G.722.2 "Wideband coding speech at around 16kbit / s using Adaptive Multi-Rate Wideband (AMR-WB)".
Il comprend neuf débits, appelés modes, de 6.6 à 23.85 kbit/s, et comprend des mécanismes de transmission continue (DTX pour "Discontinuous Transmission") avec détection d'activité vocale (VAD pour "Voice Activity Détection") et génération de bruit de confort (CNG pour "Confort Noise Génération") à partir de trames de description de silence (SID pour "Silence Insertion Descriptor"), ainsi que des mécanismes de correction de trames perdues (FEC pour "Frame Erasure Concealment", parfois appelé PLC pour "Packet Loss Concealment").  It includes nine speeds, called modes, from 6.6 to 23.85 kbit / s, and includes continuous transmission mechanisms (DTX for "Discontinuous Transmission") with voice activity detection (VAD for "Voice Activity Detection") and noise generation of comfort (CNG for "Comfort Noise Generation") from frames of silence description (SID for "Silence Insertion Descriptor"), as well as mechanisms of correction of lost frames (FEC for "Frame Erasure Concealment", sometimes called PLC for "Packet Loss Concealment").
On ne reprend pas ici les détails de l'algorithme de codage et de décodage AMR-WB, une description détaillée de ce codée se trouve dans les spécifications 3GPP (TS 26.190, 26.191, 26.192, 26.193, 26.194, 26.204) et UIT-T-G.722.2 (et les Annexes et Appendice correspondantes) ainsi que dans l'article de B. Bessette et al. intitulé « The adaptive multirate wideband speech codée (AMR-WB) », IEEE Transactions on Speech and Audio Processing, vol. 10, no. 8, 2002, pp. 620-636 et les codes sources des standards 3GPP et UIT-T associés.  The details of the AMR-WB coding and decoding algorithm are not repeated here, a detailed description of this codec is found in the 3GPP specifications (TS 26.190, 26.191, 26.192, 26.193, 26.194, 26.204) and ITU-TG .722.2 (and the corresponding Appendices and Appendix) and in the article by B. Bessette et al. entitled "The adaptive multirate broadband speech coded (AMR-WB)", IEEE Transactions on Speech and Audio Processing, vol. 10, no. 8, 2002, pp. 620-636 and associated 3GPP and ITU-T standard source codes.
Le principe de l'extension de bande dans le codée AMR-WB est assez rudimentaire. En effet, la bande haute (6.4-7 kHz) est générée en mettant en forme un bruit blanc par le biais d'une enveloppe temporelle (appliquée sous la forme de gains par sous-trame) et fréquentielle (par l'application d'un filtre de synthèse de prédiction linéaire ou LPC pour "Linear Prédictive Coding"). Cette technique d'extension de bande est illustrée à la figure 1.  The principle of band extension in the AMR-WB codec is rather rudimentary. Indeed, the high band (6.4-7 kHz) is generated by formatting a white noise through a temporal envelope (applied in the form of gains per subframe) and frequency (by the application of a linear prediction synthesis filter or LPC for "Linear Predictive Coding"). This band extension technique is illustrated in Figure 1.
Un bruit blanc, uHBl (n) , n = 0, · · · , 79 , est généré à 16 kHz par sous-trame de 5 ms par générateur congruentiel linéaire (bloc 100). Ce bruit uHBl (n) est mis en forme dans le temps par application de gains par sous-trame ; cette opération est décomposée en deux étapes de traitement (blocs 102, 106 ou 109) : A white noise, u HB1 (n), n = 0, · · ·, 79, is generated at 16 kHz per 5 ms subframe per linear congruent generator (block 100). This noise u HB1 (n) is shaped in time by applying gains per subframe; this operation is broken down into two processing steps (blocks 102, 106 or 109):
· Un premier facteur est calculé (bloc 101) pour mettre le bruit blanc uHBl (n) (bloc· A first factor is calculated (block 101) to set the white noise u HB1 (n) (block
102) à un niveau semblable à celui de l'excitation, u(n) , « = (), · · - , 63 , décodée à102) at a level similar to that of excitation, u (n), "= (), · · -, 63, decoded at
12.8 kHz dans la bande basse : 12.8 kHz in the low band:
63  63
2  2
∑ (l) On peut noter ici que la normalisation des énergies se fait en comparant des blocs de taille différente (64 pour u(n) et 80 pour uHBl (n) ), sans compensation des différences de fréquences d'échantillonnage (12.8 ou 16 kHz). Σ (l) It can be noted here that the normalization of the energies is done by comparing blocks of different size (64 for u (n) and 80 for u HBl (n)), without compensation of the differences of sampling frequencies (12.8 or 16 kHz) .
• L'excitation dans la bande haute est ensuite obtenue (bloc 106 ou 109) sous la forme :  • The excitation in the high band is then obtained (block 106 or 109) in the form:
uHB (n) = gHBuHB2(n) u HB (n) = g HB u HB2 (n)
où le gain gHB est obtenu différemment selon le débit. Si le débit de la trame actuelle est <23.85 kbit/s, le gain gHB est estimé « en aveugle » (c'est-à-dire sans information supplémentaire); dans ce cas, le bloc 103 filtre le signal décodé en bande basse par un filtre passe-haut ayant une fréquence de coupure à 400 Hz pour obtenir un signal shp (n) , « = (), · · - , 63 - ce filtre passe-haut élimine l'influence des très basses fréquences qui peuvent biaiser l'estimation faite dans le bloc 104 - puis on calcule le « tilt » (indicateur de pente spectrale) noté etiU du signal shp (n) par autocorrélation normalisée (bloc 104): where the gain g HB is obtained differently depending on the flow rate. If the rate of the current frame is <23.85 kbit / s, the gain g HB is estimated to be "blind" (ie without additional information); in this case, the block 103 filters the low-band decoded signal by a high-pass filter having a cut-off frequency at 400 Hz to obtain a signal s hp (n), "= (), · -, - 63 - high-pass filter eliminates the influence of the very low frequencies that can bias the estimate made in block 104 - then the "tilt" (signal of spectral slope) noted e tiU of the signal s hp (n) is calculated by standard autocorrelation (block 104):
63 e =—  63 e = -
ctilt 63 et enfin on calcule gHB sous la forme : ctilt 63 and finally we calculate g HB in the form:
SHB = WSPSSP + (1 - WSP)SBG SHB = W SPSSP + ( 1 - W SP) SBG
où gsp = l - etilt est le gain appliqué dans les trames actives de parole (SP pour speech), gBG = l .25gsp est le gain appliqué dans les trames inactives de parole associées à un bruit de fond (BG pour Background) et wsp est une fonction de pondération qui dépend de la détection d'activité vocale (VAD). On comprend que l'estimation du tilt { etilt ) permet d'adapter le niveau de la bande haute en fonction de la nature spectrale du signal ; cette estimation est particulièrement importante quand la pente spectrale du signal décodé CELP est telle que l'énergie moyenne décroît quand la fréquence augmente (cas d'un signal voisé où etiU est proche de 1, donc gsp = l - etilt est ainsi réduit). A noter aussi que le facteur gHB dans le décodage AMR-WB est borné pour prendre des valeurs dans l'intervalle [0.1, 1.0]. where g sp = l - e tilt is the gain applied in active speech frames (SP for speech), g BG = l .25g sp is the gain applied in inactive speech frames associated with background noise (BG for Background) and w sp is a weighting function that depends on Voice Activity Detection (VAD). It is understood that the estimation of the tilt (e tilt ) makes it possible to adapt the level of the high band according to the spectral nature of the signal; this estimate is particularly important when the spectral slope of the decoded signal CELP is such that the average energy decreases when the frequency increases (case of a voiced signal where e tiU is close to 1, so g sp = l - e tilt is thus reduced). Note also that the factor g HB in the decoding AMR-WB is bounded to take values in the interval [0.1, 1.0].
A 23.85 kbit/s, une information de correction est transmise par le codeur AMR-WB et décodée (blocs 107, 108) afin d'affiner le gain estimé par sous-trame (4 bits toutes les 5ms, soit 0.8 kbit/s). L'excitation artificielle uHB (n) est ensuite filtrée (bloc 111) par un filtre de synthèse LPC (bloc 111) de fonction de transfert 1/ AHB (z) et fonctionnant à la fréquence d'échantillonnage de 16 kHz. La réalisation de ce filtre dépend du débit de la trame courante:At 23.85 kbit / s, correction information is transmitted by the encoder AMR-WB and decoded (blocks 107, 108) in order to refine the estimated gain per subframe (4 bits every 5ms, ie 0.8 kbit / s) . The artificial excitation u HB (n) is then filtered (block 111) by a transfer function function LPC (block 111) synthesis filter 1 / A HB (z) and operating at the sampling frequency of 16 kHz. The realization of this filter depends on the rate of the current frame:
• A 6.6 kbit/s, le filtre \l AHB (z) est obtenu en pondérant par un facteur ^=0.9 un filtre LPC d'ordre 20, I l Àext (z) qui « extrapole » le filtre LPC d'ordre 16, 1/ À(z) , décodé dans la bande basse (à 12.8 kHz) - les détails de l'extrapolation dans le domaine des paramètres ISF (pour "Imittance Spectral Frequency" en anglais) sont décrits dans le norme G.722.2 à la section 6.3.2.1; dans ce cas, • At 6.6 kbit / s, the filter \ l A HB (z) is obtained by weighting by a factor ^ = 0.9 an LPC filter of order 20, I l À ext (z) which "extrapolates" the LPC filter from order 16, 1 / A (z), decoded in the low band (at 12.8 kHz) - details of the extrapolation in the domain of the ISF parameters (for "Imittance Spectral Frequency") are described in the standard G. 722.2 in section 6.3.2.1; in that case,
\I AHB (z) = \ I Aext (z l Y) \ IA HB (z) = \ IA ext (zl Y)
· Aux débits > 6.6 kbit/s, le filtre 1 / AHB (z) est d'ordre 16 et correspond simplement à :· At rates> 6.6 kbit / s, the filter 1 / A HB (z) is of order 16 and simply corresponds to:
où ^ =0.6. A noter que dans ce cas le filtre II A(z l f) est utilisé à 16 kHz, ce qui résulte en un étalement (par homothétie) de la réponse en fréquence de ce filtre de [0, 6.4 kHz] à [0, 8 kHz].  where ^ = 0.6. Note that in this case the filter II A (zlf) is used at 16 kHz, which results in a spread (by homothety) of the frequency response of this filter from [6.4 kHz] to [0.8 kHz] ].
Le résultat, sHB (n) , est enfin traité par un filtre passe-bande (bloc 112) de type FIR ("FiniteThe result, s HB (n), is finally processed by a band-pass filter (block 112) of type FIR ("Finite
Impulse Response"), pour ne garder que la bande 6 - 7 kHz ; à 23.85 kbit/s, un filtre passe- bas également de type FIR (bloc 113) se rajoute au traitement pour atténuer encore plus les fréquences supérieures à 7 kHz. La synthèse en hautes fréquences (HF) est finalement additionnée (bloc 130) à la synthèse en basses fréquences (BF) obtenue avec les blocs 120 à 123 et ré-échantillonnée à 16 kHz (bloc 123). Ainsi même si la bande haute s'étend en théorie de 6.4 à 7 kHz dans le codée AMR-WB, la synthèse HF est plutôt comprise dans la bande 6-7 kHz avant addition avec la synthèse BF. Impulse Response "), to keep only the band 6 - 7 kHz, at 23.85 kbit / s, a low-pass filter also FIR type (block 113) is added to the treatment to further attenuate frequencies above 7 kHz. The synthesis at high frequencies (HF) is finally added (block 130) to the low frequency synthesis (BF) obtained with the blocks 120 to 123 and resampled at 16 kHz (block 123). theoretically extends from 6.4 to 7 kHz in the AMR-WB coding, the HF synthesis is rather in the band 6-7 kHz before addition with the synthesis BF.
On peut identifier plusieurs inconvénients à la technique d'extension de bande du codée AMR-WB :  Several disadvantages can be identified with the AMR-WB coding extension technique:
• Le signal dans la bande haute est un bruit blanc mis en forme (par gains temporels par sous-trame, par filtrage par 1 / AHB (z) et filtrage passe-bande), ce qui n'est pas un bon modèle général du signal dans la bande 6.4-7 kHz. Il existe par exemple des signaux de musique très harmoniques pour lesquels la bande 6.4-7 kHz contient des composantes sinusoïdales (ou tones) et aucun bruit (ou peu de bruit), pour ces signaux l'extension de bande du codée AMR-WB dégrade fortement la qualité. • The signal in the high band is white noise formatted (by temporal gains per subframe, filtering by 1 / A HB (z) and bandpass filtering), which is not a good general model signal in the band 6.4-7 kHz. For example, there are very harmonic music signals for which the 6.4-7 kHz band contains sinusoidal components (or tones) and no noise (or little noise), for these signals the band extension of the AMR-WB coding degrades. strongly the quality.
• Le filtre passe-bas à 7 kHz (bloc 113) introduit un décalage de près de 1 ms entre les bandes basses et hautes, ce qui peut potentiellement dégrader la qualité de certains signaux en désynchronisant légèrement les deux bandes à 23.85 kbit/s - cette désynchronisation peut également poser problème lors d'une commutation de débit de 23.85 kbit/s à d'autres modes. • The 7 kHz low-pass filter (block 113) introduces an offset of nearly 1 ms between the low and high bands, which can potentially degrade the quality of some signals by slightly desynchronizing the two bands at 23.85 kbit / s - this Desynchronization can also be a problem when switching from 23.85 kbit / s to other modes.
• L'estimation de gains par sous-trame (bloc 101, 103 à 105) n'est pas optimale. Pour partie, elle se base sur une égalisation de l'énergie « absolue » par sous-trame (bloc 101) entre des signaux à des fréquences différentes : l'excitation artificielle à 16 kHz • The estimate of gains per subframe (block 101, 103 to 105) is not optimal. In part, it is based on an equalization of the "absolute" energy per sub-frame (block 101) between signals at different frequencies: the artificial excitation at 16 kHz
(bruit blanc) et un signal à 12.8 kHz (excitation ACELP décodée). On peut noter en particulier que cette approche induit implicitement une atténuation de l'excitation bande haute (par un ratio 12.8/16=0.8) ; en fait, on notera également qu'aucune désaccentuation (ou déemphase) n'est effectuée sur la bande haute dans le codée AMR-WB, ce qui induit implicitement une amplification relative proche de 0.6 (qui correspond à la valeur de la réponse en fréquence de l / (l - 0.68z_1 ) à 6400 Hz).(white noise) and a signal at 12.8 kHz (ACELP decoded excitation). It can be noted in particular that this approach implicitly induces an attenuation of the high band excitation (by a ratio 12.8 / 16 = 0.8); in fact, it will also be noted that no deemphasis is performed on the high band in the AMR-WB coding, which implicitly induces a relative amplification close to 0.6 (which corresponds to the value of the frequency response s / (l - 0.68z _1) to 6400 Hz).
En fait, les facteurs de 1/0.8 et de 0.6 se compensent approximativement. In fact, the factors of 1 / 0.8 and 0.6 compensate each other approximately.
• Sur la parole, les tests de caractérisation du codée 3GPP AMR-WB documentés dans le rapport 3GPP TR 26.976 ont montré que le mode à 23.85 kbit/s a une qualité moins bonne qu'à 23.05 kbit/s, sa qualité est en fait similaire à celle du mode à 15.85 kbit/s. Ceci montre en particulier que le niveau du signal HF artificiel doit être contrôlé de façon très prudente, car la qualité est dégradée à 23.85 kbit/s alors que les 4 bits par trame sont sensés permettre de mieux approcher l'énergie des hautes fréquences originales.  • On speech, the 3GPP AMR-WB coding characterization tests documented in the 3GPP TR 26.976 report showed that the 23.85 kbit / sa mode is not as good as 23.05 kbit / s, its quality is in fact similar to that of the 15.85 kbit / s mode. This shows in particular that the level of artificial RF signal must be controlled very carefully, because the quality is degraded to 23.85 kbit / s while the 4 bits per frame are supposed to better approach the energy of the original high frequencies.
« La limitation de la bande codée à 7 kHz résulte de l'application d'un modèle strict de la réponse en émission des terminaux acoustiques (filtre P.341 dans la norme UIT-T G.191). Or, pour une fréquence d'échantillonnage de 16 kHz, les fréquences dans la bande 7-8 kHz restent importantes, en particulier pour les signaux de musique, pour assurer un bon niveau de qualité.  "The limitation of the 7 kHz coded band results from the application of a strict model of the emission response of acoustic terminals (filter P.341 in ITU-T G.191). However, for a sampling frequency of 16 kHz, frequencies in the band 7-8 kHz remain important, especially for music signals, to ensure a good level of quality.
L'algorithme de décodage AMR-WB a été amélioré en partie avec le développement du codée scalable UIT-T G.718 qui a été normalisé en 2008. The AMR-WB decoding algorithm has been improved in part with the development of the ITU-T G.718 scalable codec which was standardized in 2008.
La norme UIT-T G.718 comprend un mode dit interopérable, pour lequel le codage cœur est compatible avec le codage G.722.2 (AMR-WB) à 12.65 kbit/s ; de plus, le décodeur G.718 a la particularité de pouvoir décoder un train binaire AMR-WB/G.722.2 à tous les débits possibles du codée AMR-WB (de 6.6 à 23.85 kbit/s).  ITU-T G.718 includes an interoperable mode, for which core coding is compatible with 12.65 kbit / s G.722.2 (AMR-WB) coding; in addition, the G.718 decoder has the particularity of being able to decode a bit stream AMR-WB / G.722.2 at all possible bit rates of the AMR-WB codec (from 6.6 to 23.85 kbit / s).
Le décodeur interopérable G.718 en mode bas délai (« low delay » en anglais) (G.718-LD) est illustré à la figure 2. On liste ci-dessous les améliorations apportées à la fonctionnalité de décodage de train binaire AMR-WB dans le décodeur G.718, avec des références à la figure 1 lorsque nécessaire :  The G.718 interoperable decoder in low delay mode (G.718-LD) is illustrated in FIG. 2. Below are the improvements made to the bit-stream decoding functionality AMR- WB in the G.718 decoder, with references to Figure 1 when necessary:
• L'extension de bande (décrite par exemple dans la clause 7.13.1 de la recommandation G.718, bloc 206) est identique à celle du décodeur AMR-WB, sauf que le filtre passe-bande 6-7 kHz et le filtre de synthèse l/AHB(z) (blocs 111 et 112) sont en ordre inversé. De plus, à 23.85 kbit/s les 4 bits transmis par sous-trames par le codeur AMR-WB ne sont pas utilisés dans le décodeur G.718 interopérable ; la synthèse des hautes fréquences (HF) à 23.85 kbit/s est donc identique à 23.05 kbit/s ce qui évite le problème connu de qualité du décodage AMR-WB à 23.85 kbit/s. A fortiori, le filtre passe-bas à 7 kHz (bloc 113) n'est pas utilisé, et le décodage spécifique du mode à 23.85 kbit/s est omis (blocs 107 à 109). • The band extension (described in clause 7.13.1 of Recommendation G.718, block 206) is identical to that of the AMR-WB decoder, except that the 6-7 kHz band-pass filter and the filter Synthesis 1 / A HB (z) (Blocks 111 and 112) are in reverse order. In addition, at 23.85 kbit / s the 4 bits transmitted by AMR-WB encoder subframes are not used in the interoperable G.718 decoder; the synthesis of high frequencies (HF) at 23.85 kbit / s is therefore identical to 23.05 kbit / s which avoids the known problem of quality of AMR-WB decoding at 23.85 kbit / s. A fortiori, the low-pass filter at 7 kHz (block 113) is not used, and the specific decoding mode 23.85 kbit / s is omitted (blocks 107 to 109).
• Un post-traitement de la synthèse à 16 kHz (voir clause 7.14 de G.718) est mis en œuvre dans G.718 par "noise gâte" dans le bloc 208 (pour « améliorer » la qualité des silences par réduction du niveau), filtrage passe-haut (bloc 209), post-filtre de basses fréquences (dit « bass posfilter») dans le bloc 210 atténuant le bruit interharmonique en basses fréquences et une conversion en entiers 16 bits avec contrôle de saturation (avec contrôle de gain ou AGC) dans le bloc 211.  • A post-processing of the 16 kHz synthesis (see clause 7.14 of G.718) is implemented in G.718 by "noise gâte" in block 208 (to "improve" the quality of the silences by reducing the level ), high-pass filtering (block 209), low-frequency post-filter (so-called "bass posfilter") in block 210 attenuating interharmonic noise at low frequencies, and conversion to 16-bit integers with saturation control (with control of gain or AGC) in block 211.
Cependant l'extension de bande dans les codées AMR-WB et/ou G.718 (mode interopérable) reste encore limitée sur plusieurs aspects. However, the band extension in the AMR-WB and / or G.718 codecs (interoperable mode) is still limited in several respects.
• En particulier, la synthèse de hautes fréquences par bruit blanc mis en forme (par une approche temporelle de type source-filtre LPC) est un modèle très limité du signal dans la bande des fréquences supérieures à 6.4 kHz.  • In particular, the synthesis of high frequencies by shaped white noise (by a temporal approach of source-filter type LPC) is a very limited model of the signal in the frequency band higher than 6.4 kHz.
• Seule la bande 6.4-7 kHz est re-synthétisée de façon artificielle, alors qu'en pratique une bande plus large (jusqu'à 8 kHz) est en théorie possible à la fréquence d'échantillonnage de 16 kHz, ce qui peut potentiellement améliorer la qualité des signaux, s'ils ne sont pas pré-traités par un filtre de type P.341 (50-7000 Hz) tel que définie dans la Software Tool Library {norme G.191) de l'UIT-T.  • Only the 6.4-7 kHz band is artificially re-synthesized, whereas in practice a wider band (up to 8 kHz) is theoretically possible at the sampling frequency of 16 kHz, which can potentially improve signal quality, if not pre-processed by a P.341 (50-7000 Hz) filter as defined in the ITU-T Software Tool Library (G.191 standard).
Il existe donc un besoin pour améliorer l'extension de bande dans un codée de type AMR-WB ou une version interopérable de ce codée ou plus généralement pour améliorer l'extension de bande d'un signal audio. There is therefore a need to improve the band extension in an AMR-WB codec or an interoperable version of this codec or more generally to improve the band extension of an audio signal.
La présente invention vient améliorer la situation.  The present invention improves the situation.
L'invention propose à cet effet, un procédé d'extension de bande de fréquence d'un signal audiofréquence lors d'un processus de décodage ou d'amélioration comportant une étape de décodage ou d'extraction, dans une première bande de fréquence dite bande basse, d'un signal d'excitation et des coefficients d'un filtre de prédiction linéaire. Le procédé est tel qu'il comporte les étapes suivantes:  To this end, the invention proposes a method of extending the frequency band of an audiofrequency signal during a decoding or improvement process comprising a decoding or extraction step, in a so-called first frequency band. low band, an excitation signal and the coefficients of a linear prediction filter. The method is such that it comprises the following steps:
- obtention d'un signal étendu dans au moins une deuxième bande de fréquence supérieure à la première bande de fréquence à partir d'un signal d'excitation suréchantillonné et étendu dans au moins une deuxième bande de fréquence;  obtaining an extended signal in at least a second frequency band greater than the first frequency band from an oversampled excitation signal and extended in at least a second frequency band;
- mise à l'échelle du signal étendu par un gain défini par sous-trame en fonction d'un ratio d'énergie par trame et sous-trame du signal audiofréquence dans la première bande de fréquence; - filtrage dudit signal étendu mis à l'échelle par un filtre de prédiction linéaire dont les coefficients sont dérivés des coefficients du filtre de la bande basse. scaling the extended signal by a gain defined by subframe according to a ratio of energy per frame and subframe of the audiofrequency signal in the first frequency band; filtering said extended signal scaled by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter.
Ainsi, la prise en compte du signal d'excitation (issu du décodage de la bande basse ou d'une extraction du signal en bande basse) permet d'effectuer l'extension de bande avec un modèle de signal plus adapté pour certains types de signaux comme les signaux de musique. Thus, taking into account the excitation signal (resulting from the decoding of the low band or from a low band signal extraction) makes it possible to carry out the band extension with a signal model that is more suitable for certain types of band. signals like music signals.
En effet, le signal d'excitation décodé ou estimé dans la bande basse comporte dans certains cas des harmoniques, qui quand elles existent, peuvent être transposées en haute fréquence de telle sorte que cela permet d'assurer un certain niveau d'harmonicité dans la bande haute reconstruite.  Indeed, the excitation signal decoded or estimated in the low band has in some cases harmonics, which when they exist, can be transposed in high frequency so that it ensures a certain level of harmonicity in the high band reconstructed.
L'extension de bande selon le procédé permet donc d'améliorer la qualité pour ce type de signaux.  The band extension according to the method thus makes it possible to improve the quality for this type of signal.
De plus, l'extension de bande selon le procédé est réalisée en étendant d'abord un signal d'excitation et en appliquant ensuite une étape de filtrage de synthèse ; cette approche exploite le fait que l'excitation décodée dans la bande basse est un signal dont le spectre est relativement plat, ce qui évite les traitements de blanchiment du signal décodé qui peuvent exister dans les méthodes connues d'extension de bande dans le domaine fréquentiel dans l'état de l'art.  In addition, the band extension according to the method is performed by first extending an excitation signal and then applying a synthesis filtering step; this approach exploits the fact that the decoded excitation in the low band is a signal whose spectrum is relatively flat, which avoids the decoded signal whitening treatments that may exist in the known methods of band extension in the frequency domain in the state of the art.
On remarquera que même si l'invention est motivée par l'amélioration de la qualité de l'extension de bande dans le contexte du codage AMR-WB interopérable, les différents modes de réalisation s'appliquent au cas plus général de l'extension de bande d'un signal audio, en particulier dans un dispositif d'amélioration effectuant une analyse du signal audio pour extraire les paramètres nécessaires à l'extension de bande.  It will be noted that even if the invention is motivated by the improvement of the quality of the band extension in the context of the interoperable AMR-WB coding, the different embodiments apply to the more general case of the extension of band of an audio signal, in particular in an enhancement device performing an analysis of the audio signal to extract the parameters necessary for the band extension.
Le fait de prendre en compte l'énergie au niveau de la trame courante et celle de la sous-trame dans le signal en bande basse (première bande de fréquence) permet d'ajuster le ratio entre l'énergie par sous-trame et l'énergie par trame dans la bande haute (deuxième bande de fréquence) et d'ajuster ainsi des ratios d'énergie plutôt que des énergies absolues. Cela permet de garder dans la bande haute le même ratio d'énergie entre sous-trame et trame que dans la bande basse, ce qui est particulièrement bénéfique lorsque l'énergie des sous-trames varie beaucoup, par exemple dans le cas de sons transitoires, d'attaques.  Taking into account the energy at the current frame and that of the subframe in the low band signal (first frequency band) makes it possible to adjust the ratio between the energy per subframe and the subframe. energy per frame in the high band (second frequency band) and thus adjust energy ratios rather than absolute energies. This makes it possible to keep in the high band the same ratio of energy between subframe and frame as in the low band, which is particularly beneficial when the energy of the subframes varies greatly, for example in the case of transient sounds. , of attacks.
Les différents modes particuliers de réalisation mentionnés ci-après peuvent être ajoutés indépendamment ou en combinaison les uns avec les autres, aux étapes du procédé d'extension défini ci-dessus.  The various particular embodiments mentioned below may be added independently or in combination with each other, to the steps of the extension method defined above.
Dans un mode de réalisation, le procédé comporte en outre une étape de filtrage passe-bande adaptatif en fonction du débit de décodage de la trame courante.  In one embodiment, the method further includes an adaptive bandpass filtering step based on the decoding rate of the current frame.
Ce filtrage adaptatif permet d'optimiser la largeur de bande étendue en fonction du débit, et donc la qualité du signal reconstruit après extension de bande. En effet, pour les bas débits (typiquement à 6.6 et 8.85 kbit/s pour AMR-WB), la qualité générale du signal décodé en bande basse (par le codée AMR-WB ou une version interopérable) n'étant pas très bonne, il est préférable de ne pas trop étendre la bande décodée et donc de limiter l'extension de bande en adaptant la réponse en fréquence du filtre passe-bande associé pour couvrir par exemple une bande approximative de 6 à 7 kHz ; cette limitation est d'autant plus avantageuse que le signal d'excitation lui-même est relativement mal codé et il est préférable de ne pas en utiliser une sous-bande trop large pour l'extension des hautes fréquences. A l'opposé, pour les débits supérieurs (12.65 kbit/s et supérieurs pour AMR-WB), la qualité peut être améliorée avec une synthèse HF couvrant une bande plus large, par exemple approximativement de 6 à 7.7 kHz. La limite haute de 7.7 kHz (au lieu de 8 kHz) est un exemple de réalisation, qui pourra être ajustée à des valeurs proches de 7.7 kHz. Cette limite est ici justifiée par le fait que l'extension est faite dans l'invention sans information auxiliaire et qu'une extension jusqu'à 8 kHz (même si elle est en théorie possible) pourrait résulter en des artefacts pour des signaux particuliers. De plus, cette limitation à 7.7 kHz tient compte du fait que typiquement les filtres anti-repliement en conversion analogique/numérique et les filtres de ré-échantillonnage entre 16 kHz et d'autres fréquences ne sont pas parfaits et qu'ils introduisent typiquement une réjection aux fréquences inférieures à 8 kHz. This adaptive filtering makes it possible to optimize the extended bandwidth as a function of the bit rate, and therefore the quality of the reconstructed signal after band extension. Indeed, for low bit rates (typically 6.6 and 8.85 kbit / s for AMR-WB), the overall quality of the decoded signal in low band (by AMR-WB codec or an interoperable version) not being very good, it is better not to extend the decoded band too much and thus to limit the band extension by adapting the frequency response of the filter bandpass associated to cover for example an approximate band of 6 to 7 kHz; this limitation is all the more advantageous that the excitation signal itself is relatively poorly coded and it is preferable not to use a sub-band too wide for the extension of high frequencies. In contrast, for higher rates (12.65 kbit / s and higher for AMR-WB), the quality can be improved with HF synthesis covering a wider band, for example approximately 6 to 7.7 kHz. The high limit of 7.7 kHz (instead of 8 kHz) is an example embodiment, which can be adjusted to values close to 7.7 kHz. This limitation is here justified by the fact that the extension is made in the invention without auxiliary information and that an extension up to 8 kHz (although theoretically possible) could result in artifacts for particular signals. In addition, this limitation at 7.7 kHz takes into account the fact that typically the anti-aliasing filters in analog / digital conversion and resampling filters between 16 kHz and other frequencies are not perfect and they typically introduce a rejection at frequencies below 8 kHz.
Dans un mode possible de réalisation le procédé comporte une étape de transformée temps-fréquence du signal d'excitation, l'étape d'obtention d'un signal étendu s'effectuant alors dans le domaine fréquentiel et une étape de transformée temps-fréquence inverse du signal étendu avant les étapes de mise à l'échelle et de filtrage.  In one possible embodiment, the method comprises a step of transforming the time-frequency of the excitation signal, the step of obtaining an extended signal then taking place in the frequency domain and a reverse time-frequency transforming step. of the extended signal before the scaling and filtering steps.
La mise en œuvre de l'extension de bande (du signal d'excitation) dans le domaine fréquentiel permet d'obtenir une finesse d'analyse en fréquence dont on ne dispose pas avec une approche temporelle, et permet aussi d'avoir une résolution fréquentielle suffisante pour détecter des harmoniques et transposer en hautes fréquences des harmoniques du signal (dans la bande basse) pour améliorer la qualité tout en respectant la structure du signal.  The implementation of the band extension (of the excitation signal) in the frequency domain makes it possible to obtain a fineness of frequency analysis which is not available with a temporal approach, and also makes it possible to have a resolution Frequency sufficient to detect harmonics and transpose high harmonics of the signal (in the low band) to improve quality while respecting the structure of the signal.
Dans un mode de réalisation détaillé, l'étape de génération d'un signal d'excitation sur-échantillonné et étendu est effectuée selon l'équation suivante:  In a detailed embodiment, the step of generating an oversampled and extended excitation signal is performed according to the following equation:
UHBl (k) =U HBl (k) =
avec k l'indice de l'échantillon, UHBI (k) le spectre du signal d'excitation étendu, U(k) le spectre du signal d'excitation obtenu après l'étape de transformée et start_band une variable prédéfinie. with k the index of the sample, U H BI (k) the spectrum of the extended excitation signal, U (k) the spectrum of the excitation signal obtained after the transforming step and start_band a predefined variable.
Ainsi, cette fonction comprend bien un ré-échantillonnage du signal d'excitation en ajoutant des échantillons au spectre de ce signal.  Thus, this function includes a resampling of the excitation signal by adding samples to the spectrum of this signal.
Dans la bande de fréquence correspondant aux échantillons allant de 200 à 239, le spectre original est conservé, pour pouvoir y appliquer une réponse d'atténuation progressive du filtre passe-haut dans cette bande de fréquence et aussi pour ne pas introduire de défauts audibles lors de l'étape d'addition de la synthèse basse fréquence à la synthèse haute fréquence. In the frequency band corresponding to the samples ranging from 200 to 239, the original spectrum is conserved, in order to be able to apply a progressive attenuation response of the high-pass filter in this frequency band and also to not introduce defects. audible during the step of adding the low frequency synthesis to the high frequency synthesis.
Dans un mode de réalisation particulier, le procédé comporte une étape de filtrage de désaccentuation du signal étendu au moins dans la deuxième bande de fréquence.  In a particular embodiment, the method comprises a de-emphasis filtering step of the extended signal at least in the second frequency band.
Ainsi, le signal dans la deuxième bande de fréquence est ramené dans un domaine cohérent avec le signal dans la première bande de fréquence.  Thus, the signal in the second frequency band is brought into a domain coherent with the signal in the first frequency band.
Dans un mode particulier de réalisation, le procédé comporte en outre une étape de génération d'un signal de bruit au moins dans la deuxième bande de fréquence le signal étendu étant obtenu par combinaison du signal d'excitation étendu et du signal de bruit.  In a particular embodiment, the method further comprises a step of generating a noise signal at least in the second frequency band, the extended signal being obtained by combining the extended excitation signal and the noise signal.
En effet, il suffit d'avoir des caractéristiques issues du signal d'excitation suréchantillonné et étendu dans au moins une deuxième bande de fréquence pour avoir un modèle de signal adapté à certains types de signaux. Celui-ci peut être combiné à un autre signal, par exemple un bruit généré pour obtenir le signal étendu ayant un modèle de signal adapté.  Indeed, it suffices to have characteristics from the oversampled excitation signal and extended in at least a second frequency band to have a signal model adapted to certain types of signals. This can be combined with another signal, for example a noise generated to obtain the extended signal having a suitable signal pattern.
Dans un mode de réalisation l'étape de combinaison s'effectue par mixage additif adaptatif avec un gain d'égalisation de niveau entre le signal d'excitation étendu et le signal de bruit.  In one embodiment, the combining step is performed by adaptive additive mixing with a level equalization gain between the extended excitation signal and the noise signal.
L'application de ce gain d'égalisation permet à l'étape de combinaison de s'adapter aux caractéristiques du signal pour optimiser la proportion relative de bruit dans le mélange.  The application of this equalization gain allows the combining step to adapt to the characteristics of the signal to optimize the relative proportion of noise in the mixture.
La présente invention vise également un dispositif d'extension de bande de fréquence d'un signal audiofréquence comportant un étage de décodage ou d'extraction, dans une première bande de fréquence dite bande basse, d'un signal d'excitation et des coefficients d'un filtre de prédiction linéaire. Le dispositif est tel qu'il comporte:  The present invention also aims at a frequency band extension device for an audio frequency signal comprising a decoding or extraction stage, in a first so-called low band frequency band, of an excitation signal and of the transmission coefficients. a linear prediction filter. The device is such that it comprises:
- un module d'obtention d'un signal étendu (UHB2(k), 503)) dans au moins une deuxième bande de fréquence supérieure à la première bande de fréquence à partir d'un signal d'excitation sur-échantillonné et étendu dans au moins une deuxième bande de fréquence (UHBi(k)); a module for obtaining an extended signal (U H B2 (k), 503) in at least a second frequency band greater than the first frequency band from an oversampled excitation signal and extended in at least a second frequency band (U H Bi (k));
- un module de mise à l'échelle (507) du signal étendu par un gain défini par sous-trame en fonction d'un ratio d'énergie par trame et sous-trame du signal audiofréquence dans la première bande de fréquence;  - a scaling module (507) of the signal extended by a gain defined by subframe according to a ratio of energy per frame and subframe of the audiofrequency signal in the first frequency band;
- un module de filtrage (510) dudit signal étendu mis à l'échelle par un filtre de prédiction linéaire dont les coefficients sont dérivés des coefficients du filtre de la bande basse.  a filtering module (510) of said extended signal scaled by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter.
Ce dispositif présente les mêmes avantages que le procédé décrit précédemment, qu'il met en œuvre.  This device has the same advantages as the method described above, which it implements.
L'invention vise un décodeur comportant un dispositif tel que décrit. Elle vise un programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé d'extension de bande tel que décrit, lorsque ces instructions sont exécutées par un processeur. The invention relates to a decoder comprising a device as described. It is directed to a computer program comprising code instructions for implementing the steps of the tape extension method as described, when these instructions are executed by a processor.
Enfin l'invention se rapporte à un support de stockage, lisible par un processeur, intégré ou non au dispositif d'extension de bande, éventuellement amovible, mémorisant un programme informatique mettant en œuvre un procédé d'extension de bande tel que décrit précédemment.  Finally, the invention relates to a storage medium, readable by a processor, integrated or not to the band expansion device, possibly removable, storing a computer program implementing a band extension method as described above.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels :  Other features and advantages of the invention will appear more clearly on reading the following description, given solely by way of nonlimiting example, and with reference to the appended drawings, in which:
la figure 1 illustre une partie d'un décodeur de type AMR-WB mettant en œuvre des étapes d'extension de bande de fréquence de l'état de l'art et tel que décrit précédemment;  FIG. 1 illustrates a part of an AMR-WB decoder implementing frequency band extension steps of the state of the art and as previously described;
la figure 2 illustre un décodeur de type interopérable G.718-LD à 16kHz selon l'état de l'art et tel que décrit précédemment;  FIG. 2 illustrates a decoder of the interoperable type G.718-LD at 16 kHz according to the state of the art and as described previously;
la figure 3 illustre un décodeur interopérable avec le codage AMR-WB et intégrant un dispositif d'extension de bande selon un mode de réalisation de l'invention; la figure 4 illustre sous forme d'organigramme, les étapes principales d'un procédé d'extension de bande selon un mode de réalisation de l'invention;  FIG. 3 illustrates an interoperable decoder with the AMR-WB coding and integrating a band extension device according to one embodiment of the invention; FIG. 4 illustrates in flowchart form the main steps of a band extension method according to one embodiment of the invention;
la figure 5 illustre un premier mode de réalisation dans le domaine fréquentiel d'un dispositif d'extension de bande selon l'invention;  FIG. 5 illustrates a first embodiment in the frequency domain of a band extension device according to the invention;
la figure 6 illustre un exemple de réponse en fréquence d'un filtre passe-bande utilisée dans un mode particulier de l'invention;  FIG. 6 illustrates an example of frequency response of a bandpass filter used in a particular embodiment of the invention;
la figure 7 illustre un deuxième mode de réalisation dans le domaine temporel d'un dispositif d'extension de bande selon l'invention; et  FIG. 7 illustrates a second embodiment in the time domain of a band extension device according to the invention; and
la figure 8 illustre une réalisation matérielle d'un dispositif d'extension de bande selon l'invention.  FIG. 8 illustrates a hardware embodiment of a band extension device according to the invention.
La figure 3 illustre un exemple de décodeur, compatible avec la norme AMR- WB/G.722.2 dans lequel on retrouve un post-traitement similaire à celui introduit dans G.718 et décrit en référence à la figure 2 et une extension de bande améliorée selon le procédé d'extension de l'invention, mis en œuvre par le dispositif d'extension de bande illustré par le bloc 309. FIG. 3 illustrates an exemplary decoder, compatible with the AMR-WB / G.722.2 standard, in which there is a postprocessing similar to that introduced in G.718 and described with reference to FIG. 2 and an improved band extension according to the extension method of the invention, implemented by the band extension device illustrated by block 309.
Contrairement au décodage AMR-WB qui fonctionne avec une fréquence d'échantillonnage de sortie de 16 kHz et au décodage G.718 qui fonctionne à 8 ou 16 kHz, on considère ici un décodeur qui peut fonctionner avec un signal de sortie (synthèse) à la fréquence fs = 8, 16, 32 ou 48 kHz. A noter qu'on suppose ici que le codage a été effectué selon l'algorithme AMR-WB avec une fréquence interne de 12.8 kHz pour le codage CELP en bande basse et à 23.85 kbit/s un codage de gain par sous-trame à la fréquence de 16 kHz ; même si l'invention est décrite ici au niveau du décodage, on suppose ici que le codage peut aussi fonctionner avec un signal d'entrée à la fréquence fs = 8, 16, 32 ou 48 kHz et des opérations de ré-échantillonnage adéquate, dépassant le cadre de l'invention, sont mises en œuvre au codage en fonction de la valeur de fs. On peut noter que quand fs=8 kHz, dans le cas d'un décodage compatible avec AMR-WB, il n'est pas nécessaire d'étendre la bande basse 0-6.4 kHz, car la bande audio reconstruite à la fréquence /s est limitée à 0-4000 Hz. Unlike AMR-WB decoding which operates with an output sampling frequency of 16 kHz and G.718 decoding which operates at 8 or 16 kHz, a decoder is considered here which can operate with an output signal (synthesis) at the frequency fs = 8, 16, 32 or 48 kHz. Note that it is assumed here that the coding was performed according to the AMR-WB algorithm with an internal frequency of 12.8 kHz for the CELP coding in low band and at 23.85 kbit / s a subframe gain coding at the frequency of 16 kHz; even if the invention is described here at the decoding level, it is assumed here that the coding can also operate with an input signal at the frequency fs = 8, 16, 32 or 48 kHz and adequate resampling operations, beyond the scope of the invention, are implemented at the coding according to the value of fs. It can be noted that when fs = 8 kHz, in the case of a decoding compatible with AMR-WB, it is not necessary to extend the low band 0-6.4 kHz, because the audio band reconstructed at the frequency / s is limited to 0-4000 Hz.
A la figure 3, le décodage CELP (BF pour basses fréquences) fonctionne toujours à la fréquence interne de 12.8 kHz, comme dans AMR-WB et G.718, et l'extension de bande (HF pour hautes fréquences) faisant l'objet de l'invention fonctionne à la fréquence de 16 kHz, les synthèses BF et HF sont combinées (bloc 312) à la fréquence fs après ré-échantillonnage adéquat (bloc 306 et traitement interne au bloc 311). Dans des variantes de l'invention, la combinaison des bandes basse et haute pourra se faire à 16 kHz, après avoir rééchantillonnée la bande basse de 12.8 à 16 kHz, avant de ré-échantillonner le signal étendu à la fréquence fs.  In Figure 3, the CELP decoding (BF for low frequencies) always operates at the internal frequency of 12.8 kHz, as in AMR-WB and G.718, and the band extension (HF for high frequencies) being the subject of the invention operates at the frequency of 16 kHz, the synthesis BF and HF are combined (block 312) at the frequency fs after adequate resampling (block 306 and internal processing block 311). In variants of the invention, the combination of the low and high bands can be done at 16 kHz, after resampling the low band of 12.8 to 16 kHz, before resampling the extended signal at the frequency fs.
Le décodage selon la figure 3 dépend du mode (ou débit) AMR-WB associé à la trame courante reçue. A titre indicatif et sans que cela impacte le bloc 309, le décodage de la partie CELP en bande basse comporte les étapes suivantes:  The decoding according to FIG. 3 depends on the mode (or bit rate) AMR-WB associated with the current frame received. As an indication and without this having an effect on block 309, the decoding of the low band CELP part comprises the following steps:
• Démultiplexage des paramètres codés (bloc 300) en cas de trame correctement reçue ( =0 où est le « bad frame indicator » valant 0 pour une trame reçue et 1 pour une trame perdue)  • Demultiplexing the coded parameters (block 300) in the case of a correctly received frame (= 0 where is the "bad frame indicator" worth 0 for a received frame and 1 for a lost frame)
• Décodage des paramètres ISF avec interpolation et conversion en coefficients LPC (bloc 301) comme décrit dans la clause 6.1 de la norme G.722.2.  • Decoding of ISF parameters with interpolation and conversion to LPC coefficients (block 301) as described in clause 6.1 of G.722.2.
• Décodage de l'excitation CELP (bloc 302), avec une partie adaptative et fixe pour reconstruire l'excitation (exc ou u n) ) dans chaque sous-trame de longueur 64 à 12.8 kHz:  • Decoding of the CELP excitation (block 302), with an adaptive and fixed part to reconstruct the excitation (exc or u n)) in each subframe of length 64 to 12.8 kHz:
u \n) = gpv(n) + gcc(n) , η = 0, · · · ,63 u \ n) = g p v (n) + g c c (n), η = 0, · · ·, 63
en suivant les notations de la clause 7.1.2.1 de G.718 concernant le décodage CELP, où v(n) et c(n) sont respectivement les mots de code des dictionnaires adaptatif et fixe, et g et gc sont les gains décodés associés. Cette excitation u n) est utilisée dans le dictionnaire adaptatif de la sous-trame suivante ; elle est ensuite post-traitée et on distingue comme dans G.718 l'excitation u n) (aussi notée exc) de sa version post-traitée modifiée u(n) (aussi notée exc2) qui sert d'entrée au filtre de synthèse, 1 / Â(z) , dans le bloc 303. Dans des variantes qui peuvent être mises en œuvre pour l'invention, les post-traitements appliqués à l'excitation peuvent être modifiés (par exemple, la dispersion de phase peut être améliorée) ou ces post- traitements peuvent être étendus (par exemple, une réduction du bruit interharmonique peut être mise en œuvre), sans affecter la nature du procédé d'extension de bande selon l'invention. by following the notations of clause 7.1.2.1 of G.718 concerning CELP decoding, where v (n) and c (n) are respectively the code words of the adaptive and fixed dictionaries, and g and g c are the decoded gains associates. This excitation a) is used in the adaptive dictionary of the following subframe; it is then post-processed and one discerns as in G.718 the excitement a) (also noted exc) of its modified post-processed version u (n) (also noted exc2) which serves as input to the synthesis filter, 1 / ((z), in block 303. In variants that can be implemented for the invention, the post-treatments applied to the excitation can be modified (for example, the phase dispersion can be improved) or these post The treatments may be extended (for example, interharmonic noise reduction may be implemented) without affecting the nature of the band extension method of the invention.
• Filtrage de synthèse par 1/ Â(z) (bloc 303) où le filtre LPC décodé Â(z) est d'ordre 16  • Synthetic filtering by 1 /  (z) (block 303) where the decoded LPC filter  (z) is of order 16
• Post-traitement bande étroite (bloc 304) selon la clause 7.3 de G.718 si fs=8 kHz. • Narrowband post-processing (block 304) according to clause 7.3 of G.718 if fs = 8 kHz.
• Désaccentuation (bloc 305) par le filtre 1 / (l - 0.68z_1 ) • Deactivation (block 305) by the filter 1 / (l - 0.68z _1 )
• Post-traitement des basses fréquences (bloc 306) tel que décrit à la clause 7.14.1.1 de G.718. Ce traitement introduit un retard qui est pris en compte dans le décodage de la bande haute (>6.4 kHz).  • Low frequency post-processing (block 306) as described in clause 7.14.1.1 of G.718. This processing introduces a delay which is taken into account in the decoding of the high band (> 6.4 kHz).
• Ré-échantillonnage de la fréquence interne de 12.8 kHz à la fréquence de sortie fs (bloc 307). Plusieurs réalisations sont possibles. Sans perte de généralité, on considère ici à titre d'exemple que si fs=8 ou 16 kHz, le ré-échantillonnage décrit dans la clause 7.6 de G.718 est repris ici, et si fs=32 ou 48 kHz, des filtres à réponse impulsionnelle finie (FIR) supplémentaires sont utilisés.  • Resampling of the internal frequency from 12.8 kHz to the output frequency fs (block 307). Several achievements are possible. Without loss of generality, we consider here as an example that if fs = 8 or 16 kHz, the resampling described in clause 7.6 of G.718 is repeated here, and if fs = 32 or 48 kHz, filters Finite Impulse Response (FIR) are used.
• Calcul des paramètres du "noise gâte" (bloc 308) qui est réalisé de façon préférentielle comme décrit dans la clause 7.14.3 de G.718.  • Calculation of the parameters of the "noise gate" (block 308) which is carried out preferentially as described in clause 7.14.3 of G.718.
On peut noter que l'utilisation des blocs 306, 308, 314 est optionnelle.  It can be noted that the use of blocks 306, 308, 314 is optional.
On notera également que le décodage de la bande basse décrit ci-dessus suppose une trame courante dite « active » avec un débit entre 6.6 et 23.85 kbit/s. En fait, quand le mode DTX (transmission continue en français) est activé, certaines trames peuvent être codées comme « inactives » et dans ce cas on peut soit transmettre un descripteur de silence (sur 35 bits) soit ne rien transmettre. En particulier, on rappelle que la trame SID décrit plusieurs paramètres : paramètres ISF moyennés sur 8 trames, énergie moyenne sur 8 trames, flag de dithering pour la reconstruction de bruit non stationnaire. Dans tous les cas, au décodeur, on retrouve le même modèle de décodage que pour une trame active, avec une reconstruction de l'excitation et d'un filtre LPC pour la trame courante, ce qui permet d'appliquer l'invention même sur des trames inactives. Le même constat s'applique pour le décodage de « trames perdues » (ou FEC, PLC) dans lequel le modèle LPC est appliqué.  Note also that the decoding of the low band described above assumes a current frame called "active" with a rate between 6.6 and 23.85 kbit / s. In fact, when the DTX (Continuous Transmission in French) mode is activated, some frames can be coded as "inactive" and in this case you can either transmit a silence descriptor (on 35 bits) or not transmit anything. In particular, it is recalled that the SID frame describes several parameters: ISF parameters averaged over 8 frames, average energy over 8 frames, dithering flag for the non-stationary noise reconstruction. In all cases, at the decoder, we find the same decoding model as for an active frame, with a reconstruction of the excitation and an LPC filter for the current frame, which makes it possible to apply the invention itself to inactive frames. The same applies for the decoding of "lost frames" (or FEC, PLC) in which the LPC model is applied.
Contrairement au décodage AMR-WB ou G.718, le décodeur selon l'invention permet d'étendre la bande basse décodée (50-6400 Hz en tenant en compte du filtrage passe-haut à 50 Hz au décodeur, 0-6400 Hz dans le cas général) à une bande étendue dont la largeur varie, allant approximativement de 50-6900 Hz à 50-7700 Hz en fonction du mode mis en œuvre dans la trame courante. On peut ainsi parler d'une première bande de fréquence de 0 à 6400Hz et d'une deuxième bande de fréquence de 6400 à 8000Hz. En réalité, dans le mode de réalisation privilégié, l'extension de l'excitation est réalisée dans le domaine fréquentiel dans une bande de 5000 à 8000 Hz, pour permettre un filtrage passe-bande de largeur 6000 à 6900 ou 7700 Hz. Unlike decoding AMR-WB or G.718, the decoder according to the invention makes it possible to extend the decoded low band (50-6400 Hz while taking into account the 50 Hz high-pass filtering at the decoder, 0-6400 Hz in the decoder. the general case) to an extended band whose width varies, ranging from approximately 50-6900 Hz to 50-7700 Hz depending on the mode implemented in the current frame. We can talk about a first frequency band from 0 to 6400Hz and a second frequency band from 6400 to 8000Hz. In reality, in the preferred embodiment, the extension of the excitation is carried out in the frequency domain in a band of 5000 to 8000 Hz, to allow bandpass filtering of width 6000 to 6900 or 7700 Hz.
Dans un mode de réalisation privilégié, à 23.85 kbit/s, comme dans le décodeur G.718 décrit en référence à la figure 2, l'information de correction de gain HF (0.8 kbit/s) transmise à 23.85 kbit/s est ici ignorée. Ainsi à la figure 3, aucun bloc spécifique à 23.85 kbit/s n'est utilisé.  In a preferred embodiment, at 23.85 kbit / s, as in the G.718 decoder described with reference to FIG. 2, the gain correction information HF (0.8 kbit / s) transmitted at 23.85 kbit / s is here ignored. Thus in FIG. 3, no specific block at 23.85 kbit / s is used.
La partie décodage bande haute est réalisée dans le bloc 309 représentant le dispositif d'extension de bande selon l'invention et qui est détaillé à la figure 5 dans un premier mode de réalisation et à la figure 7 dans un deuxième mode de réalisation.  The high band decoding part is produced in the block 309 representing the band extension device according to the invention and which is detailed in FIG. 5 in a first embodiment and in FIG. 7 in a second embodiment.
Ce dispositif comprend au moins un module d'obtention d'un signal étendu dans au moins une deuxième bande de fréquence supérieure à la première bande de fréquence à partir d'un signal d'excitation sur-échantillonné et étendu dans au moins une deuxième bande de fréquence (UHBi(k)), un module de mise à l'échelle du signal étendu par un gain défini par sous-trame en fonction d'un ratio d'énergie par trame et sous-trame du signal audiofréquence dans la première bande de fréquence et un module de filtrage dudit signal étendu mis à l'échelle par un filtre de prédiction linéaire dont les coefficients sont dérivés des coefficients du filtre de la bande basse. This device comprises at least one module for obtaining an extended signal in at least one second frequency band greater than the first frequency band from an oversampled excitation signal and extended in at least a second band. of frequency (U H Bi (k)), a scaling module of the signal extended by a gain defined by subframe according to a ratio of energy per frame and subframe of the audiofrequency signal in the first frequency band and a filtering module of said extended signal scaled by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter.
Afin d'aligner les bandes basses et hautes décodées, un retard (bloc 310) est introduit dans le premier mode de réalisation pour synchroniser les sorties des blocs 306 et 307 et la bande haute synthétisée à 16 kHz est ré-échantillonnée de 16 kHz à la fréquence fs (sortie de bloc 311). Par exemple, quand fs= lb kHz le retard Γ=30 échantillons, qui correspond au retard de ré-échantillonnage de 12.8 à 16 kHz de 15 échantillons + retard du post-traitement des basses fréquences de 15 échantillons. La valeur du retard T devra être adaptée pour les autres cas {fs=32, 48 kHz) en fonction des traitements mis en œuvre. On rappelle que quand fs=8 kHz, il n'est pas nécessaire d'appliquer les blocs 309 à 311 car la bande du signal en sortie du décodeur est limité à 0-4000 Hz.  In order to align the decoded low and high bands, a delay (block 310) is introduced in the first embodiment to synchronize the outputs of the blocks 306 and 307 and the high band synthesized at 16 kHz is resampled from 16 kHz to the frequency fs (block output 311). For example, when fs = lb kHz the delay Γ = 30 samples, which corresponds to the resampling delay of 12.8 to 16 kHz of 15 samples + delay of the low frequency post-processing of 15 samples. The value of the delay T will have to be adapted for the other cases {fs = 32, 48 kHz) according to the treatments implemented. Remember that when fs = 8 kHz, it is not necessary to apply the blocks 309 to 311 because the output signal band of the decoder is limited to 0-4000 Hz.
A noter que le procédé d'extension de l'invention mis en œuvre dans le bloc 309 selon le premier mode de réalisation n'introduit de façon préférentielle aucun retard supplémentaire par rapport à la bande basse reconstruite à 12.8 kHz ; cependant, dans des variantes de l'invention (par exemple en utilisant une transformation temps/fréquence avec recouvrement), un retard pourra être introduit. Ainsi, de façon générale la valeur de dans le bloc 310 devra être ajustée en fonction de la mise en œuvre spécifique. Par exemple dans le cas où le post-traitement des basses fréquences (bloc 306) n'est pas utilisé, le retard à introduire pour fs=l6 kHz pourra être fixé à Γ=15 échantillons ; de même si l'invention est réalisée suivant la variante du mode de réalisation décrite à la figure 7, la valeur de T se réduit pour compenser le retard introduit par le post-traitement des basses fréquences (bloc 306) s'il est utilisé. Les bandes basse et haute sont ensuite combinées (ajoutées) dans le bloc 312 et la synthèse obtenue est post-traitée par filtrage passe-haut à 50 Hz (de type IIR) d'ordre 2 dont les coefficients dépendent de la fréquence fs (bloc 313) et post-traitement de sortie avec application optionnelle du "noise gate"de façon similaire à G.718 (bloc 314). It should be noted that the extension method of the invention implemented in block 309 according to the first embodiment introduces preferentially no additional delay with respect to the low band reconstructed at 12.8 kHz; however, in variants of the invention (for example using a time / frequency transformation with overlap), a delay may be introduced. Thus, in general the value of in block 310 will have to be adjusted according to the specific implementation. For example, in the case where the post-processing of low frequencies (block 306) is not used, the delay to be introduced for fs = 16 kHz can be set at Γ = 15 samples; likewise if the invention is carried out according to the variant of the embodiment described in FIG. 7, the value of T is reduced to compensate for the delay introduced by the post-processing of the low frequencies (block 306) if it is used. The low and high bands are then combined (added) in block 312 and the resulting synthesis is post-processed by high-order 50 Hz (type IIR) high-pass filtering whose coefficients depend on the frequency fs (block 313) and output post-processing with optional noise gate application similar to G.718 (block 314).
Le dispositif d'extension de bande selon l'invention, illustré par le bloc 309 selon le mode de réalisation du décodeur de la figure 3, met en œuvre un procédé d'extension de bande décrit maintenant en référence à la figure 4.  The band extension device according to the invention, illustrated by block 309 according to the embodiment of the decoder of FIG. 3, implements a band extension method described now with reference to FIG. 4.
Ce dispositif d'extension peut également être indépendant du décodeur et peut mettre en œuvre le procédé décrit à la figure 4 pour effectuer une extension de bande d'un signal audio existant stocké ou transmis au dispositif, avec une analyse du signal audio pour en extraire une excitation et un filtre LPC.  This extension device may also be independent of the decoder and may implement the method described in FIG. 4 to perform a band extension of an existing audio signal stored or transmitted to the device, with an analysis of the audio signal to extract it an excitation and an LPC filter.
Ce dispositif reçoit en entrée un signal d'excitation dans une première bande de fréquence dite bande basse u(n) dans le cas d'une mise en œuvre dans le domaine temporel ou U(k) dans le cas d'une mise en œuvre dans le domaine fréquentiel pour laquelle une étape de transformée temps fréquence est alors appliquée.  This device receives as input an excitation signal in a first so-called low-band frequency band u (n) in the case of an implementation in the time domain or U (k) in the case of an implementation. in the frequency domain for which a time-frequency transform step is then applied.
Dans le cas d'une application dans un décodeur, ce signal d'excitation reçu est un signal décodé.  In the case of an application in a decoder, this received excitation signal is a decoded signal.
Dans le cas d'un dispositif d'amélioration indépendant du décodeur, le signal d'excitation bande basse est extrait par analyse du signal audio.  In the case of an enhancement device independent of the decoder, the low band excitation signal is extracted by analysis of the audio signal.
Dans un mode possible de réalisation, le signal audio bande basse est rééchantillonné avant l'étape d'extraction de l'excitation, si bien que l'excitation extraite du signal audio par prédiction linéaire estimée à partir du signal bande basse (ou de paramètres LPC associés à la bande basse) est déjà ré-échantillonnée. Un exemple de réalisation dans ce cas consiste à prendre un signal bande basse échantillonné à 12.8 kHz dont on dispose d'un filtre LPC bande basse décrivant l'enveloppe spectrale court-terme pour la trame courante, le sur-échantillonner à 16 kHz, et le filtrer par un filtre de prédiction LPC obtenu en extrapolant le filtre LPC. Un autre exemple de réalisation consiste à prendre un signal bande basse échantillonné à 12.8 kHz dont on ne dispose pas de modèle LPC, le sur-échantillonner à 16 kHz, effectuer une analyse LPC sur ce signal à 16 kHz, et filtrer ce signal par un filtre de prédiction LPC obtenu par cette analyse.  In a possible embodiment, the low band audio signal is resampled before the excitation extraction step, so that the excitation extracted from the audio signal by linear prediction estimated from the low band signal (or parameters LPC associated with the low band) is already resampled. An exemplary embodiment in this case consists in taking a sampled low band signal at 12.8 kHz, which has a low-band LPC filter describing the short-term spectral envelope for the current frame, oversampling it at 16 kHz, and filter it by an LPC prediction filter obtained by extrapolating the LPC filter. Another embodiment is to take a low band signal sampled at 12.8 kHz which is not available LPC model, the oversampler at 16 kHz, perform an LPC analysis on this signal at 16 kHz, and filter this signal by a LPC prediction filter obtained by this analysis.
Une étape E401 de génération d'un signal d'excitation sur-échantillonné étendu ( ext (n) ou UHB1 (k) ) dans une deuxième bande de fréquence supérieure à la première bande de fréquence est effectuée. Cette étape de génération peut comporter à la fois une étape de ré-échantillonnage et une étape d'extension ou simplement une étape d'extension en fonction du signal d'excitation obtenu en entrée. A step E401 for generating an extended oversampled excitation signal (e xt (n) or U HB1 (k)) in a second frequency band greater than the first frequency band is performed. This generation step may comprise both a resampling step and an extension step or simply an extension step depending on the excitation signal obtained at the input.
Cette étape est détaillée ultérieurement dans les modes de réalisation décrits en référence aux figures 5 et 7. Ce signal d'excitation sur-échantillonné étendu est utilisé pour obtenir un signal étendu (UHB2(k)) dans une deuxième bande de fréquence. Ce signal étendu possède alors un modèle de signal adapté à certains types de signaux grâce aux caractéristiques du signal d'excitation étendu. This step is detailed later in the embodiments described with reference to FIGS. 5 and 7. This extended oversampled excitation signal is used to obtain an extended signal (U H B2 (k)) in a second frequency band. This extended signal then has a signal model adapted to certain types of signals thanks to the characteristics of the extended excitation signal.
Ce signal étendu peut être obtenu après combinaison du signal d'excitation suréchantillonné et étendu avec un autre signal, par exemple un signal de bruit.  This extended signal can be obtained after combining the oversampled and extended excitation signal with another signal, for example a noise signal.
Ainsi, dans un mode de réalisation, une étape E402 de génération d'un signal de bruit ( uHB (n) ou U HB (k) ) au moins dans la deuxième bande de fréquence est effectuée. La deuxième bande de fréquence est par exemple une bande haute fréquence allant de 6000 à 8000 Hz. Par exemple, ce bruit peut être généré de façon pseudo-aléatoire par un générateur congruentiel linéaire. Dans des variantes de l'invention, on pourra remplacer cette génération de bruit par d'autres méthodes, par exemple on pourra définir un signal d'amplitude constante (de valeur arbitraire, telle que 1) et appliquer des signes aléatoires à chaque raie fréquentielle générée. Thus, in one embodiment, a step E402 for generating a noise signal (u HB (n) or U HB (k)) at least in the second frequency band is performed. The second frequency band is for example a high frequency band ranging from 6000 to 8000 Hz. For example, this noise can be generated pseudo-randomly by a linear congruential generator. In variants of the invention, this noise generation can be replaced by other methods, for example a signal of constant amplitude (of arbitrary value such as 1) could be defined and random signs applied to each frequency line. generated.
Le signal d'excitation étendu est ensuite combiné au signal de bruit à l'étape E403 pour obtenir le signal étendu que l'on pourra également dénommer signal combiné ( uHBl (n) ou UHB2 (k) ) dans la bande de fréquence étendue correspondant à toute la bande de fréquence incluant la première et la deuxième bande de fréquence. Ainsi, la combinaison de ces deux types de signaux permet d'obtenir un signal combiné avec des caractéristiques plus adaptées à certains types de signaux comme des signaux musicaux. The extended excitation signal is then combined with the noise signal in step E403 to obtain the extended signal which may also be called a combined signal (u HB1 (n) or U HB2 (k)) in the frequency band range corresponding to the entire frequency band including the first and the second frequency band. Thus, the combination of these two types of signals makes it possible to obtain a combined signal with characteristics more adapted to certain types of signals such as musical signals.
En effet, le signal d'excitation décodé ou estimé dans la bande basse comporte dans certains cas, des harmoniques plus proches des signaux musicaux que le signal de bruit seul. Indeed, the decoded or estimated excitation signal in the low band in some cases has harmonics closer to the musical signals than the noise signal alone.
Les harmoniques basses fréquences, si elles existent, peuvent ainsi être transposées en haute fréquence de telle sorte que leur mélange avec du bruit permet d'assurer un certain niveau d'harmonicité ou de niveau relatif de bruit ou de planéité spectrale (« spectral flatness » en anglais) dans la bande haute reconstruite. Low-frequency harmonics, if they exist, can thus be transposed into high frequency so that their mixing with noise makes it possible to ensure a certain level of harmonicity or relative level of noise or spectral flatness ("spectral flatness"). in English) in the reconstructed high band.
L'extension de bande selon le procédé améliore la qualité pour ce type de signaux par rapport à AMR-WB.  The band extension according to the method improves the quality for this type of signals compared to AMR-WB.
Le signal combiné (ou étendu) est ensuite filtré en E404 par un filtre de prédiction linéaire dont les coefficients sont dérivés des coefficients du filtre de la bande basse ( Â(z) ) décodés ou obtenus par analyse et extraction à partir du signal bande basse ou une version sur-échantillonnée de celui-ci. L'extension de bande selon le procédé est donc réalisée en étendant d'abord un signal d'excitation et en appliquant ensuite une étape de filtrage de synthèse par prédiction linéaire (LPC); cette approche exploite le fait que l'excitation LPC décodée dans la bande basse est un signal dont le spectre est relativement plat, ce qui évite des traitements supplémentaires de blanchiment du signal décodé dans l'extension de bande. De façon avantageuse, les coefficients de ce filtre peuvent par exemple être obtenus à partir des paramètres décodés du filtre de prédiction linéaire (LPC) en bande basse. Si le filtre LPC utilisé en bande haute échantillonnée 16 kHz est de la forme \l A{z l γ) , où 1/ Â(z) est le filtre décodé en bande basse, et γ un facteur de pondération, la réponse en fréquence du filtre I I A(z l γ) correspond à un étalement de la réponse en fréquence du filtre décodé en bande basse. Dans une variante on pourra étendre le filtre 1 / Â(z) à un ordre supérieur (comme à 6.6 kbit/s dans le bloc 111) pour éviter un tel étalement. The combined (or extended) signal is then filtered at E404 by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter (((z)) decoded or obtained by analysis and extraction from the low band signal or an oversampled version of it. The band extension according to the method is therefore achieved by first extending an excitation signal and then applying a linear prediction synthesis filtering step (LPC); this approach exploits the fact that the LPC decoded excitation in the low band is a signal whose spectrum is relatively flat, which avoids additional processing of whitening of the decoded signal in the band extension. Advantageously, the coefficients of this filter can for example be obtained from the decoded parameters of the linear band prediction filter (LPC). If the LPC filter used in the high sampled 16 kHz band is of the form \ l A {zl γ), where 1 / Â (z) is the low band decoded filter, and γ is a weighting factor, the frequency response of the IIA filter (zl γ) corresponds to a spread of the frequency response of the decoded low band filter. In a variant, the filter 1 / A (z) can be extended to a higher order (as to 6.6 kbit / s in the block 111) to avoid such spreading.
De façon préférentielle mais optionnelle, des étapes supplémentaires de filtrage passe-bande adaptatif en E405 et/ou de mise à l'échelle en E406 et E407 peuvent être effectuées pour d'une part améliorer la qualité du signal d'extension selon le débit de décodage et d'autre part pour s'assurer de garder le même ratio d'énergie entre une sous- trame et une trame de signal combiné que dans la bande basse de fréquence.  Preferably, but additionally, additional steps of adaptive bandpass filtering at E405 and / or scaling at E406 and E407 can be performed to improve the quality of the extension signal according to the bit rate. decoding and on the other hand to ensure to keep the same energy ratio between a subframe and a combined signal frame as in the low frequency band.
Ces étapes seront expliquées plus en détails dans les modes de réalisation des figures These steps will be explained in more detail in the embodiments of the figures
5 et 7. 5 and 7.
Dans un premier mode de réalisation, le dispositif d'extension de bande est décrit maintenant en référence à la figure 5. Ce dispositif met en œuvre le procédé d'extension de bande décrit précédemment en référence à la figure 4.  In a first embodiment, the band extension device is described now with reference to FIG. 5. This device implements the band extension method described above with reference to FIG. 4.
Ainsi, à l'entrée de ce dispositif, un signal d'excitation bande basse décodé ou estimé par analyse est reçu ( u(n) ). L'extension de bande utilise ici l'excitation décodée à 12.8 kHz (exc2 ou u(n) ) en sortie du bloc 302.  Thus, at the input of this device, a low band excitation signal decoded or estimated by analysis is received (u (n)). The band extension here uses the decoded excitation at 12.8 kHz (exc2 or u (n)) at the output of block 302.
On notera que dans ce mode de réalisation, la génération de l'excitation suréchantillonné et étendu s'effectue dans une bande de fréquence allant de 5 à 8 kHz incluant donc une deuxième bande de fréquence (6.4-8kHz) supérieure à la première bande de fréquence (0-6.4 kHz).  Note that in this embodiment, the generation of the oversampled and extended excitation is carried out in a frequency band ranging from 5 to 8 kHz including a second frequency band (6.4-8kHz) greater than the first band of frequency (0-6.4 kHz).
Ainsi, la génération du signal d'excitation étendu s'effectue au moins sur la deuxième bande de fréquence mais aussi sur une partie de la première bande de fréquence.  Thus, the generation of the extended excitation signal is effected at least on the second frequency band but also on a part of the first frequency band.
Bien évidemment, les valeurs définissant ces bandes de fréquences peuvent être différentes selon le décodeur ou le dispositif de traitement dans lequel l'invention s'applique.  Of course, the values defining these frequency bands may be different depending on the decoder or the processing device in which the invention applies.
Pour cet exemple de réalisation, ce signal est transformé pour obtenir un spectre de signal d'excitation U(k) par le module de transformation temps-fréquence 500.  For this exemplary embodiment, this signal is transformed to obtain an excitation signal spectrum U (k) by the time-frequency transformation module 500.
Dans un mode de réalisation particulier, la transformée utilise une DCT-IV (pour "Discrète Cosine Transform" - Type IV en anglais) (bloc 500) sur la trame courante de 20 ms (256 échantillons), sans fenêtrage, ce qui revient à transformer directement u(n) avec n = 0, · · · , 255 selon la formule suivante : In a particular embodiment, the transform uses a DCT-IV (for "Discrete Cosine Transform" - Type IV in English) (block 500) on the current frame of 20 ms (256 samples), without windowing, which amounts to directly transform u (n) with n = 0, · · ·, 255 according to the following formula:
où N = 256 et & = 0,· · ·, 255 . where N = 256 and & = 0, · · ·, 255.
On note ici que la transformation sans fenêtrage (ou de façon équivalente avec une fenêtre rectangulaire implicite de la longueur de la trame) est possible car le traitement est effectué dans le domaine de l'excitation, et non le domaine du signal, si bien qu'aucun artefact (effets de bloc) n'est audible, ce qui constitue un avantage important de ce mode de réalisation de l'invention.  We note here that the transformation without windowing (or equivalently with a rectangular window implicit in the length of the frame) is possible because the processing is performed in the field of excitation, and not the domain of the signal, so that no artifact (block effects) is audible, which is an important advantage of this embodiment of the invention.
Dans ce mode de réalisation, la transformation DCT-IV est mise en œuvre par FFT suivant l'algorithme dit « Evolved ZXT(EDCT) » décrit dans l'article de D.M. Zhang, HT. Li, A Low Complexity Transform - Evolved DCT, IEEE 14th International Conférence on Computational Science and Engineering (CSE), Aug. 2011, pp. 144-149, et mis en œuvre dans les normes UIT-T G.718 Annex B et G.729.1 Annex E. In this embodiment, the DCT-IV transformation is implemented by FFT according to the "Evolved ZXT (EDCT)" algorithm described in the article by D. M. Zhang, HT. Li, A Low Complexity Transform - Evolved DCT, IEEE 14th International Conference on Computational Science and Engineering (CSE), Aug. 2011, pp. 144-149, and implemented in ITU-T G.718 Annex B and G.729.1 Annex E.
Dans des variantes de l'invention et sans perte de généralité, la transformation DCT- IV pourra être remplacée par d'autres transformations temps-fréquences court-terme de même longueur et dans le domaine de l'excitation, comme une FFT (pour "Fast Fourier Transform" en anglais) ou une DCT-II {Discrète Cosine Transform - Type II). De façon alternative, on pourra remplacer la DCT-IV sur la trame par une transformation avec recouvrement-addition et fenêtrage de longueur supérieure à la longueur de la trame courante, par exemple en utilisant une MDCT (pour "Modified Discrète Cosine Tranform" en anglais). Dans ce cas le retard Tdans le bloc 310 de la figure 3, devra être ajusté (réduit) de façon adéquate en fonction du retard additionnel dû à l'analyse/synthèse par cette transformée.  In variants of the invention and without loss of generality, the DCT-IV transformation may be replaced by other short-term time-frequency transformations of the same length and in the field of excitation, such as an FFT (for Fast Fourier Transform "in English) or DCT-II (Discrete Cosine Transform - Type II). Alternatively, it will be possible to replace the DCT-IV on the frame by a recovery-addition and windowing transformation of length greater than the length of the current frame, for example by using an MDCT (for "Modified Discrete Cosine Tranform"). ). In this case, the delay T in block 310 of FIG. 3 will have to be adjusted (reduced) adequately as a function of the additional delay due to the analysis / synthesis by this transform.
Le spectre DCT, U(k) , de 256 échantillons couvrant la bande 0-6400 Hz (à 12.8 kHz), est ensuite étendu (bloc 501) en un spectre de 320 échantillons couvrant la bande 0- 8000 Hz (à 16 kHz) sous la forme suivante :  The DCT spectrum, U (k), of 256 samples covering the band 0-6400 Hz (at 12.8 kHz), is then extended (block 501) into a spectrum of 320 samples covering the band 0-8000 Hz (at 16 kHz) in the following form:
0 £ = 0,· · · ,199  0 £ = 0, · · ·, 199
t *) = U(k) £ = 200,· · - , 239 t * ) = U (k) £ = 200, · · -, 239
U(k + start _ band - 240) k = 240, · · · , 319  U (k + start _ band - 240) k = 240, · · ·, 319
où on prend de façon préférentielle start_band = 160. where preferentially start_band = 160 is used.
Le bloc 501 fonctionne comme module de génération d'un signal d'excitation suréchantillonné et étendu et réalise l'étape E401 comportant un ré-échantillonnage de 12.8 à 16 kHz dans le domaine fréquentiel, en rajoutant ¼ d'échantillons ( k = 240, · · ·, 319 ) au spectre, le ratio entre 16 et 12.8 étant de 5/4.  Block 501 functions as a module for generating an oversampled and extended excitation signal and performs step E401 with resampling of 12.8 to 16 kHz in the frequency domain, adding ¼ samples (k = 240, · · ·, 319) to the spectrum, the ratio between 16 and 12.8 being 5/4.
De plus, le bloc 501 réalise un filtrage passe-haut implicite dans la bande 0-5000 Hz puisque les 200 premiers échantillons de UHBl (k) sont mis à zéro ; comme expliqué plus tard, ce filtrage passe-haut est également complété par une partie d'atténuation progressive des valeurs spectrales d'indices k = 200, · · -, 255 dans la bande 5000-6400 Hz, cette atténuation progressive est mise en œuvre dans le bloc 504 mais pourrait être réalisée séparément en dehors du bloc 504. De façon équivalente et dans des variantes de l'invention, la mise en œuvre du filtrage passe-haut séparée en blocs de coefficients d'indice & = 0,· · ·, 199 mis à zéro, de coefficients k = 200, · · -, 255 atténués, dans le domaine transformé, pourra donc être effectué en une seule étape. In addition, the block 501 carries out an implicit high-pass filtering in the 0-5000 Hz band since the first 200 samples of U HB1 (k) are set to zero; as explained more later, this high-pass filtering is also completed by a progressive attenuation part of the spectral values of indices k = 200, · · -, 255 in the band 5000-6400 Hz, this progressive attenuation is implemented in the block 504 but could be performed separately outside the block 504. Equivalently and in variants of the invention, the implementation of high-pass filtering separated into blocks of index coefficients & = 0, · · ·, 199 set to zero, with coefficients k = 200, · · -, 255 attenuated, in the transformed domain, can therefore be carried out in a single step.
Dans cet exemple de réalisation et selon la définition de UHBl(k) , on remarque que la bande 5000-6000 Hz de U HBl(k) (qui correspond aux indices k = 200, · · -, 239 ) est copiée à partir de la bande 5000-6000 Hz de U(k) . Cette approche permet de conserver le spectre original dans cette bande et elle évite d'introduire des distorsions dans la bande 5000-6000 Hz lors de l'addition de la synthèse HF avec la synthèse BF - en particulier la phase du signal (implicitement représentée dans le domaine DCT-IV) dans cette bande est préservée. In this exemplary embodiment and according to the definition of U HB1 (k), it is noted that the 5000-6000 Hz band of U HB1 (k) (which corresponds to the indices k = 200, · · -, 239) is copied from of the 5000-6000 Hz U (k) band. This approach preserves the original spectrum in this band and avoids introducing distortions in the 5000-6000 Hz band during the addition of HF synthesis with BF synthesis - particularly the signal phase (implicitly represented in the DCT-IV domain) in this band is preserved.
La bande 6000-8000 Hz de UHBl(k) est ici définie en copiant la bande 4000-6000 Hz de U(k) puisque la valeur de start_band est fixée préférentiellement à 160. The 6000-8000 Hz band of U HB1 (k) is here defined by copying the 4000-6000 Hz band of U (k) since the value of start_band is preferably fixed at 160.
Dans une variante du mode de réalisation, la valeur de start_band pourra être rendue adaptative autour de la valeur de 160, sans modifier la nature de l'invention. Les détails de l'adaptation de la valeur start_band ne sont pas décrits ici car ils dépassent le cadre de l'invention sans en changer la portée.  In a variant of the embodiment, the value of start_band can be made adaptive around the value of 160, without changing the nature of the invention. The details of the adaptation of the value start_band are not described here because they go beyond the scope of the invention without changing the scope.
Pour certains signaux en bande élargie (échantillonnés à 16 kHz), la bande haute (>6 kHz) peut être bruitée, harmonique ou comporter un mélange de bruit et d'harmoniques. De plus, le niveau d'harmonicité dans la bande 6000-8000 Hz est généralement corrélé à celui des bandes de fréquences inférieures. Ainsi, dans un mode particulier de réalisation, le bloc 502 de génération de bruit, met en œuvre l'étape E402 de la figure 4 et réalise une génération de bruit dans le domaine fréquentiel, ½BN( ) pour k = 240,· · ·, 319 (80 échantillons) correspondant à une deuxième bande de fréquence dite haute fréquence afin de combiner ensuite ce bruit avec le spectre UHBl(k) dans le bloc 503. For some broadband signals (sampled at 16 kHz), the high band (> 6 kHz) may be noisy, harmonic or have a mixture of noise and harmonics. In addition, the level of harmonicity in the 6000-8000 Hz band is generally correlated with that of the lower frequency bands. Thus, in a particular embodiment, the noise generation block 502 implements the step E402 of FIG. 4 and generates a noise generation in the frequency domain, ½ BN () for k = 240, · · ·, 319 (80 samples) corresponding to a second so-called high frequency frequency band in order to then combine this noise with the spectrum U HB1 (k) in the block 503.
Dans un mode de réalisation particulier, le bruit (dans la bande 6000-8000 Hz) est généré de façon pseudo-aléatoire avec un générateur congruentiel linéaire sur 16 bits In a particular embodiment, the noise (in the 6000-8000 Hz band) is generated pseudo-randomly with a 16-bit linear congruent generator
avec la convention que UHBN {2 9) dans la trame courante correspond à la valeur U HBN Q\9) de la trame précédente. Dans des variantes de l'invention, on pourra remplacer cette génération de bruit par d'autres méthodes. Le bloc 503 de combinaison peut être réalisé de différentes façons. De façon privilégiée, on considère un mixage additif adaptatif de la forme : with the convention that U HBN {2 9) in the current frame corresponds to the value U HBN Q \ 9) of the previous frame. In variants of the invention, this noise generation can be replaced by other methods. The combination block 503 can be realized in different ways. In a privileged way, we consider an adaptive additive mix of the form:
UHB2 (k) = βυΗΒΙ (k) + GHBNUHBN (k) , k = 240, · · · , 319 U HB2 (k) = βυ ΗΒΙ (k) + G HBN U HBN (k), k = 240, · · ·, 319
où GHBN est un facteur de normalisation servant à égaliser le niveau d'énergie entre les deux signaux, where G HBN is a normalization factor for equalizing the energy level between the two signals,
319  319
∑ uHB1(k)2 + ε Σ u HB1 (k) 2 + ε
G £ =240  G = 240
HBN 319  HBN 319
∑ UHBN (k)2 + ε Σ U HBN (k) 2 + ε
¾=240  ¾ = 240
avec ε =0.01, et le coefficient (compris entre 0 et 1) est ajusté en fonction de paramètres estimés à partir de la bande basse décodée et le coefficient β (compris entre 0 et 1) dépend de a . with ε = 0.01, and the coefficient (between 0 and 1) is adjusted according to parameters estimated from the decoded low band and the coefficient β (between 0 and 1) depends on a.
Dans un mode de réalisation privilégié on calcule l'énergie du bruit dans trois bandes : 2000-4000 Hz, 4000-6000 Hz et 6000-8000 Hz, avec  In a preferred embodiment, the energy of the noise is calculated in three bands: 2000-4000 Hz, 4000-6000 Hz and 6000-8000 Hz, with
^N2-4 ∑ U ' k) ^ N2-4 Σ U 'k)
eN(80,159)  eN (80.159)
^N4-6 ∑ U '2(k) ^ N4-6 Σ U ' 2 (k)
teN 4((116600,,223399))  teN 4 ((116600,, 223399))
∑ U '2(k) Σ U ' 2 (k)
teN(240,319)  Ten (240.319)
ou or
et N(^, ^2) est l'ensemble des indices k pour lesquels le coefficient d'indice £ est classifié comme étant associé à du bruit. Cet ensemble peut être par exemple obtenu en détectant les pics locaux dans U et en considérant que ces raies ne sont pas associés à du bruit, soit (en appliquant la négation de la condition précédente): and N (^, ^ 2 ) is the set of indices k for which the index coefficient est is classified as being associated with noise. This set can be obtained for example by detecting the local peaks in U and in whereas these lines are not associated with noise, ie (by applying the negation of the previous condition):
N(a, b) = {a≤k≤b \\U + 1)|} N (a, b) = {a≤k≤b \\ U + 1) |}
On peut noter que d'autres méthodes de calcul de l'énergie du bruit sont possibles, par exemple en prenant la valeur médiane du spectre sur la bande considérée ou en appliquant un lissage à chaque raie fréquentielle avant de calculer l'énergie par bande.  It may be noted that other methods of calculating the noise energy are possible, for example by taking the median value of the spectrum on the band in question or by applying a smoothing to each frequency line before calculating the energy per band.
On fixe de telle sorte que le ratio entre l'énergie du bruit dans les bandes 4-6 kHz et 6-8 kHz soit le même qu'entre les bandes 2-4 kHz et 4-6 kHz : = P - E, The ratio of the energy of the noise in the bands 4-6 kHz and 6-8 kHz is set so that between the bands 2-4 kHz and 4-6 kHz: = P - E,
Σ U2(k) - E ou Σ U 2 (k) - E or
El  El
EN4_6 = mzx(EN4_6 , EN2_4), p = p = max(p, EN6_&) E _ 6 N4 = MZX (N4 _ E 6, E N 2 _ 4), p = p = max (p, E N6 _ &)
'N2-4 où max(.,.) est la fonction qui donne le maximum des deux arguments.  'N2-4 where max (.,.) Is the function that gives the maximum of both arguments.
Dans des variantes de l'invention, le calcul de a pourra être remplacé par d'autres méthodes. Par exemple, dans une variante, on pourra extraire (calculer) différents paramètres (ou « features » en anglais) caractérisant le signal en bande basse, dont un paramètre « tilt » similaire à celui calculé dans le codée AMR-WB, et on estimera le facteur a en fonction d'une régression linéaire à partir de ces différents paramètres en limitant sa valeur entre 0 et 1. La régression linéaire pourra par exemple être estimée de façon supervisée en estimant le facteur a en se donnant la bande haute originale dans une base d'apprentissage. On notera que le mode de calcul de ne limite pas la nature de l'invention.  In variants of the invention, the calculation of a may be replaced by other methods. For example, in one variant, it will be possible to extract (calculate) different parameters (or "features" in English) characterizing the low band signal, including a "tilt" parameter similar to that calculated in the AMR-WB codec, and it will be estimated the factor a according to a linear regression from these different parameters by limiting its value between 0 and 1. The linear regression could for example be estimated in a supervised manner by estimating the factor a by giving itself the original high band in a learning base. Note that the calculation method does not limit the nature of the invention.
Dans un mode de réalisation privilégié, on prendIn a preferred embodiment, we take
afin de préserver l'énergie du signal étendu après mixage. to preserve the energy of the extended signal after mixing.
Dans une variante les facteurs β et a pourront être adaptés pour tenir compte du fait qu'un bruit injecté dans une bande donnée du signal est perçu en général comme plus fort qu'un signal harmonique à la même énergie dans la même bande. Ainsi on pourra modifier les facteurs β et or comme suit:  In a variant, the factors β and a may be adapted to take account of the fact that noise injected into a given band of the signal is generally perceived as stronger than a harmonic signal at the same energy in the same band. Thus we can modify the factors β and gold as follows:
β ^ β.ί( ) β ^ β.ί ()
a <- a.f{a) où f{a) est une fonction décroissante de , par exemple f ( ) = b - a Jcc , = 1.1 , a = 1.2 , f (oc) limité de 0.3 à 1. Il faut remarquer qu'après multiplication par f(cc) , a2 + β2 < 1 si bien que l'énergie du signal UHB2 (k) = βυ HBl (k) + ocGHBNU HBN (k) est plus basse que l'énergie de UHB1 (k) (la différence d'énergie dépend de a , plus on rajoute de bruit, plus l'énergie est atténuée). a <- af {a) where f {a) is a decreasing function of, for example f () = b - a Jcc, = 1.1, a = 1.2, f (oc) limited from 0.3 to 1. It should be noted that after multiplication by f (cc ), a 2 + β 2 <1 so that the signal energy U HB2 (k) = βυ HB1 (k) + ocG HBN U HBN (k) is lower than the energy of U HB1 (k) ( the energy difference depends on a, the more noise is added, the more the energy is attenuated).
Dans d'autres variantes de l'invention on pourra prendre :  In other variants of the invention, it will be possible to take:
β = \ - α β = \ - α
ce qui permet de préserver le niveau d'amplitude (quand les signaux combinés sont de même signe) ; cependant cette variante a le désavantage de résulter en une énergie globale (au niveau de UHB2(k) ) qui n'est pas monotone en fonction de . which preserves the amplitude level (when the combined signals are of the same sign); however, this variant has the disadvantage of resulting in a global energy (at U HB2 (k)) which is not monotonic as a function of.
On remarque donc ici que le bloc 503 réalise l'équivalent du bloc 101 de la figure 1 pour normaliser le bruit blanc en fonction d'une excitation qui est par contre ici dans le domaine fréquentiel, déjà étendue à la cadence de 16 kHz ; de plus, le mixage est limité à la bande 6000-8000 Hz.  It should therefore be noted here that the block 503 realizes the equivalent of the block 101 of FIG. 1 to normalize the white noise as a function of an excitation which is on the other hand here in the frequency domain, already extended at the rate of 16 kHz; in addition, the mix is limited to the band 6000-8000 Hz.
Dans une variante simple, on peut considérer une réalisation du bloc 503, où les spectres, UHBl (k) ou GHBNU HBN (k) , sont sélectionnés (commutés) de façon adaptative, ce qui revient à n'autoriser que les valeurs 0 ou 1 pour a ; cette approche revient à classifier le type d'excitation à générer dans la bande 6000-8000 Hz In a simple variant, it is possible to consider an embodiment of block 503, where the spectra, U HB1 (k) or G HBN U HBN (k), are selected (switched) adaptively, which amounts to allowing only the values 0 or 1 for a; this approach amounts to classifying the type of excitation to be generated in the 6000-8000 Hz band
Le bloc 504 réalise de façon optionnelle, une double opération d'application de réponse en fréquence de filtre passe-bande et de filtrage de désaccentuation (ou déemphase) dans le domaine fréquentiel.  The block 504 optionally carries out a dual operation of application of bandpass filter frequency response and deemphasis filtering (or deemphasis) in the frequency domain.
Dans une variante de l'invention, le filtrage de désaccentuation pourra être réalisé dans le domaine temporel, après le bloc 505 voire avant le bloc 500 ; cependant, dans ce cas, le filtrage passe-bande réalisé dans le bloc 504 peut laisser certaines composantes basses fréquences de très faibles niveaux qui se voient amplifier par désaccentuation, ce qui peut modifier de façon légèrement perceptible la bande basse décodée. Pour cette raison, on préfère ici réaliser la désaccentuation dans le domaine fréquentiel. Dans le mode de réalisation privilégié, les coefficients d'indice & = 0, · · · , 199 sont mis à zéro, ainsi la désaccentuation est limitée aux coefficients supérieurs.  In a variant of the invention, the deemphasis filtering may be performed in the time domain, after block 505 or even before block 500; however, in this case, bandpass filtering performed in block 504 may leave some low frequency components of very low levels which are amplified by de-emphasis, which may slightly discern the decoded low band. For this reason, it is preferred here to perform the deemphasis in the frequency domain. In the preferred embodiment, the index coefficients & = 0, · · ·, 199 are set to zero, so the deemphasis is limited to the higher coefficients.
L'excitation est d'abord désaccentuée selon l'équation suivante :  The excitation is first de-emphasized according to the following equation:
UHB 2 55U HB 2 55
19 où Gdeem≠(k) est la réponse en fréquence du filtre l/ (l - 0.68z_1 ) sur une bande de fréquence discrète restreinte. En prenant en compte les fréquences discrètes (impaires) de la DCT-IV, on définit ici Gdeem≠(k) comme: 19 where G deem ≠ (k) is the frequency response of the filter l / (l - 0.68z _1 ) over a restricted discrete frequency band. Taking into account the discrete (odd) frequencies of the DCT-IV, we define here G deem ≠ (k) as:
G→h (k) = 1 , fc = 0.-, 255 G → h (k) = 1 , fc = 0.
e k - 0.68 e k - 0.68
or
256 -80 + £ + - 256 -80 + £ + -
Dans le cas où une autre transformation que la DCT-IV est utilisée, la définition de 6k pourra être ajustée (par exemple pour des fréquences paires). In the case where a transformation other than the DCT-IV is used, the definition of 6 k can be adjusted (for example for even frequencies).
On note que la désaccentuation est appliquée en deux phases pour k = 200,· · -, 255 correspondant à la bande de fréquence 5000-6400 Hz, où la réponse l / (l - 0.68z_1 ) est appliquée comme à 12.8 kHz, et pour k = 256, · · -,319 correspondant à la bande de fréquence 6400-8000 Hz, où la réponse est étendue de 16 kHz ici à une valeur constante dans la bande 6.4-8 kHz. It is noted that the de-emphasis is applied in two phases for k = 200, · · -, 255 corresponding to the frequency band 5000-6400 Hz, where the response l / (l - 0.68z _1 ) is applied as at 12.8 kHz, and for k = 256, · · -, 319 corresponding to the 6400-8000 Hz frequency band, where the response is extended from 16 kHz here to a constant value in the 6.4-8 kHz band.
On peut noter que dans le codée AMR-WB la synthèse HF n'est pas désaccentuée. Dans le mode de réalisation présenté ici, le signal hautes fréquences est au contraire désaccentué de manière à le ramener dans un domaine cohérent avec le signal basses fréquences (0-6.4 kHz) qui sort du bloc 305. Ceci est important pour l'estimation et l'ajustement ultérieur de l'énergie de la synthèse HF.  It may be noted that in the AMR-WB coding the HF synthesis is not de-emphasized. In the embodiment presented here, the high frequency signal is on the contrary de-emphasized so as to bring it back to a domain coherent with the low frequency signal (0-6.4 kHz) coming out of block 305. This is important for the estimation and the subsequent adjustment of the energy of the HF synthesis.
Dans une variante du mode de réalisation, afin de réduire la complexité, on pourra fixer Gdeemph (k) à une valeur constante indépendante de k , en prenant par exempleIn a variant of the embodiment, in order to reduce the complexity, it is possible to fix G deemph (k) at a constant value independent of k, for example by taking
Gdeemph (k) = 0.6 ce qui correspond approximativement à la valeur moyenne de Gdeemph (k) pour k = 200, · · -,319 dans les conditions du mode de réalisation décrit ci-dessus. G deemph (k) = 0.6 which corresponds approximately to the average value of G deemph (k) for k = 200, · · -, 319 under the conditions of the embodiment described above.
Dans une autre variante du mode de réalisation du dispositif d'extension, la désaccentuation pourra être réalisée de façon équivalente dans le domaine temporel après DCT inverse. Une telle réalisation est mise en œuvre à la figure 7 décrite plus loin.  In another variant of the embodiment of the extension device, the de-emphasis can be performed in an equivalent way in the time domain after inverse DCT. Such an embodiment is implemented in Figure 7 described below.
En plus de la désaccentuation, un filtrage passe-bande est appliqué avec deux parties séparées : l'une passe-haut fixe, l'autre passe-bas adaptative (fonction du débit).  In addition to de-emphasis, band-pass filtering is applied with two separate parts: one fixed high-pass, the other adaptive low-pass (flow-rate function).
Ce filtrage est effectué dans le domaine fréquentiel, et sa réponse en fréquence est illustrée à la figure 6. Les fréquences de coupures à 3 dB sont 6000 Hz pour la partie basse et pour la partie haute approximativement 6900, 7300, 7600 Hz à 6.6, 8.86 et aux débits supérieurs à 8.85 kbit/s (respectivement). Dans le mode de réalisation privilégiée, on calcule la réponse partielle de filtre passe- bas dans le domaine fréquentiel comme suit: This filtering is carried out in the frequency domain, and its frequency response is illustrated in FIG. 6. The 3 dB cutoff frequencies are 6000 Hz for the low part and for the high part approximately 6900, 7300, 7600 Hz at 6.6, 8.86 and at rates greater than 8.85 kbit / s (respectively). In the preferred embodiment, the partial low-pass filter response in the frequency domain is calculated as follows:
Gln(k) =1-0.999 k où Nln =60 à 6.6 kbit/s, 40 à 8.85 kbit/s, 20 aux débits >8.85 bit/s. G ln (k) = 1-0.999 k where N ln = 60 to 6.6 kbit / s, 40 to 8.85 kbit / s, at rates> 8.85 bit / s.
Ensuite on applique un filtre passe-bande sous la forme :  Then we apply a bandpass filter in the form:
0 £ = 0,···,199  0 £ = 0, ···, 199
Ghp(k-200)UHB2\k) £ = 200,···, 255 G hp (k-200) HB HB2 \ k) = = 200, ···, 255
UHB3(k) U HB3 (k)
U HB2 (^) £ = 256,---,319-N,r U HB2 ()) = = 256, ---, 319-N, r
[Glp(k -320- Nlv)UHB2\k) * = 320-Nlp,-,319 [G lp (k -320- N lv) U HB2 \ k) * = 320-lp N, -, 319
La définition de Gh (k) , k = 0,···,55, est donnée par exemple au tableau 1 ci-dessous. The definition of G h (k), k = 0, ···, 55, is given for example in Table 1 below.
Tableau 1  Table 1
On notera que dans des variantes de l'invention les valeurs de Ghp(k) pourront être modifiées tout en gardant une atténuation progressive. De même le filtrage passe-bas à largeur de bande variable, Glp(k) , pourra être ajusté avec des valeurs ou un support fréquentiel différents, sans changer le principe de cette étape de filtrage. It will be noted that in variants of the invention the values of G hp (k) may be modified while keeping a gradual attenuation. Similarly, the variable bandwidth low-pass filtering, G lp (k), may be adjusted with different values or frequency support, without changing the principle of this filtering step.
On notera aussi que l'exemple de filtrage passe-bande illustré à la figure 6 pourra être adapté en définissant une seule étape de filtrage combinant les filtrages passe-haut et passe-bas. Dans un autre mode de réalisation, le filtrage passe-bande pourra être réalisé de façon équivalente dans le domaine temporel (comme dans le bloc 112 de la figure 1) avec différents coefficients de filtre selon le débit, après une étape de DCT inverse. Une telle réalisation est mise en œuvre à la figure 7 décrite plus loin. Cependant, on notera qu'il est avantageux de réaliser cette étape directement dans le domaine fréquentiel car le filtrage est effectué dans le domaine de l'excitation LPC et donc les problèmes de convolution circulaire et d'effets de bord sont très limités dans ce domaine. It will also be noted that the bandpass filtering example illustrated in FIG. 6 can be adapted by defining a single filtering step combining the high-pass and low-pass filterings. In another embodiment, the bandpass filtering may be performed equivalently in the time domain (as in block 112 of FIG. 1) with different filter coefficients according to the bit rate, after an inverse DCT step. Such an embodiment is implemented in Figure 7 described below. However, it will be noted that it is advantageous to carry out this step directly in the frequency domain because the filtering is carried out in the field of LPC excitation and therefore the problems of circular convolution and edge effects are very limited in this field. .
Le bloc 505 de transformée inverse réalise une DCT inverse sur 320 échantillons pour trouver l'excitation haute-fréquence échantillonnée à 16 kHz. Sa mise en œuvre est identique au bloc 500, car la DCT-IV est orthonormée, sauf que la longueur de la transformée est de 320 au lieu de 256, et on obtient: The inverse transform block 505 performs an inverse DCT on 320 samples to find the high frequency excitation sampled at 16 kHz. Its implementation is identical to block 500, because the DCT-IV is orthonormed, except that the length of the transform is 320 instead of 256, and we obtain:
où Nl6k = 320 et & = 0, · · ·,319 . where N l6k = 320 and & = 0, · · ·, 319.
Cette excitation échantillonnée à 16 kHz est ensuite de façon optionnelle mise à l'échelle par des gains définis par sous-trame de 80 échantillons (bloc 507). This excitation sampled at 16 kHz is then optionally scaled by gains defined by subframe of 80 samples (block 507).
Dans un mode de réalisation privilégié, on calcule d'abord (bloc 506) un gain gHBi(m) par sous-trame par des ratios d'énergie des sous-trames tel que dans chaque sous-trame d'indice la trame courante: In a preferred embodiment, a gain g H Bi (m) per subframe is first calculated (block 506) by energy ratios of the subframes such that in each subframe the frame common:
or
63  63
∑u(n + 64m)2 + Σu (n + 64m) 2 +
79  79
e2(m) ∑uHB(n + 80m)2 + ε e 2 (m) Σu HB (n + 80m) 2 + ε
319  319
∑uHB (n)2 + Σu HB (n) 2 +
e3 (m) 255e 3 (m) 255
u(n)2 + £ avec ε = 0.01. On peut écrire le gain par sous-trame gHBl (m) sous la forme : u (n) 2 + £ with ε = 0.01. We can write the gain by subframe g HBl (m) in the form:
ce qui montre qu'on assure dans le signal uHB le même ratio entre énergie par sous-trame et énergie par trame que dans le signal u(n) . which shows that the signal u HB has the same ratio between energy per subframe and energy per frame as in the signal u (n).
Le bloc 507 effectue la mise à l'échelle du signal combiné (ou étendu) (étape E406 de la figure 4) selon l'équation suivante:  Block 507 scales the combined (or extended) signal (step E406 of FIG. 4) according to the following equation:
U HB N) = SHBI (M)U HB = 8°m, · · · , 80(m + 1) - 1 U HB N) = S HBI (M) U HB = 8 ° m, · · ·, 80 (m + 1) - 1
On notera que la réalisation du bloc 506 diffère de celle du bloc 101 de la figure 1, car l'énergie au niveau de la trame courante est prise en compte en plus de celle de la sous- trame. Cela permet d'avoir le ratio de l'énergie de chaque sous-trame par rapport à l'énergie de la trame. On compare donc des ratios d'énergie (ou énergies relatives) plutôt que les énergies absolues entre bande basse et bande haute.  Note that the embodiment of the block 506 differs from that of the block 101 of Figure 1, because the energy at the current frame is taken into account in addition to that of the subframe. This makes it possible to have the ratio of the energy of each sub-frame with respect to the energy of the frame. Energy ratios (or relative energies) are compared rather than the absolute energies between low band and high band.
Ainsi, cette étape de mise à l'échelle permet de conserver dans la bande haute le ratio d'énergie entre la sous-trame et la trame de la même façon que dans la bande basse.  Thus, this scaling step makes it possible to keep in the high band the energy ratio between the subframe and the frame in the same way as in the low band.
De façon optionnelle, le bloc 509 effectue ensuite la mise à l'échelle du signal (étape E407 de la figure 4) selon l'équation suivante:  Optionally, block 509 then scales the signal (step E407 of FIG. 4) according to the following equation:
U HB "(«) = SHBI (M)U HB '(«) / N = 8°m, · · · , 80(m + 1) - 1 U HB "(") = S HBI ( M ) U HB '(") / N = 8 ° m, · · ·, 80 (m + 1) - 1
où le gain gHB2 (m) est obtenu à partir du bloc 508 en exécutant les blocs 103, 104 et 105 du codée AMR-WB (l'entrée du bloc 103 étant l'excitation décodée en bande basse, u(n) ). Les blocs 508 et 509 sont utiles pour ajuster le niveau du filtre de synthèse LPC (bloc 510), ici en fonction du tilt du signal. D'autres méthodes de calcul du gain gHB2 (m) sont possibles sans changer la nature de l'invention. where the gain g HB2 (m) is obtained from the block 508 by executing the blocks 103, 104 and 105 of the AMR-WB coding (the input of the block 103 being the decoded excitation in the low band, u (n)) . Blocks 508 and 509 are useful for adjusting the level of the LPC synthesis filter (block 510), here depending on the tilt of the signal. Other methods of calculating the gain g HB2 (m) are possible without changing the nature of the invention.
Enfin, l'excitation, uHB n) ou uHB "(n) , est filtrée (étape E404 de la figure 4) par le module de filtrage 510 qui peut être réalisé ici en prenant comme fonction de transfert 1 / A(zJ Y) , où ^ =0.9 à 6.6 kbit/s et ^ =0.6 aux autres débits, ce qui limite l'ordre du filtre à l'ordre 16. Finally, the excitation, u HB n) or u HB "(n), is filtered (step E404 of FIG. 4) by the filtering module 510 which can be realized here by taking as transfer function 1 / A (zJ Y), where ^ = 0.9 to 6.6 kbit / s and ^ = 0.6 at other rates, which limits the order of the filter to order 16.
Dans une variante, ce filtrage pourra être réalisé de la même façon que ce qui est décrit pour le bloc 111 de la figure 1 du décodeur AMR-WB, cependant l'ordre du filtre passe à 20 au débit de 6.6, ce qui ne change pas de façon significative la qualité du signal synthétisé. Dans une autre variante, on pourra effectuer le filtrage de synthèse LPC dans le domaine fréquentiel, après avoir calculé la réponse en fréquence du filtre mis en œuvre dans le bloc 510. In a variant, this filtering can be done in the same way as described for the block 111 of FIG. 1 of the AMR-WB decoder, however the order of the filter goes to 20 at the rate of 6.6, which does not change. not significantly the quality of the synthesized signal. In another variant, it will be possible to perform LPC synthesis filtering in the domain frequency, after calculating the frequency response of the filter implemented in block 510.
Dans des variantes de réalisation de l'invention, le codage de la bande basse (0-6.4 kHz) pourra être remplacé par un codeur CELP autre que celui utilisé dans AMR-WB, comme par exemple le codeur CELP dans G.718 à 8 kbit/s. Sans perte de généralité d'autres codeurs en bande élargie ou fonctionnant à des fréquences supérieurs à 16 kHz, dans lesquels le codage de la bande basse fonctionne à une fréquence interne à 12.8 kHz pourraient être utilisés. Par ailleurs, l'invention peut être adaptée de façon évidente à d'autres fréquences d'échantillonnage que 12.8 kHz, lorsqu'un codeur de basses fréquences fonctionne à une fréquence d'échantillonnage inférieure à celle du signal original ou reconstruit. Lorsque le décodage en bande basse n'utilise pas de prédiction linéaire, on ne dispose pas d'un signal d'excitation à étendre, dans ce cas on pourra réaliser une analyse LPC du signal reconstruit dans la trame courante et on calculera une excitation LPC de manière à pouvoir appliquer l'invention.  In alternative embodiments of the invention, the coding of the low band (0-6.4 kHz) may be replaced by a CELP coder other than that used in AMR-WB, for example the CELP coder in G.718 to 8. kbit / s. Without loss of generality other encoders in wide band or operating at frequencies higher than 16 kHz, in which the coding of the low band operates at an internal frequency at 12.8 kHz could be used. Moreover, the invention can be obviously adapted to other sampling frequencies than 12.8 kHz, when a low frequency encoder operates at a sampling frequency lower than that of the original or reconstructed signal. When the low band decoding does not use a linear prediction, it does not have an excitation signal to be extended, in this case it will be possible to carry out an LPC analysis of the reconstructed signal in the current frame and calculate an LPC excitation. so as to be able to apply the invention.
Enfin, dans une autre variante de l'invention, l'excitation ( u(n) ) est rééchantillonnée, par exemple par interpolation linéaire ou "spline" cubique, de 12.8 à 16 kHz avant transformation (par exemple DCT-IV) de longueur 320. Cette variante a le défaut d'être plus complexe, car la transformée (DCT-IV) de l'excitation est alors calculée sur une plus grande longueur et le ré-échantillonnage n'est pas effectué dans le domaine de la transformée.  Finally, in another variant of the invention, the excitation (u (n)) is resampled, for example by linear interpolation or cubic "spline", from 12.8 to 16 kHz before transformation (for example DCT-IV) of length 320. This variant has the defect of being more complex, because the transform (DCT-IV) of the excitation is then calculated over a greater length and the resampling is not carried out in the field of the transform.
De plus, dans des variantes de l'invention, tous les calculs nécessaires à l'estimation des gains { GHBN , gHBl (m) , gHB2(m) , gHBN , ...) pourront être effectués dans un domaine logarithmique. Moreover, in variants of the invention, all the calculations necessary for the estimation of the gains {G HBN , g HB1 (m), g HB2 (m), g HBN , ...) can be carried out in a field logarithmic.
En référence à la figure 7, un deuxième mode de réalisation du dispositif d'extension de bande est maintenant décrit. Ce mode de réalisation fonctionne dans le domaine temporel.  Referring to Fig. 7, a second embodiment of the tape extender is now described. This embodiment operates in the time domain.
Comme dans le mode de réalisation de la figure 5, le principe du mode de réalisation avec mixage d'un signal étendu à 16 kHz et d'un signal de bruit est conservé, cependant ce mélange est cette fois réalisé dans le domaine temporel et cette fois-ci la génération principale de l'excitation se fait par sous-trame et non par trame.  As in the embodiment of FIG. 5, the principle of the embodiment with mixing of a signal extended to 16 kHz and of a noise signal is retained, however this mixture is this time realized in the time domain and this once the main generation of the excitation is done by subframe and not by frame.
Le signal d'excitation u(n) , η = 0,· · · , 255 , issu du décodage basse fréquence dans la trame courante est d'abord ré-échantillonné sans retard (étape E401 de la figure 4) à 16 kHz (bloc 700) et dans un mode de réalisation particulier, une interpolation linéaire est utilisée pour obtenir le signal d'excitation étendu dans une deuxième bande de fréquence, uext(n) , η = 0,· · · ,319 . Dans une variante de réalisation, on pourra utiliser d'autres méthodes de ré-échantillonnage, par exemple par "splines" ou par filtrage multi-cadences. The excitation signal u (n), η = 0, · · ·, 255, resulting from the low frequency decoding in the current frame is first resampled without delay (step E401 of FIG. 4) at 16 kHz ( block 700) and in a particular embodiment, a linear interpolation is used to obtain the extended excitation signal in a second frequency band, u ext (n), η = 0, · · ·, 319. In an alternative embodiment, it will be possible to use other resampling methods, for example by "splines" or by multi-rate filtering.
On s'assure que l'énergie du signal uext (n) a un niveau similaire à l'excitation u(n) avec les blocs 701 et 702 de la façon suivante: It is ensured that the energy of the signal u ext (n) has a level similar to the excitation u (n) with the blocks 701 and 702 as follows:
Dans une variante de réalisation on pourra multiplier u 'ext (n) par 5/4 pour compenser l'atténuation par le ratio 12.8/16 , causée par différentes fréquences d'échantillonnage de signaux uext(n) et u(n) . In an alternative embodiment it is possible to multiply u ' ext (n) by 5/4 to compensate the attenuation by the ratio 12.8 / 16, caused by different signal sampling frequencies u ext (n) and u (n).
Le générateur de bruit dans le bloc 703 met en œuvre l'étape E402 de la figure 4 et peut être réalisé comme dans le bloc 502 décrit en figure 5, sauf que le signal en sortie correspond à une sous-trame temporelle, uHBN (n), η = 0,· · · ,319 The noise generator in the block 703 implements the step E402 of FIG. 4 and can be made as in the block 502 described in FIG. 5, except that the output signal corresponds to a temporal subframe , u HBN ( FIG. n), η = 0, · · ·, 319
Le bloc 704 de combinaison peut être réalisé de différentes façons. De façon privilégiée, on considère un mixage additif adaptatif par sous-trame de la forme :  The combination block 704 can be realized in different ways. In a privileged way, we consider an adaptive additive mix by subframe of the form:
uHBl (n + 80m) = βιι€Χί (n + 80m) + agHBNuHBN (n + 80m) , n = 0, · · · , 79 u HB1 (n + 80m) = βιι € Χί (n + 80m) + ag HBN u HBN (n + 80m), n = 0, · · ·, 79
où § est un facteur de normalisation servant à égaliser le niveau d'harmonicité des deux signaux combinés where § is a f ac t eur Standards for equalizing the level of harmonicity of the two combined signals
+ £
k=0  k = 0
> HBN  > HBN
UHBN (n + ε U HB N ( n + ε
k=0 et m est l'indice de la sous-trame et les facteurs et β sont calculés comme dans le premier mode de réalisation. On remarque donc ici que le bloc 704 réalise l'équivalent du bloc 101 de la figure 1. De plus, le calcul du facteur oblige à calculer la transformée du signal d'excitation décodé (ou le signal décodé lui-même selon le domaine de calcul du niveau relatif de bruit ou de planéité spectrale dite "spectral flatness" en anglais) en bande basse si ce calcul repose sur la planéité spectrale ; dans des variantes, dont l'utilisation d'une régression linéaire décrite précédemment, une telle transformée n'est pas nécessaire.  k = 0 and m is the index of the subframe and the factors and β are calculated as in the first embodiment. It should be noted here that the block 704 realizes the equivalent of the block 101 of FIG. 1. Moreover, the calculation of the factor obliges to calculate the transform of the decoded excitation signal (or the decoded signal itself according to the domain of FIG. calculation of the relative level of noise or flatness spectral flatness "spectral flatness" in English) in low band if this calculation rests on the spectral flatness; in variants, including the use of a linear regression described above, such a transform is not necessary.
Ensuite le signal temporel est désaccentué (bloc 705) par un filtre de la forme ^^ / (! -O-68^1 ) ' ou 8 deemph est calculé de sorte à prolonger le filtre 1 / (l - 0.68z_1 ) (défini à 12.8 kHz) à la fréquence d'échantillonnage de 16 kHz = |(l - 0.68e^2"6000/16000 ) / (l - o.68e^2"6000/12800 )| , puis traité par un filtrage passe- bande de largeur de bande variable (bloc 706) dont l'ordre est fixe (de valeur 30) mais les coefficients changent en fonction du débit de décodage de la trame courante. Un exemple de réalisation d'un tel filtrage passe-bande adaptatif de type FIR est donné aux tableaux ci-dessous définissant la réponse impulsionnelle du filtre FIR selon le débit. Then the time signal is deemphasized (block 705) by a filter of the form ^^ / (! -O- 68 ^ 1 ) where 8 deemph is calculated so as to extend the filter 1 / (l - 0.68z _1 ) ( defined at 12.8 kHz) at the sampling frequency of 16 kHz = | (l - 0.68e ^ 2 " 6000/16000 ) / (l - o.68 e ^ 2 " 6000/12800 ) | , then processed by bandwidth filtering variable bandwidth (block 706) whose order is fixed (value 30) but the coefficients change depending on the decoding rate of the current frame. An exemplary embodiment of such type FIR adaptive bandpass filtering is given in the tables below defining the impulse response of the FIR filter according to the bit rate.
Tableau 2c (débits >8.85 kbit/s)  Table 2c (bitrates> 8.85 kbit / s)
L'étape de mise à l'échelle (E407 à la figure 4) est effectuée par les blocs 508 et 509 identiques à la figure 5. L'étape de filtrage (E404 de la figure 4) est effectuée par le module de filtrage (bloc 510) identique à celui décrit en référence à la figure 5. The scaling step (E407 in FIG. 4) is performed by blocks 508 and 509 identical to FIG. The filtering step (E404 of FIG. 4) is performed by the filtering module (block 510) identical to that described with reference to FIG. 5.
Il n'est pas utile ici de mettre en œuvre une étape de mise à l'échelle comme effectué dans le mode de réalisation de la figure 5 par les blocs 506 et 507 puisque l'excitation est générée par sous-trames. La cohérence du ratio d'énergie au niveau de la trame est déjà assurée.  It is not useful here to implement a scaling step as performed in the embodiment of Fig. 5 by blocks 506 and 507 since the excitation is generated by subframes. The coherence of the energy ratio at the level of the frame is already assured.
Dans des variantes de l'invention, l'excitation en bande basse u(n) et le filtre LPC 1 / Â(z) seront estimés par trame, par analyse LPC d'un signal en bande basse dont la bande doit être étendue. Le signal d'excitation bande basse est alors extrait par analyse du signal audio.  In variations of the invention, the low band excitation u (n) and the LPC 1 / λ filter (z) will be estimated per frame, by LPC analysis of a low band signal whose band must be extended. The low band excitation signal is then extracted by analyzing the audio signal.
Dans un mode possible de réalisation de cette variante, le signal audio bande basse est ré-échantillonné avant l'étape d'extraction de l'excitation, si bien que l'excitation extraite du signal audio (par prédiction linéaire) est déjà ré-échantillonnée.  In a possible embodiment of this variant, the low band audio signal is resampled before the excitation extraction step, so that the excitation extracted from the audio signal (by linear prediction) is already resolved. sampled.
L'invention illustrée à la figure 5, ou alternativement à la figure 7, s'applique dans ce cas à une bande basse qui n'est pas décodée mais analysée.  The invention illustrated in FIG. 5, or alternatively in FIG. 7, applies in this case to a low band which is not decoded but analyzed.
La figure 8 représente un exemple de réalisation matérielle d'un dispositif de d'extension de bande 800 selon l'invention. Celui-ci peut faire partie intégrante d'un décodeur de signal audiofréquence ou d'un équipement recevant des signaux audiofréquences décodés ou non. FIG. 8 represents an exemplary hardware embodiment of a band extension device 800 according to the invention. This may be an integral part of an audio-frequency signal decoder or equipment receiving decoded or non-decoded audio signals.
Ce type de dispositif comporte un processeur PROC coopérant avec un bloc mémoire This type of device comprises a PROC processor cooperating with a memory block
BM comportant une mémoire de stockage et/ou de travail MEM. BM having a memory storage and / or working MEM.
Un tel dispositif comporte un module d'entrée E apte à recevoir un signal audio d'excitation décodé ou extrait dans une première bande de fréquence dite bande basse ( u(n) ou U(k) ) et les paramètres d'un filtre de synthèse de prédiction linéaire ( A(z) ). Il comporte un module de sortie S apte à transmettre le signal haute fréquence synthétisé (HF_syn) par exemple à un module d'application d'un retard comme le bloc 310 de la figure 3 ou à un module de ré-échantillonnage comme le module 311.  Such a device comprises an input module E able to receive a decoded or extracted excitation audio signal in a first so-called low band frequency band (u (n) or U (k)) and the parameters of a filter of linear prediction synthesis (A (z)). It comprises an output module S adapted to transmit the synthesized high frequency signal (HF_syn) for example to a delay application module such as block 310 of FIG. 3 or to a resampling module such as module 311 .
Le bloc mémoire peut avantageusement comporter un programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé de d'extension de bande au sens de l'invention, lorsque ces instructions sont exécutées par le processeur PROC, et notamment les étapes d'obtention d'un signal étendu dans au moins une deuxième bande de fréquence supérieure à la première bande de fréquence à partir d'un signal d'excitation sur-échantillonné et étendu dans au moins une deuxième bande de fréquence, de mise à l'échelle du signal étendu par un gain défini par sous-trame en fonction d'un ratio d'énergie d'une trame et d'une sous-trame et de filtrage dudit signal étendu mis à l'échelle par un filtre de prédiction linéaire dont les coefficients sont dérivés des coefficients du filtre de la bande basse. Typiquement, la description de la figure 4 reprend les étapes d'un algorithme d'un tel programme informatique. Le programme informatique peut également être stocké sur un support mémoire lisible par un lecteur du dispositif ou téléchargeable dans l'espace mémoire de celui-ci. The memory block may advantageously comprise a computer program comprising code instructions for implementing the steps of the band extension method in the sense of the invention, when these instructions are executed by the processor PROC, and in particular the steps for obtaining an extended signal in at least a second frequency band greater than the first frequency band from an oversampled and extended excitation signal in at least a second frequency band, scaling of the signal extended by a subframe defined gain based on a frame and subframe energy ratio and filtering said extended signal scaled by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter. Typically, the description of FIG. 4 repeats the steps of an algorithm of such a computer program. The computer program can also be stored on a memory medium readable by a reader of the device or downloadable in the memory space thereof.
La mémoire MEM enregistre de manière générale, toutes les données nécessaires à la mise en œuvre du procédé.  The memory MEM generally records all the data necessary for the implementation of the method.
Dans un mode possible de réalisation, le dispositif ainsi décrit peut également comporter les fonctions de décodage bande basse et autre fonctions de traitement décrites par exemple en figure 3 en plus des fonctions d'extension de bande selon l'invention.  In a possible embodiment, the device thus described may also comprise the low band decoding functions and other processing functions described for example in FIG. 3 in addition to the band extension functions according to the invention.

Claims

REVENDICATIONS
Procédé d'extension de bande de fréquence d'un signal audiofréquence lors d'un processus de décodage ou d'amélioration comportant une étape de décodage ou d'extraction, dans une première bande de fréquence dite bande basse, d'un signal d'excitation et des coefficients d'un filtre de prédiction linéaire, le procédé étant caractérisé en ce qu'il comporte les étapes suivantes: A method of extending the frequency band of an audiofrequency signal during a decoding or improvement process comprising a decoding or extraction step, in a first so-called low band frequency band, of a signal of excitation and coefficients of a linear prediction filter, the method being characterized in that it comprises the following steps:
- obtention d'un signal étendu (UHB2(k), E403)) dans au moins une deuxième bande de fréquence supérieure à la première bande de fréquence à partir d'un signal d'excitation sur-échantillonné et étendu dans au moins une deuxième bande de fréquence (UHBi(k), E401); obtaining an extended signal (U H B2 (k), E403) in at least one second frequency band greater than the first frequency band from an oversampled and extended excitation signal in at least a second frequency band (U H Bi (k), E401);
- mise à l'échelle (E406) du signal étendu par un gain défini par sous-trame en fonction d'un ratio d'énergie d'une trame et d'une sous-trame;  scaling (E406) the extended signal by a gain defined by subframe according to a ratio of energy of a frame and a subframe;
- filtrage (E404) dudit signal étendu mis à l'échelle par un filtre de prédiction linéaire dont les coefficients sont dérivés des coefficients du filtre de la bande basse.  filtering (E404) said extended signal scaled by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter.
Procédé selon la revendication 1, caractérisé en ce qu'il comporte en outre une étape de filtrage (E405) passe-bande adaptatif en fonction du débit de décodage de la trame courante. Method according to claim 1, characterized in that it further comprises an adaptive bandpass filtering step (E405) as a function of the decoding rate of the current frame.
Procédé selon la revendication 1, caractérisé en ce qu'il comporte une étape de transformée temps-fréquence du signal d'excitation, l'étape d'obtention d'un signal étendu s'effectuant alors dans le domaine fréquentiel et une étape de transformée temps-fréquence inverse du signal étendu avant les étapes de mise à l'échelle et de filtrage. Method according to Claim 1, characterized in that it comprises a step of transforming the time-frequency of the excitation signal, the step of obtaining an extended signal then taking place in the frequency domain and a transforming step inverse time-frequency of the extended signal before the scaling and filtering steps.
Procédé selon la revendication 3, caractérisé en ce que l'étape de génération d'un signal d'excitation sur-échantillonné et étendu est effectuée selon l'équation suivante: Method according to claim 3, characterized in that the step of generating an oversampled and extended excitation signal is performed according to the following equation:
UHBl (k) =U HBl (k) =
avec k l'indice de l'échantillon, UHBI (k) le spectre du signal d'excitation étendu, U(k) le spectre du signal d'excitation obtenu après l'étape de transformée et start_band une variable prédéfinie. with k the index of the sample, U H BI (k) the spectrum of the extended excitation signal, U (k) the spectrum of the excitation signal obtained after the transforming step and start_band a predefined variable.
5. Procédé selon l'une des revendications 1 à 4, caractérisé en ce qu'il comporte une étape de filtrage de désaccentuation du signal étendu au moins dans la deuxième bande de fréquence. 5. Method according to one of claims 1 to 4, characterized in that it comprises a de-emphasis filtering step of the extended signal at least in the second frequency band.
6. Procédé selon la revendication 1, caractérisé en ce qu'il comporte en outre une étape de génération (E402) d'un signal de bruit au moins dans la deuxième bande de fréquence le signal étendu (UHB2(k)) étant obtenu par combinaison (E403) du signal d'excitation étendu et du signal de bruit. 6. Method according to claim 1, characterized in that it further comprises a step of generating (E402) a noise signal at least in the second frequency band the extended signal (U H B2 (k)) being obtained by combining (E403) the extended excitation signal and the noise signal.
7. Procédé selon la revendication 6, caractérisé en ce que l'étape de combinaison s'effectue par mixage additif adaptatif avec un gain d'égalisation de niveau entre le signal d'excitation étendu et le signal de bruit. 7. Method according to claim 6, characterized in that the combining step is carried out by adaptive additive mixing with a level equalization gain between the extended excitation signal and the noise signal.
8. Dispositif d'extension de bande de fréquence d'un signal audiofréquence comportant une étage de décodage ou d'extraction, dans une première bande de fréquence dite bande basse, d'un signal d'excitation et des coefficients d'un filtre de prédiction linéaire, le dispositif étant caractérisé en ce qu'il comporte: 8. A frequency band extension device for an audiofrequency signal comprising a decoding or extraction stage, in a first so-called low-band frequency band, of an excitation signal and coefficients of a radio frequency filter. linear prediction, the device being characterized in that it comprises:
- un module d'obtention d'un signal étendu (UHB2(k), 503)) dans au moins une deuxième bande de fréquence supérieure à la première bande de fréquence à partir d'un signal d'excitation sur-échantillonné et étendu dans au moins une deuxième bande de fréquence (UHBi(k)); a module for obtaining an extended signal (U H B2 (k), 503) in at least a second frequency band greater than the first frequency band from an oversampled excitation signal and extended in at least a second frequency band (U H Bi (k));
- un module de mise à l'échelle (507) du signal étendu par un gain défini par sous-trame en fonction d'un ratio d'énergie par trame et sous-trame du signal audiofréquence dans la première bande de fréquence;  - a scaling module (507) of the signal extended by a gain defined by subframe according to a ratio of energy per frame and subframe of the audiofrequency signal in the first frequency band;
- un module de filtrage (510) dudit signal étendu mis à l'échelle par un filtre de prédiction linéaire dont les coefficients sont dérivés des coefficients du filtre de la bande basse.  a filtering module (510) of said extended signal scaled by a linear prediction filter whose coefficients are derived from the coefficients of the low band filter.
9. Décodeur de signal audiofréquence caractérisé en ce qu'il comporte un dispositif d'extension de bande de fréquence conforme à la revendication 8. 9. Audio frequency signal decoder characterized in that it comprises a frequency band extension device according to claim 8.
10. Programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé d'extension de bande de fréquence selon l'une des revendications 1 à 7, lorsque ces instructions sont exécutées par un processeur. Computer program comprising code instructions for implementing the steps of the frequency band extension method according to one of claims 1 to 7, when these instructions are executed by a processor.
11. Support de stockage lisible par un dispositif d'extension de bande de fréquence sur lequel est enregistré un programme informatique comprenant des instructions de code pour l'exécution des étapes du procédé d'extension de bande de fréquence selon l'une des revendications 1 à 7. 11. Storage medium readable by a frequency band extension device on which is recorded a computer program comprising code instructions for performing the steps of the frequency band extension method according to one of claims 1 to 1. at 7.
EP14742262.0A 2013-06-25 2014-06-24 Improved frequency band extension in an audio signal decoder Active EP3014611B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1356100A FR3007563A1 (en) 2013-06-25 2013-06-25 ENHANCED FREQUENCY BAND EXTENSION IN AUDIO FREQUENCY SIGNAL DECODER
PCT/FR2014/051563 WO2014207362A1 (en) 2013-06-25 2014-06-24 Improved frequency band extension in an audio signal decoder

Publications (2)

Publication Number Publication Date
EP3014611A1 true EP3014611A1 (en) 2016-05-04
EP3014611B1 EP3014611B1 (en) 2019-03-13

Family

ID=49151174

Family Applications (1)

Application Number Title Priority Date Filing Date
EP14742262.0A Active EP3014611B1 (en) 2013-06-25 2014-06-24 Improved frequency band extension in an audio signal decoder

Country Status (6)

Country Link
US (1) US9911432B2 (en)
EP (1) EP3014611B1 (en)
CN (1) CN105324814B (en)
ES (1) ES2724576T3 (en)
FR (1) FR3007563A1 (en)
WO (1) WO2014207362A1 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TR201901336T4 (en) 2010-04-09 2019-02-21 Dolby Int Ab Mdct-based complex predictive stereo coding.
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10249307B2 (en) 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
CN107886966A (en) * 2017-10-30 2018-04-06 捷开通讯(深圳)有限公司 Terminal and its method for optimization voice command, storage device
EP3553777B1 (en) * 2018-04-09 2022-07-20 Dolby Laboratories Licensing Corporation Low-complexity packet loss concealment for transcoded audio signals
CN110660409A (en) * 2018-06-29 2020-01-07 华为技术有限公司 Method and device for spreading spectrum
CN110556122B (en) * 2019-09-18 2024-01-19 腾讯科技(深圳)有限公司 Band expansion method, device, electronic equipment and computer readable storage medium

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10041512B4 (en) 2000-08-24 2005-05-04 Infineon Technologies Ag Method and device for artificially expanding the bandwidth of speech signals
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
SE522553C2 (en) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandwidth extension of acoustic signals
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
EP1451812B1 (en) * 2001-11-23 2006-06-21 Koninklijke Philips Electronics N.V. Audio signal bandwidth extension
ES2259158T3 (en) * 2002-09-19 2006-09-16 Matsushita Electric Industrial Co., Ltd. METHOD AND DEVICE AUDIO DECODER.
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
KR100707174B1 (en) * 2004-12-31 2007-04-13 삼성전자주식회사 High band Speech coding and decoding apparatus in the wide-band speech coding/decoding system, and method thereof
WO2006107837A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
KR101171098B1 (en) * 2005-07-22 2012-08-20 삼성전자주식회사 Scalable speech coding/decoding methods and apparatus using mixed structure
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8831958B2 (en) * 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
FR2947945A1 (en) * 2009-07-07 2011-01-14 France Telecom BIT ALLOCATION IN ENCODING / DECODING ENHANCEMENT OF HIERARCHICAL CODING / DECODING OF AUDIONUMERIC SIGNALS
EP2502230B1 (en) * 2009-11-19 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Improved excitation signal bandwidth extension
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
HUE052882T2 (en) * 2011-02-15 2021-06-28 Voiceage Evs Llc Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a celp codec
WO2012131438A1 (en) * 2011-03-31 2012-10-04 Nokia Corporation A low band bandwidth extender
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal

Also Published As

Publication number Publication date
FR3007563A1 (en) 2014-12-26
ES2724576T3 (en) 2019-09-12
CN105324814B (en) 2019-06-04
US9911432B2 (en) 2018-03-06
CN105324814A (en) 2016-02-10
WO2014207362A1 (en) 2014-12-31
EP3014611B1 (en) 2019-03-13
US20160133273A1 (en) 2016-05-12

Similar Documents

Publication Publication Date Title
EP3014611B1 (en) Improved frequency band extension in an audio signal decoder
EP3020043B1 (en) Optimized scale factor for frequency band extension in an audiofrequency signal decoder
EP3103116B1 (en) Improved frequency band extension in an audio signal decoder
RU2390856C2 (en) Systems, methods and devices for suppressing high band-pass flashes
WO2007096552A2 (en) Method for trained discrimination and attenuation of echoes of a digital signal in a decoder and corresponding device
FR2907586A1 (en) Digital audio signal e.g. speech signal, synthesizing method for adaptive differential pulse code modulation type decoder, involves correcting samples of repetition period to limit amplitude of signal, and copying samples in replacing block
EP2347411A1 (en) Pre-echo attenuation in a digital audio signal
WO2014009657A1 (en) Processing method for improving the quality of audio frequency signals

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20160122

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAX Request for extension of the european patent (deleted)
RIN1 Information on inventor provided before grant (corrected)

Inventor name: RAGOT, STEPHANE

Inventor name: KANIEWSKA, MAGDALENA

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: GRANT OF PATENT IS INTENDED

INTG Intention to grant announced

Effective date: 20181106

RIN1 Information on inventor provided before grant (corrected)

Inventor name: KANIEWSKA, MAGDALENA

Inventor name: RAGOT, STEPHANE

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE PATENT HAS BEEN GRANTED

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

Ref country code: AT

Ref legal event code: REF

Ref document number: 1108804

Country of ref document: AT

Kind code of ref document: T

Effective date: 20190315

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602014042825

Country of ref document: DE

REG Reference to a national code

Ref country code: NL

Ref legal event code: MP

Effective date: 20190313

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190613

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190613

Ref country code: RS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190614

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

REG Reference to a national code

Ref country code: ES

Ref legal event code: FG2A

Ref document number: 2724576

Country of ref document: ES

Kind code of ref document: T3

Effective date: 20190912

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 1108804

Country of ref document: AT

Kind code of ref document: T

Effective date: 20190313

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190713

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SM

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602014042825

Country of ref document: DE

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190713

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

26N No opposition filed

Effective date: 20191216

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

REG Reference to a national code

Ref country code: BE

Ref legal event code: MM

Effective date: 20190630

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20190624

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20190630

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20190630

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20190624

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20190630

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO

Effective date: 20140624

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20190313

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20230523

Year of fee payment: 10

Ref country code: FR

Payment date: 20230524

Year of fee payment: 10

Ref country code: DE

Payment date: 20230523

Year of fee payment: 10

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20230523

Year of fee payment: 10

Ref country code: ES

Payment date: 20230703

Year of fee payment: 10