WO2009109139A1 - 超宽带扩展编码、解码方法、编码器及超宽带扩展系统 - Google Patents

超宽带扩展编码、解码方法、编码器及超宽带扩展系统 Download PDF

Info

Publication number
WO2009109139A1
WO2009109139A1 PCT/CN2009/070651 CN2009070651W WO2009109139A1 WO 2009109139 A1 WO2009109139 A1 WO 2009109139A1 CN 2009070651 W CN2009070651 W CN 2009070651W WO 2009109139 A1 WO2009109139 A1 WO 2009109139A1
Authority
WO
WIPO (PCT)
Prior art keywords
coefficient
frequency
mdct
signal
band
Prior art date
Application number
PCT/CN2009/070651
Other languages
English (en)
French (fr)
Inventor
肖玮
刘泽新
马付伟
吴文海
王庭红
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2009109139A1 publication Critical patent/WO2009109139A1/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Definitions

  • the present invention relates to the field of voice communication technologies, and in particular, to an ultra-wideband extension coding, decoding method, an encoder, a decoder, and an ultra-wideband extension system. Background technique
  • the band extension technology for real-time voice communication mainly uses the Time Domain Bandwidth Extension (TD-BWE) to achieve narrowband speech signal expansion from 0 to 3.4 kHz at a lower code rate.
  • TD-BWE Time Domain Bandwidth Extension
  • the prior art extends the narrowband speech signal from 0 to 3.4 kHz to 0 to 7 kHz, and only completes the band extension of less than 4 kHz, and the decoded
  • the speech signal lacks an ultra-wideband signal above 7 kHz, so the audio quality is still not greatly improved;
  • the excitation signal used in the band extension is derived from the speech generation model and cannot be accurate. Describe the music signal, the coding effect on the music-like signal is relatively poor, and the reuse effect in the ultra-wideband part is not good.
  • a first object of the embodiments of the present invention is to provide an ultra-wideband extended coding method and an encoder, which are capable of reconstructing a residual frequency domain coding coefficient of 7k to 8 kHz and a band extension parameter capable of reconstructing a high frequency signal of 8k to 14 kHz. .
  • a second object of the embodiments of the present invention is to provide an ultra-wideband extended decoding method and a decoder for realizing reconstruction of a high frequency signal of 7k to 14 kHz, and obtaining an ultra-wideband signal of 0 to 14 kHz.
  • a third object of the embodiments of the present invention is to provide an ultra-wideband extension system to implement a frequency band extension of 7k to 14 kHz.
  • an embodiment of the present invention provides an ultra-wideband extended coding method, including:
  • an embodiment of the present invention further provides an ultra-wideband extended encoder, including:
  • a quadrature image analysis filter for splitting the ultra-wideband speech signal into a high frequency sub-band signal and a low frequency sub-band signal
  • a core layer encoder configured to perform speech coding on the low frequency subband signal to obtain a low frequency signal parameter
  • a core layer decoder configured to perform low-frequency signal parameters obtained by performing speech coding on the low-frequency sub-band signal, and performing speech decoding to obtain a low-band recovery signal
  • a low frequency MDCT module configured to perform MDCT transform on the low band recovery signal to obtain a low frequency MDCT recovery coefficient
  • a broadband enhancement module configured to perform broadband enhancement on the low-band recovery signal to obtain a residual MDCT coefficient and a residual MDCT coding coefficient
  • a perceptual weighting processing module configured to perform perceptual weighting on the low frequency MDCT recovery coefficient and the residual MDCT coefficient according to the low frequency subband signal to obtain a template MDCT coefficient
  • a spectrum folding module configured to perform spectrum folding on the high frequency sub-band signal
  • a high frequency MDCT module for performing MDCT transform on the spectrally folded high frequency sub-band signal to obtain a high frequency MDCT coefficient
  • a high-band ultra-wideband extension processor configured to match the template MDCT coefficient and the high-frequency MDCT coefficient according to a minimum mean square error principle to obtain a band extension parameter
  • a multiplexer configured to transmit the low frequency signal parameter, the residual MDCT coding coefficient, and the encoded frequency band extension parameter.
  • an embodiment of the present invention further provides an ultra-wideband extended decoding method, including:
  • the low frequency sub-band recovery signal and the high frequency sub-band recovery signal are combined to obtain an ultra-wideband speech recovery signal.
  • an embodiment of the present invention further provides an ultra-wideband extension decoder, including:
  • a demultiplexer configured to receive the low frequency signal parameter, the residual MDCT coding coefficient, and the encoded error parameter
  • a core layer decoder configured to decode the received low frequency signal parameter to obtain a low band recovery signal
  • a high-band ultra-wideband extension decoder configured to decode the received coded band extension parameter to obtain a band extension recovery parameter
  • An MDCT module configured to perform MDCT transform on the low-band recovery signal to obtain a low-frequency MDCT recovery coefficient
  • a superimposing module configured to superimpose the low frequency MDCT recovery coefficient and the residual MDCT recovery coefficient to obtain a low band enhanced MDCT coefficient
  • a low frequency IMDCT module configured to perform an IMDCT transform on the lowband enhanced MDCT coefficients to obtain a low frequency subband recovery signal
  • a perceptual weighting processing module configured to perform perceptual weighting on the low-band enhanced MDCT coefficients according to the low-frequency sub-band recovery signal, to obtain a template MDCT recovery coefficient
  • a high-band ultra-wideband extended inverse processor configured to reconstruct a high-frequency MDCT recovery coefficient according to the template MDCT recovery coefficient and the band extension recovery parameter;
  • a high frequency IMDCT module configured to perform IMDCT conversion on the high frequency MDCT recovery coefficient
  • a spectrum folding module configured to frequency-fold the high frequency MDCT recovery coefficient subjected to IMDCT transformation to obtain a high frequency sub-band recovery signal
  • a quadrature mirror synthesis filter is configured to combine the low frequency sub-band recovery signal and the high frequency sub-band recovery signal to obtain an ultra-wideband speech recovery signal.
  • the above decoding scheme decodes the residual frequency domain coding coefficients to obtain a residual frequency domain recovery coefficient of 7k ⁇ 8kHz, spreads the 0 ⁇ 7kHz signal to 0 ⁇ 8kHz, and perceives the extended low-band enhanced frequency domain coefficients.
  • the template of reconstructing the frequency of 8k ⁇ 14kHz high frequency signal is obtained by weighting, and the band expansion recovery parameter is applied to the template to reconstruct the 8k ⁇ 14kHz signal, thus realizing the reconstruction of the high frequency signal from 7k ⁇ 14kHz, and obtaining 0 ⁇
  • the 14kHz ultra-wideband signal greatly enriches the signal content and improves the audio quality.
  • an embodiment of the present invention further provides an ultra-wideband extension system, including: any of the ultra-wideband extension encoders in the foregoing embodiments, and any ultra-wideband extension solution in the foregoing embodiment. Code.
  • the scheme can obtain residual MDCT coding coefficients for reconstructing 7k ⁇ 8kHz and frequency band extension parameters for reconstructing 8k ⁇ 14kHz high frequency signals by using the ultra-wideband extension coder in the above embodiment, and the ultra-wideband extension decoder
  • the 7k ⁇ 8kHz signal can be reconstructed by using the residual MDCT coding coefficient, and the 8k ⁇ 14kHz high frequency signal is reconstructed by the band extension parameter, which realizes the ultra-wideband extension of 7k ⁇ 14kHz, which greatly enriches the signal content and improves the audio quality.
  • FIG. 2 is a flowchart of an embodiment of an ultra-wideband extension coding method according to the present invention
  • FIG. 3 is a flowchart of an embodiment of an ultra-wideband extension decoding method according to the present invention.
  • FIG. 4 is a schematic structural diagram of an embodiment of an ultra-wideband extension encoder according to the present invention.
  • FIG. 5 is a schematic structural diagram of an embodiment of an ultra-wideband extension decoder according to the present invention. detailed description
  • the following embodiments of the present invention achieve ultra-wideband extension based on the correlation between low frequency and high frequency of the signal.
  • the existing speech codec standard can be used in the speech codec.
  • the G.729.1 codec standard is taken as an example for description.
  • FIG 2 ultra wideband extension coding method flowchart of an embodiment of the present invention comprises: 101, ultra wideband speech signal input as 0 ⁇ 16kHz step 5 ( ") for the high frequency sub-band signals split ⁇ " ( " And the low frequency sub-band signal ⁇ "(").
  • the input signal 5 (") is an ultra-wideband signal with a sampling rate of 32 kHz. After QMF analysis filtering and sampling, it is divided into two channels, low band and high band, and output separately.
  • the sample rate is 16 kHz low frequency sub-band signal 5 (") and high frequency sub-band signal ⁇ ").
  • the effective bandwidth of the low band channel is 0-8 kHz
  • the effective bandwidth of the high band channel is 8-16 kHz;
  • Step 102 In order to avoid the influence of power frequency noise on the ultra-wideband extended coding, the low frequency sub- The signal (") is filtered through a high-pass filter ⁇ ' to filter out 50Hz power-frequency noise, and the output is a low-band signal that removes power-frequency noise.
  • the high-frequency sub-band signal ⁇ (") is multiplied by (- 1). "Frequency folding, output 0".
  • Step 103 Perform speech coding on the low-band signal (") obtained by filtering the low-frequency sub-band signal, and output the code stream to obtain a low-frequency signal parameter, and transmit the low-frequency signal parameter to the decoding end.
  • each frame is 20 ms long, including 320 samples, and is encoded by a core layer encoder such as a G.729.1 encoder to obtain the low frequency signal parameters;
  • Step 104 performing voice on low frequency signal parameters Decoding, get low band recovery signal
  • Step 105 Perform a wideband enhancement on the low-band recovery signal with reference to the low-band signal (") for removing the power-frequency noise, and obtain a modified Discrete Cosine Transform (MDCT) coefficient U) and a residual MDCT coding coefficient.
  • MDCT Discrete Cosine Transform
  • CELP codebook excitation linear prediction
  • the residual signal is subjected to a 640-point MDCT transform to obtain a residual MDCT coefficient of size 320.
  • the CELP model used in the core layer encoder can accurately compile signals below 4 kHz. Therefore, the main contribution of the residual signal comes from the coding error of 4k ⁇ 7kHz and the signal of 7k ⁇ 8kHz without the core layer encoder processing.
  • the MDCT coefficients of the 6.8k ⁇ 8kHz signal that is, encode the 48th MDCT coefficients for the middle and the back, to reconstruct the 7k ⁇ 8kHz signal, and use it for the reconstruction of the subsequent 8k ⁇ 14kHz signal;
  • the MDCT coefficients of 4k ⁇ 6.8kHz are encoded, that is, the first 112 MDCT coefficients in W are encoded, and the encoding processing result is superimposed on the broadband signal processed by the core layer to achieve broadband enhancement. the goal of.
  • the residual MDCT coefficients are encoded, and the segmented spherical vector quantization technique can be used to encode the MDCT coefficients of 4k ⁇ 8kHz, that is, the last 160 MDCT coefficients are encoded to obtain the residual MDCT coding coefficients, which will be disabled.
  • the difference MDCT coding coefficient is output to the decoding end; encoding the residual MDCT coefficient to obtain the residual MDCT coding coefficient specifically includes:
  • the 16-point size is divided into 10 sub-bands, and the spectral envelope of each sub-band is obtained:
  • spectral envelope For the spectral envelope of the subband, Huffman coding is used.
  • the above spectral envelope is used for the bit allocation of z-16 cells before spherical vector quantization.
  • the normalized frequency point (i.e., the residual MDCT coefficient) is quantized by spherical vector quantization to obtain a residual MDCT coding coefficient.
  • the spherical vector quantization can use Z-16 grid, that is, the 16 MDCT coefficients are uniformly quantized continuously, and the used codebook and quantization process are consistent with G.729.1.
  • the MDCT coefficients and the last 3 sub-bands related to 6.8k ⁇ 8kHz can be encoded at least, and the 8kHz to 6.8k signals can be enhanced by the broadband.
  • the remaining sub-bands can be prioritized according to actual needs.
  • Step 106 Perform MDCT transformation on the low-band recovery signal to obtain a low-frequency MDCT recovery coefficient W. Step 105 and step 106 can be performed simultaneously.
  • Step 107 According to the low frequency subband signal ("), the low frequency MDCT recovery coefficient W and the residual
  • the MDCT coefficient t performs perceptual weighting to obtain the template MDCT coefficient ().
  • S enh (k) perceptually weights the superimposed signal according to the low frequency sub-band signal (") to obtain the template MDCT coefficient S L (k) with a bandwidth of 8 kHz.
  • the 7 kHz to 8 kHz signal coding coefficient is first reconstructed by the broadband enhancement, and then the correlation between the broadband and the ultra-wideband partial spectrum is utilized, and a suitable "template" is selected in the broadband of 0 ⁇ 8 kHz, and copied to the ultra-wideband portion for reconstruction. Spectrum from 8k to 14kHz.
  • the selection of "template” first needs to pre-process the MDCT coefficients of 0 ⁇ 8 kHz obtained by superposition: On the one hand, the number of resonance peaks in the low frequency part of the signal is more than the number of resonance peaks in the high frequency part, especially below 3 kHz The formant causes the spectral envelope to be not flat. In order to ensure that the post-replication spectrum is as close as possible to the original spectrum, this embodiment limits the selection frequency range of the "template" to
  • the spectrum of the broadband part that is, the low-band spectrum
  • the rate of decline of the low-band spectrum is also faster than that of the ultra-wideband part. If the low-band spectrum is directly copied to the super-band In the broadband portion, the spectrum is not flat, and the energy discontinuity at the boundary of each subband of the reconstructed ultra-wideband is further solved. Therefore, the present embodiment can further perform spectrum shaping on the low-band spectrum to make the spectrum flatter.
  • a wideband signal sensing weighting method is used to perform spectrum shaping processing on the low band spectrum.
  • LPC linear predictive coding
  • the template MDCT coefficient of the output signal effectively reduces the formant height in the low-band spectrum, achieves the purpose of spectrum flattening, and avoids the reconstructed sub-band. The phenomenon of energy discontinuity at the boundary.
  • the high frequency sub-band signal can be spectrally folded and MDCT transformed while performing the above steps to obtain high frequency MDCT coefficients. That is, the high frequency sub-band signal is spectrally folded by multiplying (- 1)", and W d (") is output. The MDCT transform will be performed to obtain a high frequency MDCT coefficient of 1 .
  • Step 108 Match the template MDCT coefficient and the high frequency MDCT coefficient according to the principle of minimum mean square error (to obtain a band extension parameter, that is, select a continuous template between 3-8 kHz)
  • the MDCT coefficient is matched with the spectrum to be reconstructed, that is, the high-frequency MDCT coefficient 1 , after the energy gain adjustment, and the optimal spectrum "template" for copying is selected by setting the band extension parameter by the principle of minimum mean square error.
  • the first 240 frequency points representing 8k ⁇ 14kHz are divided into three sub-bands, each of which contains 60, 60 and 120 MDCT coefficients respectively.
  • the last 80 frequency points (ie, the residual MDCT coefficients) belong to 14 ⁇ 16 kHz, which has exceeded the frequency range involved in the embodiment of the present invention, and can be directly set to zero.
  • band extension parameters for the optimal spectrum copy "template" are selected by the following formula:
  • the optimal "template” for reconstructing the three sub-bands of the ultra-wideband portion is selected, and the band extension parameter, g j , is obtained at the same time.
  • Step 109 Encoding the band extension parameter, specifically: performing binary coding directly on the starting point position of the “template”; and performing Huffman coding on the energy gain value.
  • Step 110 Transmit the encoded band extension parameter, .
  • the encoding end completes the ultra-wideband extension.
  • the 7k ⁇ 8kHz frequency signal is reconstructed by the wideband enhanced coding, and the 8k - 14kHz signal is reproduced from the 3k ⁇ 8kHz signal, thereby realizing the bandwidth expansion of 7k - 14kHz. , enabling the decoding end to more accurately reproduce the speech signal and accurately describe the music signal.
  • a decoding end receives a code stream transmitted by an encoding end, and performs separation to obtain a low-frequency signal parameter, a residual MDCT coding coefficient, and a coded band extension parameter.
  • a low-frequency signal parameter e.g., a coded bit stream
  • a residual MDCT coding coefficient e.g., a residual MDCT coding coefficient
  • a coded band extension parameter e.g., a coded band extension parameter.
  • Step 201 Decode the received low frequency signal parameter, the residual MDCT coding coefficient, and the encoded frequency band extension parameter to obtain a low band recovery signal U") of 0 ⁇ 7 kHz, and a residual MDCT recovery coefficient of 6.8 k - 8 kHz ⁇ ⁇ W and band extension recovery parameters ⁇ , where the low-band recovery signal can be decoded by a core layer decoder such as a G.729.1 decoder; the band extension recovery parameters A, ⁇ can be decoded by a high-band ultra-wideband extension decoder; When the encoding end enhances the wideband signal, there is a residual MDCT encoding coefficient in the received code stream.
  • U low band recovery signal
  • the band extension recovery parameters A, ⁇ can be decoded by a high-band ultra-wideband extension decoder
  • the encoding end enhances the wideband signal, there is a residual MDCT encoding coefficient in the received code stream.
  • the residual MDCT encoding coefficient can be decoded by the wideband enhanced decoder to obtain a residual related to at least 6.8k ⁇ 8kHz.
  • MDCT The recovery coefficient realizes the extension of 7k ⁇ 8kHz (that is, the frequency domain signal of 7k ⁇ 8kHz);
  • Step 204 performing inverse modified cosine transform (ie, IMDCT) on the superposed coefficients to obtain a low-frequency sub-band recovery signal.
  • IMDCT inverse modified cosine transform
  • the low frequency sub-band recovery signal ⁇ ( «) obtained after processing is closer to the original low frequency sub-band signal. Therefore, in this embodiment, the low-frequency sub-band recovery signal that is enhanced by the wideband is directly used as the approximation value of the low-frequency sub-band signal at the decoding end, and the perceptual weighting parameter is calculated in real time, thereby avoiding coding the perceptual weighting parameter at the encoding end, further saving The bit overhead.
  • Step 205 Perform perceptual weighting on the low-band enhanced MDCT coefficients according to the low-frequency sub-band recovery signal ⁇ ( «), and obtain a template MDCT recovery coefficient of 0). Similar to the encoding end, before reconstructing the 8k ⁇ 14kHz signal, the same perceptual weighting processing module as the low-band enhanced MDCT coefficient input is subjected to perceptual weighting of the low-band enhanced MDCT coefficients to obtain an approximation to the encoding end S L ( k) The template MDCT recovery coefficient is different from the template MDCT coefficient of the encoding end, and the approximate template MDCT recovery coefficient is recorded as W; the content of the perceptual weighting processing specifically includes: limiting the frequency range of the "template” to 3k ⁇ 8kHz And perform weighted sensing processing to reduce the height of the formant in the signal spectrum, make the spectrum flatter, and avoid energy discontinuity at the subband boundary after reconstruction.
  • the low-frequency sub-band recovery signal ( «) obtained by the IMDCT transform due to the actual decoding and the ⁇ is different from the original low-frequency sub-band signal, so the analysis result obtained by linear predictive coding approximates the encoding end.
  • the reconstructed 0-8 kHz signal is subjected to perceptual weighting processing by the perceptual weighting processing module, and the output template MDCT recovery coefficient ⁇ ) .
  • Step 206 Reconstruct the high-frequency MDCT recovery coefficient according to the template MDCT recovery coefficient W and the band extension recovery parameter, and reconstruct the high-frequency MDCT recovery coefficient (W. according to the wideband portion MDCT recovery coefficient W selected when the sub-bands of the UWB portion are extracted.
  • Step 207 Perform high-frequency MDCT restoration coefficient 0) IMDCT transformation and frequency speech folding to obtain a high-frequency sub-band recovery signal ("), wherein the high-frequency MDCT recovery coefficient obtained by frequency band expansion is transformed back into the time domain by IMDCT, and Corresponding to the encoding end, and then performing the frequency again
  • Step 208 synthesizing the low frequency sub-band recovery signal SW and the high frequency sub-band recovery signal Obtain an ultra-wideband speech recovery signal ⁇ ⁇ ").
  • the specifics are as follows: The low-band and high-band 16 kHz sampling signals are sampled separately, and respectively filtered and superimposed by QMF to obtain a 32 kHz sample. The ultra-wideband signal ⁇ ("), and output. At this time, the decoding end copies the 8k ⁇ 14kHz frequency signal through the 3k ⁇ 8kHz spectrum signal, and completes the decoding of one frame of the ultra-wideband voice signal.
  • the coding coefficients of the 7k ⁇ 8kHz frequency speech signal are first reconstructed by the broadband enhancement, and then the bandwidth extension parameters of the wideband signal replica UWB signal are obtained at the encoding end according to the principle of the mean square error, and the parameters are performed.
  • Binary, huffman coding based on the existing speech coder, the decoder reconstructs the 7k ⁇ 8kHz frequency signal by wideband enhanced decoding, and extends the 0 ⁇ 7kHz signal to 0 ⁇ 8kHz, making the resulting 0 ⁇ 8kHz signal closer.
  • the original signal and, using the obtained 0 ⁇ 8 kHz signal and the decoded band extension parameter to reconstruct the 8 ⁇ 14 kHz frequency signal, the computational complexity is low, and the parameters to be transmitted are small, and the ultra-wideband extension of 7k ⁇ 14 kHz is realized.
  • the signal content is greatly enriched, the sound quality is improved, and the voice signal and the music signal can be reproduced more accurately by the above embodiment.
  • the foregoing coding method embodiment and decoding method embodiment may also perform codec processing using other time-frequency domain transforms such as Fast Fourier Transform (FFT).
  • FFT Fast Fourier Transform
  • the orthogonal image analysis filter passes through a high-pass filter and a low-pass filter H. And 2 to 1 sample module will be UWB voice signal
  • the high-pass filter H w filters out the power-frequency noise in the low-frequency sub-band signal
  • the core layer encoder can use the existing standard speech encoder such as G.729.1 encoder to perform speech coding on the filtering to obtain low-frequency signal parameters;
  • the core layer decoder performs speech decoding on the low frequency signal parameter to obtain a low band recovery signal);
  • the low frequency MDCT module performs MDCT transformation on the low band recovery signal to obtain ⁇ (.
  • the broadband enhancement module is used for the low band recovery signal ⁇ ) Performing wideband enhancement to obtain a residual MDCT coding coefficient, which may include a residual acquisition module, a residual MDCT module, a wideband enhanced encoder, and a superposition module, and the residual acquisition module combines the low frequency subband signal W and the lowband recovery signal U «) That is, the low frequency sub-band signal after filtering the power frequency noise is subtracted from the low-band recovery signal to obtain the residual signal residual.
  • the MDCT module performs MDCT transformation on the residual signal ⁇ ( «) to obtain the residual MDCT coefficient W; the broadband enhancement Encoder vs.
  • ⁇ — ⁇ ⁇ Z number and residual MDCT coefficient that is, the superimposed signals of the two are processed to obtain the template MDCT coefficient (k); the spectrum folding module (-1) "bands the high frequency sub-band signal ⁇ ) to obtain s f ° ld ⁇ n) ⁇
  • High-frequency MDCT module performs MDCT transformation on 4. ⁇ ( «) to obtain high-frequency MDCT coefficient S H (k); high-band ultra-wideband extended high-band ultra-wideband extension processor on template MDCT coefficient and The high-frequency MDCT coefficients are calculated by the least squares principle of the mean square error, and the band extension parameters ⁇ and gj are obtained .
  • the high-band ultra-wideband extended encoder encodes the band extension parameters ⁇ and gj ; the low-frequency signal parameters and residuals are transmitted through the multiplexer MUX. MDCT coding coefficients and encoded error parameters.
  • the wideband enhancement module can further add a wideband enhancement decoder to decode the residual MDCT coding coefficients to obtain a residual MDCT recovery coefficient ⁇ t).
  • the superposition module will be superimposed, and the perceptual weighting processing module will The superimposed signal and (") are used as input signals, and the superimposed signal is subjected to perceptual weighting according to ("), which further reduces the error between the encoder and the decoder.
  • FIG. 5 is a schematic structural diagram of an embodiment of an ultra-wideband extension decoder according to the present invention.
  • This embodiment corresponds to the encoder shown in FIG. 4, and the demultiplexer DEMUX receives the code stream sent by the encoder to obtain low-frequency signal parameters and codes.
  • the core layer decoder decodes the low frequency signal parameter, and obtains the low band recovery signal wideband enhancement decoder to decode the received residual MDCT coding coefficient to obtain the residual MDCT recovery coefficient i ⁇ W; MDCT module
  • the MDCT transform is performed on the low frequency sub-band recovery signal, and the low-frequency MDCT recovery coefficient is obtained.
  • the superimposition module superimposes the low-frequency MDCT recovery coefficient and the residual MDCT recovery coefficient to obtain a low-band enhanced MDCT coefficient; the low-frequency IMDCT module reduces the low-band enhanced MDCT coefficient.
  • the perceptual weighting processing module performs perceptual weighting on the low band enhanced MDCT coefficient according to 4 ⁇ » to obtain the template MDCT recovery coefficient (); the high band UWB extension inverse
  • the processor uses the template MDCT recovery coefficient and the band extension recovery parameter, and reconstructs the high frequency MDCT recovery coefficient H (k); the high frequency IMDCT module performs IMDCT transformation on the high frequency MDCT recovery coefficient (k) to obtain ld (n);
  • the frequency word folding module Perform spectrum folding on ⁇ to obtain high frequency sub-band recovery signal ⁇ ); de-emphasis
  • the UWB expansion system is composed of the encoder in any of the above encoder embodiments and the decoder in any of the above decoder embodiments, and can realize an extension of 7k to 14 kHz, ensuring good transmission of 0 to 14 kHz audio signals.
  • the method includes the steps of the foregoing method embodiments; and the foregoing storage medium includes: a medium that can store program codes, such as a ROM, a RAM, a magnetic disk, or an optical disk.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

超宽带扩展编码、 解码方法、 编码器及超宽带扩展系统 技术领域
本发明涉及语音通信技术领域, 尤其涉及一种超宽带扩展编码、 解码方 法、 编码器、 解码器及超宽带扩展系统。 背景技术
在实时语音通信中, 由于语音信号的传输质量受釆样率和带宽等因素的 影响, 现有的语音频编解码器通常釆用降低釆样率、 损失高频部分的内容等 手段, 以保证编解码过程的实现。 对于宽带语音信号(50Hz ~ 7kHz )的传输, 更是如此, 为了避免混叠效应, 通常将宽带信号转换成带限信号后, 再进行 编码, 这样, 在码率确定的情况下, 特别是对于中、 低比特率, 保证有足够 的比特对低频内容进行编码。 但是, 宽带信号的高频部分包含丰富的内容, 缺少这部分内容, 对音频的音质有很大的损伤。 针对这个问题, 产生了频带 扩展技术,如图 1所示。对低频部分信号参数 X[k]仍釆用原始的编解码流程; 同时在编解码端, 建立合适的参数模型, 增加有限数据量和计算量, 对高频 部分进行重构, 并与解码后的低频部分进行整合, 将频率范围扩大, 得到频 带扩展后的信号参数 Y[k], 从而达到提高整体音频质量的目的。
目前, 用于实时语音通信的频带扩展技术, 主要是通过时域带宽扩展方 法( The Time Domain Bandwidth Extension, TD-BWE ), 实现在较低的码率下 从 0 ~ 3.4kHz的窄带语音信号扩展到 0 ~ 7kHz的宽带语音信号, 详见国际电 信联盟电信标准部门 ( ITU-T )提出的语音编码标准 G.729.1。
发明人在实现本发明的过程中, 发现现有技术至少存在以下问题: 现有 技术将窄带语音信号从 0 ~ 3.4kHz扩展到 0 ~ 7kHz,仅完成了不到 4kHz的频 带扩展,解码后的语音信号缺少 7kHz以上的超宽带信号,使得音频质量仍然 得不到很大提高; 频带扩展中使用的激励信号源自语音生成模型, 无法准确 地描述音乐信号, 对于类音乐信号的编码效果比较差, 在超宽带部分重用效 果欠佳。 发明内容
本发明实施例的第一目的在于提出一种超宽带扩展编码方法及编码器, 以获取能够重构 7k ~ 8kHz 的残差频域编码系数以及能够重构 8k ~ 14kHz高 频信号的频带扩展参数。
本发明实施例的第二目的在于提出一种超宽带扩展解码方法及解码器, 以实现 7k ~ 14kHz高频信号的重构, 获得 0 ~ 14kHz超宽带信号。
本发明实施例的第三目的在于提出一种超宽带扩展系统, 以实现 7k ~ 14kHz的频带扩展。
为实现上述第一目的, 本发明实施例提供了一种超宽带扩展编码方法, 包括:
将超宽带语音信号拆分为高频子带信号和低频子带信号;
对所述低频子带信号进行语音编码, 得到低频信号参数;
对所述低频信号参数进行语音解码, 得到低带恢复信号;
对所述低带恢复信号进行时 -频域变换, 得到低频频域恢复系数; 对所述低带恢复信号进行宽带增强, 获得残差频域系数及残差频域编码 系数;
根据所述低频子带信号对所述低频频域恢复系数及残差频域系数进行感 知加权, 得到模板频域系数;
对所述高频子带信号进行频谱折叠以及时 -频域变换, 得到高频频域系 数;
根据均方误差最小原则对所述模板频域系数与高频频域系数进行匹配, 传输所述低频信号参数、 残差频域编码系数及编码后的频带扩展参数。 为实现上述第一目的, 本发明实施例还提供了一种超宽带扩展编码器, 包括:
正交镜像分析滤波器, 用于将超宽带语音信号拆分为高频子带信号和低 频子带信号;
核心层编码器, 用于对所述低频子带信号进行语音编码, 得到低频信号 参数;
核心层解码器, 用于将所述低频子带信号进行语音编码后得到的低频信 号参数, 进行语音解码, 得到低带恢复信号;
低频 MDCT模块, 用于对所述低带恢复信号进行 MDCT变换, 得到低 频 MDCT恢复系数;
宽带增强模块,用于对所述低带恢复信号进行宽带增强 ,获得残差 MDCT 系数及残差 MDCT编码系数;
感知加权处理模块, 用于根据所述低频子带信号对所述低频 MDCT恢复 系数及残差 MDCT系数进行感知加权, 得到模板 MDCT系数;
频谱折叠模块, 用于对所述高频子带信号进行频谱折叠;
高频 MDCT模块,用于对经过频谱折叠的所述高频子带信号进行 MDCT 变换, 得到高频 MDCT系数;
高带超宽带扩展处理器, 用于根据均方误差最小原则对所述模板 MDCT 系数与高频 MDCT系数进行匹配, 得到频带扩展参数;
高带超宽带扩展编码器, 用于对所述频带扩展参数进行编码;
复用器, 用于传输所述低频信号参数、 残差 MDCT编码系数及编码后的 频带扩展参数。
上述方案通过宽带增强获得重构 7k ~ 8kHz信号的编码系数,并在此基础 上选择模板频域系数, 根据均方误差最小原则匹配, 获得了 8k ~ 14kHz重构 高频信号的频带扩展参数, 通过编码传输, 使得解码端能够通过频带扩展参 数重构 8k ~ 14kHz高频信号, 从而实现了 7k ~ 14kHz超宽带信号的扩展。 为实现上述第二目的,本发明实施例还提供了一种超宽带扩展解码方法, 包括:
接收超宽带语音编码信号, 并从中提取低频信号参数、 残差频域编码系 数及编码后的频带扩展参数;
对接收到的低频信号参数、 残差频域编码系数及编码后的频带扩展参数 进行解码, 得到低带恢复信号、 残差频域恢复系数以及频带扩展恢复参数; 对所述低带恢复信号进行频域变换, 得到低频频域恢复系数;
叠加所述低频频域恢复系数与残差频域恢复系数, 得到低带增强频域系 数;
对叠加后得到的系数进行频 -时域变换, 得到低频子带恢复信号; 根据所述低频子带恢复信号对所述低带增强频域系数进行感知加权, 得 到模板频域恢复系数;
根据所述模板频域恢复系数以及频带扩展恢复参数重构高频频域恢复系 数;
将所述高频频域恢复系数进行频-时域变换及频语折叠, 得到高频子带恢 复信号;
合并所述低频子带恢复信号与高频子带恢复信号, 得到超宽带语音恢复 信号。
为实现上述第二目的, 本发明实施例还提供了一种超宽带扩展解码器, 包括:
解复用器, 用于接收所述低频信号参数、 残差 MDCT编码系数及编码后 的误差参数;
核心层解码器, 用于对接收到的所述低频信号参数进行解码, 得到低带 恢复信号;
宽带增强解码器, 用于对接收到的残差 MDCT编码系数进行解码, 得到 残差 MDCT恢复系数;
高带超宽带扩展解码器, 用于对接收到的所述编码后的频带扩展参数进 行解码, 得到频带扩展恢复参数;
MDCT模块,用于对所述低带恢复信号进行 MDCT变换,得到低频 MDCT 恢复系数;
叠加模块, 用于对所述低频 MDCT恢复系数与残差 MDCT恢复系数进 行叠加, 得到低带增强 MDCT系数;
低频 IMDCT模块, 用于对所述低带增强 MDCT系数进行 IMDCT变换, 得到低频子带恢复信号;
感知加权处理模块, 用于根据所述低频子带恢复信号对所述低带增强 MDCT系数进行感知加权, 得到模板 MDCT恢复系数;
高带超宽带扩展反处理器, 用于根据所述模板 MDCT恢复系数以及频带 扩展恢复参数重构高频 MDCT恢复系数;
高频 IMDCT模块, 用于将所述高频 MDCT恢复系数进行 IMDCT变换; 频谱折叠模块, 用于将经过 IMDCT变换的高频 MDCT恢复系数进行频 语折叠, 得到高频子带恢复信号;
正交镜像合成滤波器, 用于合并所述低频子带恢复信号与高频子带恢复 信号, 得到超宽带语音恢复信号。
上述解码方案通过对残差频域编码系数进行解码,得到 7k ~ 8kHz的残差 频域恢复系数, 将 0 ~ 7kHz信号扩展到了 0 ~ 8kHz, 并对扩展后的低带增强 频域系数进行感知加权获得重构 8k ~ 14kHz高频信号频语的模板, 并将频带 扩展恢复参数作用于模板, 重构了 8k ~ 14kHz信号, 从而实现了 7k ~ 14kHz 高频信号的重构, 获得了 0 ~ 14kHz超宽带信号, 大大丰富了信号内容, 提高 了音频质量。
为实现上述第三目的, 本发明实施例还提供了一种超宽带扩展系统, 包 括: 上述实施例中任一超宽带扩展编码器及上述实施例中任一超宽带扩展解 码器。
本方案通过上述实施例中的超宽带扩展编码器能够获取用于重构 7k ~ 8kHz 的残差 MDCT编码系数以及用于重构 8k ~ 14kHz高频信号的频带扩展 参数, 并且超宽带扩展解码器能够利用残差 MDCT编码系数重构 7k ~ 8kHz 信号, 利用频带扩展参数重构 8k ~ 14kHz高频信号, 实现了 7k ~ 14kHz的超 宽带扩展, 大大丰富了信号内容, 提高了音频质量。
下面通过附图和实施例, 对本发明的技术方案做进一步的详细描述。 附图说明
图 1为现有技术中频带扩展示意图;
图 2为本发明超宽带扩展编码方法实施例的流程图;
图 3为本发明超宽带扩展解码方法实施例的流程图;
图 4为本发明超宽带扩展编码器实施例的结构示意图;
图 5为本发明超宽带扩展解码器实施例的结构示意图。 具体实施方式
本发明下述实施例基于信号低频和高频之间的相关性,实现超宽带扩展。 其中, 语音编解码时可使用现有的语音编解码标准, 下述实施例中均以 G.729.1编解码标准为例进行说明。
图 2为本发明超宽带扩展编码方法实施例的流程图, 具体包括: 步骤 101、将输入的超宽带语音信号如 0 ~ 16kHz的 5 (")拆分为高频子 带信号^" (")和低频子带信号^ "(")。其中,输入信号5 (")为釆样率 32kHz 的超宽带信号, 经过 QMF分析滤波和 釆样, 分成低带和高带两个通道, 分别输出釆样率为 16kHz的低频子带信号5 (")和高频子带信号^^ ")。 其 中, 低带通道的有效带宽为 0-8kHz, 高带通道的有效带宽为 8-16kHz;
步骤 102、 为了避免工频噪声对超宽带扩展编码的影响, 可使得低频子 带信号 (")经过一个高通滤波器 ^' , 滤除 50Hz的工频噪声, 输出为去除 工频噪声的低带信号 同时, 高频子带信号 ^^(")通过乘以 (- 1)"进行频 语折叠, 输出 0)。
步骤 103、 对低频子带信号滤除工频噪声后得到的低带信号 (")进行语 音编码, 输出码流, 得到低频信号参数, 将低频信号参数传输到解码端。 其 中,将原始的子带信号 (")进行分帧处理,每帧长为 20ms, 包括 320个样本, 经过核心层编码器如 G.729.1编码器编码, 得到所述低频信号参数; 步骤 104、 对低频信号参数进行语音解码, 得到低带恢复信号
步骤 105、参考去除工频噪声的低带信号 (")对低带恢复信号 进行 宽带增强,获得残差改进型离散余弦变换(Modified Discrete Cosine Transform 即 MDCT)系数 U )及残差 MDCT编码系数。
实验结果表明, 核心层编码器釆用的码激励线性预测 ( Codebook excitation linear prediction, CELP )技术对 4kHz以下的信号编码精度较高, 而对 4kHz 以上宽带信号特别是音乐信号的编码精度不甚理想, 因此, 可对 4kHz以上的宽带信号进行增强,进一步提高核心层输出音频的质量。具体为: 减去 得到低带的残差信号
残差信号 进行 640点的 MDCT变换,得到大小为 320的残差 MDCT 系数
Senh (k) =∑, rL (n)hk (n) , ^ = 0, 1, · · · , 319 其中, (")是 MDCT正变换的基函数
Figure imgf000009_0001
此处, 选择正弦窗 (η + 0.5)- π
640 j
核心层编码器中使用的 CELP模型对 4kHz以下的信号能够比较精确地编 码, 因此, 残差信号 的主要贡献来自于 4k ~ 7kHz的编码误差和未经核心 层编码器处理的 7k ~ 8kHz的信号。 编码时, 首先对 6.8k ~ 8kHz信号 的 MDCT系数进行编码, 即, 针对 中后 48个 MDCT系数进行编码处 理, 以重构 7k ~ 8kHz信号, 并用于后续 8k ~ 14kHz信号的重构; 当有足够 的比特可用时 , 再对 4k ~ 6.8kHz的 MDCT系数进行编码 , 即 , 针对 W中 前 112个 MDCT系数进行编码处理, 并将 的编码处理结果叠加到核心 层处理的宽带信号, 达到宽带增强的目的。
对所述残差 MDCT系数 进行编码,可釆用分段球型矢量量化技术, 对 4k ~ 8kHz的 MDCT系数进行编码, 即对 后 160个 MDCT系数进行 编码, 得到残差 MDCT编码系数, 将残差 MDCT编码系数输出到解码端; 对残差 MDCT系数进行编码, 得到残差 MDCT编码系数具体包括:
首先,将 按 16点大小均分成 10个子带,并求得每个子带的频谱包 络:
Figure imgf000010_0001
其次, 对子带的频谱包络, 釆用 Huffman编码, 以上频谱包络用于球型 矢量量化前的 z-16格的比特分配。
将归一化后的频点(即残差 MDCT系数)用球型矢量量化进行量化处理, 得到残差 MDCT编码系数。 其中, 球型矢量量化可釆用 Z-16格, 即连续地 对 16个 MDCT系数统一进行量化,所釆用的码书和量化过程与 G.729.1—致。 实际应用中, 可至少先对 MDCT系数与 6.8k ~ 8kHz相关的后 3个子带进行 编码处理, 即可对 8kHz至 6.8k信号的进行宽带增强, 其余 Ί个子带可根据 实际需要进行优先级排序, 按照可用的比特量按序对按优先级排序的子带进 行编码处理; 当 6.8k ~ 8kHz的 MDCT系数全部进行编码处理后, 根据剩余 可用的比特量对 4k ~ 6.8kHz的 MDCT系数进行部分或全部编码处理。 可进一步对残差 MDCT编码系数进行解码, 得到残差 MDCT恢复系数 。
步骤 106、 对低带恢复信号 进行 MDCT变换, 得到低频 MDCT恢 复系数 W。 步骤 105与步骤 106可同时进行。
步骤 107、 根据低频子带信号 (")对低频 MDCT恢复系数 W及残差
MDCT系数 t)进行感知加权, 得到模板 MDCT系数 ()。 其中, 当对残 差 MDCT 系数 4^ 进行解码恢复后, 叠加 与残差 MDCT 恢复系数
Senh (k) , 根据低频子带信号 (")对叠加信号进行感知加权, 得到模板 MDCT 系数 SL (k) , 其带宽为 8kHz。
本发明实施例首先通过宽带增强重构了 7kHz ~ 8kHz信号编码系数, 然 后利用宽带与超宽带部分频谱的相关性,在 0 ~ 8kHz宽带选择合适的"模板", 复制到超宽带部分, 以重建 8k ~ 14kHz的频谱。
其中, 选择 "模板"首先需要对叠加得到的 0 ~ 8kHz的 MDCT系数进行 前置处理: 一方面, 在信号的低频部分共振峰的数量要比高频部分共振峰的 数量多,特别是 3kHz以下的共振峰导致频谱包络并不平坦,为了保证复制后 频谱与原始频谱尽可能相近, 本实施例将 "模板" 的选择频率范围限制在
3kHz ~ 8kHz之间; 另一方面, 宽带部分的频谱即低带频谱除了较低频带的频 谱平坦以外, 低带频谱的下降速度也较超宽带部分快, 若直接将低带频谱分 别复制到超宽带部分, 易造成频谱不平坦, 以及重建后的超宽带各子带边界 处的能量不连续的问题, 因此, 本实施例还可进一步对低带频谱进行频谱整 形, 使得频谱更加平坦。
本实施例使用宽带信号感知加权的方法对低带频谱进行频谱整形处理。 具体包括: 对原始低频子带信号 (")进行线性预测编码 (Linear predictive coding , LPC )分析,得到分析结果 4 , 并计算感知加权参数 HO)= 4(z/ ; 宽带增强后的低带频谱信号通过该感知加权处理模块后, 输出信号的模 板 MDCT系数 有效降低了低带频谱中的共振峰高度, 达到了频谱平坦 化的目的, 并避免了重建后的子带边界处能量不连续的现象。
可在执行上述步骤的同时,对高频子带信号进行频谱折叠以及 MDCT变 换, 得到高频 MDCT系数。 即, 高频子带信号 通过乘以 (- 1)"进行频谱 折叠, 输出 Wd(")。 将 进行 MDCT变换, 得到高频 MDCT系数1
步骤 108、根据均方误差最小原则对模板 MDCT系数 与高频 MDCT 系数 ( 进行匹配, 得到频带扩展参数, 即在 3-8kHz 间选择连续的模板
MDCT系数,经过能量增益调整后,与待重建的频谱即高频 MDCT系数1 进行匹配, 以均方误差最小原则, 通过设置频带扩展参数选择用于复制的最 优频谱 "模板"。
其中,对于高频的子带信号的高频 MDCT緣 SH (k、,将表示 8k ~ 14kHz 的前 240个频点分成 3个子带, 每个子带分别包含 60、 60和 120个 MDCT 系数。 后 80个频点 (即残差 MDCT系数)属于 14 ~ 16kHz, 已超出了本发 明实施例所涉及的频率范围, 直接置零即可。
通过如下公式选择用于最优频谱复制 "模板" 的频带扩展参数:
Wf 1
E =∑ (SHJ (k0 + k) - gj · SL (Δ .十 k)f j = 0, 1, 2 其中, 是待复制区域的原始频谱( = 0代表 8k ~ 9.5kHz的频谱, j = 1代表 9.5k ~ 11 kHz的频谱, J = 2代表 Ilk ~ 14kHz的频谱 ); k。'j表示 8k ~ 14kHz范围内子带的起始频点位置; ^为子带频点数; & (Δ + )是 3k ~ 8kHz 内的一段频谱; Δ 是该段频谱的起始点位置; 表示能量增益值, sU) = ;
Figure imgf000013_0001
通过上述计算过程, 选择重建超宽带部分 3个子带的最优 "模板", 同时 得到频带扩展参数 、 gj。
步骤 109、 对频带扩展参数进行编码, 具体可为: 对于 "模板" 的起始 点位置 , 直接进行二进制编码; 对于能量增益值 进行哈夫曼(Huffman ) 编码。
步骤 110、 传输编码后的频带扩展参数 、 。 到此时, 编码端便完成 了超宽带扩展,本实施例通过宽带增强编码重构了 7k ~ 8kHz频语信号,并由 3k ~ 8kHz信号复制 8k - 14kHz信号, 从而实现 7k - 14kHz的带宽扩展, 使 得解码端能够更准确再现语音信号、 准确地描述音乐信号。
图 3为本发明超宽带扩展解码方法实施例的流程图, 解码端接收到编码 端传输的码流, 进行分离, 得到低频信号参数、 残差 MDCT编码系数与编码 后的频带扩展参数, 由于编解码实际应用及传输过程中难免产生误差, 因此 将解码端得到的相应信号、 系数或参数均记为恢复系数或恢复参数; 然后, 通过以下步骤实现超宽带扩展解码:
步骤 201、 对接收到的低频信号参数、 残差 MDCT编码系数及编码后的 频带扩展参数进行解码, 得到 0 ~ 7kHz 的低带恢复信号 U")、 6.8k - 8kHz 的残差 MDCT恢复系数^^ W以及频带扩展恢复参数 ^、 。 其中, 低带恢 复信号 可通过核心层解码器如 G.729.1解码器解码得到; 频带扩展恢复 参数 A 、 ^可通过高带超宽带扩展解码器解码得到; 当编码端对宽带信号增 强时, 接收到的码流中还有残差 MDCT编码系数, 此时, 可通过宽带增强解 码器解码残差 MDCT编码系数, 得到至少与 6.8k ~ 8kHz相关的残差 MDCT 恢复系数 , 实现了 7k ~ 8kHz的扩展(即 7k ~ 8kHz的频域信号); 步骤 202、 对低带恢复信号 进行 MDCT变换, 得到低频 MDCT恢 复系数 步骤 203、 叠加低频 MDCT 恢复系数^^ ( 与残差 MDCT 恢复系数
§^k 得到低带增强 MDCT系数, 即有效带宽为 8kHz的 MDCT系数; 步骤 204、对叠加后得到的系数进行反改进型离散余弦变换(即 IMDCT ), 得到低频子带恢复信号 。
由于实现了 7k ~ 8kHz的扩展,处理后得到的低频子带恢复信号 ^^(«)与 原始低频子带信号 更为接近。 因此, 本实施例可直接在解码端将经过 宽带增强的低频子带恢复信号 作为低频子带信号 的逼近值, 实 时地计算感知加权参数, 避免了在编码端对感知加权参数进行编码, 进一步 节省了比特开销。
步骤 205、 根据低频子带恢复信号 ^^(«)对低带增强 MDCT系数进行感 知加权, 得到模板 MDCT恢复系数 0)。 其中, 与编码端类似, 在重构 8k ~ 14kHz信号前, 将 与低带增强 MDCT系数输入相同的感知加权处理模 块, 根据 对低带增强 MDCT 系数进行感知加权, 得到近似于编码端 SL (k)的模板 MDCT恢复系数, 为与编码端的模板 MDCT系数相区别, 将该 近似的模板 MDCT恢复系数记为 W;感知加权处理的内容具体包括:将"模 板" 的频率范围限制在 3k ~ 8kHz, 并进行加权感知处理, 以降低信号频谱中 共振峰的高度, 让频谱更加平坦, 并避免重建后的子带边界处能量不连续的 现象。 感知加权过程中, 由于实际解码得到的 与^^ 的叠加经过 IMDCT变换得到的低频子带恢复信号 («)与原始低频子带信号 有差 异, 因而经过线性预测编码得到的分析结果近似于编码端的分析结果, 记为 AL ,以示区别,则对重建后的 0-8kHz信号,得到感知加权参数 Αθ) 重建后的 0-8kHz信号通过该感知加权处理模块进行感知加权处理后,输出模 板 MDCT恢复系数 <^)。 步骤 206、根据模板 MDCT恢复系数 W以及频带扩展恢复参数 、 ^ 重构高频 MDCT恢复系数 (W。 其中, 根据 提取出超宽带部分各子带进 行扩展时所选择的宽带部分 MDCT恢复系数 W的起始位置,根据^提取出 超宽带部分各子带进行扩展时所选择的宽带部分 MDCT 系数 对应的能 量 增 益 , 从 而 得 到 超 宽 带 部 分 的 MDCT 系 数 SH {kQ + k) = g SL ^] + k) j = 0, 1, 2 . 将 3个子带的 MDCT系数进行合并, 并添加 80个全零系数, 即完成了超宽带部分 MDCT系数的重建, 得到高频 MDCT恢复系数 W。
步骤 207、 将高频 MDCT恢复系数 0)进行 IMDCT变换及频语折叠, 得到高频子带恢复信号 (")。 其中, 经过频带扩展得到的高频 MDCT恢复 系数 经 IMDCT变换回时域, 并且与编码端对应, 然后再进行一次频
^OMF / \
语折叠, 即输出为高频子带恢复信号 (")。 由于 3k ~ 8kHz信号的频谱下降 的坡势相对于 8k ~ 14kHz信号的频语较陡,为了获得更接近高频信号的频谱, 可进一步作去加重处理, 使得重构超宽带部分的频语从整体上呈大体下降趋 势略緩, 从而获得更好的音质。 去加重的传递方程表达式为 , 其中, "为预先设定的常数。
步骤 208、合成低频子带恢复信号 S W与高频子带恢复信号
Figure imgf000015_0001
,得 到超宽带语音恢复信号^ ^")。 具体可为: 分别对低带和高带的 16kHz釆样 信号进行 釆样, 并分别通过 QMF合成滤波并进行叠加, 得到 32kHz釆样 的超宽带信号 ^^(") , 并输出。 此时解码端便通过 3k ~ 8kHz 频谱信号复制 8k ~ 14kHz频语信号, 完成了一帧超宽带语音信号的解码。
上述编解码方法实施例,首先通过宽带增强重构 7k ~ 8kHz频语信号的编 码系数, 然后根据均方误差最小原则, 在编码端得到宽带信号复制超宽带信 号的频带扩展参数, 并对参数进行二进制、 huffman编码, 解码端在现有语音 编码器的基础上, 通过宽带增强解码重构 7k ~ 8kHz频语信号, 将 0 ~ 7kHz 信号扩展到了 0 ~ 8kHz, 使得到的 0 ~ 8kHz信号更接近原始信号; 并且, 利 用得到的 0 ~ 8kHz信号与解码得到的频带扩展参数重构 8 ~ 14kHz频语信号, 计算复杂度低, 且需要传输的参数少, 实现了 7k ~ 14kHz的超宽带扩展, 大 大丰富了信号内容, 提高了音质, 通过上述实施例能够更准确地再现了语音 信号、 音乐信号。 上述编码方法实施例和解码方法实施例还可釆用快速傅立 叶变换(FFT )等其他时-频域变换进行编解码处理。
图 4为本发明超宽带扩展编码器实施例的结构示意图, 如图 4所示, 正 交镜像分析滤波器通过高通滤波器 、低通滤波器 H。以及 2比 1釆样模块将 超宽带语音信号
Figure imgf000016_0001
; 高通滤波器 Hw滤除低频子带信号 中的工频噪声, 得到 核心层编 码器可使用现有的标准语音编码器如 G.729.1 编码器对滤除 进行语音编 码, 得到低频信号参数; 核心层解码器对所述低频信号参数进行语音解码, 得到低带恢复信号 );低频 MDCT模块对低带恢复信号 进行 MDCT 变换, 得到^ ^( 。 宽带增强模块用于对低带恢复信号^ )进行宽带增强, 获得残差 MDCT编码系数, 可包括残差获取模块、 残差 MDCT模块、 宽带 增强编码器及叠加模块, 残差获取模块通过合并低频子带信号 W与低带恢 复信号 U«), 即滤除工频噪声后的低频子带信号 减去所述低带恢复信 号 得到残差信号 残差 MDCT模块对残差信号^(«)进行 MDCT 变换,得到残差 MDCT系数 W;宽带增强编码器对残差 MDCT系数 W 进行编码,得到残差 MDCT编码系数; 叠加模块将 ∞re(t)与残差 MDCT系数 进行叠加; 感知加权处理模块通过 LPC模块对 (")进行 LPC分析, 得 到 4 , 通过感知加权参数为 HO) = 的感知加权模块对低频 MDCT系
\— β■ Z 数及残差 MDCT系数 即二者的叠加信号进行处理,得到模板 MDCT系 数 (k) ; 频谱折叠模块 (- 1)"对高频子带信号^ )进行频谱折叠, 得到 sf°ld {n) \ 高频 MDCT模块对 4。ω(«)进行 MDCT变换, 得到高频 MDCT系数 SH (k) ; 高带超宽带扩展高带超宽带扩展处理器对模板 MDCT系数 与高 频 MDCT系数 进行均方误差最小原则匹配计算, 得到频带扩展参数 Δ 、 gj;高带超宽带扩展编码器对频带扩展参数 Δ 、 gj进行编码;通过多路器 MUX 传输低频信号参数、 残差 MDCT编码系数及编码后的误差参数。
为提高音质, 宽带增强模块还可进一步增加宽带增强解码器, 对残差 MDCT编码系数进行解码, 得到残差 MDCT恢复系数 ^^ t) , 此时, 叠加模 块将 与 叠加, 感知加权处理模块将 与 的叠加信号与 (")作为输入信号, 根据 (")对叠加信号进行感知加权处理, 进一步减少了 编码器与解码器之间的误差。
图 5为本发明超宽带扩展解码器实施例的结构示意图, 本实施例与图 4 给出的编码器相对应, 解复用器 DEMUX将接收编码器发送的码流, 得到低 频信号参数及编码后的频带扩展参数; 核心层解码器对低频信号参数进行解 码, 得到低带恢复信号 宽带增强解码器对接收到的残差 MDCT编码 系数进行解码, 得到残差 MDCT恢复系数 i^W ; MDCT模块对低频子带恢 复信号 进行 MDCT变换, 得到低频 MDCT恢复系数^^ 叠加模块 对低频 MDCT恢复系数^ 与残差 MDCT恢复系数 进行叠加, 得到 低带增强 MDCT系数;低频 IMDCT模块对低带增强 MDCT系数进行 IMDCT 变换, 得到低频子带恢复信号 ^ ; 高带超宽带扩展解码器对接收到的编 码后的频带扩展参数进行解码, 得到频带扩展恢复参数 、 sU); 感知加权 处理模块根据 4βΜ»对低带增强 MDCT系数进行感知加权,得到模板 MDCT 恢复系数 (); 高带超宽带扩展反处理器用模板 MDCT恢复系数 以及 频带扩展恢复参数 、 重构高频 MDCT恢复系数 H (k); 高频 IMDCT模 块对高频 MDCT恢复系数 (k)进行 IMDCT变换得到 ld (n); 频语折叠模块 对^ 进行频谱折叠,得到高频子带恢复信号^^ ) ; 去加重模块对 ) 进行去加重处理; 正交镜像合成滤波器合成低频子带恢复信号 ^^(«)与高频 子带恢复信号 得到超宽带语音恢复信号 ¾ra )。 其中, 去加重模块 可根据编码器端的实际需求进行保留或去除。
超宽带扩展系统由上述任意编码器实施例中的编码器及上述任意解码器 实施例中的解码器组成, 能够实现 7k ~ 14kHz的扩展, 保证了 0 ~ 14kHz音 频信号的良好传输。
本领域普通技术人员可以理解: 实现上述方法实施例的全部或部分步骤 可以通过程序指令相关的硬件来完成, 前述的程序可以存储于一计算机可读 取存储介质中, 该程序在执行时, 执行包括上述方法实施例的步骤; 而前述 的存储介质包括: ROM, RAM, 磁碟或者光盘等各种可以存储程序代码的介 质。
最后应说明的是: 以上实施例仅用以说明本发明的技术方案, 而非对其 限制; 尽管参照前述实施例对本发明进行了详细的说明, 本领域的普通技术 人员应当理解: 其依然可以对前述各实施例所记载的技术方案进行修改, 或 者对其中部分技术特征进行等同替换; 而这些修改或者替换, 并不使相应技 术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权 利 要求
1、 一种超宽带扩展编码方法, 其特征在于, 包括:
将超宽带语音信号拆分为高频子带信号和低频子带信号;
对所述低频子带信号进行语音编码, 得到低频信号参数;
对所述低频信号参数进行语音解码, 得到低带恢复信号;
对所述低带恢复信号进行时 -频域变换, 得到低频频域恢复系数; 对所述低带恢复信号进行宽带增强, 获得残差频域系数及残差频域编码 系数;
根据所述低频子带信号对所述低频频域恢复系数及残差频域系数进行感 知加权, 得到模板频域系数;
对所述高频子带信号进行频谱折叠以及时 -频域变换, 得到高频频域系 数;
根据均方误差最小原则对所述模板频域系数与高频频域系数进行匹配, 得到频带扩展参数;
对所述频带扩展参数进行编码;
传输所述低频信号参数、 残差频域编码系数及编码后的频带扩展参数。
2、 根据权利要求 1 所述的超宽带扩展编码方法, 其特征在于, 所述时- 频域变换为 MDCT变换; 所述频域系数为 MDCT系数; 所述频域编码系数 为 MDCT编码系数; 所述频域恢复系数为 MDCT恢复系数。
3、 根据权利要求 2所述的超宽带扩展编码方法, 其特征在于, 对所述低 频子带信号进行语音编码之前还包括:
滤除所述低频子带信号中的工频噪声。
4、 根据权利要求 3所述的超宽带扩展编码方法, 其特征在于, 对所述低 带恢复信号进行宽带增强, 获得残差频域系数及残差频域编码系数具体为: 用所述低频子带信号减去所述低带恢复信号, 得到残差信号; 对所述残差信号进行 MDCT变换, 得到残差 MDCT系数; 对所述残差 MDCT系数进行编码 , 得到残差 MDCT编码系数。
5、 根据权利要求 4所述的超宽带扩展编码方法, 其特征在于, 根据所述 低频子带信号对所述低频频域恢复系数及残差频域系数进行感知加权具体 为:
将所述低频 MDCT恢复系数与所述残差 MDCT系数进行叠加; 根据所述低频子带信号获得的感知加权参数, 对叠加得到的信号进行感 知力口权。
6、 根据权利要求 4所述的超宽带扩展编码方法, 其特征在于, 对所述残 差 MDCT系数进行编码具体为:
根据比特量首先对所述残差 MDCT系数的后 48个进行部分或全部编码, 然后根据剩余比特量对所述后 48个之前的 112个残差 MDCT系数进行部分 或全部编码。
7、 根据权利要求 6所述的超宽带扩展编码方法, 其特征在于, 进行部分 或全部编码具体为:
将所述残差 MDCT系数每 16个分成一个子带, 对部分或全部子带进行 球型矢量量化。
8、 根据权利要求 5所述的超宽带扩展编码方法, 其特征在于, 将所述低 频 MDCT恢复系数与所述残差 MDCT系数进行叠加具体为:
对所述残差 MDCT系数经过编码后得到的残差 MDCT编码系数, 进行 解码, 得到残差 MDCT恢复系数;
将所述低频 MDCT恢复系数与所述残差 MDCT恢复系数进行叠加。
9、 根据权利要求 2所述的超宽带扩展编码方法, 其特征在于, 根据均方 误差最小原则对所述模板频域系数与高频频域系数进行匹配, 得到频带扩展 参数具体为:
将所述高频 MDCT系数分段; 根据均方误差最小原则, 得到所述模板 MDCT 系数相对于每段高频 MDCT系数的能量增益值,以及所述能量增益值对应的所述模板 MDCT系数 起始位置;
对所述频带扩展参数进行编码具体为: 对所述能量增益值及起始位置进 行编码。
10、 根据权利要求 2所述的超宽带扩展编码方法, 其特征在于, 根据所 述低频子带信号对所述低频频域恢复系数及残差频域系数进行感知加权, 得 到模板频域系数具体为:
根据所述低频子带信号对 3kHz ~ 8kHz范围内的所述低频 MDCT恢复系 数及残差 MDCT系数进行感知加权, 得到模板 MDCT系数。
11、 一种超宽带扩展解码方法, 其特征在于, 包括:
接收超宽带语音编码信号, 并从中提取低频信号参数、 残差频域编码系 数及编码后的频带扩展参数;
对接收到的低频信号参数、 残差频域编码系数及编码后的频带扩展参数 进行解码, 得到低带恢复信号、 残差频域恢复系数以及频带扩展恢复参数; 对所述低带恢复信号进行频域变换, 得到低频频域恢复系数;
叠加所述低频频域恢复系数与残差频域恢复系数, 得到低带增强频域系 数;
对叠加后得到的系数进行频 -时域变换, 得到低频子带恢复信号; 根据所述低频子带恢复信号对所述低带增强频域系数进行感知加权, 得 到模板频域恢复系数;
根据所述模板频域恢复系数以及频带扩展恢复参数重构高频频域恢复系 数;
将所述高频频域恢复系数进行频-时域变换及频语折叠, 得到高频子带恢 复信号;
合并所述低频子带恢复信号与高频子带恢复信号, 得到超宽带语音恢复 信号。
12、 根据权利要求 11所述的超宽带扩展解码方法, 其特征在于, 所述时 -频域变换为 MDCT变换, 所述频 -时域变换为 IMDCT变换; 所述频域编码 系数为 MDCT编码系数; 所述频域恢复系数为 MDCT恢复系数; 所述频域 系数为 MDCT系数; 所述频 -时域变换为 IMDCT变换。
13、 根据权利要求 12所述的超宽带扩展解码方法, 其特征在于, 根据所 述低频子带恢复信号对所述低带增强频域系数进行感知加权还包括: 提取 3kHz ~ 8kHz所述氐频 MDCT恢复系数。
14、 根据权利要求 12或 13所述的超宽带扩展解码方法, 其特征在于, 将所述高频频域恢复系数进行频-时域变换之后还包括:
对经过 IMDCT变换的高频 MDCT恢复系数进行去加重处理。
15、 一种超宽带扩展编码器, 其特征在于, 包括:
正交镜像分析滤波器, 用于将超宽带语音信号拆分为高频子带信号和低 频子带信号;
核心层编码器, 用于对所述低频子带信号进行语音编码, 得到低频信号 参数;
核心层解码器, 用于将所述低频子带信号进行语音编码后得到的低频信 号参数, 进行语音解码, 得到低带恢复信号;
低频 MDCT模块, 用于对所述低带恢复信号进行 MDCT变换, 得到低 频 MDCT恢复系数;
宽带增强模块,用于对所述低带恢复信号进行宽带增强 ,获得残差 MDCT 系数及残差 MDCT编码系数;
感知加权处理模块, 用于根据所述低频子带信号对所述低频 MDCT恢复 系数及残差 MDCT系数进行感知加权, 得到模板 MDCT系数;
频谱折叠模块, 用于对所述高频子带信号进行频谱折叠;
高频 MDCT模块,用于对经过频谱折叠的所述高频子带信号进行 MDCT 变换, 得到高频 MDCT系数;
高带超宽带扩展处理器, 用于根据均方误差最小原则对所述模板 MDCT 系数与高频 MDCT系数进行匹配, 得到频带扩展参数;
高带超宽带扩展编码器, 用于对所述频带扩展参数进行编码;
复用器, 用于传输所述低频信号参数、 残差 MDCT编码系数及编码后的 频带扩展参数。
16、 根据权利要求 15所述的超宽带扩展编码器, 其特征在于, 还包括: 高通滤波器, 用于滤除所述低频子带信号中的工频噪声;
所述核心层编码器还用于对滤除工频噪声的低频子带信号进行语音编 码。
17、 根据权利要求 15所述的超宽带扩展编码器, 其特征在于, 所述宽带 增强模块包括:
残差获取模块, 用于用所述低频子带信号减去所述低带恢复信号, 得到 残差信号;
残差 MDCT模块, 用于对所述残差信号进行 MDCT 变换, 得到残差 MDCT系数;
宽带增强编码器,用于对所述残差 MDCT系数进行编码,得到残差 MDCT 编码系数;
叠加模块, 用于将经过 MDCT 的所述低带恢复信号与所述残差 MDCT 系数进行叠加。
18、 根据权利要求 17所述的超宽带扩展编码器, 其特征在于, 所述宽带 增强模块还包括:
宽带增强解码器, 用于对所述残差 MDCT 系数经过编码后得到的残差 MDCT编码参数, 进行解码, 得到残差 MDCT恢复系数;
所述叠加模块还用于将经过 MDCT变换的所述低带恢复信号与所述残差 MDCT恢复系数进行叠加。
19、 一种超宽带扩展解码器, 其特征在于, 包括:
解复用器, 用于接收所述低频信号参数、 残差 MDCT编码系数及编码后 的误差参数;
核心层解码器, 用于对接收到的所述低频信号参数进行解码, 得到低带 恢复信号;
宽带增强解码器, 用于对接收到的残差 MDCT编码系数进行解码, 得到 残差 MDCT恢复系数;
高带超宽带扩展解码器, 用于对接收到的所述编码后的频带扩展参数进 行解码, 得到频带扩展恢复参数;
MDCT模块,用于对所述低带恢复信号进行 MDCT变换,得到低频 MDCT 恢复系数;
叠加模块, 用于对所述低频 MDCT恢复系数与残差 MDCT恢复系数进 行叠加, 得到低带增强 MDCT系数;
低频 IMDCT模块, 用于对所述低带增强 MDCT系数进行 IMDCT变换, 得到低频子带恢复信号;
感知加权处理模块, 用于根据所述低频子带恢复信号对所述低带增强 MDCT系数进行感知加权, 得到模板 MDCT恢复系数;
高带超宽带扩展反处理器, 用于根据所述模板 MDCT恢复系数以及频带 扩展恢复参数重构高频 MDCT恢复系数;
高频 IMDCT模块, 用于将所述高频 MDCT恢复系数进行 IMDCT变换; 频谱折叠模块, 用于将经过 IMDCT变换的高频 MDCT恢复系数进行频 语折叠, 得到高频子带恢复信号;
正交镜像合成滤波器, 用于合并所述低频子带恢复信号与高频子带恢复 信号, 得到超宽带语音恢复信号。
20、 根据权利要求 19所述的超宽带扩展解码器, 其特征在于, 还包括: 去加重模块, 用于对经过 IMDCT变换的高频 MDCT恢复系数进行去加 重处理。
21、 一种超宽带扩展系统, 其特征在于, 包括: 上述权利要求 15-18 中 任一项所述的超宽带扩展编码器及上述权利要求 19-20 中任一项所述的超宽 带扩展解码器。
PCT/CN2009/070651 2008-03-05 2009-03-05 超宽带扩展编码、解码方法、编码器及超宽带扩展系统 WO2009109139A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN 200810082734 CN101527138B (zh) 2008-03-05 2008-03-05 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
CN200810082734.3 2008-03-05

Publications (1)

Publication Number Publication Date
WO2009109139A1 true WO2009109139A1 (zh) 2009-09-11

Family

ID=41055556

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2009/070651 WO2009109139A1 (zh) 2008-03-05 2009-03-05 超宽带扩展编码、解码方法、编码器及超宽带扩展系统

Country Status (2)

Country Link
CN (1) CN101527138B (zh)
WO (1) WO2009109139A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986685A (zh) * 2020-08-31 2020-11-24 北京百瑞互联技术有限公司 一种实现高采样率的音频编解码方法及系统
CN112309408A (zh) * 2020-11-10 2021-02-02 北京百瑞互联技术有限公司 一种扩展lc3音频编解码带宽的方法、装置及存储介质
CN113470667A (zh) * 2020-03-11 2021-10-01 腾讯科技(深圳)有限公司 语音信号的编解码方法、装置、电子设备及存储介质
WO2023241240A1 (zh) * 2022-06-15 2023-12-21 腾讯科技(深圳)有限公司 音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
US11869525B2 (en) 2014-07-28 2024-01-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder to filter a discontinuity by a filter which depends on two fir filters and pitch lag
CN117746889A (zh) * 2022-12-21 2024-03-22 行吟信息科技(武汉)有限公司 音频处理方法、装置、电子设备及存储介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011122875A2 (ko) 2010-03-31 2011-10-06 한국전자통신연구원 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
TWI453694B (zh) * 2010-12-02 2014-09-21 Univ Nat Taiwan Science Tech 一種避免像素擴張之影像加密方法
CN105247614B (zh) 2013-04-05 2019-04-05 杜比国际公司 音频编码器和解码器
CN103413557B (zh) * 2013-07-08 2017-03-15 深圳Tcl新技术有限公司 语音信号带宽扩展的方法和装置
EP3066760B1 (en) * 2013-11-07 2020-01-15 Telefonaktiebolaget LM Ericsson (publ) Methods and devices for vector segmentation for coding
CN107123418B (zh) * 2017-05-09 2020-12-25 广东小天才科技有限公司 一种语音消息的处理方法及移动终端
JP6693551B1 (ja) * 2018-11-30 2020-05-13 株式会社ソシオネクスト 信号処理装置および信号処理方法
BR112021013767A2 (pt) * 2019-01-13 2021-09-21 Huawei Technologies Co., Ltd. Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório
CN112669860B (zh) * 2020-12-29 2022-12-09 北京百瑞互联技术有限公司 一种增加lc3音频编解码有效带宽的方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1527995A (zh) * 2001-11-14 2004-09-08 ���µ�����ҵ��ʽ���� 编码设备和解码设备
CN1809872A (zh) * 2003-06-25 2006-07-26 科丁技术公司 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
US20070033023A1 (en) * 2005-07-22 2007-02-08 Samsung Electronics Co., Ltd. Scalable speech coding/decoding apparatus, method, and medium having mixed structure
CN101044552A (zh) * 2004-10-27 2007-09-26 松下电器产业株式会社 语音编码装置和语音编码方法
CN101048814A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 编码装置、解码装置、编码方法及解码方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1527995A (zh) * 2001-11-14 2004-09-08 ���µ�����ҵ��ʽ���� 编码设备和解码设备
CN1809872A (zh) * 2003-06-25 2006-07-26 科丁技术公司 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
CN101044552A (zh) * 2004-10-27 2007-09-26 松下电器产业株式会社 语音编码装置和语音编码方法
CN101048814A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 编码装置、解码装置、编码方法及解码方法
US20070033023A1 (en) * 2005-07-22 2007-02-08 Samsung Electronics Co., Ltd. Scalable speech coding/decoding apparatus, method, and medium having mixed structure

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11869525B2 (en) 2014-07-28 2024-01-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder to filter a discontinuity by a filter which depends on two fir filters and pitch lag
US12014746B2 (en) 2014-07-28 2024-06-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder to filter a discontinuity by a filter which depends on two fir filters and pitch lag
US12033648B2 (en) 2014-07-28 2024-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder for removing a discontinuity between frames by subtracting a portion of a zero-input-reponse
CN113470667A (zh) * 2020-03-11 2021-10-01 腾讯科技(深圳)有限公司 语音信号的编解码方法、装置、电子设备及存储介质
CN111986685A (zh) * 2020-08-31 2020-11-24 北京百瑞互联技术有限公司 一种实现高采样率的音频编解码方法及系统
CN112309408A (zh) * 2020-11-10 2021-02-02 北京百瑞互联技术有限公司 一种扩展lc3音频编解码带宽的方法、装置及存储介质
WO2023241240A1 (zh) * 2022-06-15 2023-12-21 腾讯科技(深圳)有限公司 音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN117746889A (zh) * 2022-12-21 2024-03-22 行吟信息科技(武汉)有限公司 音频处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN101527138A (zh) 2009-09-09
CN101527138B (zh) 2011-12-28

Similar Documents

Publication Publication Date Title
WO2009109139A1 (zh) 超宽带扩展编码、解码方法、编码器及超宽带扩展系统
JP7483792B2 (ja) 符号化オーディオ信号を復号する復号装置および復号方法
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
US8532983B2 (en) Adaptive frequency prediction for encoding or decoding an audio signal
WO2009067883A1 (fr) Procédé de codage/décodage et dispositif pour le bruit de fond
Ning et al. Wideband audio compression using a combined wavelet and WLPC representation

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09718262

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09718262

Country of ref document: EP

Kind code of ref document: A1