WO2010000179A1 - 频带扩展的方法、系统和设备 - Google Patents

频带扩展的方法、系统和设备 Download PDF

Info

Publication number
WO2010000179A1
WO2010000179A1 PCT/CN2009/072371 CN2009072371W WO2010000179A1 WO 2010000179 A1 WO2010000179 A1 WO 2010000179A1 CN 2009072371 W CN2009072371 W CN 2009072371W WO 2010000179 A1 WO2010000179 A1 WO 2010000179A1
Authority
WO
WIPO (PCT)
Prior art keywords
excitation spectrum
frequency domain
signal
band
spectrum
Prior art date
Application number
PCT/CN2009/072371
Other languages
English (en)
French (fr)
Inventor
张德明
张立斌
张琦
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2010000179A1 publication Critical patent/WO2010000179A1/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Definitions

  • the present invention relates to the field of signal bearing technologies, and in particular, to a method, system and device for band extension. Background technique
  • the spectrum envelope, the time domain envelope, and the partial spectral coefficients of the broadband and ultra-wideband parts can only be encoded, and then these parameters are adopted at the decoding end.
  • the method performs band expansion to reconstruct signals in the broadband and ultra-wideband parts.
  • the existing method of frequency band extension is mainly represented by AMRWB+ (Adaptive multi-rate wide band plus adaptive multi-rate wideband coding +), which uses a narrow-band excitation signal and a high-band synthesis filter to generate a high-band signal to achieve frequency band expansion. .
  • AMRWB+ Adaptive multi-rate wide band plus adaptive multi-rate wideband coding +
  • the inventors of the present invention have found that the prior art needs to consume more bit resources to describe the high-band synthesis filter parameters, and there are many bit resources consumed, and the bit resources are limited. The problem is not applicable or the effect of refactoring is not good.
  • Embodiments of the present invention provide a method, system, and device for band extension, which solve the problem of consuming more bit resources.
  • a decoding method including:
  • a reconstructed high band signal is generated based on the excitation spectrum and contour information in the original high band signal.
  • An encoding method including:
  • Tone feature analysis is performed on the frequency domain signal of the ultra-wideband portion to extract pitch feature parameters; and the pitch feature parameters are quantized and encoded.
  • a band extension system comprising:
  • An encoding end configured to send an original highband signal and a tone feature parameter
  • a decoding end configured to receive a tone feature parameter and an original high band signal sent by the encoding end; generate an excitation spectrum according to the tone feature parameter; and generate a reconstructed high band according to the excitation spectrum and the contour information in the original high band signal signal.
  • a decoding end comprising:
  • a receiving unit configured to receive a tone feature parameter and an original high band signal
  • An excitation spectrum generating unit configured to generate an excitation spectrum according to the pitch characteristic parameter
  • a high band signal generating unit configured to generate a reconstructed high band signal based on the excitation spectrum and the contour information in the original high band signal.
  • An encoding end including:
  • a tone characteristic parameter extracting unit configured to perform pitch characteristic analysis on a frequency domain signal of an ultra-wideband portion, and extract a pitch characteristic parameter
  • a quantization unit configured to quantize and encode the tonal feature parameters.
  • the embodiment of the invention adopts the key feature parameter of the original high-band signal at the encoding end: the tone feature parameter, and performs coding transmission with very few bit resources.
  • the decoding end an excitation spectrum is generated according to the pitch characteristic parameter, and a reconstructed high-band signal is finally generated according to the contour information of the original high-band signal, thereby realizing band expansion. Due to the detailed feature of the original high-band signal when the high-band signal is reconstructed at the decoding end, the reconstructed high-band signal has a better match in detail except that the contour is close to the original high-band signal. A better hearing effect can be achieved with less bit resource consumption.
  • the program may be stored in a computer readable storage medium, and the storage medium may include: Read Only Memory (ROM), Random Access Memory (RAM), disk or optical disk.
  • ROM Read Only Memory
  • RAM Random Access Memory
  • FIG. 1 is a flow chart of a first embodiment of a decoding method of the present invention
  • FIG. 2 is a flow chart of a second embodiment of a decoding method of the present invention.
  • FIG. 3 is a flow chart of an embodiment of an encoding method of the present invention.
  • FIG. 4 is a structural diagram of an embodiment of a band extension system of the present invention.
  • Figure 5 is a structural diagram of an embodiment of a band extension decoding end of the present invention
  • Figure 6 is a block diagram showing an embodiment of a band extension coding end of the present invention.
  • FIG. 1 is a signaling flowchart of a first embodiment of a decoding method according to the present invention.
  • Embodiments of the present invention are utilized in ultra-wideband codecs.
  • the encoder's input signal is a 32 kHz sample rate with a processing frame length of 20 ms. After the input signal is divided into sub-bands and down-sampling, the signal corresponding to the 0 ⁇ 8 kHz band has 320 sampling points, and the signal corresponding to the 8 ⁇ 16 kHz band has 320 sampling points.
  • the signal in the 0 ⁇ 8kHz band is processed by the core encoder, and the core encoder can be the G.729.1 codec or other wideband signal codec.
  • a set of MDCT coefficients are obtained after MDCT transformation, that is, the frequency domain signals corresponding to the frequency band ⁇ Y_swb(0), y_swb(l), ⁇ , y_swb(319) ⁇ , since the UWB only processes signals in the 8 ⁇ 14kHz band, only the frequency i or the signal is processed ⁇ y- b( 0), y- b(l), ⁇ , y_swb(239) ⁇ .
  • the frequency domain signal is divided into N sub-bands, and the frequency domain envelope of each sub-band is extracted and quantized to obtain a set of 4 ⁇ frequency i or packet end ⁇ spec _ env(0), spec _ env(l),... ,spec_ env(N - 1) ⁇ , this group of packets is finally encoded and transmitted to the decoder.
  • the 7 ⁇ 8 kHz part of the signal is no longer in its processing range.
  • the characteristic parameters of the 7 ⁇ 8 kHz partial signal need to be extracted at the encoding end.
  • the G.729.1 encoder performs MDCT transformation on the 4 ⁇ 8 kHz signal, the corresponding frequency domain signal ⁇ y _ wb(0), y _ wb(l), ..., y _ wb(l59) ⁇ , where 7
  • the frequency domain signals corresponding to ⁇ 8kHz are ⁇ y -wb( ⁇ 2Q), y _wb( ⁇ 2 ⁇ ), ..., y_wb(159) ⁇ , which are divided into M sub-bands at the encoding end, and each sub-band is extracted.
  • the embodiment of the present band extension method comprises an encoding method and a decoding method: the tone characteristic parameter is first extracted by the encoding end and sent to the decoding end, and the decoding end reconstructs the high band signal according to the pitch characteristic parameter and the contour information of the original high band signal. Specifically, the following steps are included:
  • Step 101 The encoding end sends the extracted pitch feature parameter to the decoding end.
  • Max(Corr[n) lc quantizes the tonal feature parameters, and obtains the quantized tonal feature parameters and transmits them to the decoding end.
  • Step 102 Decoding the decoder to obtain a tone feature parameter.
  • the decoding end decodes the received code to obtain a tone feature parameter. .
  • Step 103 The decoding end generates an excitation spectrum according to the pitch feature parameter.
  • Step 103A The decoding end generates an initial excitation spectrum
  • Step 103B The decoding end can whiten the initial excitation spectrum to equalize the energy distribution of the initial excitation spectrum
  • the decoding end extracts the spectral envelope of the initial excitation spectrum E, the initial excitation spectrum is whitened. Specific steps are as follows:
  • the initial excitation spectrum is divided into 7 sub-bands, and the average energy of each sub-band, that is, the spectral envelope, is calculated.
  • the spectral envelope can also be smoothly interpolated to obtain a set of normalization factors ⁇ (0), (1), extended (279) .
  • the decoding end performs tone adjustment on the initial excitation spectrum according to the original frequency band signal spectrum to obtain an excitation spectrum; it should be noted that if the initial excitation spectrum passes the whitening operation of 103B, the initial excitation spectrum input in this step is the initial excitation spectrum after whitening.
  • the pitch characteristic parameter ⁇ min(Q) / TW ) of the pseudo spectrum SE of the initial excitation spectrum.
  • Noise ⁇ noise(O) , noise( 1 ), whil , noise(279) ⁇ .
  • Step 104 The decoder may perform frequency band adjustment on the finally generated excitation spectrum to obtain a more accurate excitation spectrum of the frequency band;
  • Step 105 The decoding end generates a reconstructed highband signal according to the excitation spectrum and contour information (such as frequency domain envelope information) in the original highband signal. That is, the energy level matching adjustment of the excitation spectrum is performed to obtain a reconstructed high-band signal; the specific steps are as follows:
  • the frequency domain envelope of the excitation spectrum (in this embodiment, the frequency domain energy), that is, according to the same subband division with the encoding end, extracts the subband energy of the excitation spectrum, and the excitation spectrum subband energy of the 7 ⁇ 8 kHz portion is: ⁇ excit _ energy _ extra(O), excit _ energy _ extra( ⁇ ), excit _ energy _ extra ⁇ , excitation spectrum subband energy of 8 ⁇ 14kHz Shao is ⁇ e;cd _ energy(O), excit _ energy (l), whil, excit _ energy (14) ⁇ .
  • 5b decodes the frequency domain envelope information of the original highband signal:
  • the frequency domain energy of the original highband signal can be obtained by multiplying the frequency domain envelope by the number of spectral coefficients in the subband: ⁇ orig _ energy _ extra(0) , orig _ energy _ extrail), orig _ energy _ extra(2) ⁇ and ⁇ orig _ energy(O), orig _ energy (I), , orig _ energy (IA) ⁇ .
  • 5c can smooth the frequency domain energy of the excitation spectrum and the frequency domain energy of the original high-band signal according to the pitch characteristic parameters of the original high-band signal, and obtain the frequency domain energy of the smoothed excitation spectrum.
  • 5d calculates the energy level matching gain factor of each subband according to the smoothed frequency domain energy
  • Excit _ energy _ sm(i) is smoothed, and the input is the frequency domain energy in 5a, 5b.
  • the excitation spectrum including the reconstructed spectrum of the 7 ⁇ 8kHz part ⁇ H extra(0), y_re_ extra( ⁇ ), ---, y_re_ extra(39) ⁇ , the reconstructed part of the 8 ⁇ 14kHz part ⁇ y _ re(0 ), y _ re(l), - --, y_ re(239) ⁇ , that is, the final reconstructed high-band signal completes the band extension.
  • the decoding end performs energy level matching adjustment on the excitation spectrum, so that the energy envelope of the synthesized spectrum is close to the original ultra-wideband spectrum.
  • the embodiment of the invention adopts the key feature parameter of the original high-band signal at the encoding end: the tone feature parameter, and performs coding transmission with very few bit resources.
  • the excitation spectrum of the reconstructed high-band signal is generated according to the pitch characteristic parameter, and the reconstructed high-band signal is finally generated according to the contour information of the original high-band signal (for example, the frequency domain envelope) to implement frequency band expansion.
  • the reconstructed high-band signal Due to the operation of the high-band signal at the decoding end, based on the detailed feature of the original high-band signal, that is, the pitch characteristic parameter, the reconstructed high-band signal has a detail in addition to the contour and the original high-band signal. A good match can achieve better hearing results with less bit resource consumption.
  • FIG. 2 is a signaling flowchart of a second embodiment of a decoding method according to the present invention.
  • Embodiments of the present invention are utilized in ultra-wideband codecs.
  • the input signal of the encoder is a sampling rate of 32 kHz, and the processing frame length is 20 ms. After the input signal is divided into sub-bands and down-sampling, there are 320 sampling points corresponding to the 0 ⁇ 8 kHz band, and 320 samples corresponding to the 8 ⁇ 16 kHz band.
  • the signal in the 0 ⁇ 8kHz band is processed by the core encoder, and the core encoder can be the G.729.1 codec or other wideband signal codec.
  • a set of MDCT coefficients is obtained, that is, the frequency domain signals corresponding to the frequency band ⁇ y_swb(0), y_swb(l), ⁇ , y_swb(319) ⁇ , since the ultra-wideband part only processes 8 ⁇
  • the frequency domain signal is divided into N sub-bands, and the frequency domain envelope of each sub-band is extracted and quantized to obtain a set of 4 ⁇ frequency i or packet end ⁇ spec _ env(0), spec _ env(l),... ,spec_ env(N - 1) ⁇ , this group of packets is finally encoded and transmitted to the decoder.
  • the 7 ⁇ 8 kHz part of the signal is no longer in its processing range.
  • the characteristic parameters of the 7 ⁇ 8 kHz partial signal need to be extracted at the encoding end.
  • the G.729.1 encoder performs MDCT transformation on the 4 ⁇ 8 kHz signal, the corresponding frequency domain signal ⁇ y _ wb(0), y _ wb(l), ..., y _ wb(l59) ⁇ , where 7
  • the frequency domain signals corresponding to ⁇ 8 kHz are ⁇ y_wb(l20), y_wb(l2l), ..., y_wb(l59) ⁇ , which are divided into M subbands at the encoding end, and the frequency domain envelope of each subband is extracted and quantized. , get a set of quantized frequency domain envelopes
  • the embodiment of the present band extension method comprises an encoding method and a decoding method: the tone characteristic parameter is first extracted by the encoding end and sent to the decoding end, and the decoding end reconstructs the high band signal according to the pitch characteristic parameter and the contour information of the original high band signal. Specifically, the following steps are included:
  • Step 201 The encoding end sends the extracted pitch feature parameter to the decoding end.
  • the tonal feature analysis is performed, the tonal feature parameters are extracted, and the parameter is quantized and transmitted to the decoding end.
  • A(l) divides the frequency domain signals ⁇ 3 ⁇ 4 ⁇ c(0), 3 ⁇ 4 ⁇ c(l), ⁇ , «(239) ⁇ into K sub-bands, in this embodiment
  • the tonal characteristics of the ⁇ spec(0), speed), whil, ⁇ c(119) ⁇ part, tona correspond to the tonal characteristics of the ⁇ spec(l20), spec(121),..., spec(239) ⁇ part .
  • the encoding end quantizes to A, its value range can be limited to 1.125 ⁇ 4.5.
  • the parameters used can be of various sources, and the calculation of specific parameters can also have various calculation methods. E.g:
  • a frequency domain signal ⁇ (0), speed), ⁇ , spec(239) ⁇ of the ultra-wideband part may be ⁇
  • may also be a pseudo-spectral signal ⁇ s(0),s(s) calculated by the original frequency domain signal through the following formula (1). l), whil,s(239) ⁇ :
  • step (1) the calculation of the mean value can also be calculated according to the following formula.
  • step (1) the calculation of the sub-band tonal characteristic parameter may also be calculated according to the following formula:
  • step (2) the synthesis of the pitch characteristic parameters can also be calculated according to the following formula
  • step (2) the synthesis of the pitch characteristic parameters can also be calculated according to the following formula.
  • Step 202 The decoding end decodes and obtains a tone feature parameter.
  • Step 203 The decoding end generates an excitation spectrum according to the pitch characteristic parameter. Specifically, the method may include the following steps: Step 203A: The decoding end generates an initial excitation spectrum.
  • the excitation spectrum E ⁇ excit(O), excitd), ..., excit(V - 1) ⁇
  • the excitation spectrum can be obtained, for example, in the following manner:
  • the MDCT transform is performed on the time domain signal in the 0 ⁇ 4 kHz band reconstructed by the decoder, and the frequency domain signal in the 0 ⁇ 4 kHz band is obtained ⁇ > ⁇ _/0(0), ⁇ _/0(1), ⁇ ⁇ , y_lo(159) ⁇ , and the decoded frequency domain signals in the 4 ⁇ 7kHz band ⁇ )_/ ⁇ 0),) _/ ⁇ 1), «, y_ ⁇ 119) ⁇
  • the two-part spectrum combination constitutes the original excitation spectrum ⁇ y_ lo(0), y _ lo(l), ⁇ , y_ to(159), y _ h(0), y _ h(l), ⁇ , y_h(U9) ⁇ .
  • Step 203B Since the excitation spectrum itself has a tonal characteristic, in order to match the tonal characteristics of the excitation spectrum with the tonal characteristics of the original ultra-wideband signal spectrum, the initial excitation spectrum can be adjusted in tone, and the specific step is performed.
  • the steps are as follows:
  • SE ⁇ s _ excit(0), s _ excit( ⁇ ), , s _ excit(219) ⁇ .
  • c divides the excitation spectrum and the pseudo spectrum into two sub-bands.
  • SE ⁇ ⁇ s _ excit(l60), s _ excit (161), ,s _ excit ⁇ 219) ⁇ ,
  • Step 203C The decoding end can whiten the excitation spectrum after the tone adjustment, so that the energy distribution of the excitation spectrum is balanced, which is beneficial to subsequent energy level matching adjustment;
  • the decoding end extracts the spectral envelope of the stimulus Y after the tone adjustment, and whitens the excitation spectrum. Specific steps are as follows:
  • the spectral envelope is smoothly interpolated to obtain a set of normalization factors W(0), (1), ⁇ ⁇ - ⁇ (279) ⁇ .
  • C whitens the excitation spectrum, and the excitation spectrum after whitening is:
  • the whitening process is:
  • the final excitation spectrum is generated.
  • the stimuli after the tone adjustment is also possible to use the stimuli after the tone adjustment as the final excitation spectrum without whitening.
  • Step 204 The decoding end may perform frequency band adjustment on the finally generated excitation spectrum to obtain a more accurate excitation spectrum of the frequency band;
  • the decoding end uses the following formula to adjust the frequency band of the excitation spectrum.
  • Step 205 The decoding end may add a noise spectrum to the excitation spectrum.
  • the noise spectrum is added under the control of the pitch characteristic parameters of the original UWB signal, and the excitation spectrum after the noise is obtained.
  • Y _ extra _n ⁇ y _ extra _ n(0), y _ extra _ ⁇ ( ⁇ ), ⁇ , y _ extra _ «(39) ⁇ ,
  • Y _swb_n ⁇ y _swb_ n(0), y _swb _ n(l), ---, y_swb_ «(239) ⁇ .
  • the specific process is as follows:
  • the decoding end generates a reconstruction high according to the excitation spectrum and the contour information in the original high-band signal (such as frequency domain envelope information) With signal. That is, the decoding end performs energy level matching adjustment on the excitation spectrum to obtain a reconstructed high-band signal.
  • the energy level matching adjustment is performed on the excitation spectrum so that the energy envelope of the synthesized spectrum is close to the original ultra-wideband spectrum. Specific steps are as follows:
  • the frequency domain envelope of the excitation spectrum (in this embodiment, the frequency domain energy), that is, according to the same subband division with the encoding end, extracts the subband energy of the excitation spectrum, and the excitation spectrum subband energy of the 7 ⁇ 8 kHz portion is
  • 6b decodes the frequency domain envelope information of the original highband signal:
  • the frequency domain energy of the original highband signal can be obtained by multiplying the frequency domain envelope by the number of spectral coefficients in the subband: ⁇ orig _ energy _ extra(O ), orig _ energy _ extra(l), orig _ energy _ extra(2) ⁇ and ⁇ orig _ energy(Q), orig _ energy , , orig _ energy(l4) ⁇ .
  • 6c can smooth the frequency domain energy of the excitation spectrum and the frequency domain energy of the original high-band signal according to the pitch characteristic parameters of the original high-band signal, and obtain the frequency domain energy of the smoothed excitation spectrum ⁇ excit _ energy _ extra _ sm (0), excit _ energy _ extra _ (1), excit _ energy _ extra _ sm(2) ⁇ ,
  • Frequency domain energy for the 8 ⁇ 14kHz portion: energy _ sm ⁇ i) energy ( ⁇ ) ⁇ , where e .
  • excitation spectrum including the reconstructed spectrum of the 7 ⁇ 8kHz part ⁇ n extra(O), y_re_ extra( ⁇ ---, y_re_ extra(39) ⁇ , the reconstructed spectrum of the 8 ⁇ 14kHz part ⁇ y_r e (0), Y_ / ⁇ (1), ⁇ ,)_ re(239) ⁇ , the final reconstructed high-band signal, Complete the expansion of the frequency band.
  • the embodiment of the invention adopts the key feature parameter of the original high-band signal at the encoding end: the tone feature parameter, and performs coding transmission with very few bit resources.
  • the excitation spectrum of the reconstructed high-band signal is generated according to the pitch characteristic parameter, and the reconstructed high-band signal is finally generated according to the contour information of the original high-band signal (for example, the frequency domain envelope) to implement frequency band expansion.
  • the reconstructed high-band signal Due to the operation of the high-band signal at the decoding end, based on the detailed feature of the original high-band signal, that is, the pitch characteristic parameter, the reconstructed high-band signal has a detail in addition to the contour and the original high-band signal. A good match can achieve better hearing results with less bit resource consumption.
  • FIG. 3 is a structural diagram of an embodiment of an encoding method according to the present invention.
  • Step 301 Perform pitch characteristic analysis on the frequency domain signal of the ultra-wideband part to extract pitch characteristic parameters; the specific steps are as follows:
  • the 301E combines the pitch characteristic parameters of each sub-band to obtain the tone feature parameters.
  • Step 301 can also be done in the following manner.
  • Step 302 Quantize and encode the tonal feature parameters.
  • FIG. 4 is a structural diagram of an embodiment of a frequency band extension system according to the present invention.
  • the encoding end 401 is configured to send the original highband signal and the tonal feature parameter
  • the encoding end 401 performs pitch characteristic analysis on the frequency domain signals ⁇ (0), «(1), . . . , 3 ⁇ 4 ⁇ c(239) ⁇ of the ultra-wideband portion, extracts pitch characteristic parameters, and quantizes the pitch parameters. , the code is transmitted to the decoder.
  • the tonal feature parameter to is quantized, and the quantized tonal feature parameter toWfl is obtained and transmitted to the decoding end.
  • the decoding end 402 is configured to receive the tone feature parameter and the original high band signal sent by the encoding end 401; generate an excitation spectrum according to the tone feature parameter; and generate a reconstruction according to the excitation spectrum and the contour information in the original high band signal High band signal.
  • the decoding end 402 may further include:
  • the receiving unit 40201 is configured to receive the tone feature parameter and the original high band signal sent by the encoding end 401;
  • the excitation spectrum generating unit 40202 is configured to generate an excitation i-ridge of the reconstructed high-band signal according to the pitch characteristic parameter;
  • a high-band signal generating unit 40203 configured to generate a reconstructed high-band signal according to the excitation spectrum and the contour information in the original high-band signal;
  • the excitation spectrum generating unit 40202 may further include: an excitation spectrum shaping unit 40202a for generating an initial excitation spectrum, and shaping the initial excitation spectrum to obtain a tone-formed excitation spectrum.
  • the excitation spectrum generating unit 40202 may further include:
  • the whitening unit 40202b is configured to whiten the excitation spectrum after the initial excitation spectrum or the tone adjustment to obtain an excitation spectrum after whitening.
  • the decoding end 402 may further include:
  • the band adjustment unit 40204 is configured to perform band adjustment on the generated excitation spectrum.
  • the noise adding unit 40205 is configured to add a noise spectrum in the excitation spectrum that brings the excitation spectrum closer to the original high-band signal spectrum structure.
  • the high band signal generating unit 40203 may further include:
  • a spectral envelope extracting unit 40203a configured to extract a spectral envelope of the excitation spectrum
  • a smoothing unit 40203b configured to perform smooth interpolation on a spectral envelope of the excitation spectrum and the original highband signal decoding spectral envelope to generate a continuous frequency domain envelope
  • a gain factor calculation unit 40203c configured to calculate a gain factor of the energy level matching according to the frequency domain envelope
  • the generating unit 40203d is configured to shape the excitation spectrum according to the gain factor to generate a reconstructed highband signal.
  • FIG. 5 is a structural diagram of an implementation of a band extension decoding end according to the present invention; the method includes: a receiving unit 501, configured to receive a tone feature parameter and an original high band signal sent by an encoding end; and an excitation spectrum generating unit 502, configured to Generating an excitation spectrum of the reconstructed high-band signal according to the pitch characteristic parameter;
  • a high band signal generating unit 503 configured to perform a wheel according to the excitation spectrum and the original high band signal
  • the profile information generates frequency domain information for reconstructing the high band signal.
  • the excitation spectrum generating unit 502 further includes:
  • the excitation spectrum shaping unit 502a is configured to shape the generated excitation spectrum according to the general characteristic.
  • the whitening unit 502b is used to whiten the generated excitation spectrum.
  • the decoding end may further include:
  • the band adjustment unit 504 is configured to perform band adjustment on the excitation spectrum.
  • a noise adding unit 505 is configured to add a noise spectrum in the excitation spectrum that brings the excitation spectrum closer to the original high-band signal spectrum structure.
  • the high band signal generating unit 503 may further include:
  • a spectral envelope extracting unit 503a configured to extract a spectral envelope of the excitation spectrum
  • a smoothing unit 503b configured to perform smooth interpolating on the spectral envelope of the excitation spectrum and the original high-band signal decoding spectral envelope to generate a continuous frequency domain envelope
  • a gain factor calculation unit 503c configured to calculate a gain factor of the energy level matching according to the frequency domain envelope
  • the generating unit 503d is configured to shape the excitation spectrum according to the gain factor to generate a reconstructed highband signal.
  • FIG. 6 is a structural diagram of an embodiment of a band extension coding end according to the present invention.
  • the code end can be applied to the system shown in FIG. 4, and includes:
  • a tone characteristic parameter extracting unit 601 configured to perform tone characteristic analysis on the ultra-wideband portion of the frequency domain signal to extract pitch characteristic parameters
  • the frequency domain signals ⁇ spec(0), spec(l), ⁇ , spec(239) ⁇ are equally divided into K sub-bands, in this embodiment
  • the pitch characteristic parameters are obtained by synthesizing each sub-band tonal feature parameter.
  • Max(/Zwc 2 , fluc 3 ) can also be done in the following ways:
  • the max(Corr[n]) quantization unit 602 is configured to perform quantization coding on the tone feature parameter to send the tone feature parameter.
  • the tone feature parameter extraction unit 601 can include:
  • the autocorrelation function unit 601a is used to calculate an autocorrelation function of the ultra-wideband partial frequency domain signal.
  • the extracting unit 601c comprehensively extracts pitch characteristic parameters that characterize the entire UWB partial tonal feature.
  • the program may be stored in a computer readable storage medium, and the storage medium may include: ROM, RAM, disk or CD, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

频带扩展的方法、 系统和设备
本申请要求于 2008 年 6 月 30 日提交中国专利局、 申请号为 200810130702.6、 发明名称为 "频带扩展的方法、 系统和设备" 的中国专利申 请的优先权, 其全部内容通过引用结合在本申请中。
技术领域
本发明涉及信号承载技术领域, 具体涉及频带扩展的方法、 系统和设备。 背景技术
现有承载技术中, 宽带、 超宽带部分资源受限制的情况下, 通常只能对宽 带、 超宽带部分的频谱包络、 时域包络、 部分谱系数进行编码, 然后在解码端 通过这些参数方法进行频带扩展, 重构宽带、 超宽带部分的信号。
现有的频带扩展的方法主要以 AMRWB+ ( Adaptive multi-rate wide band plus自适应多速率宽带编码 + ) 为代表的, 利用窄带的激励信号和高带的合成 滤波器生成高带信号, 实现频带扩展。
在对现有技术的研究和实践过程中, 本发明的发明人发现,现有技术需要 消耗较多的比特资源来描述高带合成滤波器参数,存在着消耗比特资源多, 在 比特资源有限的情况下不适用或重构的效果不好的问题。
发明内容
本发明实施例提供一种频带扩展的方法、 系统和设备,解决消耗比特资源 多的问题。
一种解码方法, 包括:
获取音调特征参数和原始高带信号;
根据所述音调特征参数生成激励谱;
根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号。 一种编码方法, 包括:
对超宽带部分的频域信号进行音调特征分析提取音调特征参数; 将所述音调特征参数进行量化编码。
一种频带扩展系统, 包括:
编码端, 用于发送原始高带信号和音调特征参数; 解码端, 用于接收编码端发送的音调特征参数和原始高带信号; 根据所述 音调特征参数生成激励谱;根据所述激励谱和所述原始高带信号中的轮廓信息 生成重构高带信号。
一种解码端, 包括:
接收单元, 用于接收音调特征参数和原始高带信号;
激励谱生成单元, 用于根据所述音调特征参数生成激励谱;
高带信号生成单元,用于根据所述激励谱和所述原始高带信号中的轮廓信 息生成重构高带信号。
一种编码端, 包括:
音调特征参数提取单元,用于对超宽带部分的频域信号进行音调特征分析 提取音调特征参数;
量化单元, 用于将所述音调特征参数进行量化编码。
本发明实施例采用在编码端提取原始高带信号的关键特征参数:音调特征 参数, 用极少的比特资源进行编码传输。 在解码端, 根据音调特征参数生成激 励谱, 并根据原始高带信号的轮廓信息最终生成重构的高带信号, 实现频带扩 展。 由于在解码端进行高带信号的重构时,基于原始高带信号的细节特征进行 操作, 重构的高带信号除了轮廓和原始高带信号接近之外,在细节上有较好的 匹配, 通过较少的比特资源消耗就能达到较好的听觉效果。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步 骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读 存储介质中, 存储介质可以包括: 只读存储( ROM, Read Only Memory )、 随 机存取存储器(RAM, Random Access Memory ), 磁盘或光盘等。
附图说明
图 1是本发明一种解码方法的第一个实施例的流程图;
图 2是本发明一种解码方法的第二个实施例的流程图;
图 3是本发明一种编码方法的一个实施例的流程图;
图 4是本发明一种频带扩展系统的一个实施例的结构图;
图 5是本发明一种频带扩展解码端的一个实施例的结构图; 图 6是本发明一种频带扩展编码端的一个实施例的结构图。
具体实施方式
请参阅图 1为本发明一种解码方法的第一个实施例的信令流程图。
本发明实施例运用在超宽带编解码器中。 编码器的输入信号是 32kHz采样 率, 处理帧长为 20ms。对输入信号进行分频带、 下采样处理后,对应于 0~8kHz 频带的信号有 320个采样点, 对应于 8~16kHz频带的信号有 320个采样点。 其中 0~8kHz频带内的信号由核心编码器处理,核心编码器可以是 G.729.1编解码器, 也可以是其它宽带信号编解码器。
对于 8~16kHz频带内的时域信号 {yjU (l), ······ ,y_hi( \9)} , 经过 MDCT变换后得到了一组 MDCT系数, 即该频带对应的频域信号 {y_swb(0),y_swb(l), ······ ,y_swb(319)} , 由于超宽带部分仅处理 8~14kHz频带内的 信号, 所以对频 i或信号仅处理 {y― b(0),y― b(l), ······ ,y_swb(239)}。在编码端会 将这组频域信号分为 N个子带, 提取每个子带的频域包络并量化, 得到一组量 4匕后的频 i或包终 {spec _ env(0), spec _ env(l),…… ,spec_ env(N - 1) } , 这组包终经过编 码传输到解码端。
对于宽带核心编码器 G.729.1, 7~8kHz部分信号已不在其处理范围之内, 为了确保在解码端解码信号频谱的连续性, 在编码端需要提取 7~8kHz部分信 号的特征参数。 由于 G.729.1编码器对 4~8kHz的信号进行了 MDCT变换, 对应 的频域信号 {y _ wb(0), y _ wb(l),…… ,y _ wb(l59)} , 其中 7~8kHz对应的频域信号为 {y -wb(\2Q),y _wb(\2\),……,y_wb(159)} , 在编码端将其分为 M个子带, 提取每个 子 带 的 频 域 包 络并 量化 , 得 到 一 组 量化后 的 频 域 包 络
{spec _ env _ extra(0), spec _ env _ extra(\), , spec _ env _ extra(M - 1) } , 这组包终经过编 码传输到解码端。 在本实施例中 N=15, M=3。
本频带扩展方法实施例包括编码方法和解码方法:先由编码端提取音调特 征参数, 并发送给解码端, 由解码端根据音调特征参数和原始高带信号的轮廓 信息重构高带信号。 具体包括以下步骤:
步骤 101: 编码端发送提取的音调特征参数到解码端;
对超宽带部分的频域信号 { «(0), speed), .… , «(239)}进行音调特征分析, 提取音调特征参数, 并将所述音调特征参数进行量化编码,将编码传输到解码 端。
具体步骤如下:
la、 计算超宽带部分频域信号的自相关函数 Corr[«]= spec(n)xspec(n + i) , ne[MIN,MAX] , 在本实施例中 ΜΙΝ=5 ΜΑΧ=70。 '—。 lb、 超宽带部分的音调特征参数为画 =^^^。
max(Corr[n ) lc、 将音调特征参数 量化, 得到量化后的音调特征参数 将其编 码传输至解码端。
步骤 102: 解码端解码得到音调特征参数;
解码端对接收到的编码进行解码后得到音调特征参数
Figure imgf000006_0001
步骤 103: 解码端根据音调特征参数生成激励谱;
具体可以包括以下步骤:
步骤 103A: 解码端生成初始激励谱;
具体为解码端根据解码重构的窄带谱和宽带谱生成初始激励谱;生成初始 激励谱时可以加入随机噪声得到 E = {e;td (0),e;cd (l),……, e;cd (279) }。
步骤 103B: 解码端可以对初始激励谱进行白化, 使初始激励谱的能量分 布均衡;
解码端提取初始激励谱 E的谱包络后, 对初始激励谱进行白化,。 具体步 骤如下:
a将初始激励谱分为 7个子带, 计算每个子带的平均能量, 即谱包络,
Figure imgf000006_0002
b 为了使白化后的初始激励谱有更好的连续性,对谱包络还可以进行平滑 内插, 得到一组归一化因子 { (0), (1),··· (279)}。 平滑内插的过程如下: ) = 79 , 其中 W为一
Figure imgf000006_0003
χ 40 + 20, i = 1, 2, 3, 4, 5 个 40点对称窗函数。 c 对初 始 激励谱进行 白 化 , 白 化后 的 初 始 激励谱为 E ' = {excit '(0), excit '(1), · · · excit '(279) } , 白 4匕过程为: excit i) = excit(i) I β(ί)。
103C: 解码端根据原始频带信号谱对初始激励谱进行音调整形得到激励 谱; 需要说明的是如果初始激励谱经过了 103B的白化操作, 该步骤输入的初 始激励谱是白化后的初始激励谱。
具体步骤如下:
■>Jy_swb2(0) + y_swb2(l),i = 0
a根据公式 _ swb2 (239) + y_ swb2 (238) , i = 239 由 E, 计算 jy _ swb2 (i) + (y _ swb(i + T)-y _ swb(i + 1))2 , otherwise 出初始激励谱的伪谱 SE = {s _ excit(0), s _ excit(l),…… ,s_ excit{219) } b 采用如下的方法计算初始激励谱的伪谱 SE的音调特征参数1\
240
计算伪谱 SE频域信号的 自相关函数 Corr[n] = ^ spec(n)xspec(n + i) , n e [MIN, MAX ] , 在本实施例中 MIN=5 M AX=70。 初始激励谱的伪谱 SE的音调特征参数 Γ= min(Q)/TW) 。
max(Corr[n])
C 计算音调整形因子 a = x(to/¾^-r) , rl = l-« , r2 = /max(D。 在本实 施例中 =—1.9/0.6。
d 利用音调整形因子对初始激励谱进行调整。 具体为: 如果《>0 , 即 tona^T , 即原始超宽带频谱的音调特性比初始激励谱的音调特性要强, 则对 初始激励谱进行锐化调整, 即; F = E'Xd><r2 + rl) , 得到音调整形后的激励谱 Y = {y _ excit (0), y _ excit(V), ---y _ excit(219) }。
如果"≤0 , 即
Figure imgf000007_0001
即原始超宽带频谱的音调特性比初始激励谱的音 调特性要弱, 则对初始激励谱自适应的加入噪声, 进行平滑调整, 调整过程如 下:
生成随机噪声 Noise= { noise(O) , noise( 1 ),…… ,noise(279) }。
计 算 激励信 号 和 噪 声 信 号 的 能 量 , energyE' = XCit'(i) 和 energyN =
Figure imgf000007_0002
。 根 据 下 式 对 激 励 信 号 进 行 音 调 调 整 ,
Y = , 得到音调整形后的激励谱
Figure imgf000008_0001
Y -{y _ excit(O), y _ excitil), ---y _ excit{219) }。 音调整形后的激励谱的音调特性和原始超宽带信号谱的音调特性更加匹 配。
步骤 104: 解码端可以对最终生成的激励谱进行频带调整, 以获得频带更 加精确的激励谱;
具体步骤如下:
4a Y _ extra = {y _ extra(0), y _ extra(l), ---,y _ extra(39) } , y_extra(i) = y _excit(219 -i) , 对应于 7~8kHz的激励信号。
4b Y_swb = {y_ swb(0), y _ swb(\ ---,y_ swb(2 9) } , y _ swb(i) = y_ excitiSTART + i) , 对应于 8~14kHz的激励信号。 其中 START为激励 信号起始位置参数, 在本实施例中 START=30。
步骤 105: 解码端根据所述激励谱和原始高带信号中的轮廓信息 (如频域 包络信息 )生成重构高带信号。 即对激励谱进行能级匹配调整得到重构高带信 号; 具体步骤如下:
5a获取激励谱的频域包络(本实施例中为频域能量), 即按照和编码端相 同的子带划分, 提取激励谱的子带能量, 7~8kHz部分的激励谱子带能量为: {excit _ energy _ extra(O), excit _ energy _ extra(\), excit _ energy _ extra } , 8~ 14kHz邵 分的激励谱子带能量为 {e;cd _ energy(O), excit _ energy(l),……, excit _ energy (14) }。子带 能量的计算过程为: er^ = J _«(02 , 即对每个子带内的频谱系数求平方和。
5b解码得到原始高带信号的频域包络信息:
{spec _ env _ extra(O), spec _ env _ extra(V), spec _ env _ extra(2) } 和 {spec _ env(0), spec _ env(l),…… ,spec _env(U)}。 由于频域包终代表了本子带的平均 能量,所以将频域包络乘以本子带内的频谱系数的个数可以得到原始高带信号 的频域能量: {orig _ energy _ extra(0),orig _ energy _ extrail), orig _ energy _ extra(2) }和 {orig _ energy(O), orig _ energy (I), , orig _ energy (I A) }。 5c 可以对激励谱的频域能量和原始高带信号的频域能量, 按照原始高带 信号的音调特征参数进行平滑处理, 得到平滑后的激励谱的频域能量
{excit _ energy _ extra _ sm(0), excit _ energy _ extra _ s (l), excit _ energy _ extra _ sm(2) } 、 {excit _ energy _ (0), excit _ energy _麓 (1), , excit _ energy _ (14) }和原始 τ¾带信号 的频域能量
{orig _ energy _ extra _ sm(0),orig _ energy _ extra _ sm(l),orig _ energy _ extra _ sm(2) }、 {orig _ energy _ sm(0),orig _ energy _ (1), , orig _ energy _ (14) }。
5d 根据平滑后的频域能量计算每个子带的能级匹配增益因子
I orig _ energy _ extra _ sm{i) · _Q ^ 2
excit _ energy _ extra _ sm{i)
Ψ = {Ζ(0),/Τ(1),···,/Τ(17)} , χ{ί) I 当然, 如果没 orig _ energy _ sm(i) Ί .
.otherwise
excit _ energy _ sm(i) 有进行平滑处理, 输入的为 5a、 5b中的频域能量。
5e对激励谱进行能级匹配整形: 对每个子带的激励谱的谱系数乘以本子 带相应的能级匹配增益因子, 即}^_^(0 = }^_ , 得到重构的高带激励谱, 包括 7 ~ 8kHz部分的重构谱 { H extra(0), y_re_ extra(\), ---,y_re_ extra(39) } , 8~ 14kHz部分的重构语 { y _ re(0), y _ re(l),- --,y_ re(239) } , 即最终的重构高带信号, 完成频带的扩展。
解码端对激励谱进行能级匹配调整,使合成谱的能量包络和原始超宽带谱 相接近。
本发明实施例采用在编码端提取原始高带信号的关键特征参数:音调特征 参数, 用极少的比特资源进行编码传输。 在解码端, 根据音调特征参数生成控 制重构高带信号的激励谱, 并根据原始高带信号的轮廓信息 (例如频域包络) 最终生成重构的高带信号, 实现频带扩展。 由于在解码端进行高带信号的重构 时,基于原始高带信号的细节特征即音调特征参数进行操作, 重构的高带信号 除了轮廓和原始高带信号接近之外,在细节上有较好的匹配,通过较少的比特 资源消耗就能达到较好的听觉效果。
请参阅图 2为本发明一种解码方法的第二个实施例的信令流程图。 本发明实施例运用在超宽带编解码器中。 编码器的输入信号是 32kHz采样 率, 处理帧长为 20ms。对输入信号进行分频带、 下采样处理后,对应于 0~8kHz 频带的信号有 320个采样点, 对应于 8~16kHz频带的信号有 320个采样点。 其中 0~8kHz频带内的信号由核心编码器处理,核心编码器可以是 G.729.1编解码器, 也可以是其它宽带信号编解码器。
对于 8~16kHz频带内的时域信号 {yjU (l), ······ ,y_hi( \9)} , 经过
MDCT变换后得到了一组 MDCT系数, 即该频带对应的频域信号 {y_swb(0),y_swb(l), ······ ,y_swb(319)} , 由于超宽带部分仅处理 8~14kHz频带内的 信号, 所以对频 i或信号仅处理 {y― b(0),y_ b(l), ······ ,y_swb(239)}。在编码端会 将这组频域信号分为 N个子带, 提取每个子带的频域包络并量化, 得到一组量 4匕后的频 i或包终 {spec _ env(0), spec _ env(l),…… ,spec_ env(N - 1) } , 这组包终经过编 码传输到解码端。
对于宽带核心编码器 G.729.1, 7~8kHz部分信号已不在其处理范围之内, 为了确保在解码端解码信号频谱的连续性, 在编码端需要提取 7~8kHz部分信 号的特征参数。 由于 G.729.1编码器对 4~8kHz的信号进行了 MDCT变换, 对应 的频域信号 {y _ wb(0), y _ wb(l),…… ,y _ wb(l59)} , 其中 7~8kHz对应的频域信号为 {y_wb(l20),y_wb(l2l),…… ,y_wb(l59)} , 在编码端将其分为 M个子带, 提取每个 子 带 的 频 域 包 络并 量化 , 得 到 一 组 量化后 的 频 域 包 络
{spec _ env _ extra(0), spec _ env _ extra{l), , spec _ env _ extra{M _ 1) } , 这组包络经过编 码传输到解码端。 在本实施例中 N=15, M=3。
本频带扩展方法实施例包括编码方法和解码方法:先由编码端提取音调特 征参数, 并发送给解码端, 由解码端根据音调特征参数和原始高带信号的轮廓 信息重构高带信号。 具体包括以下步骤:
步骤 201: 编码端发送提取的音调特征参数到解码端;
对超宽带部分的频域信号 {¾?«(0), speed),… . , «(239)}进行音调特征分析, 提取音调特征参数, 并将该参数量化编码, 传输到解码端。
具体的提取过程如下:
( 1 )计算每个子带的音调特征参数:
A(l)将频域信号 {¾^c(0),¾^c(l), ······ , «(239)}均分为 K个子带,在本实施例 中, K=4, 第 i组频域信号为:
S{ = {spec(i x 60 + 0), spec(i x 60 + 1),……, spec(i x 60 + 59)},/ = 0, 1, 2, 3。
B(l)搜索每组频域信号中的最大值 pe^=max , 并记录最大值所在位置
Pi。
C(l) 计算 A±L范围内的频域包络的均值, 即: L + l , 在本实施例中 L=7。
Figure imgf000011_0001
D(l) 本子带的音调特征参数为 fluCi = peak mea^。
(2) 综合提取出表征整个超宽带部分音调特征的 G个音调特征参数, 在 本实施例中 G=2。 具体为 , = ^^。 + /^1)/2'''=() , 其中 to 。对应于
(fluc2 + fluc3 ) / 2, = 1
{spec(0), speed),…… ,^c(119)} 部 分 的 音 调 特 征 , tona, 对 应 于 {spec(l20), spec(121),……, spec(239) }部分的音调特征。
(3 )将音调特征参数 量化, 得到量化后的音调特征参数 ; ? , 将 其编码传输至解码端。
编码端对 to A量化时, 对其取值范围可以限定在 1.125~4.5范围之内。 在编码端提取音调特征参数时, 利用到的参数可以有多种来源, 具体参数 的计算也可以有多种计算方法。 例如:
A其中超宽带部分的频域信号 { (0), speed), ······ , spec(239) }可以是对原始 频域信号直接取绝对值得到的 {|y_ b(0)|,|y_ b(l)|,…… ,|y_ b(239)|} ,也可以是 由原始频域信号经过下面的公式( 1 )计算得到的伪谱信号 {s(0),s(l),…… ,s(239)}:
^]y_swb2(0) + y_swb2(l),i = 0
/y _ swb2 (239) + y_ swb2 (238) , i = 239 ( 1 ) jy _ swb2 () + ( _ swb(i + l)-y _ swb(i + 1))2, otherwise B在步骤 ( 1 ) 中, 均值的计算也可以是根据下式计算得到 。
Figure imgf000011_0002
在步骤(1 ) 中, 子带音调特征参数的计算也可以是根据下式计算得到
Figure imgf000012_0001
C在步骤 ( 2 ) 中, 音调特征参数的综合也可以根据下式计算得到
Figure imgf000012_0002
在步骤 ( 2 ) 中, 音调特征参数的综合也可以根据下式计算得到
Figure imgf000012_0003
步骤 202: 解码端解码得到音调特征参数;
解码音调特征参数得到 tonaq和 to 如果在编码端对 量化时,对其取 值范围限定在 1.125~4.5范围之内, 在解码端可以按下式对其进行非线性的增 强, tona. =tonaq +tonaq xtonaq xTonality— TILT ,在本实施例中
Figure imgf000012_0004
= 2.5/22。 通过对音调特征参数的非线性增强, 可以更好的控制超宽带谱的合成。 当然也 可以不进行非线性增强。
步骤 203: 解码端根据音调特征参数生成激励谱; 具体可以包括以下步骤: 步骤 203A: 解码端生成初始激励谱;
在解码端可以通过多种方式生成激励谱 E = {excit(O), excitd),……, excit(V - 1) } , 可以采用例如以下方式得到激励谱:
对解码端重构的 0~4kHz频带内的时域信号做 MDCT变换, 得到 0~4kHz频 带内的频域信号{>^_/0(0),}^_/0(1), ······ ,y_lo(159)} ,以及解码得到的 4~7kHz频带内 的频域信号{)_/<0),)_/<1),…… ,y_ <119)} , 将这两部分谱组合构成原始激励谱 {y_ lo(0), y _ lo(l), ······ ,y_ to(159), y _ h(0), y _ h(l), ······ ,y_h(U9)} .
由于在解码端需要重构出 7~8kHz的频谱, 所以在激励谱中需要包含 7~8kHz的激励信息, 在本实施例中 V=280。
步骤 203B 由于激励谱本身具有音调特性, 为了使激励谱的音调特性和原 始超宽带信号谱的音调特性相匹配, 可以对初始激励谱进行音调整形, 具体步 骤如下:
a根据公式( 1 )计算出激励谱的伪谱:
SE = {s _ excit(0), s _ excit(\), ,s _ excit(219) }。
b 采用和编码端步骤(1)、(2)相同的方法分别得到伪谱两个子带的音调 特征参数 Γ。和 7。
c将激励谱和伪谱分为两个子带,
E0 ={excit(Qi),excit(\), ,excit(\59)} , Ε1 = {excit(160),excit(161), , excit(219) };
SEQ ={s _ excit(0), s _ excit{\), ,s _ excit (159) } ,
SE^ ={s _ excit(l60), s _ excit (161), ,s _ excit{219)} ,
Figure imgf000013_0001
d计算音调整形因子:
C 利用音调整形因子对初始激励谱进行调整。 具体为: 令
Figure imgf000013_0002
rli=aiIMAXi , 根据激励谱的音调特性 7;和原始超宽带谱的音调特性 to 之间 的关系对激励谱进行调整, , 得到音调整形后的
Figure imgf000013_0003
激励谱 Y = {YQ,Y1} = {y_ excit(0), y _ excit{\ excit{219) }。 步骤 203C: 解码端可以对音调整形后的激励谱进行白化, 使激励谱的能 量分布均衡, 有利于后续的能级匹配调整;
解码端提取音调整形后的激励语 Y的谱包络, 对激励谱进行白化。 具体步 骤如下:
a 将激励谱分为 7个子带, 计算每个子带的平均能量, 即谱包络,
Figure imgf000013_0004
b 为了使白化后的谱有更好的连续性,对谱包络进行平滑内插,得到一组 归一化因子 W(0), (1), · · -^(279) }。 平滑内插的过程如下: ) = 19 ,其中 W
Figure imgf000014_0001
-,ix40 + 20,i = 1,2,3,4,5 为一个 40点对称窗函数。 C对激励谱进行白化, 白化后的激励谱为:
Y = {y _ excit '(0), _ excit '(1), · · · y— excit '(279) },
白化过程为:
y _ excit '(/) = y _ excit ( ) I β{ϊ)。
此时, 便生成了最终的激励谱。 当然也可以不进行白化, 直接用音调整形 后的激励语作为最终的激励谱。
步骤 204: 解码端可以对最终生成的激励谱进行频带调整, 以获得频带更 加精确的激励谱;
解码端对激励谱进行频带调整采用下列公式,
4a Y _ extra = {y _ extra(0), y _ extra(l), ---,y _ extra(39) } , y _ extra(i) = y_ excit '(279 - ) , 对应于 7~8kHz的激励信号。
4b Y_swb = {y_ swb(0), y _ swb(\ ---,y_ swb(2 9) } , y _ swb(i) = y_ excit '(START + i) , 对应于 8~14kHz的激励信号。 其中 START为激励 信号起始位置参数, 在本实施例中 START=30。
步骤 205: 解码端可以在激励谱中加入噪声谱;
为了使激励谱在谱细节上更接近原始超宽带的频谱,在原始超宽带信号的 音调特征参数的控制下加入噪声谱, 得到加噪之后的激励谱
Y _ extra _n = {y _ extra _ n(0), y _ extra _ η(ί),···, y _ extra _ «(39)} ,
Y _swb_n = {y _swb_ n(0), y _swb _ n(l), ---,y_swb_ «(239) }。 具体过程如下:
5a 将原始超宽带信号的音调特征参数映射在 0~1的区间范围内, ton^ = tona /(4.5 + Tonality—TILT x 22)。
5b计算能量增益因子 ener, 在本实施例中 1 - (tona0 + tonax )x0.5
ener = 0.25
6 °
5c 对 7~8kHz 的 激 励 信 号 加 入 噪 声 谱 : y _ extra _ n(i) = y _ extraii) x tona0 + ener x - tona x noise 其申 noise是一个在 ±0.5范围之内的随机数, 即噪声谱。
5d对 8~14kHz的激励信号加入噪声谱:
y _ wb _ n(i) - y _ eb(i) x tona + ener x -Jl-tona2 x noise 其申 noise是一个在
+ 0·5范围之内的随机数, 即噪声谱; tona为综合音调特征参数, 设置如下: tona0 , i = 0, 1, · · · 95
tona = { tonaj,i = 144,145,·· -239 。 ΐοηα0 χ(ί-μ) + tona χμ,μ= '· ^ , othersie 步骤 206: 解码端根据所述激励谱和原始高带信号中的轮廓信息 (如频域 包络信息 )生成重构高带信号。 即解码端对激励谱进行能级匹配调整得到重构 的高带信号。
对激励谱进行能级匹配调整, 使合成谱的能量包络和原始超宽带谱相接 近。 具体步骤如下:
6a获取激励谱的频域包络(本实施例中为频域能量), 即按照和编码端相 同的子带划分, 提取激励谱的子带能量, 7~8kHz部分的激励谱子带能量为
[excit _ energy _ extra(0), excit _ energy _ extra \), excit _ energy _ extra 2) } , 8~14kHz部分的激励谱子带能量为
[excit _ energy(0), excit _ energy(l), , excit _ energy (14) }。 子带能量的 计算过程为: erg} = 2 — ·)2 , 即对每个子带内的频谱系数求平方和。
6b解码得到原始高带信号的频域包络信息:
{spec _ env _ extra(0), spec _ env _ extra{\), spec _ env _ extra{2) } 和
{spec _ env( ), spec _ env(l), , spec _ env 。 由于频 i或包终代表了本子带的 平均能量,所以将频域包络乘以本子带内的频谱系数的个数可以得到原始高带 信号的频域能量: {orig _ energy _ extra(O), orig _ energy _ extra(l), orig _ energy _ extra(2) } 和 {orig _ energy(Q), orig _ energy , , orig _ energy(l4)}。 6c 可以对激励谱的频域能量和原始高带信号的频域能量, 按照原始高带 信号的音调特征参数进行平滑处理, 得到平滑后的激励谱的频域能量 {excit _ energy _ extra _ sm(0), excit _ energy _ extra _ (1), excit _ energy _ extra _ sm(2) } 、
{excit _ energy _纖 (0), excit _ energy _ sm(V), , excit _ energy _纖 (14) } 和原始高带信号的频域能量
{orig _ energy _ extra _ sm(0), orig _ energy _ extra _ sm(l), orig _ energy _ extra _ sm(2) }
、 {orig _ energy _腿 (0), orig _ energy _腿 (1), , orig _ energy _ (14) }。 具体处理如下:
对 7~8kHz邢分的频域能量: energy _ extra _ sm(i) = energy _ extra(i) χ , 其中 ϊ =— ·> g0 = energy _ extra(i) , ¾ = ^ (tona0 x e0 x + (1— tona0 ) x energy _ extra(i)) , Nt 为每个子带内的频谱系数的个数, 在本实施例中为 8, 16, 16。 对 8~ 14kHz部分的频域能量: energy _ sm{i) = energy (ί) χχ , 其中 e
r
ei tona0 + tonax tona0 + tonax
energy(i) , ¾ = ^ (—— —— - x i + (1 ―—— -) x '
Figure imgf000016_0001
6d 根据平滑后的频域能量计算每个子带的能级匹配增益因子
' orig _ energy _ extra _ - _Q ^ 2
excit energy extra sm(i)
Ψ = { (0), υ 7)}, ): 。 当然, 如果
Figure imgf000016_0002
没有进行平滑处理, 输入的为 6a、 6b中的频域能量
6e对激励谱进行能级匹配整形: 对每个子带的激励谱的谱系数乘以本子 带相应的能级匹配增益因子, 即)^_/^(0 = )^_ , 得到重构的高带激励谱, 包括 7~8kHz部分的重构谱 { n extra(O), y_re_ extra(\ ---,y_re_ extra(39) } , 8~14kHz部分的重构谱 {y_re(0),y_ /τ(1),· ··,)_ re(239)} , 即最终的重构高带信号, 完成频带的扩展。
本发明实施例采用在编码端提取原始高带信号的关键特征参数:音调特征 参数, 用极少的比特资源进行编码传输。 在解码端, 根据音调特征参数生成控 制重构高带信号的激励谱, 并根据原始高带信号的轮廓信息 (例如频域包络) 最终生成重构的高带信号, 实现频带扩展。 由于在解码端进行高带信号的重构 时,基于原始高带信号的细节特征即音调特征参数进行操作, 重构的高带信号 除了轮廓和原始高带信号接近之外,在细节上有较好的匹配,通过较少的比特 资源消耗就能达到较好的听觉效果。
请参阅图 3为本发明一种编码方法的一个实施例的结构图;
步骤 301:对超宽带部分的频域信号进行音调特征分析提取音调特征参数; 具体步骤如下:
301A将频域信号 { (0), «(1), ······ ,¾^(239)}均分为 Κ个子带, 在本实施 例中 Κ=4,第 i组频域信号为:
St = {spec(i x 60 + 0), spec(i x 60 + 1),……, spec(i χ 60 + 59)},/ = 0, 1, 2, 3。
301B 搜索每个子带频域信号中的最大值 =max ,并记录最大值所在 位置 Pi。
301C计算 A±L范围内的频域包络的均值, 即: L + l , 在本实施例中 L=7。
Figure imgf000017_0001
均值的计算也可以是根据下式计算得到 m ni = speed X 60+ j)卜 。 301D 本子带的音调特征参数为 fluCi = peak, I mean,。
子带音调特征参数的计算也可以是根据下 式计算得到 fluct = 。
Figure imgf000017_0002
301E 综合每个子带音调特征参数得到音调特征参数。
提取出表征整个超宽带部分音调特征的 G个音调特征参数, 在本实施例中
G=2 。 具 体 为 i = fluc+ flu l2,i = Q , 其 中 1画0 对 应 于
I ( fluc2 + fluc3 ) / 2, = 1 {spec(0), speed),…… ,^c(119)} 部 分 的 音 调 特 征 , tona, 对 应 于
{spec(l20), spec(l2l),……, spec(239) }部分的音调特征。 音调特征参数的综合也可以根据下式计算得到 t(mai = \^ fl^fluCl i = 0。
msLx(fluc2 , fluc3 ),i = 1 步骤 301还可以采用下列方式完成,
计算超宽带部分频域信号的自相关函数;
240- κ
计算超宽带部分频域信号的自相关函数 Corr[n] = ^ spec(n) x spec(n + i) , η e [ΜΙΝ, MAX ] , 在本实施例中 ΜΙΝ=5 Μ ΑΧ=70。
Figure imgf000018_0001
步骤 302: 将所述音调特征参数进行量化编码。
请参阅图 4为本发明一种频带扩展系统的一个实施例的结构图;
编码端 401, 用于发送原始高带信号和音调特征参数;
编码端 401对超宽带部分的频域信号 { (0), «(1),… . ,¾^c(239)}进行音调 特征分析, 提取音调特征参数, 并将所述音调参数进行量化编码, 将编码传输 到解码端。
具体步骤如下:
240- κ
a、 计算超宽带部分频域信号的自相关函数 Corr[«]= ^ spec(n)xspec(n + i), n e [MIN, MAX ] , 在本实施例中 MIN=5 M AX=70。
b、 超宽带部分的音调特征参数为^ =^^1 。
max(Corr[n]) c、 将音调特征参数 to 量化, 得到量化后的音调特征参数 toWfl 将其编 码传输至解码端。
解码端 402, 用于接收编码端 401发送的音调特征参数和原始高带信号; 根 据所述音调特征参数生成激励谱;根据所述激励谱和所述原始高带信号中的轮 廓信息生成重构高带信号。 解码端 402进一步可以包括:
接收单元 40201 , 用于接收编码端 401发送的音调特征参数和原始高带信 号;
激励谱生成单元 40202, 用于根据所述音调特征参数生成重构高带信号的 激励 i脊;
高带信号生成单元 40203 , 用于根据所述激励谱和所述原始高带信号中的 轮廓信息生成重构高带信号;
激励谱生成单元 40202进一步可以包括: 激励谱整形单元 40202a, 用于生 成初始激励谱, 对所述初始激励谱进行整形得到音调整形后的激励谱。
激励谱生成单元 40202进一步可以包括:
白化单元 40202b,用于对所述初始激励谱或音调整形后的激励谱进行白化 得到白化后的激励谱。
解码端 402进一步可以包括:
频带调整单元 40204, 用于对生成的激励谱进行频带调整。
噪声加入单元 40205 , 用于在所述激励谱中加入使激励谱更接近原始高带 信号谱结构的噪声谱。
所述高带信号生成单元 40203进一步还可以包括:
谱包络提取单元 40203a, 用于提取激励谱的谱包络;
平滑单元 40203b,用于对激励谱的谱包络和原始高带信号解码谱包络进行 平滑内插生成连续的频域包络;
增益因子计算单元 40203c,用于根据所述频域包络计算能级匹配的增益因 子;
生成单元 40203d, 用于根据所述增益因子对激励谱进行整形, 生成重构的 高带信号。
请参阅图 5为本发明一种频带扩展解码端的一个实施列的结构图; 包括: 接收单元 501 , 用于接收编码端发送的音调特征参数和原始高带信号; 激励谱生成单元 502, 用于根据所述音调特征参数生成重构高带信号的激 励谱;
高带信号生成单元 503 , 用于根据所述激励谱和所述原始高带信号中的轮 廓信息生成重构高带信号的频域信息。
所述激励谱生成单元 502进一步包括:
激励谱整形单元 502a, 用于根据所述普特性对生成的激励谱进行整形。 白化单元 502b, 用于对生成的激励谱进行白化。
所述解码端还可以包括:
频带调整单元 504, 用于对激励谱进行频带调整。
噪声加入单元 505, 用于在所述激励谱中加入使激励谱更接近原始高带信 号谱结构的噪声谱。
所述高带信号生成单元 503进一步可以包括:
谱包络提取单元 503a, 用于提取激励谱的谱包络;
平滑单元 503b,用于对激励谱的谱包络和原始高带信号解码谱包络进行平 滑内插生成连续的频域包络;
增益因子计算单元 503c, 用于根据所述频域包络计算能级匹配的增益因 子;
生成单元 503d, 用于根据所述增益因子对激励谱进行整形, 生成重构的高 带信号。
请参阅图 6为本发明一种频带扩展编码端的一个实施例的结构图; 该编码 端可以应用在图 4所示的系统中, 其包括:
音调特征参数提取单元 601 , 用于对超宽带部分的频域信号进行音调特征 分析提取音调特征参数;
具体步骤如下:
将频域信号 {spec(0),spec(l), ······ ,spec(239)}均分为 K个子带, 在本实施例中
Κ=4,第 i组频域信号为:
St = {spec(i x 60 + 0), spec(i x 60 + 1),……, spec(i χ 60 + 59)},/ = 0, 1, 2, 3。
搜索每个子带频域信号中的最大值 =max , 并记录最大值所在位置
Pi。
计算 A ±L范围内的频域包络的均值, 即: , 在本实施例中 L=7。
Figure imgf000020_0001
均值的计算也可以是根据下式计算得到 mea^ =^¾^C(ix60+ j) ^60„ 本子带的音调特征参数为 flUCi = peak mea^。
子带音调特征参数的计算也可以是根据下 式计算得到 fluct = 。
Figure imgf000021_0001
综合每个子带音调特征参数得到音调特征参数。
提取出表征整个超宽带部分音调特征的 G个音调特征参数, 在本实施例中
G=2 。 具 体 为 , ^ 。 +
flucm , 其 中 。 对 应 于 (fluc2 + 3 )12 =1
{spec(Q), spec(\),…… ,^ec(119)} 部 分 的 音 调 特 征 , tona, 对 应 于
{spec(120), spec(121),……, spec(239) }部分的音调特征。
音调特征参数的综合也可以根据下式计算得到 tom =
Figure imgf000021_0002
max(/Zwc2 , fluc3 ), 还可以采用下列方式完成:
计算超宽带部分频域信号的自相关函数; 计算超宽带部分频域信号的自相关函数 Corr[n] = spec(n) x spec(n + i) , n e [MIN, MAX ] , 在本实施例中 MIN=5 M AX=70。 _ -m j min(Corr[wl)
晋调特征参数为 tona =—— ―。
max(Corr[n]) 量化单元 602, 用于将所述音调特征参数进行量化编码发送所述音调特征 参数。
其中, 音调特征参数提取单元 601可以包括:
自相关函数单元 601a,用于通过计算超宽带部分频域信号的自相关函数得 提取单元 601c, 综合提取出表征整个超宽带部分音调特征的音调特征参 数。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步 骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读 存储介质中, 存储介质可以包括: ROM、 RAM, 磁盘或光盘等。
施例的说明只是用于帮助理解本发明的方法及其核心思想; 同时,对于本领域 的一般技术人员,依据本发明的思想, 在具体实施方式及应用范围上均会有改 变之处, 综上所述, 本说明书内容不应理解为对本发明的限制。

Claims

权 利 要 求
1、 一种解码方法, 其特征在于, 包括:
获取音调特征参数和原始高带信号;
根据所述音调特征参数生成激励谱;
根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号。
2、 根据权利要求 1所述的解码方法, 其特征在于,所述根据所述音调特征 参数生成激励谱包括:
生成初始激励谱;
对所述初始激励谱进行音调整形得到音调整形后的激励谱。
3、 根据权利要求 2所述的解码方法, 其特征在于, 所述对所述初始激励谱 进行音调整形得到音调整形后的激励谱包括:
计算初始激励谱的伪谱;
计算初始激励谱的伪谱的音调特征参数;
根据所述音调特征参数和所述伪谱的音调特征参数计算音调整形因子; 利用所述音调整形因子对初始激励谱进行调整。
4、 根据权利要求 2所述的解码方法, 其特征在于, 所述根据所述音调特征 参数生成激励谱进一步包括:对所述初始激励谱或音调整形后的激励谱进行白 化得到白化后的激励谱。
5、 根据权利要求 1、 2或 4任一所述的解码方法, 其特征在于, 所述根据所 述音调特征参数生成激励谱后进一步包括: 对生成的所述激励谱进行频带调
6、 根据权利要求 1、 2或 4任一所述的解码方法, 其特征在于, 所述根据所 述音调特征参数生成激励语后进一步包括: 在所述激励谱中加入噪声谱。
7、 根据权利要求 1、 2或 4任一所述的解码方法, 其特征在于, 所述根据激 励谱和原始高带信号中的轮廓信息生成重构高带信号包括:
获取所述激励谱的频域包络和原始高带信号的频域包络;
根据所述频域包络计算能级匹配的增益因子;
根据所述增益因子对所述激励谱进行整形, 生成重构的高带信号。
8、根据权利要求 7所述的解码方法, 其特征在于, 所述获取所述激励谱和 原始高带信号的频域包络之后进一步包括:
对所述激励谱的频域包络和所述原始高带信号的频域包络进行平滑处理, 得到平滑后的激励谱的频域包络和原始高带信号的频域包络。
9、 一种编码方法, 其特征在于:
对超宽带部分的频域信号进行音调特征分析提取音调特征参数; 将所述音调特征参数进行量化编码。
10、 根据权利要求 9所述的编码方法, 其特征在于, 所述对超宽带部分的 频域信号进行音调特征分析提取音调特征参数包括:通过计算超宽带部分频域 信号的自相关函数得到所述音调特征参数。
11 , 根据权利要求 9所述的编码方法, 其特征在于, 所述对超宽带部分的 频域信号进行音调特征分析提取音调特征参数包括:
计算每个子带频域信号音调特征参数;
综合提取出表征整个超宽带部分音调特征的音调特征参数。
12、 根据权利要求 11所述的编码方法, 其特征在于, 所述计算子带频域信 号音调特征参数包括:
将频域信号平均分成多个子带频域信号;
搜索每个子带频域信号的最大值和所在位置;
计算每个子带频域信号最大值设定范围内的频域包络平均值;
子带频域信号的音调特征参数为子带频域信号最大值与频域包络平均值 的比值。
13、 一种频带扩展系统, 其特征在于, 包括:
编码端, 用于发送原始高带信号和音调特征参数;
解码端, 用于接收编码端发送的音调特征参数和原始高带信号; 根据所述 音调特征参数生成激励谱;根据所述激励谱和所述原始高带信号中的轮廓信息 生成重构高带信号。
14、 一种解码端, 其特征在于包括:
接收单元, 用于接收音调特征参数和原始高带信号;
激励谱生成单元, 用于根据所述音调特征参数生成激励谱;
高带信号生成单元,用于根据所述激励谱和所述原始高带信号中的轮廓信 息生成重构高带信号。
15、 根据权利要求 14所述的频带扩展解码端, 其特征在于, 所述激励谱生 成单元包括:
激励谱整形单元, 用于生成初始激励谱,对所述初始激励谱进行音调整形 得到音调整形后的激励谱。
16、 根据权利要求 15所述的频带扩展解码端, 其特征在于, 所述解激励谱 生成单元包括:
白化单元,用于对所述初始激励谱或音调整形后的激励谱进行白化得到白 化后的激励谱。
17、 根据权利要求 14、 15或 16任一所述的频带扩展解码端, 其特征在于所 述解码端进一步包括:
频带调整单元, 用于对生成的所述激励谱进行频带调整。
18、 根据权利要求 14或 16所述的频带扩展解码端, 其特征在于, 所述解码 端进一步包括:
噪声加入单元, 用于在所述激励谱中加入噪声谱。
19、 一种编码端, 其特征在于, 包括:
音调特征参数提取单元,用于对超宽带部分的频域信号进行音调特征分析 提取音调特征参数;
量化单元, 用于将所述音调特征参数进行量化编码。
20、 根据权利要求 19所述的编码端, 其特征在于, 所述音调特征参数提取 单元包括:
自相关函数单元,用于通过计算超宽带部分频域信号的自相关函数得到所 述音调特征参数。
21、 根据权利要求 19所述的编码端, 其特征在于, 所述音调特征参数提取 单元包括:
计算单元, 用于计算每个子带频域信号音调特征参数;
提取单元, 综合提取出表征整个超宽带部分音调特征的音调特征参数。
PCT/CN2009/072371 2008-06-30 2009-06-22 频带扩展的方法、系统和设备 WO2010000179A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN 200810130702 CN101620854B (zh) 2008-06-30 2008-06-30 频带扩展的方法、系统和设备
CN200810130702.6 2008-06-30

Publications (1)

Publication Number Publication Date
WO2010000179A1 true WO2010000179A1 (zh) 2010-01-07

Family

ID=41465494

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2009/072371 WO2010000179A1 (zh) 2008-06-30 2009-06-22 频带扩展的方法、系统和设备

Country Status (2)

Country Link
CN (1) CN101620854B (zh)
WO (1) WO2010000179A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102194458B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 频带复制方法、装置及音频解码方法、系统
US20130024191A1 (en) * 2010-04-12 2013-01-24 Freescale Semiconductor, Inc. Audio communication device, method for outputting an audio signal, and communication system
CN102339607A (zh) * 2010-07-16 2012-02-01 华为技术有限公司 一种频带扩展的方法和装置
WO2013063688A1 (en) * 2011-11-03 2013-05-10 Voiceage Corporation Improving non-speech content for low rate celp decoder
CN104517610B (zh) 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CN113539281A (zh) * 2020-04-21 2021-10-22 华为技术有限公司 音频信号编码方法和装置
CN113963703A (zh) * 2020-07-03 2022-01-21 华为技术有限公司 一种音频编码的方法和编解码设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1185616A (zh) * 1996-10-24 1998-06-24 索尼公司 音频带宽扩展系统和方法
CN1297222A (zh) * 1999-09-29 2001-05-30 索尼公司 信息处理设备、方法和记录媒体
JP2003255973A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
CN1496559A (zh) * 2001-01-12 2004-05-12 艾利森电话股份有限公司 语音带宽扩展
US20070124140A1 (en) * 2005-10-07 2007-05-31 Bernd Iser Method for extending the spectral bandwidth of a speech signal
CN101023472A (zh) * 2004-09-06 2007-08-22 松下电器产业株式会社 可扩展编码装置和可扩展编码方法
CN101048814A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 编码装置、解码装置、编码方法及解码方法
CN101180677A (zh) * 2005-04-01 2008-05-14 高通股份有限公司 用于宽频带语音编码的系统、方法和设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
EP1444688B1 (en) * 2001-11-14 2006-08-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1185616A (zh) * 1996-10-24 1998-06-24 索尼公司 音频带宽扩展系统和方法
CN1297222A (zh) * 1999-09-29 2001-05-30 索尼公司 信息处理设备、方法和记录媒体
CN1496559A (zh) * 2001-01-12 2004-05-12 艾利森电话股份有限公司 语音带宽扩展
JP2003255973A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
CN101023472A (zh) * 2004-09-06 2007-08-22 松下电器产业株式会社 可扩展编码装置和可扩展编码方法
CN101048814A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 编码装置、解码装置、编码方法及解码方法
CN101180677A (zh) * 2005-04-01 2008-05-14 高通股份有限公司 用于宽频带语音编码的系统、方法和设备
US20070124140A1 (en) * 2005-10-07 2007-05-31 Bernd Iser Method for extending the spectral bandwidth of a speech signal

Also Published As

Publication number Publication date
CN101620854B (zh) 2012-04-04
CN101620854A (zh) 2010-01-06

Similar Documents

Publication Publication Date Title
JP2021502588A (ja) ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
JP6599362B2 (ja) 高帯域励起信号生成
JP6368029B2 (ja) 雑音信号処理方法、雑音信号生成方法、符号化器、復号化器、並びに符号化および復号化システム
US10194151B2 (en) Signal encoding method and apparatus and signal decoding method and apparatus
US11616954B2 (en) Signal encoding method and apparatus and signal decoding method and apparatus
WO2009117967A1 (zh) 编码、解码的方法及装置
JP6538209B2 (ja) ノイズ変調とゲイン調整とを実行するシステムおよび方法
WO2010000179A1 (zh) 频带扩展的方法、系统和设备
WO2009067883A1 (fr) Procédé de codage/décodage et dispositif pour le bruit de fond
US11705142B2 (en) Signal encoding method and device and signal decoding method and device
TW201401268A (zh) 產生帶寬延伸訊號的裝置與方法
WO2009109139A1 (zh) 超宽带扩展编码、解码方法、编码器及超宽带扩展系统
TWI713927B (zh) 使用尺度參數之降低取樣或內插來編碼及解碼音訊信號之設備及方法
KR102271852B1 (ko) 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
US10902860B2 (en) Signal encoding method and apparatus, and signal decoding method and apparatus
KR20210131926A (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
JP2018165843A (ja) 帯域幅拡張のための高周波復号方法及びその装置
TW202211208A (zh) 對多頻道音頻信號的頻道使用比例參數的聯合編碼的音頻解碼器、音頻編碼器和相關方法
WO2011144130A1 (zh) 一种频带扩展的方法和装置
Lee et al. Bandwidth Extension of a Narrowband Speech Coder for Music Streaming Services Over IP Networks

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09771949

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09771949

Country of ref document: EP

Kind code of ref document: A1