WO2008072737A1 - 符号化装置、復号装置およびこれらの方法 - Google Patents

符号化装置、復号装置およびこれらの方法 Download PDF

Info

Publication number
WO2008072737A1
WO2008072737A1 PCT/JP2007/074141 JP2007074141W WO2008072737A1 WO 2008072737 A1 WO2008072737 A1 WO 2008072737A1 JP 2007074141 W JP2007074141 W JP 2007074141W WO 2008072737 A1 WO2008072737 A1 WO 2008072737A1
Authority
WO
WIPO (PCT)
Prior art keywords
spectrum
decoding
band
decoded
encoding
Prior art date
Application number
PCT/JP2007/074141
Other languages
English (en)
French (fr)
Inventor
Tomofumi Yamanashi
Masahiro Oshikiri
Original Assignee
Panasonic Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corporation filed Critical Panasonic Corporation
Priority to EP07850645.8A priority Critical patent/EP2101322B1/en
Priority to CN2007800444142A priority patent/CN101548318B/zh
Priority to US12/518,371 priority patent/US8560328B2/en
Priority to JP2008549379A priority patent/JP5339919B2/ja
Publication of WO2008072737A1 publication Critical patent/WO2008072737A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Definitions

  • the present invention relates to an encoding device, a decoding device, and a method thereof used in a communication system that encodes and transmits a signal.
  • Non-Patent Document 1 parameters that generate high-frequency spectrum data from low-frequency spectrum data by converting input signals into frequency-domain components and using the correlation between low-frequency spectrum data and high-frequency spectrum data.
  • Non-Patent Document 1 Masahiro Oshikiri, Hiroyuki Ehara, Koji Yoshida, ⁇ Improvement of Ultra Wideband Scalable Speech Coding Using Spectral Coding Based on Pitch Filtering, '' Sound Lecture 2-4-13, p. 297-298, Sep. 2004.
  • the upper layer layer on the decoding side uses the spectrum data as it is in the high frequency band obtained by extending the bandwidth in the lower layer. It cannot be said that the high-frequency spectrum data with sufficient accuracy is reproduced.
  • An object of the present invention is to calculate high-frequency spectrum data with high accuracy using low-frequency spectrum data on the decoding side, and obtain a decoded signal with higher quality. Coding apparatus, decoding apparatus, and methods thereof.
  • the encoding device of the present invention includes a first encoding means for generating a first encoded data by encoding a low-frequency part of the input signal that is a band lower than a predetermined frequency, and the first code First decoding means for decoding the encoded data to generate a first decoded signal, and a second encoded data by encoding a predetermined band portion of the residual signal of the input signal and the first decoded signal
  • the low-frequency part of one of the input signal, the first decoded signal, and the calculated signal calculated using the first decoded signal is obtained as a finalizer.
  • a filtering unit that obtains a pitch coefficient and a filtering coefficient for obtaining a high frequency part that is a band higher than the predetermined frequency of the input signal.
  • the decoding device of the present invention is a decoding device using a scalable codec having a layer configuration of r layers (r is an integer of 2 or more), and is an m-th layer (m is an integer of r or less). ) And receiving means for receiving the band extension parameter calculated using the decoded signal, and using the band extension parameter for the low frequency component of the decoded signal of the nth layer (n is an integer equal to or less than r). And a decoding means for generating a high frequency component.
  • the decoding device of the present invention includes first encoded data that is transmitted from the encoding device and that encodes a low-frequency portion that is a band lower than a predetermined frequency in the input signal in the encoding device; Second encoded data obtained by encoding a predetermined band portion of the residual between the first decoded spectrum obtained by decoding the first encoded data and the spectrum of the input signal; the input signal; Of the decoded spectrum and the first added spectrum obtained by adding the first decoded spectrum and the second decoded spectrum obtained by decoding the second encoded data, any one of the low-frequency parts And receiving means for receiving a pitch coefficient and a filtering coefficient for obtaining a high-frequency portion that is higher than the predetermined frequency of the input signal and decoding the first encoded data.
  • a first decoding means for generating a third decoded spectrum in a low frequency Before A first decoding means for generating a third decoded spectrum in a low frequency; a second decoding means for decoding the second encoded data to generate a fourth decoded spectrum in the predetermined band portion; and the pitch coefficient and Using a filtering coefficient, the third decoded spectrum, the fourth decoded spectrum, And a fifth decoding spectrum generated using both of them, by band-extending any one of the fifth decoded spectrum, thereby decoding a band portion that has not been decoded by the first decoding means and the second decoding means. And a decoding means.
  • the encoding method of the present invention includes a first encoding step of generating a first encoded data by encoding a low-frequency part of a band lower than a predetermined frequency in the input signal, and the first code A decoding step of decoding the encoded data to generate a first decoded signal, and a second encoded data by encoding a predetermined band portion of the residual signal of the input signal and the first decoded signal Filtering the low frequency part of one of the two encoding steps and the input signal, the first decoded signal, and a calculated signal calculated using the first decoded signal. And a filtering step for obtaining a pitch coefficient and a filtering coefficient for obtaining a high-frequency portion that is a band higher than the predetermined frequency of the input signal.
  • a decoding method of the present invention is a decoding method using a scalable codec having a layer configuration of r layers (r is an integer of 2 or more), and is an m-th layer (m is an integer of r or less)
  • the band extension parameter is used for the reception step of receiving the band extension parameter calculated using the decoded signal of (1) and the low frequency component of the decoded signal of the nth layer (n is an integer equal to or less than r).
  • a decoding step for generating a high frequency component.
  • the decoding method includes first encoded data obtained by encoding a low-frequency portion, which is a band lower than a predetermined frequency, of the input signal in the encoding device transmitted from the encoding device, and the first Second encoded data obtained by encoding a predetermined band portion of a residual between the first decoded spectrum obtained by decoding the encoded data and the spectrum of the input signal, the input signal, the first decoded spectrum, Of the first addition spectrum obtained by adding the first decoded spectrum and the second decoded spectrum obtained by decoding the second encoded data, one of the low-frequency portions is filtered.
  • a first decoding step of generating a third decoded scan Bae spectrum in a second decoding step of generating a fourth decoded spectrum in said predetermined band portion by decoding the second encoded data, the first condensate And the second decoding step are generated using the third decoded spectrum, the fourth decoding spectrum, and both using the pitch coefficient and the filtering coefficient.
  • the coding band is selected in the higher layer on the coding side, the band is expanded on the decoding side, and the band components that could not be decoded in the lower layer and the higher layer are reduced.
  • decoding high-frequency spectrum data with high accuracy can be calculated flexibly according to the coding band selected in the higher layer on the coding side, and a V-quality decoded signal with better quality can be obtained. .
  • FIG. 1 is a block diagram showing the main configuration of an encoding apparatus according to Embodiment 1 of the present invention.
  • FIG. 2 is a block diagram showing the main configuration inside the second layer coding section according to Embodiment 1 of the present invention.
  • FIG. 3 is a block diagram showing the main configuration inside the spectrum encoding section according to Embodiment 1 of the present invention.
  • FIG. 4 is a diagram for explaining an outline of filtering processing of the filtering unit according to Embodiment 1 of the present invention.
  • FIG. 5 is a diagram for explaining how the spectrum of the estimated value of the input spectrum changes as the pitch coefficient T according to the first embodiment of the present invention changes.
  • FIG. 6 is a diagram for explaining how the spectrum of the estimated value of the input spectrum changes as the pitch coefficient T according to the first embodiment of the present invention changes.
  • FIG. 7 is a flowchart showing a procedure of processes performed in a pitch coefficient setting unit, a filtering unit, and a search unit according to Embodiment 1 of the present invention.
  • FIG. 8 is a block diagram showing the main configuration of the decoding apparatus according to Embodiment 1 of the present invention.
  • FIG. 9 is a block diagram showing the main configuration inside the second layer decoding section according to Embodiment 1 of the present invention.
  • FIG. 10 is a block diagram showing the main components inside the spectrum decoding section according to Embodiment 1 of the present invention. Lock figure
  • FIG. 11 is a diagram showing a decoding spectrum generated in the filtering unit according to Embodiment 1 of the present invention.
  • FIG. 12 is a diagram showing a case where the band of the second spectrum S2 (k) completely overlaps the band of the first spectrum S1 (k) according to Embodiment 1 of the present invention.
  • FIG. 13 is a diagram showing a case where the band of the first spectrum S 1 (k) and the band of the second spectrum S2 (k) according to Embodiment 1 of the present invention are not adjacent but separated from each other
  • FIG. 14 is a block diagram showing the main configuration of an encoding apparatus according to Embodiment 2 of the present invention.
  • FIG. 15 is a block diagram showing the main configuration inside the spectrum encoding section according to Embodiment 2 of the present invention.
  • FIG. 16 is a block diagram showing the main configuration of an encoding apparatus according to Embodiment 3 of the present invention.
  • FIG. 17 is a block diagram showing the main components inside the spectrum encoding unit according to Embodiment 3 of the present invention.
  • FIG. 1 is a block diagram showing the main configuration of coding apparatus 100 according to Embodiment 1 of the present invention.
  • an encoding apparatus 100 includes a downsampling unit 101, a first layer encoding unit 102, a first layer decoding unit 103, an upsampling unit 104, a delay unit 105, a second layer encoding unit 106, A spectrum encoding unit 107 and a multiplexing unit 108 are provided, and a scalable configuration consisting of two layers is adopted.
  • the first layer of the encoding device 100 encodes the speech 'audio signal input using the CELP (Code Exited Linear Prediction) method encoding method
  • the second layer encoding inputs the first layer decoded signal. Encode the residual signal with the signal.
  • the encoding apparatus 100 divides the input signal into N (N is a natural number) samples, and encodes each frame with N samples as one frame.
  • the down-sampling unit 101 performs down-sampling processing on an input audio signal and / or audio signal (hereinafter referred to as audio “audio signal”), and The sampling frequency of one audio signal is converted into Rate 1 force and Rate 2 (Rate 1> Rate 2), and output to the first layer encoding unit 102.
  • audio signal an input audio signal and / or audio signal
  • the sampling frequency of one audio signal is converted into Rate 1 force and Rate 2 (Rate 1> Rate 2), and output to the first layer encoding unit 102.
  • First layer encoding section 102 performs CELP speech encoding on the down-sampled speech 'audio signal input from down sampling section 101, and obtains the obtained first layer encoded information. Output to first layer decoding section 103 and multiplexing section 108. Specifically, the first layer encoding unit 102 obtains an LPC (Linear Prediction Coefficient) parameter by using the vocal tract information for an audio signal composed of vocal tract information and sound source information. For sound source information, an index that specifies which of the previously stored speech models is used, that is, an index that specifies which excitation vector of the adaptive codebook or fixed codebook is to be generated is obtained.
  • LPC Linear Prediction Coefficient
  • First layer decoding section 103 performs CELP speech decoding on the first layer encoded information input from first layer encoding section 102, and up-sampling the obtained first layer decoded signal Output to 104.
  • Upsampling section 104 performs upsampling processing on the first layer decoded signal input from first layer decoding section 103, converts the sampling frequency of the first layer decoded signal from Rate2 to Ratel Output to second layer encoding section 106.
  • the delay unit 105 outputs the delayed audio / audio signal to the second layer encoding unit 106 by storing the input audio signal in a built-in buffer and outputting it after a predetermined time.
  • the predetermined time that is delayed is a time that takes into account the algorithm delay that occurs in downsampling section 101, first layer encoding section 102, first layer decoding section 103, and upsampling section 104.
  • Second layer encoding section 106 converts the audio signal input from delay section 105 into a residual signal between the up-sampled first layer decoded signal input from up sampling section 104.
  • second layer encoding is performed by performing gain 'shape quantization, and the obtained second layer encoded information is output to multiplexing section 108.
  • the internal configuration and specific operation of second layer encoding section 106 will be described later.
  • the spectrum encoding unit 107 converts the input speech 'audio signal into the frequency domain. Analyze the correlation between the low-frequency component and high-frequency component of the input spectrum obtained, calculate the parameters for estimating the high-frequency component by expanding the bandwidth on the decoding side, and calculate the vector coding The information is output to the multiplexing unit 108 as information.
  • the internal configuration and specific operation of spectrum encoding section 107 will be described later.
  • Multiplexer 108 receives first layer encoded information input from first layer encoder 102, second layer encoded information input from second layer encoder 106, and spectral encoding.
  • the spectrum coding information input from unit 107 is multiplexed, and the obtained bit stream is transmitted to the decoding device.
  • FIG. 2 is a block diagram showing the main configuration inside second layer encoding section 106.
  • second layer encoding section 106 includes frequency domain transform sections 161 and 162, residual MDCT coefficient calculation section 163, band selection section 164, shape quantization section 165, and predictive coding presence / absence determination section. 166, gain quantization section 167, and multiplexing section 168.
  • Frequency domain transform section 161 performs a modified discrete cosine transform (MDCT) using the delayed speech 'audio signal input from delay section 105, and obtains the resulting input MDCT coefficient as a residual. Output to MDCT coefficient calculation section 163.
  • MDCT modified discrete cosine transform
  • Frequency domain transform section 162 performs MDCT using the up-sampled first layer decoded signal input from up-sampling section 104, and obtains the obtained first layer MDCT coefficient as a residual MDCT coefficient calculation section. Output to 163.
  • Residual MDCT coefficient calculation section 163 calculates and obtains a residual between the input MD CT coefficient input from frequency domain transform section 161 and the first layer MDCT coefficient input from frequency domain transform section 162. The obtained residual MDCT coefficients are output to band selection section 164 and shape quantization section 165.
  • Band selection section 164 divides residual MDCT coefficient input from residual MDCT coefficient calculation section 163 into a plurality of subbands, and a band to be quantized (quantization target band) from the plurality of subbands , And outputs band information indicating the selected band to the shape quantizing unit 165, the predictive coding presence / absence determining unit 166, and the multiplexing unit 168.
  • a method of selecting the quantization target band a method of selecting a band having the highest energy, or a method of selecting in consideration of the correlation with the quantization target band selected in the past and energy at the same time. There are laws.
  • the shape quantizing unit 165 includes the MDCT corresponding to the quantization target band indicated by the band information input from the band selecting unit 164 among the residual MDC T coefficients input from the residual MDCT coefficient calculating unit 163. Shape quantization is performed using the coefficients, that is, the second layer MDCT coefficients! /, And the obtained shape coding information is output to the multiplexing unit 168.
  • the shape quantizing unit 165 obtains an ideal gain value for shape quantization, and outputs the obtained ideal gain value to the gain quantizing unit 167.
  • Predictive coding presence / absence determination section 166 uses the band information input from band selection section 164 to determine the sub-subbands common between the quantization target band of the current frame and the quantization target band of the past frame. Find a number. Then, when the number of common sub-subbands is equal to or greater than a predetermined value, the predictive coding presence / absence determining unit 166 applies the residual MDCT coefficient of the quantization target band indicated by the band information, that is, the second layer MDCT coefficient. If it is determined that predictive encoding is to be performed and the number of common sub-subbands is smaller than the predetermined value, it is determined that predictive encoding is not performed on the second layer MDCT coefficient! /. Predictive coding presence / absence determination section 166 outputs the determination result to gain quantization section 167.
  • the gain quantizing unit 167 stores the past data stored in the built-in buffer. Using the quantization gain value of the frame and the built-in gain codebook, the gain encoding information is obtained by performing predictive coding of the gain of the quantization target band of the current frame. On the other hand, when the determination result input from the predictive coding presence / absence determining unit 166 indicates a determination result indicating that the predictive encoding is not performed, the gain quantizing unit 167 determines the ideal gain value input from the shape quantizing unit 165. Gain coding information is obtained by performing direct quantization as a quantization target. Gain quantization section 167 outputs gain coding information obtained to multiplexing section 168.
  • Multiplexer 168 receives band information input from band selector 164, shape encoded information input from shape quantizer 165, and gain encoded information input from gain quantizer 167. And the obtained bit stream is transmitted to the multiplexing unit 108 as second layer encoded information.
  • the band information generated by second layer encoding section 106, the shape encoding information, the gain The encoded information may be input directly to the multiplexing unit 108 without passing through the multiplexing unit 168 and multiplexed with the first layer encoded information and the spectrum encoded information.
  • FIG. 3 is a block diagram showing the main configuration inside spectrum coding section 107.
  • spectrum coding section 107 has frequency domain conversion section 171, internal state setting section 172, pitch coefficient setting section 173, filtering section 174, search section 175, and filter coefficient calculation section 176.
  • the frequency domain transform unit 171 performs frequency transform on an input audio-audio signal whose effective frequency band is 0 ⁇ k ⁇ FH, and calculates an input spectrum S (k).
  • DFT discrete Fourier transform
  • DCT discrete cosine transform
  • MDCT modified discrete cosine transform
  • Internal state setting section 172 sets the internal state of the filter used in filtering section 174 using input spectrum S (k) whose effective frequency band is 0 ⁇ k ⁇ FH. The setting of the internal state of this filter will be described later.
  • the pitch coefficient setting unit 173 sequentially outputs the pitch coefficient T to the filtering unit 174 while changing the pitch coefficient T little by little within a predetermined search range Tmin to Tma X.
  • Filtering section 174 filters the input spectrum using the internal state of the filter set by internal state setting section 172 and pitch coefficient T output from pitch coefficient setting section 173, and estimates the input spectrum. S ′ (k) is calculated. Details of this filtering process will be described later.
  • Search section 175 is a parameter indicating the similarity between input spectrum S (k) input from frequency domain transform section 171 and estimated value S '(k) of the input spectrum output from filtering section 174. Similarity is calculated. The similarity calculation process will be described in detail later. This similarity calculation process is performed every time the pitch coefficient T is given from the pitch coefficient setting unit 173 to the filtering unit 174, and the pitch coefficient that maximizes the calculated similarity, that is, the optimum pitch coefficient T ′ (Tmin ⁇ The range of Tmax) is given to the filter coefficient calculation unit 176.
  • the filter coefficient calculation unit 176 uses the optimal pitch coefficient T ′ given from the search unit 175 and the input spectrum S (k) inputted from the frequency domain conversion unit 171 to use the filter coefficient / 3
  • the filter coefficient / 3 i and the optimum pitch coefficient T are output to the multiplexing unit 108 as spectral coding information. Details of the filter coefficient / 3 calculation process in the filter coefficient calculation unit 176 will be described later.
  • FIG. 4 is a diagram for explaining an outline of the filtering process of the filtering unit 174.
  • T represents the pitch coefficient input from pitch coefficient setting unit 173
  • the input spectrum S (k) is stored as the internal state of the filter in the band of 0 ⁇ k ⁇ FL of S (k).
  • the estimated value S ′ (k) of the input spectrum obtained using the following equation (2) is stored in the FL ⁇ k ⁇ FH band of S (k).
  • the above filtering process is performed by clearing S (k) to zero each time in the range of FL ⁇ k ⁇ FH every time the pitch coefficient T is given from the pitch coefficient setting unit 173.
  • S (k) is calculated and output to search section 175 every time pitch coefficient T changes.
  • ⁇ ⁇ represents the square error between S (k) and S '(k).
  • the input term on the right side is a fixed value regardless of the pitch coefficient T, so the pitch coefficient that generates S, (k) that maximizes the second term on the right side is searched.
  • the second term on the right side of the above equation (3) is defined as the similarity. That is, a pitch coefficient T ′ that maximizes the similarity A expressed by the following equation (4) is searched.
  • FIG. 5 is a diagram for explaining how the spectrum of the estimated value S ′ (k) of the input spectrum changes as the pitch coefficient T changes.
  • FIG. 5A is a diagram showing an input spectrum S (k) having a harmonic structure stored as an internal state.
  • Figures 5B to 5D show the spectra of the input spectrum estimate S '(k) calculated by filtering using the three types of pitch coefficients TO, Tl, and ⁇ 2, respectively. It is.
  • FIG. 6 is a diagram for explaining how the spectrum of the estimated value S ′ (k) of the input spectrum changes as the pitch coefficient T changes, as in FIG. However, the phase of the input spectrum stored as the internal state is different from that shown in Fig. 5. In the example shown in Fig. 6 as well, the pitch coefficient T at which the harmonic structure is maintained is T1.
  • changing the pitch coefficient T to find T having the maximum similarity means that the pitch of the harmonic structure of the spectrum is an integer multiple thereof) by trie-and-error. This is equivalent to finding it.
  • the filter coefficient calculation unit 176 uses the optimum pitch coefficient T ′ given from the search unit 175 to obtain a filter coefficient / 3 that minimizes the square distortion E expressed by the following equation (5).
  • FIG. 7 is a flowchart showing a procedure of processes performed in pitch coefficient setting section 173, filtering section 174, and search section 175.
  • pitch coefficient setting section 173 sets pitch coefficient T and optimum pitch coefficient T ′ to lower limit value Tmin of the search range, and sets maximum similarity Amax to 0.
  • the fine lettering section 174 performs input spectral filtering. And calculate the estimated value S ′ (k) of the input spectrum.
  • search section 175 calculates similarity A between input spectrum S (k) and estimated value S ′ (k) of the input spectrum.
  • search section 175 compares calculated similarity A with maximum similarity Am ax.
  • search section 175 updates maximum similarity Amax using similarity A, and updates optimum pitch coefficient T ′ using pitch coefficient T.
  • search section 175 compares pitch coefficient T with search range upper limit value Tmax.
  • search section 175 outputs optimum pitch coefficient T 'in ST1080.
  • the encoding apparatus 100 includes the input signal divided into the low-frequency part (0 ⁇ k ⁇ FL) and the high-frequency part (FL ⁇ k ⁇ FH) in the spectrum encoding unit 107.
  • the shape of the high-frequency spectrum is estimated using the filtering unit 174 having the low-frequency spectrum as the internal state.
  • the parameter T ′ and 0 itself representing the filter characteristics of the filtering unit 174 indicating the correlation between the low-frequency spectrum and the high-frequency spectrum are transmitted to the decoding device instead of the high-frequency spectrum.
  • the optimum pitch coefficient T which indicates the correlation between the low-frequency spectrum and the high-frequency spectrum
  • the filter coefficient / 3 are also estimation parameters for estimating the high-frequency spectrum from the low-frequency spectrum.
  • the filtering unit 174 of the spectrum encoding unit 107 uses the low-frequency spectrum to increase the frequency.
  • the pitch coefficient setting unit 173 outputs the frequency difference between the low-frequency spectrum and the high-frequency spectrum used as the estimation reference, that is, the pitch coefficient T in various ways, and outputs it. 175 searches for a pitch coefficient T that maximizes the similarity between the low-frequency spectrum and the high-frequency spectrum. Therefore, the shape of the high-frequency spectrum can be estimated based on the pitch of the harmonic structure of the entire spectrum, and encoding can be performed while maintaining the harmonic structure of the entire spectrum, improving the quality of the decoded speech signal. can do.
  • the bandwidth of the low-frequency spectrum can be set arbitrarily without having to align the bandwidth of the low-frequency spectrum with the pitch of the harmonic structure (an integral multiple of that). Therefore, the spectrum can be smoothly connected at the connection portion between the low-frequency spectrum and the high-frequency spectrum with a simple operation, and the quality of the decoded speech signal can be improved.
  • FIG. 8 is a block diagram showing the main configuration of decoding apparatus 200 according to the present embodiment.
  • decoding apparatus 200 includes control section 201, first layer decoding section 202, upsampling section 203, second layer decoding section 204, spectrum decoding section 205, and switch 206.
  • Control section 201 separates the first layer encoded information, the second layer encoded information, and the spectrum encoded information that constitute the bit stream transmitted from encoding apparatus 100, and obtains the first obtained
  • the encoded information is output to first layer decoding section 202
  • the second layer encoded information is output to second layer decoding section 204
  • the spectral encoding information is output to spectrum decoding section 205.
  • the control unit 201 adaptively generates control information for controlling the switch 206 according to the constituent elements of the bit stream transmitted from the encoding apparatus 100, and outputs the control information to the switch 206.
  • First layer decoding section 202 performs CELP decoding on the first layer encoded information input from control section 201, and obtains the obtained first layer decoded signal by upsampling section 203 and switch 206. Output to.
  • Upsampling section 203 performs upsampling processing on the first layer decoded signal input from first layer decoding section 202, converts the sampling frequency of the first layer decoded signal from Rate2 to Ratel, Output to spectrum decoding section 205.
  • Second layer decoding section 204 performs gain 'shape inverse quantization using the second layer encoded information input from control section 201, and obtains the obtained second layer MDCT coefficients, that is, quantization targets Band residual MDCT coefficients are output to spectrum decoding section 205. The internal configuration and specific operation of second layer decoding section 204 will be described later.
  • Spectral decoding section 205 receives second layer MDCT coefficients input from second layer decoding section 204, spectral coding information input from control section 201, upsampling section 203, and post-upsampling input.
  • the first layer decoded signal is used to perform band extension processing, and the obtained second layer decoded signal is output to the switch 206.
  • the internal configuration and specific operation of spectrum decoding section 205 will be described later.
  • switch 206 is a bit stream transmitted from encoding apparatus 100 to decoding apparatus 200, for the first layer encoded information, the second layer encoded information, And the spectrum coding information, the bit stream is composed of the first layer coding information, the extra coding information power, or the bit stream is the first layer coding information,
  • the second layer encoded information is V
  • the second layer decoded signal input from spectrum decoding section 205 is output as a decoded signal.
  • switch 206 outputs the first layer decoded signal input from first layer decoding section 202 as a decoded signal when the bit stream is composed only of the first layer encoded information.
  • FIG. 9 is a block diagram showing a main configuration inside second layer decoding section 204.
  • second layer decoding section 204 includes separation section 241, shape inverse quantization section 242, predictive decoding presence / absence determination section 243, and gain inverse quantization section 244.
  • Separating section 241 separates the band information, shape encoded information, and gain encoded information from the second layer encoded information input from control section 201, and changes the obtained band information to the shape inverse quantization section 242 and predictive decoding presence / absence determination unit 243, shape encoding information is output to shape inverse quantization unit 242 and gain encoding information is output to gain inverse quantization unit 244.
  • the shape inverse quantization unit 242 decodes the shape encoded information input from the separation unit 241, and the MDC corresponding to the quantization target band indicated by the band information input from the separation unit 241.
  • the shape value of the T coefficient is obtained and output to the gain inverse quantization unit 244.
  • Predictive decoding presence / absence determining section 243 uses the band information input from demultiplexing section 241 to determine the common subband between the quantization target band of the current frame and the quantization target band of the past frame. Find a number. Then, when the number of common subbands is equal to or greater than a predetermined value, the predictive decoding presence / absence determining unit 243 determines that predictive decoding is performed on the MDCT coefficient of the quantization target band indicated by the band information, and When the number of subbands is smaller than the predetermined value, it is determined that predictive decoding is not performed on the MDCT coefficient of the quantization target band indicated by the band information. Predictive decoding presence / absence determination section 243 outputs the determination result to gain inverse quantization section 244.
  • the gain dequantization unit 244 determines the past frame stored in the built-in buffer. Using the gain value and the built-in gain codebook, the gain coding information input from the separation unit 241 is subjected to predictive decoding to obtain a gain value. On the other hand, when the determination result input from the predictive decoding presence / absence determining unit 243 indicates that the predictive decoding is not performed! /, And! /, The gain dequantizing unit 244 uses the built-in gain codebook. Thus, the gain encoded information input from the separation unit 241 is directly inversely quantized to obtain a gain value. Gain dequantization section 244 obtains the second layer MDCT coefficient, that is, the residual MDCT coefficient of the quantization target band, using the obtained gain value and the shape value input from shape inverse quantization section 242. Output.
  • second layer decoding section 204 having the above configuration is the same as that of second layer encoding section 1
  • FIG. 10 is a block diagram showing the main configuration inside spectrum decoding section 205.
  • spectrum decoding section 205 has frequency domain conversion section 251, addition spectrum calculation section 252, internal state setting section 253, filtering section 254, and time domain conversion section 255.
  • Frequency domain transform section 251 performs frequency transform on the first layer decoded signal after up-sampling input from up-sampling section 203, calculates first spectrum Sl (k), and adds spectrum calculation section Output to 252.
  • the effective frequency band of the first layer decoded signal after upsampling is 0 ⁇ k ⁇ FL
  • the frequency conversion method is discrete Fourier transform. Conversion (DFT), discrete cosine transform (DCT), modified discrete cosine transform (MDCT), etc.
  • Addition spectrum calculation section 252 receives first spectrum Sl (k) from frequency domain transform section 251 and second layer MDCT coefficients (hereinafter referred to as second spectrum S2) from second layer decoding section 204. (denoted as (k)) is input, the first spectrum Sl (k) and the second spectrum S2 (k) are added, and the addition result is output to the internal state setting unit 253 as the addition spectrum S3 (k) To do.
  • the addition spectrum calculation unit 252 receives only the first spectrum Sl (k) from the frequency domain conversion unit 251 and does not receive the second spectrum S2 (k) from the second layer decoding unit 204. 1Spectrum S l (k) is output to internal state setting unit 253 as addition spectrum S3 (k)
  • the internal state setting unit 253 sets the internal state of the filter used in the filtering unit 254 using the addition spectrum S3 (k).
  • Filtering section 254 calculates the internal state of the filter set by internal state setting section 253, and the optimum pitch coefficient T 'and filter coefficient / 3 included in the spectral coding information input from control section 201. Then, the sum spectrum S3 (k) is filtered to generate the sum spectrum estimate S3 ′ (k). Then, filtering section 254 outputs decoded spectrum S ′ (k) composed of added spectrum S3 (k) and estimated value S3 ′ (k) of the added spectrum to time domain converting section 255. In such a case, the filtering unit 254 uses the filter function represented by the above equation (1).
  • FIG. 11 is a diagram showing the decoded spectrum S ′ (k) generated by the filtering unit 254.
  • the fine-lettering unit 254 does not use the first layer MDCT coefficient (0 ⁇ k ⁇ FU and the second layer MDCT coefficient (FL, ⁇ Filtering is performed using the sum spectrum S3 (k) where the band is 0 ⁇ k ⁇ FL ", which is the sum of k ⁇ FL", and an estimated value S3 '(k) of the sum spectrum is obtained. As shown in FIG.
  • the decoded spectrum S ′ (k) in the band to be quantized indicated by the band information is composed of the added spectrum S3 (k)
  • the decoded spectrum S ′ (k) in FH is composed of the estimated value S3 ′ (k) of the added spectrum.
  • the decoded spectrum S '(k) in the frequency band FL' ⁇ k ⁇ FL is the estimated value S3' (k) of the added spectrum obtained by the filtering process of the filtering unit 254 using the added spectrum S3 (k). Then it takes the value of the additive spectrum S3 (k) itself.
  • FIG. 11 shows an example in which the band of the first spectrum S 1 (k) and the band of the second spectrum S2 (k) partially overlap.
  • the band of the first spectrum Sl (k) completely overlaps the band of the second spectrum S2 (k), or the first spectrum Sl (k)
  • the band of the second spectrum S2 (k) is not adjacent and may be separated.
  • FIG. 12 is a diagram showing a case where the band of the second spectrum S2 (k) completely overlaps the band of the first spectrum Sl (k).
  • the decoding spectrum S ′ (k) in the frequency band FL ⁇ k ⁇ FH takes the value of the estimated value S3 ′ (k) itself of the added spectrum.
  • the value of the addition spectrum S3 (k) is obtained by caloring the value of the first spectrum SI (k) and the value of the second spectrum S2 (k). The accuracy of the estimated value S3 ′ (k) is improved, and hence the quality of the decoded speech signal is improved.
  • FIG. 13 is a diagram showing a case where the band of the first spectrum SI (k) and the band of the second spectrum S2 (k) are not adjacent but separated from each other.
  • the filtering unit 254 obtains an estimated value S3 ′ (k) of the added spectrum using the first spectrum tunnel S l (k), and performs a band expansion process to the frequency band FL ⁇ k ⁇ FH.
  • the portion of the estimated value S3 ′ (k) corresponding to the band of the second spectrum S 2 (k) is replaced using the second spectrum S 2 (k).
  • the reason is that the accuracy of the second spectrum S2 (k) is higher than the estimated value S3 ′ (k) of the added spectrum, which improves the quality of the decoded speech signal.
  • Time domain conversion section 255 converts decoded spectrum S '(k) input from filtering section 254 into a time domain signal and outputs it as a second layer decoded signal.
  • the time domain conversion unit 255 performs processing such as appropriate windowing and overlay addition as necessary to avoid discontinuities between frames.
  • the encoding band is selected in the upper layer on the encoding side, and the decoded spectrum of the lower layer and the upper layer is added on the decoding side to obtain
  • the band is extended using the added spectrum, and the band components that cannot be decoded by the lower and upper layers are decoded. Therefore, high-frequency spectrum data with high accuracy can be calculated flexibly according to the coding band selected in the higher layer on the coding side, and a decoded signal with higher quality can be obtained.
  • second layer encoding section 106 selects force band S to be quantized and performs second layer encoding as an example. Not limited to this, second layer encoding section 106 may encode components in the same band as the bands encoded in first layer encoding section 102, which may encode fixed band components. .
  • decoding apparatus 200 uses the optimal pitch coefficient T and the filter coefficient / 3 included in the spectral encoding information to add spectrum S3 (k).
  • the present invention is not limited to this, and the decoding apparatus 200 is not limited to this, but has been described as an example in which the high-band part vector is estimated by filtering and generating the estimated value S3 ′ (k) of the added spectrum. By filtering the first spectrum SI (k), the spectrum of the high band may be estimated.
  • 1SM is not limited to this. It is possible to use an integer (natural number) of 0 or more.
  • the CELP type encoding / decoding scheme is applied in the first layer, but other encoding / decoding schemes may be used.
  • encoding apparatus 10 that performs hierarchical encoding (scalable encoding).
  • the present invention is not limited to this, and may be applied to an encoding apparatus that performs encoding in a method other than hierarchical encoding.
  • encoding apparatus 100 includes frequency domain transform sections 161 and 162, these are necessary when time domain signals are used as input signals.
  • the present invention is not limited to this, and when a vector is directly input to the spectrum encoding unit 107, the frequency domain transform units 161 and 162 may not be provided.
  • the filter coefficient is calculated by the filter coefficient calculation unit 176 after the pitch coefficient is calculated by the filtering unit 174. 1.
  • the present invention is not limited to this, and the filter coefficient calculation unit 176 may not be provided and the filter coefficient may not be calculated. Alternatively, the filter coefficient calculation unit 176 may not be provided, and the filtering unit 174 may perform filtering using the pitch coefficient and the filter coefficient to search for the optimum pitch coefficient and filter coefficient at the same time. In such a case, the following equations (6) and (7) are used instead of the above equations (1) and (2).
  • the case where the high frequency spectrum is encoded using the low frequency spectrum that is, using the low frequency spectrum as a reference for encoding has been described as an example.
  • the reference spectrum may be set in other ways. For example, it is not desirable from the viewpoint of effective use of energy, but it is acceptable to encode a low-frequency spectrum using a high-frequency spectrum, or to encode a spectrum in an intermediate frequency band. You may encode the spectrum of another band as a reference
  • FIG. 14 is a block diagram showing the main configuration of coding apparatus 300 according to Embodiment 2 of the present invention.
  • coding apparatus 300 has the same basic configuration as coding apparatus 100 (see FIGS. 1 to 3) shown in Embodiment 1, and the same components are denoted by the same reference numerals. The description is omitted.
  • the spectrum encoding unit 307 of the encoding device 300 and the spectrum encoding unit 107 of the encoding device 100 are different in part of the processing, and different codes are attached to indicate this.
  • Spectral coding section 307 converts the speech 'audio signal that is an input signal of coding apparatus 300 and the first layer decoded signal after upsampling input from upsampling section 104 into the frequency domain. Obtain the input spectrum and the first layer decoding spectrum. Then, the spectrum encoding unit 307 includes a low frequency component of the first layer decoded spectrum, Analyzing the correlation with the high-frequency component of the input spectrum, calculating the parameters for estimating the high-frequency component from the low-frequency component on the decoding side, and outputting it to the multiplexing unit 108 as spectral coding information .
  • FIG. 15 is a block diagram showing the main components inside spectrum coding section 307.
  • the spectrum encoding unit 307 has the same basic configuration as the spectrum encoding unit 107 (see FIG. 3) shown in Embodiment 1, and the same components are assigned the same reference numerals. The explanation is omitted.
  • Spectrum coding section 307 is different from spectrum coding section 107 in that frequency coding section 377 is further provided.
  • the setting unit 172, the filtering unit 174, the search unit 175, and the filter coefficient calculation unit 176 are different in part of the processing, and different reference numerals are given to indicate this.
  • Frequency domain transform section 377 performs frequency transform on the input audio-audio signal whose effective frequency band is 0 ⁇ k ⁇ FH, and calculates input spectrum S (k).
  • DFT discrete Fourier transform
  • DCT discrete cosine transform
  • MDCT modified discrete cosine transform
  • the frequency domain transform unit 371 performs upsampling in which the effective frequency band input from the upsampling unit 104 is 0 ⁇ k ⁇ FH instead of the audio 'audio signal in which the effective frequency band is 0 ⁇ k ⁇ FH.
  • a frequency conversion is performed on the subsequent first layer decoded signal to calculate a first layer decoded spectrum S (k).
  • the frequency conversion method is discrete
  • DFT discrete cosine transform
  • DCT discrete cosine transform
  • MDCT modified discrete cosine transform
  • the internal state setting unit 372 performs the first layer decoded spectrum S (k )
  • the internal state of the filter used in the filtering unit 374 is set using DEC1.
  • the internal state of this filter is set by adding spectrum S instead of input spectrum S (k).
  • Filtering section 374 performs filtering of the first layer decoded vector using the internal state of the filter set by internal state setting section 372 and pitch coefficient T output from pitch coefficient setting section 173. Calculate estimated value S '(k) of 1-layer decoded spectrum
  • Search section 375 is similar to input spectrum S (k) input from frequency domain transform section 377 and estimated value S ′ (k) of the first layer decoded spectrum output from filtering section 374.
  • Similarity which is a parameter indicating sex, is calculated.
  • the similarity calculation process is the same as the similarity calculation process performed by the search unit 175 except that the following expression (9) is used instead of the expression (4), and thus detailed description thereof is omitted.
  • This similarity calculation process is performed every time the pitch coefficient T is given from the pitch coefficient setting unit 173 to the filtering unit 374, and the pitch coefficient that maximizes the calculated similarity, that is, the optimum pitch coefficient T '(Range from Tmin to Tmax) is given to the filter coefficient calculation unit 376.
  • Filter coefficient calculation section 376 has an optimum pitch coefficient T ′ given from search section 375, input spectrum S (k) input from frequency domain conversion section 377, and first input from frequency domain conversion section 371. Using the layer decoded spectrum S (k), find the filter coefficient / 3,
  • Multiplexer 10 uses DEC1 i filter coefficient 13 and optimum pitch coefficient T 'as spectral coding information. Output to 8.
  • the filter coefficient calculation process in the filter coefficient calculation unit 376 is the same as the calculation process of the filter coefficient / 3 in the filter coefficient calculation unit 176 except that the following expression (10) is used instead of the expression (5). Since it is the same, detailed explanation is omitted.
  • encoding apparatus 300 uses spectral encoding section 307 to perform a filter that uses first layer decoded spectrum S (k) whose effective frequency band is 0 ⁇ k ⁇ FH as an internal state.
  • the shape of the high-frequency part (FL ⁇ k ⁇ FH) of the first layer decoded spectrum S (k) where the effective frequency band is 0 ⁇ k ⁇ FH is estimated using the scaling part 374.
  • the optimum pitch coefficient T ′ and the filter coefficient / 3 representing the filter characteristics of the filtering unit 374 are obtained, and these are transmitted to the decoding device instead of the encoded information of the high frequency part of the input spectrum.
  • decoding apparatus Since the decoding apparatus according to the present embodiment has the same configuration as that of decoding apparatus 100 according to Embodiment 1 and performs the same operation, description thereof is omitted.
  • the decoding spectrum of the lower layer and the upper layer is added on the decoding side, and the obtained addition spectrum is band-extended to be used for obtaining the estimated value of the adding spectrum.
  • the optimal pitch coefficient and filter coefficient are not the correlation between the estimated value S '(k) of the input spectrum and the high band (FL ⁇ k ⁇ FH) of the input spectrum S (k).
  • FIG. 16 is a block diagram showing the main configuration of encoding apparatus 400 according to Embodiment 3 of the present invention.
  • coding apparatus 400 has the same basic configuration as coding apparatus 100 (see FIGS. 1 to 3) shown in the first embodiment, and the same reference numerals are given to the same components. A description thereof will be omitted.
  • Encoding apparatus 400 is different from encoding apparatus 100 in that it further includes second layer decoding section 409. Note that the spectrum encoding unit 407 of the encoding device 400 and the spectrum encoding unit 107 of the encoding device 100 are different in part of the processing, and different codes are attached to indicate this.
  • Second layer decoding section 409 has the same configuration as second layer decoding section 204 (FIGS. 8 to 10) in decoding apparatus 200 according to Embodiment 1, and performs the same operation. The explanation is omitted. However, while the output of second layer decoding section 204 is referred to as the second layer MDCT coefficient, here the output of second layer decoding section 409 is referred to as the second layer decoded spectrum, and S (k)
  • Spectral coding section 407 converts the speech 'audio signal that is an input signal of coding apparatus 400 and the first layer decoded signal after up-sampling input from up-sampling section 104 into the frequency domain. Obtain the input spectrum and the first layer decoding spectrum. Then, spectrum encoding section 407 adds the low-frequency component of the first layer decoded spectrum and the second layer decoded spectrum input from second layer decoding section 409, adds the addition spectrum that is the addition result, and the input spectrum The band is expanded on the decoding side to calculate a parameter for estimating the low frequency component power and the high frequency component, and outputs to the multiplexing unit 108 as spectrum coding information.
  • FIG. 17 is a block diagram showing the main components inside spectrum coding section 407.
  • the spectrum encoding unit 407 has the same basic configuration as the spectrum encoding unit 107 (see FIG. 3) shown in Embodiment 1, and the same components are assigned the same reference numerals. The explanation is omitted.
  • Spectrum encoding section 407 is replaced with frequency domain transform section 171 instead of frequency domain transform section 171.
  • the filter coefficient calculation unit 176 has a difference in part of the processing, and a different reference numeral is attached to indicate this.
  • the frequency domain transform unit 471 performs upsampling in which the effective frequency band input from the upsampling unit 104 is 0 ⁇ k ⁇ FH instead of the voice / audio signal in which the effective frequency band is 0 ⁇ k ⁇ FH.
  • the frequency conversion is performed on the subsequent first layer decoded signal to calculate the first layer decoded spectrum S (k) and output it to the added spectrum calculating section 478
  • DFT discrete Fourier transform
  • DCT discrete cosine transform
  • MDCT modified discrete cosine transform
  • Addition spectrum calculation section 478 receives the low frequency (0 ⁇ k ⁇ FU component of first layer decoded spectrum S (k) input from frequency domain transform section 471 and the second layer decoding section 409.
  • the band of the added spectrum S (k) is the low band (0 ⁇ k ⁇ FL) and the second layer encoding.
  • the frequency domain transform unit 477 performs frequency transform on the input audio-audio signal whose effective frequency band is 0 ⁇ k ⁇ FH, and calculates the input spectrum S (k).
  • DFT discrete Fourier transform
  • DCT discrete cosine transform
  • MDCT modified discrete cosine transform
  • the internal state setting unit 472 uses the sum spectrum S (k) whose effective frequency band is 0 ⁇ k ⁇ FH instead of the input spectrum S (k) whose effective frequency band is 0 ⁇ k ⁇ FH.
  • the internal state of the filter used in the filtering unit 474 is set.
  • the internal state of this filter is set using the summed spectrum S (k) instead of the input spectrum S (k).
  • the internal state setting unit 172 is the same as the internal state setting, and thus detailed description thereof is omitted.
  • the filtering unit 474 uses the internal state of the filter set by the internal state setting unit 472 and the pitch coefficient T output from the pitch coefficient setting unit 473 to add the spectrum S
  • Search section 475 is a parameter indicating the similarity between input spectrum S (k) input from frequency domain transform section 477 and estimated value S '(k) of the added spectrum output from filtering section 474.
  • the similarity that is a parameter is calculated.
  • the similarity calculation process is the same as the similarity calculation process performed by the search unit 175 except that the following expression (12) is used instead of the expression (4), and thus detailed description thereof is omitted.
  • This similarity calculation process is performed each time the pitch coefficient T is given from the pitch coefficient setting unit 173 to the filtering unit 474, and the pitch coefficient that maximizes the calculated similarity, ie, the optimum
  • the pitch coefficient T ′ (range from Tmin to Tmax) is given to the filter coefficient calculation unit 476.
  • Filter coefficient calculation section 476 includes optimum pitch coefficient T ′ provided from search section 475, input spectrum S (k) input from frequency domain conversion section 477, and addition input from addition spectrum calculation section 478. Using the spectrum S (k), find the filter coefficient / 3 and filter
  • Coefficient / 3 and optimum pitch coefficient T ′ are output to multiplexing section 108 as spectral coding information.
  • the filter coefficient calculation unit 476 calculates the filter coefficient / 3 in the filter coefficient calculation unit 176 except that the following expression (13) is used instead of the expression (5). Detailed description will be omitted.
  • the encoding apparatus 400 includes a filtering unit 47 that uses the spectrum encoding unit 407 to set the added spectrum S (k) in which the effective frequency band is 0 ⁇ k ⁇ FH to an internal state.
  • the parameters indicating the correlation with the high-frequency part (FL ⁇ k ⁇ FH), that is, the optimum pitch coefficient T 'and the filter coefficient / 3 that represent the filter characteristics of the filtering part 474 are obtained, and the high-frequency part of the input spectrum is encoded. It is transmitted to the decoding device instead of the information.
  • decoding apparatus Since the decoding apparatus according to the present embodiment has the same configuration as that of decoding apparatus 100 according to Embodiment 1 and performs the same operation, the description thereof is omitted.
  • the first layer decoding spectrum and the second layer decoded spectrum are added to calculate the added spectrum, and the added spectrum and the input are calculated. Based on the correlation with the spectrum, the optimum pitch coefficient and filter coefficient are obtained.
  • the addition spectrum is calculated by adding the decoded spectra of the lower layer and the upper layer, and the estimated value of the addition spectrum is obtained using the optimum pitch coefficient and filter coefficient transmitted from the encoding side. Perform bandwidth expansion. Therefore, it is possible to further suppress the influence of coding distortion of the first layer coding and the second layer coding on the band expansion on the decoding side, and further improve the quality of the decoded signal.
  • the first layer decoded spectrum and the second layer decoded spectrum are added to calculate an added spectrum, and the correlation between the added spectrum and the input spectrum is calculated.
  • the present invention is not limited to this, and the spectrum for which the correlation with the input spectrum is obtained is described.
  • either the addition spectrum or the first decoding spectrum may be selected.
  • the optimal pitch coefficient and filter coefficient for band expansion are calculated based on the correlation between the first layer decoded spectrum and the input spectrum.
  • the optimal pitch coefficient and filter coefficient for band expansion are calculated based on the correlation between the added spectrum and the input spectrum.
  • auxiliary information input to the encoding device or the state of the transmission line can be used.
  • the first layer coding where the use efficiency of the transmission line is very high. If you are unable to transmit information,
  • the correlation between the low frequency component and the high frequency component of the input spectrum is compared with the case of calculating the optimum pitch coefficient and the filter coefficient. You may add when you ask. For example, if the distortion between the first layer decoded spectrum and the input spectrum is very small, calculating the optimum pitch coefficient and filter coefficient from the low-frequency component and high-frequency component of the input spectrum, the higher the layer, the higher the layer. Therefore, it is possible to provide a higher quality output signal.
  • the present invention provides a first layer decoded signal or a first layer decoded signal used in a scalable codec to calculate a band extension parameter in an encoding device. And a band extension parameter for band extension by the decoding device, and a low band component of a calculated signal (for example, an added signal obtained by adding the first layer decoded signal and the second layer decoded signal). Apply the first layer decoded signal or the calculated signal calculated by using the first layer decoded signal (for example, the sum signal obtained by adding the first layer decoded signal and the second layer decoded signal).
  • An advantageous effect can be obtained by configuring the band components to be different. It is possible to configure the low frequency components to be the same as each other, or to use the low frequency components of the input signal in the encoding device.
  • the force shown as an example of using a pitch coefficient and a filter coefficient as parameters used for band expansion is not limited to this.
  • one coefficient may be fixed on the encoding side and the decoding side, and only the other coefficient may be transmitted as a parameter from the encoding side.
  • separate parameters to be used for transmission can be obtained and used as band extension parameters. They may be used in combination.
  • the encoding apparatus adjusts the energy for each high-frequency subband (a band obtained by dividing the entire band into a plurality of frequency component areas) after filtering.
  • the decoding apparatus may receive the gain information and use it for band expansion.
  • gain information used for energy adjustment for each subband obtained by the encoding device is transmitted to the decoding device as a parameter used for band expansion, and this gain information is applied to the band expansion by the decoding device.
  • the pitch coefficient for estimating the high band spectrum from the low band spectrum and the filtering coefficient are fixed between the encoding device and the decoding device, so that the energy for each subband is fixed. It is possible to use only gain information for adjusting the bandwidth as a parameter for bandwidth expansion. Therefore, band expansion can be performed by using at least one of the three types of information of pitch coefficient, filtering coefficient, and gain information.
  • the encoding apparatus, decoding apparatus, and these methods according to the present invention are not limited to the above embodiments, and can be implemented with various modifications. For example, each embodiment can be implemented in combination as appropriate.
  • the encoding device and the decoding device according to the present invention can be mounted on a communication terminal device and a base station device in a mobile communication system, and thereby have a similar operation effect as described above.
  • a base station apparatus and a mobile communication system can be mounted on a communication terminal device and a base station device in a mobile communication system, and thereby have a similar operation effect as described above.
  • the power described with reference to the case where the present invention is configured by hardware can be realized by software.
  • an encoding device and a decoding device according to the present invention are described by describing an algorithm of the encoding method and the decoding method according to the present invention in a programming language, storing the program in a memory, and causing the information processing means to execute the program. The same function can be realized.
  • each functional block used in the description of each of the above embodiments is typically realized as an LSI which is an integrated circuit. These may be individually made into one chip, or may be made into one chip so as to include some or all of them. [0149] Although LSI is used here, depending on the degree of integration, IC, system LSI, super L
  • the method of circuit integration is not limited to LSI, and may be realized by a dedicated circuit or a general-purpose processor. You can use FPGA (Field Programmable Gate Array) that can be programmed after LSI manufacturing, or a reconfigurable processor that can reconfigure the connection or setting of circuit cells inside the LSI! / .
  • FPGA Field Programmable Gate Array
  • the first invention of the present invention is the first encoding means for generating a first encoded data by encoding a low-frequency part of the input signal, which is a band lower than a predetermined frequency, and the first A first decoding means for decoding the encoded data to generate a first decoded signal; and a second encoding by encoding a predetermined band portion of the residual signal between the input signal and the first decoded signal. Filtering the low-frequency part of the second encoding means for generating data and the first decoded signal or a calculated signal calculated using the first decoded signal, and And a filtering unit that obtains a band extension parameter for obtaining a high-frequency part that is a band higher than the frequency.
  • the second encoded data is decoded and the second encoded data is decoded.
  • the filtering means comprises the addition Applying a signal as the calculated signal and filtering the low-frequency portion of the sum signal, the band extension parameter for obtaining a high-frequency portion that is higher than the predetermined frequency of the input signal.
  • the third invention of the present invention further comprises gain information generating means for calculating gain information for adjusting energy for each subband after the filtering in the first or second invention. It is an encoding device.
  • a fourth invention of the present invention is a decoding device using a scalable codec having a layer configuration of r layers (r is an integer of 2 or more), wherein the encoding device uses the m-th layer (m is equal to or less than r).
  • the decoding device includes decoding means for generating a high frequency component.
  • the decoding means uses the band extension parameter to decode a decoded signal of an nth layer (m ⁇ n) different from the mth layer.
  • This is a decoding device that generates high-frequency components.
  • the receiving means further receives gain information transmitted from the encoding device, and the decoding means is configured to expand the band.
  • the decoding apparatus generates the high-frequency component of the decoded signal of the nth layer using the gain information instead of the extension parameter, or using the band extension parameter and the gain information.
  • the seventh invention of the present invention is a first encoded data obtained by encoding a low-frequency portion, which is a band lower than a predetermined frequency, of the input signal in the encoding device transmitted from the encoding device.
  • Data second encoded data obtained by encoding a predetermined band portion of the residual between the first decoded spectrum obtained by decoding the first encoded data and the spectrum of the input signal, and the first Filtering and filtering the low-frequency part of the first decoded spectrum or the first added spectrum obtained by adding the first decoded spectrum and the second decoded spectrum obtained by decoding the second encoded data
  • Receiving means for receiving a band extension parameter for obtaining a high-frequency portion that is a band higher than the predetermined frequency of the signal, and generating the third decoded spectrum in the low-frequency band by decoding the first encoded data First decryption Means, second decoding means for decoding the second encoded data to generate a fourth decoded spectrum in the predetermined band portion, and using the band extension parameter
  • the receiving means includes the first encoded data, the second encoded data, and the low-frequency portion of the first addition spectrum. And a band extension parameter for obtaining a high-frequency part that is a band higher than the predetermined frequency of the input signal.
  • the third decoding means adds the third decoded spectrum and the fourth decoded spectrum to generate a second added spectrum.
  • Filtering means for filtering the third decoded spectrum, the fourth decoded spectrum, or the second added spectrum as the fifth decoded spectrum by using the band extension parameter to perform the band extension.
  • a decoding device comprising:
  • the receiving means further receives gain information transmitted from the encoding device, and the third decoding means is the band extension parameter. 5th decoding generated using the third decoded spectrum, the fourth decoded spectrum, or both using the gain information instead of the above or using the band extension parameter and the gain information.
  • This is a decoding device that decodes a band portion that has not been decoded by the first decoding means and the second decoding means by band-extending one of the spectra.
  • An eleventh aspect of the present invention is the encoding apparatus' decoding apparatus according to any of the first to tenth aspects, comprising at least one of a band extension parameter, a pitch coefficient, and a filtering coefficient.
  • the encoding apparatus and the like according to the present invention can be applied to applications such as a communication terminal apparatus and a base station apparatus in a mobile communication system.

Abstract

 符号化側の上位レイヤにおいて選択された符号化帯域に応じて柔軟性良く精度の高い高域スペクトルデータを算出し、より品質の良い復号信号を得ることができる復号装置等を開示する。この装置において、第1レイヤ復号部(202)は、第1レイヤ符号化情報に対して復号を行って第1レイヤ復号信号を生成し、第2レイヤ復号部(204)は、第2レイヤ符号化情報に対して復号を行って第2レイヤ復号信号を生成し、スペクトル復号部(205)は、第2レイヤ復号信号と、アップサンプリング部(203)においてアップサンプリングされた第1レイヤ復号信号とを用いて帯域拡張処理を行って全帯域復号信号を生成し、スイッチ(206)は、制御部(201)において生成された制御情報に基づき、第1レイヤ復号信号または全帯域復号信号を出力する。

Description

明 細 書
符号化装置、復号装置およびこれらの方法
技術分野
[0001] 本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置、復 号装置およびこれらの方法に関する。
背景技術
[0002] インターネット通信に代表されるパケット通信システムや、移動通信システムなどで 音声 'オーディオ信号を伝送する場合、音声 'オーディオ信号の伝送効率を高めるた め、圧縮'符号化技術がよく使われる。また、近年では、単に低ビットレートで音声 'ォ 一ディォ信号を符号化するという一方で、より広帯域の音声'オーディオ信号を符号 化する技術に対するニーズが高まってレ、る。
[0003] このようなニーズに対して、符号化後の情報量を大幅には増加させることなく広帯 域の音声'オーディオ信号を符号化する様々な技術が開発されてきている。例えば、 非特許文献 1では、入力信号を周波数領域の成分に変換し、低域スペクトルデータ と高域スペクトルデータの相関を利用して、低域スペクトルデータから高域スぺクトノレ データを生成するパラメータを算出し、復号時にそのパラメータを用いて帯域拡張す る方法が挙げられている。
非特許文献 1 :押切正浩、江原宏幸、吉田幸司、「ピッチフィルタリングに基づくスぺク トル符号化を用いた超広帯域スケーラブル音声符号化の改善」、音講論集 2-4-13、 p P.297- 298、 Sep. 2004.
発明の開示
発明が解決しょうとする課題
[0004] しかしながら、従来の帯域拡張技術では、復号側の上位レイヤにお!/、て、下位レイ ャで帯域拡張して得られた周波数の高域部のスペクトルデータそのままが利用され るため、十分な精度の高域部のスペクトルデータが再現されているとは言えない。
[0005] 本発明の目的は、復号側において、低域スペクトルデータを用いて精度の高い高 域スペクトルデータを算出することができ、より品質の良い復号信号を得ることができ る符号化装置、復号装置およびこれらの方法を提供することである。
課題を解決するための手段
[0006] 本発明の符号化装置は、入力信号のうち所定周波数より低い帯域である低域の部 分を符号化して第 1符号化データを生成する第 1符号化手段と、前記第 1符号化デ 一タを復号して第 1復号信号を生成する第 1復号手段と、前記入力信号と前記第 1復 号信号との残差信号の所定の帯域部分を符号化して第 2符号化データを生成する 第 2符号化手段と、前記入力信号、前記第 1復号信号、および前記第 1復号信号を 用いて算出される算出信号、のうちいずれか一つの信号の前記低域の部分をフィノレ タリングして、前記入力信号の前記所定周波数より高い帯域である高域の部分を得 るためのピッチ係数およびフィルタリング係数を得るフィルタリング手段と、を具備する 構成を採る。
[0007] 本発明の復号装置は、 r階層(rは 2以上の整数)のレイヤ構成のスケーラブルコー デックを用いた復号装置であって、符号化装置で第 mレイヤ (mは r以下の整数)の復 号信号を用いて算出された帯域拡張パラメータを受信する受信手段と、第 nレイヤ (n は r以下の整数)の復号信号の低域成分に対して前記帯域拡張パラメータを用いるこ とにより高域成分を生成する復号手段と、を具備する構成を採る。
[0008] 本発明の復号装置は、符号化装置から送信された、前記符号化装置における入力 信号のうち所定周波数より低い帯域である低域の部分を符号化した第 1符号化デー タと、前記第 1符号化データを復号して得られた第 1復号スペクトルと前記入力信号 のスペクトルとの残差の所定の帯域部分を符号化した第 2符号化データと、前記入力 信号、前記第 1復号スペクトル、および前記第 1復号スペクトルと前記第 2符号化デー タを復号して得られた第 2復号スペクトルとを加算した第 1加算スペクトル、のうち 、ず れか一つの前記低域の部分をフィルタリングして前記入力信号の前記所定周波数よ り高レ、帯域である高域の部分を得るためのピッチ係数およびフィルタリング係数と、を 受信する受信手段と、前記第 1符号化データを復号して前記低域における第 3復号 スペクトルを生成する第 1復号手段と、前記第 2符号化データを復号して前記所定の 帯域部分における第 4復号スペクトルを生成する第 2復号手段と、前記ピッチ係数お よびフィルタリング係数を用いて、前記第 3復号スペクトル、前記第 4復号スペクトル、 およびその両方を用いて生成される第 5復号スペクトル、のうちいずれか一つを帯域 拡張することにより、前記第 1復号手段および前記第 2復号手段で復号されなかった 帯域部分を復号する第 3復号手段と、を具備する構成を採る。
[0009] 本発明の符号化方法は、入力信号のうち所定周波数より低い帯域である低域の部 分を符号化して第 1符号化データを生成する第 1符号化ステップと、前記第 1符号化 データを復号して第 1復号信号を生成する復号ステップと、前記入力信号と前記第 1 復号信号との残差信号の所定の帯域部分を符号化して第 2符号化データを生成す る第 2符号化ステップと、前記入力信号、前記第 1復号信号、および前記第 1復号信 号を用いて算出される算出信号、のうちいずれか一つの信号の前記低域の部分をフ ィルタリングして、前記入力信号の前記所定周波数より高い帯域である高域の部分を 得るためのピッチ係数およびフィルタリング係数を得るフィルタリングステップと、を有 するようにする。
[0010] 本発明の復号方法は、 r階層(rは 2以上の整数)のレイヤ構成のスケーラブルコー デックを用いた復号方法であって、符号化装置で第 mレイヤ (mは r以下の整数)の復 号信号を用いて算出された帯域拡張パラメータを受信する受信ステップと、第 nレイ ャ (nは r以下の整数)の復号信号の低域成分に対して前記帯域拡張パラメータを用 いることにより高域成分を生成する復号ステップと、を有するようにする。
本発明の復号方法は、符号化装置から送信された、前記符号化装置における入力 信号のうち所定周波数より低い帯域である低域の部分を符号化した第 1符号化デー タと、前記第 1符号化データを復号して得られた第 1復号スペクトルと前記入力信号 のスペクトルとの残差の所定の帯域部分を符号化した第 2符号化データと、前記入力 信号、前記第 1復号スペクトル、および前記第 1復号スペクトルと前記第 2符号化デー タを復号して得られた第 2復号スペクトルとを加算した第 1加算スペクトル、のうち 、ず れか一つの前記低域の部分をフィルタリングして前記入力信号の前記所定周波数よ り高レ、帯域である高域の部分を得るためのピッチ係数およびフィルタリング係数と、を 受信するステップと、前記第 1符号化データを復号して前記低域における第 3復号ス ぺクトルを生成する第 1復号ステップと、前記第 2符号化データを復号して前記所定 の帯域部分における第 4復号スペクトルを生成する第 2復号ステップと、前記第 1復 号ステップおよび前記第 2復号ステップで復号されなかった帯域部分を、前記ピッチ 係数およびフィルタリング係数を用いて、前記第 3復号スペクトル、前記第 4復号スぺ タトル、およびその両方を用いて生成される第 5復号スペクトル、のうちいずれか一つ を帯域拡張することにより復号する第 3復号ステップと、を有するようにする。
発明の効果
[0011] 本発明によれば、符号化側の上位レイヤにおいて符号化帯域を選択し、復号側に ぉレ、て帯域拡張を行い、下位レイヤおよび上位レイヤで復号できなかった帯域の成 分を復号することにより、符号化側の上位レイヤにおいて選択された符号化帯域に 応じて柔軟に精度の高い高域スペクトルデータを算出することができ、より品質の良 Vヽ復号信号を得ることができる。
図面の簡単な説明
[0012] [図 1]本発明の実施の形態 1に係る符号化装置の主要な構成を示すブロック図
[図 2]本発明の実施の形態 1に係る第 2レイヤ符号化部の内部の主要な構成を示す ブロック図
[図 3]本発明の実施の形態 1に係るスペクトル符号化部の内部の主要な構成を示す ブロック図
[図 4]本発明の実施の形態 1に係るフィルタリング部のフィルタリング処理の概要を説 明するための図
[図 5]本発明の実施の形態 1に係るピッチ係数 Tが変化するに伴い入力スペクトルの 推定値のスペクトルがどのように変化する力、を説明するための図
[図 6]本発明の実施の形態 1に係るピッチ係数 Tが変化するに伴い入力スペクトルの 推定値のスペクトルがどのように変化する力、を説明するための図
[図 7]本発明の実施の形態 1に係るピッチ係数設定部、フィルタリング部、および探索 部において行われる処理の手順を示すフロー図
[図 8]本発明の実施の形態 1に係る復号装置の主要な構成を示すブロック図
[図 9]本発明の実施の形態 1に係る第 2レイヤ復号部の内部の主要な構成を示すブ ロック図
[図 10]本発明の実施の形態 1に係るスペクトル復号部の内部の主要な構成を示すブ ロック図
[図 11]本発明の実施の形態 1に係るフィルタリング部において生成される復号スぺク トルを示す図
[図 12]本発明の実施の形態 1に係る第 1スペクトル S 1 (k)の帯域に第 2スペクトル S2 (k)の帯域が完全に重複する場合を示す図
[図 13]本発明の実施の形態 1に係る第 1スペクトル S 1 (k)の帯域と第 2スペクトル S2 ( k)の帯域とが隣接せず離れている場合を示す図
[図 14]本発明の実施の形態 2に係る符号化装置の主要な構成を示すブロック図
[図 15]本発明の実施の形態 2に係るスペクトル符号化部の内部の主要な構成を示す ブロック図
[図 16]本発明の実施の形態 3に係る符号化装置の主要な構成を示すブロック図
[図 17]本発明の実施の形態 3に係るスペクトル符号化部の内部の主要な構成を示す ブロック図
発明を実施するための最良の形態
[0013] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
[0014] (実施の形態 1)
図 1は、本発明の実施の形態 1に係る符号化装置 100の主要な構成を示すブロック 図である。
[0015] この図において、符号化装置 100は、ダウンサンプリング部 101、第 1レイヤ符号化 部 102、第 1レイヤ復号部 103、アップサンプリング部 104、遅延部 105、第 2レイヤ 符号化部 106、スペクトル符号化部 107、および多重化部 108を備え、 2レイヤから なるスケーラブルの構成をとる。なお、符号化装置 100の第 1レイヤでは CELP (Cod e Exited LinearPrediction)方式の符号化方法を用いて入力される音声'オーディオ 信号を符号化し、第 2レイヤ符号化では第 1レイヤ復号信号と入力信号との残差信号 を符号化する。符号化装置 100は、入力信号を N (Nは自然数)サンプルずつ区切り 、 Nサンプルずつを 1フレームとしてフレーム毎に符号化を行う。
[0016] ダウンサンプリング部 101は、入力される音声信号及び/又はオーディオ信号 (以 下、音声'オーディオ信号と記す)に対してダウンサンプリング処理を行い、音声'ォ 一ディォ信号のサンプリング周波数を Rate 1力、ら Rate2に変換し(Rate 1 > Rate2) 、第 1レイヤ符号化部 102に出力する。
[0017] 第 1レイヤ符号化部 102は、ダウンサンプリング部 101から入力されるダウンサンプ リング後の音声'オーディオ信号に対して CELP方式の音声符号化を行い、得られる 第 1レイヤ符号化情報を第 1レイヤ復号部 103および多重化部 108に出力する。具 体的には、第 1レイヤ符号化部 102は、声道情報と音源情報とからなる音声信号を、 声道情報にっレ、ては LPC (線形予測係数: LinearPrediction Coefficient)パラメータを 求めることにより符号化し、音源情報については、予め記憶されている音声モデルの 何れを用いるかを特定するインデックス、すなわち、適応符号帳および固定符号帳の どの音源ベクトルを生成するかを特定するインデックスを求めることにより符号化する
[0018] 第 1レイヤ復号部 103は、第 1レイヤ符号化部 102から入力される第 1レイヤ符号化 情報に対して CELP方式の音声復号を行い、得られる第 1レイヤ復号信号をアップサ ンプリング部 104に出力する。
[0019] アップサンプリング部 104は、第 1レイヤ復号部 103から入力される第 1レイヤ復号 信号に対してアップサンプリング処理を行い、第 1レイヤ復号信号のサンプリング周 波数を Rate2から Ratelに変換して第 2レイヤ符号化部 106に出力する。
[0020] 遅延部 105は、入力される音声'オーディオ信号を内蔵のバッファに記憶して所定 時間後に出力することにより、遅延された音声 ·オーディオ信号を第 2レイヤ符号化部 106に出力する。ここで、遅延される所定時間は、ダウンサンプリング部 101、第 1レ ィャ符号化部 102、第 1レイヤ復号部 103、およびアップサンプリング部 104におい て生じるアルゴリズム遅延を考慮した時間である。
[0021] 第 2レイヤ符号化部 106は、遅延部 105から入力される音声 'オーディオ信号と、ァ ップサンプリング部 104から入力されるアップサンプリング後の第 1レイヤ復号信号と の残差信号に対し、ゲイン'シエイプ量子化を行うことにより第 2レイヤ符号化を行い、 得られる第 2レイヤ符号化情報を多重化部 108に出力する。第 2レイヤ符号化部 106 の内部の構成および具体的な動作については後述する。
[0022] スペクトル符号化部 107は、入力される音声'オーディオ信号を周波数領域に変換 し、得られる入力スペクトルの低域成分と高域成分との相関を分析し、復号側におい て帯域拡張を行い低域成分力 高域成分を推定するためのパラメータを算出し、ス ベクトル符号化情報として多重化部 108に出力する。スペクトル符号化部 107の内部 の構成および具体的な動作については後述する。
[0023] 多重化部 108は、第 1レイヤ符号化部 102から入力される第 1レイヤ符号化情報、 第 2レイヤ符号化部 106から入力される第 2レイヤ符号化情報、およびスペクトル符 号化部 107から入力されるスペクトル符号化情報を多重化し、得られるビットストリー ムを復号装置に送信する。
[0024] 図 2は、第 2レイヤ符号化部 106の内部の主要な構成を示すブロック図である。
[0025] この図において、第 2レイヤ符号化部 106は、周波数領域変換部 161、 162、残差 MDCT係数算出部 163、帯域選択部 164、シエイプ量子化部 165、予測符号化有 無判定部 166、ゲイン量子化部 167、および多重化部 168を備える。
[0026] 周波数領域変換部 161は、遅延部 105から入力される遅延された音声 'オーディオ 信号を用いて修正離散コサイン変換(MDCT : Modified Discrete Cosine Transform) を行い、得られる入力 MDCT係数を残差 MDCT係数算出部 163に出力する。
[0027] 周波数領域変換部 162は、アップサンプリング部 104から入力されるアップサンプリ ング後の第 1レイヤ復号信号を用いて MDCTを行い、得られる第 1レイヤ MDCT係 数を残差 MDCT係数算出部 163に出力する。
[0028] 残差 MDCT係数算出部 163は、周波数領域変換部 161から入力される入力 MD CT係数と、周波数領域変換部 162から入力される第 1レイヤ MDCT係数との残差を 算出し、得られる残差 MDCT係数を帯域選択部 164およびシエイプ量子化部 165 に出力する。
[0029] 帯域選択部 164は、残差 MDCT係数算出部 163から入力される残差 MDCT係数 を複数のサブバンドに分割し、複数のサブバンドから量子化対象となる帯域(量子化 対象帯域)を選択し、選択された帯域を示す帯域情報をシエイプ量子化部 165、予 測符号化有無判定部 166、および多重化部 168に出力する。ここで、量子化対象帯 域を選択する方法として、エネルギが最も高い帯域を選択する方法、または過去に 選択された量子化対象帯域との相関およびエネルギを同時に考慮して選択する方 法などがある。
[0030] シエイプ量子化部 165は、残差 MDCT係数算出部 163から入力される残差 MDC T係数のうち、帯域選択部 164から入力される帯域情報が示す量子化対象帯域に対 応する MDCT係数、すなわち第 2レイヤ MDCT係数を用いてシエイプ量子化を行!/、 、得られるシエイプ符号化情報を多重化部 168に出力する。また、シエイプ量子化部 165は、シエイプ量子化の理想ゲイン値を求め、求められた理想ゲイン値をゲイン量 子化部 167に出力する。
[0031] 予測符号化有無判定部 166は、帯域選択部 164から入力される帯域情報を用い て現フレームの量子化対象帯域と過去のフレームの量子化対象帯域との間で共通 のサブサブバンドの数を求める。そして、予測符号化有無判定部 166は、共通のサ ブサブバンドの数が所定値以上である場合には、帯域情報が示す量子化対象帯域 の残差 MDCT係数、すなわち第 2レイヤ MDCT係数に対して予測符号化を行うと判 定し、共通のサブサブバンドの数が所定値より小さい場合には、第 2レイヤ MDCT係 数に対して予測符号化を行わな!/、と判定する。予測符号化有無判定部 166は、判定 結果をゲイン量子化部 167に出力する。
[0032] ゲイン量子化部 167は、予測符号化有無判定部 166から入力される判定結果が予 測符号化を行うという判定結果を示す場合には、内蔵のバッファに記憶されている過 去のフレームの量子化ゲイン値および内蔵のゲインコードブックを用いて現フレーム の量子化対象帯域のゲインの予測符号化を行ってゲイン符号化情報を得る。一方、 予測符号化有無判定部 166から入力される判定結果が予測符号化を行わないとい う判定結果を示す場合、ゲイン量子化部 167は、シエイプ量子化部 165から入力され る理想ゲイン値を量子化対象として直接量子化を行ってゲイン符号化情報を得る。 ゲイン量子化部 167は、得られるゲイン符号化情報を多重化部 168に出力する。
[0033] 多重化部 168は、帯域選択部 164から入力される帯域情報、シエイプ量子化部 16 5から入力されるシエイプ符号化情報、およびゲイン量子化部 167から入力されるゲ イン符号化情報を多重化し、得られるビットストリームを第 2レイヤ符号化情報として多 重化部 108に送信する。
[0034] なお、第 2レイヤ符号化部 106で生成される帯域情報、シエイプ符号化情報、ゲイ ン符号化情報は、多重化部 168を介さず、直接、多重化部 108に入力されて、第 1レ ィャ符号化情報およびスペクトル符号化情報と多重化されても良い。
[0035] 図 3は、スペクトル符号化部 107の内部の主要な構成を示すブロック図である。
[0036] この図において、スペクトル符号化部 107は、周波数領域変換部 171、内部状態 設定部 172、ピッチ係数設定部 173、フィルタリング部 174、探索部 175、およびフィ ルタ係数算出部 176を有する。
[0037] 周波数領域変換部 171は、入力される有効周波数帯域が 0≤k< FHである音声- オーディオ信号に対して周波数変換を行い、入力スペクトル S(k)を算出する。ここで 周波数変換の方法は、離散フーリエ変換 (DFT)、離散コサイン変換 (DCT)、変形 離散コサイン変換 (MDCT)等を適用する。
[0038] 内部状態設定部 172は、有効周波数帯域が 0≤k< FHの入力スペクトル S(k)を使 つてフィルタリング部 174で用いられるフィルタの内部状態を設定する。なお、このフ ィルタの内部状態の設定については後述される。
[0039] ピッチ係数設定部 173は、ピッチ係数 Tを予め定められた探索範囲 Tmin〜TmaX の中で少しずつ変化させながら、フィルタリング部 174に順次出力する。
[0040] フィルタリング部 174は、内部状態設定部 172で設定されたフィルタの内部状態、 ピッチ係数設定部 173から出力されるピッチ係数 Tを用いて入力スペクトルのフィル タリングを行い、入力スペクトルの推定値 S ' (k)を算出する。このフィルタリング処理の 詳細については後述する。
[0041] 探索部 175は、周波数領域変換部 171から入力される入力スペクトル S(k)とフィル タリング部 174から出力される入力スペクトルの推定値 S ' (k)との類似性を示すパラメ ータである類似度を算出する。なお、この類似度の算出処理については、後ほど詳 述する。この類似度の算出処理は、ピッチ係数設定部 173からフィルタリング部 174 にピッチ係数 Tが与えられる度に行われ、算出される類似度が最大となるピッチ係数 、すなわち最適ピッチ係数 T' (Tmin〜Tmaxの範囲)は、フィルタ係数算出部 176に 与えられる。
[0042] フィルタ係数算出部 176は、探索部 175から与えられる最適ピッチ係数 T'および 周波数領域変換部 171から入力される入力スペクトル S(k)を用いて、フィルタ係数 /3 を求め、フィルタ係数 /3 iおよび最適ピッチ係数 T,をスペクトル符号化情報として多重 化部 108に出力する。なお、フィルタ係数算出部 176におけるフィルタ係数 /3の算 出処理の詳細については後述する。
[0043] 図 4は、フィルタリング部 174のフィルタリング処理の概要を説明するための図であ
[0044] 全周波数帯域(0≤k< FH)のスペクトルを便宜的に S(k)と呼ぶ場合、フィルタリン グ部 174のフィルタ関数は次式(1)で表されるものを使用する。
M 1
, - ( ι )
[0045] この式において、 Tはピッチ係数設定部 173から入力されたピッチ係数を表してお り、 Mは M= lとする。
[0046] 図 4に示すように、 S(k)の 0≤k< FLの帯域には、入力スペクトル S(k)がフィルタの 内部状態として格納されている。一方、 S(k)の FL≤k< FHの帯域には、次式(2)を 用いて求められた入力スペクトルの推定値 S ' (k)が格納される。
[数 2]
S k) = S(k - T) … ( 2 )
[0047] この式において、フィルタリング処理により、 kより Tだけ低い周波数のスペクトル S(k —T)から S ' (k)を求める。なお、上記の式(2)に示す演算を、周波数の低い方 (k=F L)から順に kを FL≤k< FHの範囲で変化させながら繰り返すことにより、 FL≤k< F Hにおける入力スペクトルの推定値 S ' (k)が算出される。
[0048] 以上のフィルタリング処理は、ピッチ係数設定部 173からピッチ係数 Tが与えられる 度に、 FL≤k< FHの範囲において、その都度 S(k)をゼロクリアして行われる。すな わち、ピッチ係数 Tが変化するたびに S(k)は算出され、探索部 175に出力される。
[0049] 次に、探索部 175において行われる類似度の算出処理および最適なピッチ係数( 最適ピッチ係数) T'の導出処理について説明する。
[0050] まず、類似度には、様々な定義が存在する。ここでは、フィルタ係数 β および β を 0とみなして、最小 2乗誤差法に基づいて次式(3)によって定義される類似度を用 いる場合を例にとって説明する。
[数 3]
[0051] この類似度を使用した場合、最適なピッチ係数 T'を算出した後にフィルタ係数 β .
を決定することになり、フィルタ係数 /3の算出については後述する。ここで、 Εは、 S(k )と S ' (k)との間の 2乗誤差を表す。この式において右辺入力項は、ピッチ係数 Tに関 係ない固定値となるので、右辺第 2項を最大とする S, (k)を生成するピッチ係数丁が 探索される。ここで、次式 (4)に示すように、上記の式(3)の右辺第 2項を類似度と定 義する。すなわち、次式 (4)で表される類似度 Aが最大となるようなピッチ係数 T'が 探索される。
[0052] 図 5は、ピッチ係数 Tが変化するに伴い入力スペクトルの推定値 S ' (k)のスペクトル がどのように変化するかを説明するための図である。
[0053] 図 5Aは、内部状態として格納されている、調波構造を有する入力スペクトル S (k) を示す図である。図 5B〜図 5Dは、 3種類のピッチ係数 TO、 Tl、 Τ2を用いて、それ ぞれフィルタリングを行うことにより算出される入力スペクトルの推定値 S ' (k)のスぺク トルを示す図である。
[0054] この図に示す例では、図 5Cに示すスペクトルと図 5Aに示すスペクトルとが類似して いるため、 T1を用いて算出する類似度が最も高い値を示すことがわかる。すなわち、 調波構造を保つことのできるピッチ係数 Tとしては T1が最適である。 [0055] 図 6は、図 5と同様に、ピッチ係数 Tが変化するに伴い入力スペクトルの推定値 S ' (k )のスペクトルがどのように変化するかを説明するための図である。ただし、内部状態 として格納されている入力スペクトルの位相が図 5に示した場合と異なっている。図 6 に示す例においても、調波構造が保持されるピッチ係数 Tは T1のときである。
[0056] 探索部 175において、ピッチ係数 Tを変化させ、類似度が最大となる Tを見つけるこ とは、スペクトルの調波構造のピッチほたはその整数倍)をトライ 'アンド ' ·エラーで見 つけることに相当している。そして、フィルタリング部 174は、この調波構造のピッチに 基づ!/、て入力スペクトルの推定値 S ' (k)を算出するので、入力スペクトルと推定スぺ タトルとの間の接続部において調波構造が崩れない。これは、入力スペクトル S (k)と 推定スペクトル S ' (k)との接続部 k=FUこおける推定値 S ' (k)が調波構造のピッチ( またはその整数倍) Tだけ離れた入力スペクトルに基づいて算出されることを考えても 容易に理解される。
[0057] 次に、フィルタ係数算出部 176におけるフィルタ係数の算出処理について説明する
[0058] フィルタ係数算出部 176は、探索部 175から与えられる最適ピッチ係数 T'を用いて 次式(5)で表される 2乗歪み Eを最小にするようなフィルタ係数 /3を求める。
[数 5コ
[0059] 具体的には、フィルタ係数算出部 176は、複数個の /3 ^=— 1 , 0, 1)の組合せを 予めデータテーブルとして持っており、上記の式(5)の 2乗歪 Eを最小とする /3 (i =
- 1 , 0, 1)の組合せを決定し、そのインデックスを出力する。
[0060] 図 7は、ピッチ係数設定部 173、フィルタリング部 174、および探索部 175において 行われる処理の手順を示すフロー図である。
[0061] まず、 ST1010において、ピッチ係数設定部 173は、ピッチ係数 Tおよび最適ピッ チ係数 T'を探索範囲の下限値 Tminに設定し、最大類似度 Amaxを 0に設定する。
[0062] 次いで、 ST1020において、フイノレタリング部 174は、入力スペクトルのフィルタリン グを行い、入力スペクトルの推定値 S ' (k)を算出する。
[0063] 次いで、 ST1030において、探索部 175は、入力スペクトル S(k)と入力スペクトルの 推定値 S ' (k)との類似度 Aを算出する。
[0064] 次いで、 ST1040において、探索部 175は、算出された類似度 Aと最大類似度 Am axとを比較する。
[0065] ST1040における比較結果、類似度 Aが最大類似度 Amax以下である場合(ST1
040 : NO)、処理手順は ST1060に移行する。
[0066] 一方、 ST1040における比較結果、類似度 Aが最大類似度 Amaxより大きい場合(
ST1040 :YES)、探索部 175は、 ST1050において、類似度 Aを用いて最大類似 度 Amaxを更新し、ピッチ係数 Tを用いて最適ピッチ係数 T'を更新する。
[0067] 次いで、 ST1060において、探索部 175は、ピッチ係数 Tと探索範囲の上限値 Tm axとを比較する。
[0068] ST1060における比較結果、ピッチ係数 Tが探索範囲の上限値 Tmax以下である 場合(ST1060 : NO)、探索部 175は、 ST1070において T=T+ 1となるように Tを 1 インクリメントする。
[0069] 一方、 ST1060における比較結果、ピッチ係数 Τが探索範囲の上限値 Tmaxより大 きい場合(ST1040 :YES)、探索部 175は、 ST1080において、最適ピッチ係数 T' を出力する。
[0070] このように、符号化装置 100は、スペクトル符号化部 107において、低域部(0≤k < FL)および高域部(FL≤k< FH)の 2つに分けられた入力信号のスペクトルに対 し、低域スペクトルを内部状態として有するフィルタリング部 174を用いて高域スぺク トルの形状を推定する。そして、低域スペクトルと高域スペクトルとの相関性を示す、 フィルタリング部 174のフィルタ特性を表すパラメータ T'および 0 自体を、高域スぺ タトルの代わりに復号装置に伝送するため、低ビットレートで高品質にスペクトルを符 号化すること力 Sできる。ここで、低域スペクトルと高域スペクトルとの相関性を示す最 適ピッチ係数 T,およびフィルタ係数 /3は、低域スペクトルから高域スペクトルを推定 する推定パラメータでもある。
[0071] また、スペクトル符号化部 107のフィルタリング部 174が低域スペクトルを用いて高 域スペクトルの形状を推定する際に、ピッチ係数設定部 173は、推定の基準とする低 域スペクトルと高域スペクトルとの周波数差、すなわち、ピッチ係数 Tを様々に変化さ せ出力し、探索部 175は、低域スペクトルと高域スペクトルとの類似度が最大となるピ ツチ係数 T,を探索する。そのため、スペクトル全体の調波構造のピッチに基づいて 高域スペクトルの形状を推定することができ、スペクトル全体の調波構造を維持した まま符号化を行うことができ、復号音声信号の品質を向上することができる。
[0072] また、スペクトル全体の調波構造を維持したまま符号化を行うことができるため、低 域スペクトルの帯域幅を調波構造のピッチに基づ!/、て設定する必要もなぐすなわち 、低域スペクトルの帯域幅を調波構造のピッチほたは、その整数倍)に揃える必要が なぐ任意に帯域幅を設定できる。従って、簡単な動作で、低域スペクトルと高域スぺ タトルとの接続部において、スペクトルが滑らかに接続されることができ、復号音声信 号の品質を向上することができる。
[0073] 図 8は、本実施の形態に係る復号装置 200の主要な構成を示すブロック図である。
[0074] この図において、復号装置 200は、制御部 201、第 1レイヤ復号部 202、アップサン プリング部 203、第 2レイヤ復号部 204、スペクトル復号部 205、およびスィッチ 206 を備える。
[0075] 制御部 201は、符号化装置 100から伝送されるビットストリームを構成する第 1レイ ャ符号化情報、第 2レイヤ符号化情報、およびスペクトル符号化情報を分離し、得ら れる第 1符号化情報を第 1レイヤ復号部 202に、第 2レイヤ符号化情報を第 2レイヤ 復号部 204に、スペクトル符号化情報をスペクトル復号部 205に出力する。また、制 御部 201は、符号化装置 100から伝送されるビットストリームの構成要素に応じて、ス イッチ 206を制御する制御情報を適応的に生成してスィッチ 206に出力する。
[0076] 第 1レイヤ復号部 202は、制御部 201から入力される第 1レイヤ符号化情報に対し て CELP方式の復号を行い、得られる第 1レイヤ復号信号をアップサンプリング部 20 3およびスィッチ 206に出力する。
[0077] アップサンプリング部 203は、第 1レイヤ復号部 202から入力される第 1レイヤ復号 信号に対してアップサンプリング処理を行い、第 1レイヤ復号信号のサンプリング周 波数を Rate2から Ratelに変換し、スペクトル復号部 205に出力する。 [0078] 第 2レイヤ復号部 204は、制御部 201から入力される第 2レイヤ符号化情報を用い てゲイン 'シエイプの逆量子化を行い、得られる第 2レイヤ MDCT係数、すなわち量 子化対象帯域の残差 MDCT係数をスペクトル復号部 205に出力する。なお、第 2レ ィャ復号部 204の内部の構成および具体的な動作については後述する。
[0079] スペクトル復号部 205は、第 2レイヤ復号部 204から入力される第 2レイヤ MDCT 係数、制御部 201から入力されるスペクトル符号化情報、アップサンプリング部 203 力、ら入力されるアップサンプリング後の第 1レイヤ復号信号を用いて帯域拡張の処理 を行い、得られる第 2レイヤ復号信号をスィッチ 206に出力する。なお、スペクトル復 号部 205の内部の構成および具体的な動作については後述する。
[0080] スィッチ 206は、制御部 201から入力される制御情報に基づき、符号化装置 100か ら復号装置 200に伝送されるビットストリームが第 1レイヤ符号化情報、第 2レイヤ符 号化情報、およびスペクトル符号化情報から構成されている場合、上記ビットストリー ムが第 1レイヤ符号化情報、スぺ外ル符号化情報力 構成されている場合、または 上記ビットストリームが第 1レイヤ符号化情報、第 2レイヤ符号化情報から構成されて V、る場合には、スペクトル復号部 205から入力される第 2レイヤ復号信号を復号信号 として出力する。一方、スィッチ 206は、上記ビットストリームが第 1レイヤ符号化情報 のみから構成されている場合には、第 1レイヤ復号部 202から入力される第 1レイヤ 復号信号を復号信号として出力する。
[0081] 図 9は、第 2レイヤ復号部 204の内部の主要な構成を示すブロック図である。
[0082] この図において、第 2レイヤ復号部 204は、分離部 241、シエイプ逆量子化部 242 、予測復号有無判定部 243、およびゲイン逆量子化部 244を備える。
[0083] 分離部 241は、制御部 201から入力される第 2レイヤ符号化情報から帯域情報、シ エイプ符号化情報、およびゲイン符号化情報を分離し、得られる帯域情報をシエイプ 逆量子化部 242および予測復号有無判定部 243に出力し、シエイプ符号化情報を シエイプ逆量子化部 242に出力し、ゲイン符号化情報をゲイン逆量子化部 244に出 力する。
[0084] シエイプ逆量子化部 242は、分離部 241から入力されるシエイプ符号化情報を復 号し、分離部 241から入力される帯域情報が示す量子化対象帯域に対応する MDC T係数のシエイプの値を求めてゲイン逆量子化部 244に出力する。
[0085] 予測復号有無判定部 243は、分離部 241から入力される帯域情報を用いて現フレ ームの量子化対象帯域と過去のフレームの量子化対象帯域との間の共通のサブバ ンドの数を求める。そして、予測復号有無判定部 243は、共通のサブバンドの数が所 定値以上である場合には、帯域情報が示す量子化対象帯域の MDCT係数に対し て予測復号を行うと判定し、共通のサブバンドの数が所定値より小さい場合には、帯 域情報が示す量子化対象帯域の MDCT係数に対して予測復号を行わないと判定 する。予測復号有無判定部 243は、判定結果をゲイン逆量子化部 244に出力する。
[0086] ゲイン逆量子化部 244は、予測復号有無判定部 243から入力される判定結果が予 測復号を行うという判定結果を示す場合には、内蔵のバッファに記憶されている過去 のフレームのゲイン値および内蔵のゲインコードブックを用いて分離部 241から入力 されるゲイン符号化情報に対し予測復号を行ってゲイン値を得る。一方、予測復号 有無判定部 243から入力される判定結果が予測復号を行わな!/、と!/、う判定結果を示 す場合、ゲイン逆量子化部 244は、内蔵のゲインコードブックを用いて、分離部 241 から入力されるゲイン符号化情報を直接逆量子化してゲイン値を得る。ゲイン逆量子 化部 244は、得られたゲイン値、およびシエイプ逆量子化部 242から入力されるシェ イブの値を用いて、第 2レイヤ MDCT係数すなわち量子化対象帯域の残差 MDCT 係数を求めて出力する。
[0087] 上記の構成を有する第 2レイヤ復号部 204における動作は、第 2レイヤ符号化部 1
06における動作と逆であるため、その詳細な説明を省略する。
[0088] 図 10は、スペクトル復号部 205の内部の主要な構成を示すブロック図である。
[0089] この図において、スペクトル復号部 205は、周波数領域変換部 251、加算スぺタト ル算出部 252、内部状態設定部 253、フィルタリング部 254、および時間領域変換 部 255を有する。
[0090] 周波数領域変換部 251は、アップサンプリング部 203から入力されるアップサンプリ ング後の第 1レイヤ復号信号に対し周波数変換を施し、第 1スペクトル Sl(k)を算出し て加算スペクトル算出部 252に出力する。ここで、アップサンプリング後の第 1レイヤ 復号信号の有効周波数帯域が 0≤k< FLであり、周波数変換法は、離散フーリエ変 換 (DFT)、離散コサイン変換 (DCT)、変形離散コサイン変換 (MDCT)等を使用す
[0091] 加算スペクトル算出部 252は、周波数領域変換部 251から第 1スペクトル Sl(k)が 入力され、かつ第 2レイヤ復号部 204から第 2レイヤ MDCT係数 (以下、第 2スぺタト ル S2(k)と記す)が入力される場合、第 1スペクトル Sl(k)と第 2スペクトル S2(k)とを加 算し、加算結果を加算スペクトル S3(k)として内部状態設定部 253に出力する。また 、加算スペクトル算出部 252は、周波数領域変換部 251から第 1スペクトル Sl(k)が 入力されるだけで、第 2レイヤ復号部 204から第 2スペクトル S2(k)が入力されない場 合、第 1スペクトル S l(k)を加算スペクトル S3(k)として内部状態設定部 253に出力す
[0092] 内部状態設定部 253は、加算スペクトル S3(k)を使ってフィルタリング部 254で用い られるフィルタの内部状態を設定する。
[0093] フィルタリング部 254は、内部状態設定部 253により設定されたフィルタの内部状態 と、制御部 201から入力されるスペクトル符号化情報に含まれている最適ピッチ係数 T'およびフィルタ係数 /3を用いて加算スペクトル S3(k)のフィルタリングを行うことに より加算スペクトルの推定値 S3' (k)を生成する。そして、フィルタリング部 254は、加 算スペクトル S3(k)と加算スペクトルの推定値 S3' (k)とからなる復号スペクトル S ' (k) を時間領域変換部 255に出力する。かかる場合、フィルタリング部 254は、上記の式 (1)で表されるフィルタ関数を用いる。
[0094] 図 11は、フィルタリング部 254において生成される復号スペクトル S ' (k)を示す図で ある。
[0095] フイノレタリング部 254は、低域(0≤k< FUスペクトルである第 1レイヤ MDCT係数 ではなく、第 1レイヤ MDCT係数(0≤k< FUと第 2レイヤ MDCT係数(FL,≤k< F L"とを加算した、帯域が 0≤k< FL"である加算スペクトル S3 (k)を用いてフィルタリ ングを行い、加算スペクトルの推定値 S3' (k)を得る。従って、図 11に示すように、帯 域情報で示される量子化対象帯域、すなわち 0≤k< FL"の帯域からなる帯域にお ける復号スペクトル S ' (k)は、加算スペクトル S3(k)によって構成され、周波数帯域 FL ≤k< FHのうち量子化対象帯域と重複しない部分、すなわち、周波数帯域 FL"≤k < FHにおける復号スペクトル S ' (k)は、加算スペクトルの推定値 S3' (k)によって構 成される。要するに、周波数帯域 FL'≤k< FL"における復号スペクトル S ' (k)は、加 算スペクトル S3 (k)を用いたフィルタリング部 254のフィルタリング処理により得られる 加算スペクトルの推定値 S3' (k)ではなぐ加算スペクトル S3 (k)そのものの値をとる。
[0096] 図 11にお!/、ては、第 1スペクトル S 1 (k)の帯域と第 2スペクトル S2 (k)の帯域とがー 部重複する場合を例にとって示している。帯域選択部 164における量子化対象帯域 の選択結果によっては、第 1スペクトル Sl (k)の帯域と第 2スペクトル S2 (k)の帯域と が完全に重複する場合、または第 1スペクトル Sl (k)の帯域と第 2スペクトル S2 (k)の 帯域とが隣接せず離れている場合もあり得る。
[0097] 図 12は、第 1スペクトル Sl (k)の帯域に第 2スペクトル S2 (k)の帯域が完全に重複 する場合を示す図である。かかる場合、周波数帯域 FL≤k< FHにおける復号スぺ タトル S ' (k)は、加算スペクトルの推定値 S3' (k)そのものの値をとる。ここで、加算ス ぺクトノレ S3 (k)の値は、第 1スペクトル SI (k)の値と第 2スペクトル S2 (k)の値とをカロ 算して得られたものであるため、加算スペクトルの推定値 S3' (k)の精度が向上し、従 つて復号音声信号の品質が向上する。
[0098] 図 13は、第 1スペクトル SI (k)の帯域と第 2スペクトル S2 (k)の帯域とが隣接せず 離れている場合を示す図である。かかる場合、フィルタリング部 254は、第 1スぺタト ノレ S l (k)を用いて加算スペクトルの推定値 S3' (k)を求め、周波数帯域 FL≤k< FH への帯域拡張処理を行う。ただし、周波数帯域 FL≤k< FHのうち、第 2スペクトル S 2 (k)の帯域に対応する推定値 S3' (k)の部分は第 2スペクトル S 2 (k)を用いて置き 換える。その理由は、加算スペクトルの推定値 S3' (k)よりも第 2スペクトル S2 (k)の精 度がより高いためであり、これにより復号音声信号の品質が向上する。
[0099] 時間領域変換部 255は、フィルタリング部 254から入力される復号スペクトル S ' (k) を時間領域の信号に変換し、第 2レイヤ復号信号として出力する。時間領域変換部 2 55は、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレー ム間に生じる不連続を回避する。
[0100] このように、本実施の形態によれば、符号化側の上位レイヤにおいて符号化帯域を 選択し、復号側において下位レイヤおよび上位レイヤの復号スペクトルを加算し、得 られる加算スペクトルを用いて帯域拡張を行い、下位レイヤおよび上位レイヤで復号 できな力 た帯域の成分を復号する。そのため、符号化側の上位レイヤにおいて選 択された符号化帯域に応じて柔軟に精度の高い高域スペクトルデータを算出するこ とができ、より品質の良い復号信号を得ることができる。
[0101] なお、本実施の形態では、第 2レイヤ符号化部 106は、量子化対象となる帯域を選 択して第 2レイヤ符号化を行う場合を例にとって説明した力 S、本発明はこれに限らず、 第 2レイヤ符号化部 106は固定の帯域の成分を符号化しても良ぐ第 1レイヤ符号化 部 102において符号化された帯域と同様な帯域の成分を符号化しても良い。
[0102] また、本実施の形態では、復号装置 200は、スペクトル符号化情報に含まれて!/、る 最適ピッチ係数 T,およびフィルタ係数 /3を用いて、加算スペクトル S3 (k)に対してフ ィルタリングを行い、加算スペクトルの推定値 S3' (k)を生成することにより高域部のス ベクトルを推定する場合を例にとって説明したが、本発明はこれに限らず、復号装置 200は第 1スペクトル SI (k)に対してフィルタリングを行うことにより、高域部のスぺタト ルを推定しても良い。
[0103] また、本実施の形態では、式(1)において M= lとする場合を例にとって説明した
1S Mはこれに限定されることは無ぐ 0以上の整数(自然数)を用いることが可能であ
[0104] また、本実施の形態では、第 1レイヤにおいて CELP型の符号化/復号方式を適 用したが、他の符号化/復号方式を用いてもよい。
[0105] また、本実施の形態では、階層符号化 (スケーラブル符号化)を行う符号化装置 10
0を例にとって説明したが、本発明はこれに限定されず、階層符号化以外の他の方 式の符号化を行う符号化装置に適用しても良レ、。
[0106] また、本実施の形態では、符号化装置 100が周波数領域変換部 161、 162を有す る場合を例にとって説明したが、これらは時間領域信号を入力信号とする場合に必 要な構成要素であり、本発明はこれに限定されず、スペクトル符号化部 107に直接ス ベクトルが入力される場合には、周波数領域変換部 161、 162を備えなくても良い。
[0107] また、本実施の形態では、フィルタリング部 174においてピッチ係数を算出した後、 フィルタ係数算出部 176においてフィルタ係数を算出する場合を例にとって説明した 1、本発明はこれに限定されず、フィルタ係数算出部 176を備えずフィルタ係数を算 出しない構成にしても良い。また、フィルタ係数算出部 176を備えず、フィルタリング 部 174においてピッチ係数とフィルタ係数とを用いてフィルタリングを行い、最適なピ ツチ係数とフィルタ係数を同時に探索する構成にしても良い。かかる場合、上記の式 (1)および(2)の代わりに、次式(6)および(7)を用いる。
[数 6] · .. ( 6 )
[数 7]
S k) = 6 S(k - T - i) … ( 7 )
[0108] また、本実施の形態では、低域のスペクトルを用いて、すなわち、低域のスペクトル を符号化の基準として、高域のスペクトルを符号化する場合を例にとって説明したが 、本発明はこれに限定されず、基準となるスペクトルを他の仕方で設定しても良い。 例えば、エネルギを有効に利用するという観点からは望ましくないが、高域のスぺタト ルを用いて低域のスペクトルを符号化しても良ぐまたは中間周波数帯域のスぺタト ルを符号化の基準として他の帯域のスペクトルを符号化しても良い。
[0109] (実施の形態 2)
図 14は、本発明の実施の形態 2に係る符号化装置 300の主要な構成を示すブロッ ク図である。なお、符号化装置 300は、実施の形態 1に示した符号化装置 100 (図 1 〜図 3参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を 付し、その説明を省略する。
[0110] 符号化装置 300のスペクトル符号化部 307と、符号化装置 100のスペクトル符号化 部 107とは処理の一部に相違点があり、それを示すために異なる符号を付す。
[0111] スペクトル符号化部 307は、符号化装置 300の入力信号である音声'オーディオ信 号、およびアップサンプリング部 104から入力されるアップサンプリング後の第 1レイ ャ復号信号を周波数領域に変換し、入力スペクトルおよび第 1レイヤ復号スぺクトノレ を得る。そして、スペクトル符号化部 307は、第 1レイヤ復号スペクトルの低域成分と、 入力スペクトルの高域成分との相関を分析し、復号側において帯域拡張を行い低域 成分から高域成分を推定するためのパラメータを算出し、スペクトル符号化情報とし て多重化部 108に出力する。
[0112] 図 15は、スペクトル符号化部 307の内部の主要な構成を示すブロック図である。な お、スペクトル符号化部 307は、実施の形態 1に示したスペクトル符号化部 107 (図 3 参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、 その説明を省略する。
[0113] スペクトル符号化部 307は、周波数領域変換部 377をさらに具備する点において、 スペクトル符号化部 107と相違する。なお、スペクトル符号化部 307の周波数領域変 換部 371、内部状態設定部 372、フィルタリング部 374、探索部 375、フィルタ係数 算出部 376と、スペクトル符号化部 107の周波数領域変換部 171、内部状態設定部 172、フィルタリング部 174、探索部 175、フィルタ係数算出部 176とは処理の一部に おいて相違点があり、それを示すために異なる符号を付す。
[0114] 周波数領域変換部 377は、入力される有効周波数帯域が 0≤k< FHである音声- オーディオ信号に対して周波数変換を行い、入力スペクトル S(k)を算出する。ここで 周波数変換の方法は、離散フーリエ変換 (DFT)、離散コサイン変換 (DCT)、変形 離散コサイン変換 (MDCT)等を適用する。
[0115] 周波数領域変換部 371は、有効周波数帯域が 0≤k< FHである音声 'オーディオ 信号の代わりに、アップサンプリング部 104から入力される有効周波数帯域が 0≤k < FHであるアップサンプリング後の第 1レイヤ復号信号に対して周波数変換を行い 、第 1レイヤ復号スペクトル S (k)を算出する。ここで周波数変換の方法は、離散フ
DEC1
一リエ変換 (DFT)、離散コサイン変換 (DCT)、変形離散コサイン変換 (MDCT)等 を適用する。
[0116] 内部状態設定部 372は、有効周波数帯域が 0≤k< FHである入力スペクトル S(k) の代わりに、有効周波数帯域が 0≤k< FHである第 1レイヤ復号スペクトル S (k)
DEC1 を使ってフィルタリング部 374で用いられるフィルタの内部状態を設定する。なお、こ のフィルタの内部状態の設定は、入力スペクトル S (k)の代わりに加算スペクトル S
DEC
(k)を用いる点以外は、内部状態設定部 172の内部状態の設定と同様であるため、 詳細な説明を省略する。
[0117] フィルタリング部 374は、内部状態設定部 372で設定されたフィルタの内部状態、 およびピッチ係数設定部 173から出力されるピッチ係数 Tを用いて第 1レイヤ復号ス ベクトルのフィルタリングを行い、第 1レイヤ復号スペクトルの推定値 S ' (k)を算出
DEC1
する。このフィルタリング処理は、式(2)の代わりに下記の式(8)を用いる点以外は、 フィルタリング部 174のフィルタリング処理と同様であるため、詳細な説明を省略する
[数 8コ
SDECl'ik) = SDECX(k - T) … ( 8 )
[0118] 探索部 375は、周波数領域変換部 377から入力される入力スペクトル S(k)とフィル タリング部 374から出力される第 1レイヤ復号スペクトルの推定値 S ' (k)との類似
DEC1
性を示すパラメータである類似度を算出する。なお、この類似度の算出処理は、式 (4 )の代わりに下記の式(9)を用いる点以外は探索部 175における類似度の算出処理 と同様であるため、詳細な説明を省略する。
[数 9コ
[FH -1 \ 2
顯' (
" - n L … ( 9 ) k^FL
この類似度の算出処理は、ピッチ係数設定部 173からフィルタリング部 374にピッ チ係数 Tが与えられる度に行われ、算出される類似度が最大となるピッチ係数、すな わち最適ピッチ係数 T' (Tmin〜Tmaxの範囲)は、フィルタ係数算出部 376に与えら れる。
[0119] フィルタ係数算出部 376は、探索部 375から与えられる最適ピッチ係数 T'、周波数 領域変換部 377から入力される入力スペクトル S(k)、および周波数領域変換部 371 から入力される第 1レイヤ復号スペクトル S (k)を用いて、フィルタ係数 /3を求め、
DEC1 i フィルタ係数 13 および最適ピッチ係数 T'をスペクトル符号化情報として多重化部 10 8に出力する。なお、フィルタ係数算出部 376におけるフィルタ係数 の算出処理は 、式(5)の代わりに下記の式(10)を用いる点以外は、フィルタ係数算出部 176にお けるフィルタ係数 /3 の算出処理と同様であるため、詳細な説明を省略する。
[数 10]
… ( 1 0 )
E = ∑\ m ~ ^ SDE (k " — 0
[0120] 要するに、符号化装置 300は、スペクトル符号化部 307において、有効周波数帯 域が 0≤k< FHである第 1レイヤ復号スペクトル S (k)を内部状態とするフィルタリ
DEC1
ング部 374を用いて、有効周波数帯域が 0≤k< FHである第 1レイヤ復号スペクトル S (k)の高域部(FL≤k< FH)の形状を推定する。これにより、符号化装置 300
DEC1
は、第 1レイヤ復号スペクトル S (k)の高域部(FL≤k< FH)に対する推定値 S
DEC1 DE
' (k)と、入力スペクトル S (k)の高域部(FL≤k< FH)との相関性を示すパラメータ
C1
、すなわちフィルタリング部 374のフィルタ特性を表す最適ピッチ係数 T'およびフィ ルタ係数 /3を求め、これらを入力スペクトルの高域部の符号化情報の代わりに復号 装置に伝送する。
[0121] 本実施の形態に係る復号装置は、実施の形態 1に係る復号装置 100と同様な構成 を有し同様な動作を行うため、その説明を省略する。
[0122] このように、本実施の形態によれば、復号側において下位レイヤおよび上位レイヤ の復号スペクトルを加算し、得られる加算スペクトルを帯域拡張し、加算スペクトルの 推定値を求める際に用いられる最適ピッチ係数およびフィルタ係数を、入カスペタト ルの推定値 S ' (k)と、入力スペクトル S (k)の高域部(FL≤k< FH)との相関性では なぐ第 1レイヤ復号スペクトルの推定値 S ' (k)と、入力スペクトル S (k)の高域部
DEC1
(FL≤k< FH)との相関性に基づき求める。そのため、復号側の帯域拡張に対する 第 1レイヤ符号化の符号化歪みの影響を抑止することができ、復号信号の品質を向 上させること力 Sできる。 (実施の形態 3)
図 16は、本発明の実施の形態 3に係る符号化装置 400の主要な構成を示すブロッ ク図である。なお、符号化装置 400は、実施の形態 1に示した符号化装置 100 (図 1 〜図 3参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を 付し、その説明を省略する。
[0123] 符号化装置 400は、第 2レイヤ復号部 409をさらに具備する点において符号化装 置 100と相違する。なお、符号化装置 400のスペクトル符号化部 407と、符号化装置 100のスペクトル符号化部 107とは処理の一部に相違点があり、それを示すために 異なる符号を付す。
[0124] 第 2レイヤ復号部 409は、実施の形態 1に係る復号装置 200における第 2レイヤ復 号部 204 (図 8〜10)と同様な構成を有し同様な動作を行うため、詳細な説明を略す 。ただし、第 2レイヤ復号部 204の出力を第 2レイヤ MDCT係数と称するのに対し、こ こでは、第 2レイヤ復号部 409の出力を第 2レイヤ復号スペクトルと称し、 S (k)と
DEC2 記す。
[0125] スペクトル符号化部 407は、符号化装置 400の入力信号である音声'オーディオ信 号、およびアップサンプリング部 104から入力されるアップサンプリング後の第 1レイ ャ復号信号を周波数領域に変換し、入力スペクトルおよび第 1レイヤ復号スぺクトノレ を得る。そして、スペクトル符号化部 407は、第 1レイヤ復号スペクトルの低域成分と、 第 2レイヤ復号部 409から入力される第 2レイヤ復号スペクトルとを加算し、加算結果 である加算スペクトルと、入力スペクトルの高域成分との相関を分析し、復号側にお いて帯域拡張を行い低域成分力 高域成分を推定するためのパラメータを算出し、 スペクトル符号化情報として多重化部 108に出力する。
[0126] 図 17は、スペクトル符号化部 407の内部の主要な構成を示すブロック図である。な お、スペクトル符号化部 407は、実施の形態 1に示したスペクトル符号化部 107 (図 3 参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、 その説明を省略する。
[0127] スペクトル符号化部 407は、周波数領域変換部 171の代わりに周波数領域変換部
471 , 477および加算スペクトル算出部 478を具備する点において、スペクトル符号 化部 107と相違する。なお、スペクトル符号化部 407の内部状態設定部 472、フィノレ タリング部 474、探索部 475、フィルタ係数算出部 476と、スペクトル符号化部 107の 内部状態設定部 172、フィルタリング部 174、探索部 175、フィルタ係数算出部 176 とは処理の一部において相違点があり、それを示すために異なる符号を付す。 [0128] 周波数領域変換部 471は、有効周波数帯域が 0≤k< FHである音声 ·オーディオ 信号の代わりに、アップサンプリング部 104から入力される有効周波数帯域が 0≤k < FHであるアップサンプリング後の第 1レイヤ復号信号に対して周波数変換を行い 、第 1レイヤ復号スペクトル S (k)を算出して加算スペクトル算出部 478に出力する
DEC1
。ここで周波数変換の方法は、離散フーリエ変換 (DFT)、離散コサイン変換 (DCT) 、変形離散コサイン変換 (MDCT)等を適用する。
[0129] 加算スペクトル算出部 478は、周波数領域変換部 471から入力される第 1レイヤ復 号スペクトル S (k)の低域(0≤k< FU成分と、第 2レイヤ復号部 409から入力さ
DEC1
れる第 2レイヤ復号スペクトル S (k)とを加算して、得られる加算スペクトル S (k)
DEC2 SUM を内部状態設定部 472に出力する。ここで、第 2レイヤ復号スペクトル S (k)の帯
DEC2 域は第 2レイヤ符号化部 106において量子化対象帯域として選択された帯域である ため、加算スペクトル S (k)の帯域は、低域(0≤k< FL)と、第 2レイヤ符号化部 10
SUM
6において選択された量子化対象帯域とからなる。
[0130] 周波数領域変換部 477は、入力される有効周波数帯域が 0≤k< FHである音声- オーディオ信号に対して周波数変換を行い、入力スペクトル S(k)を算出する。ここで 周波数変換の方法は、離散フーリエ変換 (DFT)、離散コサイン変換 (DCT)、変形 離散コサイン変換 (MDCT)等を適用する。
[0131] 内部状態設定部 472は、有効周波数帯域が 0≤k< FHである入力スペクトル S(k) の代わりに、有効周波数帯域が 0≤k< FHである加算スペクトル S (k)を使ってフ
SUM
ィルタリング部 474で用いられるフィルタの内部状態を設定する。なお、このフィルタ の内部状態の設定は、入力スペクトル S (k)の代わりに加算スペクトル S (k)を用
SUM
いる点以外は、内部状態設定部 172の内部状態の設定と同様であるため、詳細な説 明を省略する。
[0132] フィルタリング部 474は、内部状態設定部 472で設定されたフィルタの内部状態、 およぶピッチ係数設定部 473から出力されるピッチ係数 Tを用いて加算スペクトル S
S
、、加算スペクトルの推定値 S ' (k)を算出する。このフ
SUM
ィルタリング処理は、式(2)の代わりに下記の式(11)を用いる点以外は、
グ部 174のフィルタリング処理と同様であるため、詳細な説明を省略する( [数 11]
SSUM k) = SSUM(k - T) … ( 1 1 )
[0133] 探索部 475は、周波数領域変換部 477から入力される入力スペクトル S(k)とフィル タリング部 474から出力される加算スペクトルの推定値 S ' (k)との類似性を示すパ
SUM
ラメータである類似度を算出する。なお、この類似度の算出処理は、式 (4)の代わり に下記の式(12)を用いる点以外は探索部 175における類似度の算出処理と同様で あるため、詳細な説明を省略する。
[数 12]
[0134] この類似度の算出処理は、ピッチ係数設定部 173からフィルタリング部 474にピッ チ係数 Tが与えられる度に行われ、算出される類似度が最大となるピッチ係数、すな わち最適ピッチ係数 T' (Tmin〜Tmaxの範囲)は、フィルタ係数算出部 476に与えら れる。
[0135] フィルタ係数算出部 476は、探索部 475から与えられる最適ピッチ係数 T'、周波数 領域変換部 477から入力される入力スペクトル S(k)、および加算スペクトル算出部 47 8から入力される加算スペクトル S (k)を用いて、フィルタ係数 /3を求め、フィルタ
SUM i
係数 /3および最適ピッチ係数 T'をスペクトル符号化情報として多重化部 108に出力 する。なお、フィルタ係数算出部 476におけるフィルタ係数 /3 の算出処理は、式(5) の代わりに下記の式(13)を用いる点以外は、フィルタ係数算出部 176におけるフィ ルタ係数 /3 の算出処理と同様であるため、詳細な説明を省略する。
[数 13] [0136] 要するに、符号化装置 400は、スペクトル符号化部 407において、有効周波数帯 域が 0≤k< FHである加算スペクトル S (k)を内部状態とするフィルタリング部 47
SUM
4を用いて、有効周波数帯域が 0≤k< FHである加算スペクトル S (k)の高域部(
SUM
FL≤k< FH)の形状を推定する。これにより、符号化装置 400は、加算スペクトル S
S
(k)の高域部(FL≤k< FH)に対する推定値 S ' (k)と、入力スペクトル S ( の
UM SUM
高域部(FL≤k< FH)との相関性を示すパラメータ、すなわちフィルタリング部 474 のフィルタ特性を表す最適ピッチ係数 T'およびフィルタ係数 /3を求め、入カスペタト ルの高域部の符号化情報の代わりに復号装置に伝送する。
[0137] 本実施の形態に係る復号装置は、実施の形態 1に係る復号装置 100と同様な構成 を有し同様な動作を行うため、その説明を省略する。
[0138] このように、本実施の形態によれば、符号化側においては、第 1レイヤ復号スぺクト ルと第 2レイヤ復号スペクトルとを加算して加算スペクトルを算出し、加算スペクトルと 入力スペクトルとの相関性に基づき最適ピッチ係数およびフィルタ係数を求める。ま た、復号側においては、下位レイヤおよび上位レイヤの復号スペクトルを加算して加 算スペクトルを算出し、符号化側から伝送された最適ピッチ係数およびフィルタ係数 を用い、加算スペクトルの推定値を求める帯域拡張を行う。そのため、復号側の帯域 拡張に対する第 1レイヤ符号化および第 2レイヤ符号化の符号化歪みの影響をさら に抑止することができ、復号信号の品質をさらに向上させることができる。
[0139] なお、本実施の形態では、符号化装置において、第 1レイヤ復号スペクトルと第 2レ ィャ復号スペクトルとを加算して加算スペクトルを算出し、加算スペクトルと入カスペク トルとの相関性に基づき、復号装置にて帯域拡張に利用する最適ピッチ係数および フィルタ係数を算出する場合を例にとって説明したが、本発明はこれに限定されず、 入力スペクトルとの相関性を求める対象のスペクトルとして、加算スペクトルと第 1復 号スペクトルとのいずれかを選択する構成にしても良い。例えば、第 1レイヤ復号信 号の品質を重視するような場合には、第 1レイヤ復号スペクトルと入力スペクトルとの 相関性に基づき、帯域拡張のための最適ピッチ係数およびフィルタ係数を算出し、 第 2レイヤ復号信号の品質を重視するような場合には、加算スペクトルと入カスペタト ルとの相関性に基づき、帯域拡張のための最適ピッチ係数およびフィルタ係数を算 出することが出来る。この選択の条件としては、符号化装置に入力される補助情報、 あるいは伝送路の状態 (伝送速度、帯域など)を用いれば良ぐ例えば伝送路の利用 効率が非常に高ぐ第 1レイヤ符号化情報のみし力、伝送できないような場合には、第
1復号スペクトルと入力スペクトルとの相関性に基づき、帯域拡張のための最適ピッチ 係数およびフィルタ係数を算出することにより、より品質の良い出力信号を提供するこ と力 Sできる。
[0140] なお、上記のように、最適ピッチ係数およびフィルタ係数の算出方法の場合分けに 対し、実施の形態 1で説明したように、入力スペクトルの低域成分と高域成分との相 関性を求める場合も加えても構わない。例えば、第 1レイヤ復号スペクトルと入カスペ タトルとの歪みが非常に小さい場合には、入力スペクトルの低域成分と高域成分とか ら最適ピッチ係数およびフィルタ係数を算出することによって、上位のレイヤほど、よ り高い品質の出力信号を提供することができる。
[0141] 以上、本発明の実施の形態について説明した。
[0142] 上記各実施の形態で説明したように、本発明は、スケーラブルコーデックにおいて 、符号化装置で、帯域拡張パラメータを算出するときに用いる、第 1レイヤ復号信号、 または、第 1レイヤ復号信号を用いて算出される算出信号 (たとえば、第 1レイヤ復号 信号と第 2レイヤ復号信号とを加算した加算信号)、の低域成分と、復号装置で、帯 域拡張するために帯域拡張パラメータを適用する、第 1レイヤ復号信号、または、第 1 レイヤ復号信号を用いて算出される算出信号 (たとえば、第 1レイヤ復号信号と第 2レ ィャ復号信号とを加算した加算信号)、の低域成分とが、異なるように構成することで 、有利な効果を奏することができる。なお、これら各低域成分を互いに同じにするよう に構成したり、符号化装置において入力信号の低域成分を用いるように構成したり することも可能である。
[0143] なお、上記各実施の形態においては、帯域拡張のために用いるパラメータとして、 ピッチ係数とフィルタ係数とを用いる例を示した力 これに限定されない。たとえば、 符号化側と復号側とで、一方の係数を固定しておいて、他方の係数のみをパラメ一 タとして符号化側から送信しても良い。あるいは、これらの係数を基に、送信のために 用いるパラメータを別に求めて、それを帯域拡張パラメータとしても良ぐこれらを組 み合わせて用いても良い。
[0144] また、上記各実施の形態において、符号化装置が、フィルタリング後に高域のサブ バンド (周波数成分の領域で全帯域を複数に分割した帯域) )毎のエネルギを調整 するためのゲイン情報を算出し符号化する機能を有し、復号装置が、このゲイン情報 を受信して帯域拡張に用いるようにしても良い。すなわち、帯域拡張を行うために用 いるパラメータとして、符号化装置で得られる、サブバンドごとのエネルギ調整に用い るゲイン情報を復号装置に送信し、復号装置にてこのゲイン情報を帯域拡張に適用 することが可能である。たとえば、最も単純な帯域拡張方法として、低域スペクトルか ら高域スペクトルを推定するためのピッチ係数、及びフィルタリング係数を符号化装 置と復号装置とで固定しておくことにより、サブバンド毎のエネルギを調整するゲイン 情報のみを帯域拡張のためのパラメータとして用いることが可能となる。したがって、 ピッチ係数、フィルタリング係数、ゲイン情報の 3種類の情報の少なくとも一つを用い れば、帯域拡張を行うことができる。
[0145] 本発明に係る符号化装置、復号装置、およびこれらの方法は、上記各実施の形態 に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、 適宜組み合わせて実施することが可能である。
[0146] 本発明に係る符号化装置および復号装置は、移動体通信システムにおける通信 端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作 用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供する こと力 Sでさる。
[0147] なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明した力 本 発明をソフトウェアで実現することも可能である。例えば、本発明に係る符号化方法 および復号方法のアルゴリズムをプログラミング言語によって記述し、このプログラム をメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る 符号化装置および復号装置と同様の機能を実現することができる。
[0148] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路 である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部または 全てを含むように 1チップ化されても良い。 [0149] また、ここでは LSIとしたが、集積度の違いによって、 IC、システム LSI、スーパー L
SI、ウノレ卜ラ LSI等と呼称されることもある。
[0150] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッ サで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field Pro grammable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可能な リコンフィギユラブル .プロセッサを利用しても良!/、。
[0151] さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回 路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行って も良い。ノ ィォ技術の適用等が可能性としてあり得る。
[0152] 以上、本発明の符号化装置'復号装置についてまとめると、代表的には以下のよう に表すことができる。
[0153] 本発明の第 1の発明は、入力信号のうち所定周波数より低い帯域である低域の部 分を符号化して第 1符号化データを生成する第 1符号化手段と、前記第 1符号化デ 一タを復号して第 1復号信号を生成する第 1復号手段と、前記入力信号と前記第 1復 号信号との残差信号の所定の帯域部分を符号化して第 2符号化データを生成する 第 2符号化手段と、前記第 1復号信号、または、前記第 1復号信号を用いて算出され る算出信号、の前記低域の部分をフィルタリングして、前記入力信号の前記所定周 波数より高い帯域である高域の部分を得るための帯域拡張パラメータを得るフィルタ リング手段と、を具備する符号化装置である。
[0154] 本発明の第 2の発明は、第 1の発明において、前記第 2符号化データを復号して第
2復号信号を生成する第 2復号手段と、前記第 1復号信号と前記第 2復号信号とを加 算して加算信号を生成する加算手段と、をさらに具備し、前記フィルタリング手段が、 前記加算信号を前記算出信号として適用し、前記加算信号の前記低域の部分をフィ ノレタリングして、前記入力信号の前記所定周波数より高い帯域である高域の部分を 得るための前記帯域拡張パラメータを得る、符号化装置である。
[0155] 本発明の第 3の発明は、第 1または第 2の発明において、前記フィルタリングの後、 サブバンド毎のエネルギを調整するゲイン情報を算出するゲイン情報生成手段と、を さらに具備する、符号化装置である。 [0156] 本発明の第 4の発明は、 r階層(rは 2以上の整数)のレイヤ構成のスケーラブルコー デックを用いた復号装置であって、符号化装置で第 mレイヤ (mは r以下の整数)の復 号信号を用いて算出された帯域拡張パラメータを受信する受信手段と、第 nレイヤ (n は r以下の整数)の復号信号の低域成分に対して前記帯域拡張パラメータを用いるこ とにより高域成分を生成する復号手段と、を具備する復号装置である。
[0157] 本発明の第 5の発明は、第 4の発明において、前記復号手段が、前記帯域拡張パ ラメータを用いて、第 mレイヤとは異なる第 nレイヤ (m≠n)の復号信号の高域成分を 生成する、復号装置である。
[0158] 本発明の第 6の発明は、第 4または第 5の発明において、前記受信手段が、前記符 号化装置から送信されたゲイン情報をさらに受信し、前記復号手段が、前記帯域拡 張パラメータの代わりに前記ゲイン情報を用いて、あるいは、前記帯域拡張パラメ一 タと前記ゲイン情報とを用いて、前記第 nレイヤの復号信号の高域成分を生成する、 復号装置である。
[0159] 本発明の第 7の発明は、符号化装置から送信された、前記符号化装置における入 力信号のうち所定周波数より低い帯域である低域の部分を符号化した第 1符号化デ ータと、前記第 1符号化データを復号して得られた第 1復号スペクトルと前記入力信 号のスペクトルとの残差の所定の帯域部分を符号化した第 2符号化データと、前記第 1復号スペクトル、または、前記第 1復号スペクトルと前記第 2符号化データを復号し て得られた第 2復号スペクトルとを加算した第 1加算スペクトル、の前記低域の部分を フィルタリングして前記入力信号の前記所定周波数より高い帯域である高域の部分 を得るための帯域拡張パラメータと、を受信する受信手段と、前記第 1符号化データ を復号して前記低域における第 3復号スペクトルを生成する第 1復号手段と、前記第 2符号化データを復号して前記所定の帯域部分における第 4復号スペクトルを生成 する第 2復号手段と、前記帯域拡張パラメータを用いて、前記第 3復号スペクトル、前 記第 4復号スペクトル、およびその両方を用いて生成される第 5復号スペクトル、のう ちいずれか一つを帯域拡張することにより、前記第 1復号手段および前記第 2復号手 段で復号されなかった帯域部分を復号する第 3復号手段と、を具備する復号装置で ある。 [0160] 本発明の第 8の発明は、第 7の発明において、前記受信手段が、前記第 1符号化 データと、前記第 2符号化データと、前記第 1加算スペクトルの前記低域の部分をフィ ルタリングして前記入力信号の前記所定周波数より高い帯域である高域の部分を得 るための前記帯域拡張パラメータと、を受信する、復号装置である。
[0161] 本発明の第 9の発明は、第 7の発明において、前記第 3復号手段が、前記第 3復号 スペクトルと前記第 4復号スペクトルとを加算して第 2加算スペクトルを生成する加算 手段と、前記帯域拡張パラメータを用いて、前記第 3復号スペクトル、前記第 4復号ス ぺクトル、または、前記第 5復号スペクトルとして前記第 2加算スペクトル、をフィルタリ ングして前記帯域拡張を行うフィルタリング手段と、を具備する復号装置である。
[0162] 本発明の第 10の発明は、第 7の発明において、前記受信手段が、前記符号化装 置から送信されたゲイン情報をさらに受信し、前記第 3復号手段が、前記帯域拡張パ ラメータの代わりに前記ゲイン情報を用いて、あるいは、前記帯域拡張パラメータと前 記ゲイン情報とを用いて、前記第 3復号スペクトル、前記第 4復号スペクトル、および その両方を用いて生成される第 5復号スペクトル、のうち 、ずれか一つを帯域拡張す ることにより、前記第 1復号手段および前記第 2復号手段で復号されなかった帯域部 分を復号する、復号装置である。
[0163] 本発明の第 11の発明は、上記第 1から第 10の発明において、帯域拡張パラメータ 、ピッチ係数及びフィルタリング係数の少なくとも一方を含む、符号化装置'復号装 置である。
[0164] 2006年 12月 15曰出願の特願 2006— 338341の曰本出願および 2007年 3月 2
日出願の特願 2007— 053496の日本出願に含まれる明細書、図面および要約書 の開示内容は、すべて本願に援用される。
産業上の利用可能性
[0165] 本発明に係る符号化装置等は、移動体通信システムにおける通信端末装置、基地 局装置等の用途に適用することができる。

Claims

請求の範囲
[1] 入力信号のうち所定周波数より低い帯域である低域の部分を符号化して第 1符号 化データを生成する第 1符号化手段と、
前記第 1符号化データを復号して第 1復号信号を生成する第 1復号手段と、 前記入力信号と前記第 1復号信号との残差信号の所定の帯域部分を符号化して 第 2符号化データを生成する第 2符号化手段と、
前記第 1復号信号、または、前記第 1復号信号を用いて算出される算出信号、の前 記低域の部分をフィルタリングして、前記入力信号の前記所定周波数より高レ、帯域 である高域の部分を得るための帯域拡張パラメータを得るフィルタリング手段と、 を具備する符号化装置。
[2] 前記第 2符号化データを復号して第 2復号信号を生成する第 2復号手段と、
前記第 1復号信号と前記第 2復号信号とを加算して加算信号を生成する加算手段 と、をさらに具備し、
前記フィルタリング手段は、
前記加算信号を前記算出信号として適用し、前記加算信号の前記低域の部分をフ ィルタリングして、前記入力信号の前記所定周波数より高い帯域である高域の部分を 得るための前記帯域拡張パラメータを得る、
請求項 1記載の符号化装置。
[3] 前記フィルタリングの後、サブバンド毎のエネルギを調整するゲイン情報を算出する ゲイン情報生成手段と、
をさらに具備する、請求項 1または 2記載の符号化装置。
[4] 前記帯域拡張パラメータは、ピッチ係数及びフィルタリング係数の少なくとも一方を 含む、
請求項 1から 3の!/、ずれか記載の符号化装置。
[5] r階層(rは 2以上の整数)のレイヤ構成のスケーラブルコーデックを用いた復号装置 であって、
符号化装置で第 mレイヤ (mは r以下の整数)の復号信号を用いて算出された帯域 拡張パラメータを受信する受信手段と、 第 nレイヤ (nは r以下の整数)の復号信号の低域成分に対して前記帯域拡張パラメ ータを用いることにより高域成分を生成する復号手段と、
を具備する復号装置。
[6] 前記復号手段は、
前記帯域拡張パラメータを用いて、第 mレイヤとは異なる第 nレイヤ (m≠n)の復号 信号の高域成分を生成する、
請求項 5記載の復号装置。
[7] 前記受信手段は、
前記符号化装置から送信されたゲイン情報をさらに受信し、
前記復号手段は、
前記帯域拡張パラメータの代わりに前記ゲイン情報を用いて、あるいは、前記帯域 拡張パラメータと前記ゲイン情報とを用いて、前記第 nレイヤの復号信号の高域成分 を生成する、
請求項 5または 6記載の復号装置。
[8] 符号化装置から送信された、前記符号化装置における入力信号のうち所定周波数 より低い帯域である低域の部分を符号化した第 1符号化データと、前記第 1符号化デ 一タを復号して得られた第 1復号スペクトルと前記入力信号のスペクトルとの残差の 所定の帯域部分を符号化した第 2符号化データと、前記第 1復号スペクトル、または 、前記第 1復号スペクトルと前記第 2符号化データを復号して得られた第 2復号スぺク トルとを加算した第 1加算スペクトル、の前記低域の部分をフィルタリングして前記入 力信号の前記所定周波数より高い帯域である高域の部分を得るための帯域拡張パ ラメータと、を受信する受信手段と、
前記第 1符号化データを復号して前記低域における第 3復号スペクトルを生成する 第 1復号手段と、
前記第 2符号化データを復号して前記所定の帯域部分における第 4復号スぺクト ルを生成する第 2復号手段と、
前記帯域拡張パラメータを用いて、前記第 3復号スペクトル、前記第 4復号スぺクト ル、およびその両方を用いて生成される第 5復号スペクトル、のうちいずれか一つを 帯域拡張することにより、前記第 1復号手段および前記第 2復号手段で復号されなか つた帯域部分を復号する第 3復号手段と、
を具備する復号装置。
[9] 前記受信手段は、
前記第 1符号化データと、前記第 2符号化データと、前記第 1加算スペクトルの前記 低域の部分をフィルタリングして前記入力信号の前記所定周波数より高い帯域であ る高域の部分を得るための前記帯域拡張パラメータと、を受信する、
請求項 8記載の復号装置。
[10] 前記第 3復号手段は、
前記第 3復号スペクトルと前記第 4復号スペクトルとを加算して第 2加算スペクトルを 生成する加算手段と、
前記帯域拡張パラメータを用いて、前記第 3復号スペクトル、前記第 4復号スぺクト ル、または、前記第 5復号スペクトルとして前記第 2加算スペクトル、をフィルタリングし て前記帯域拡張を行うフィルタリング手段と、
を具備する請求項 8記載の復号装置。
[11] 前記受信手段は、
前記符号化装置から送信されたゲイン情報をさらに受信し、
前記第 3復号手段は、
前記帯域拡張パラメータの代わりに前記ゲイン情報を用いて、あるいは、前記帯域 拡張パラメータと前記ゲイン情報とを用いて、前記第 3復号スペクトル、前記第 4復号 スペクトル、およびその両方を用いて生成される第 5復号スペクトル、のうちいずれか 一つを帯域拡張することにより、前記第 1復号手段および前記第 2復号手段で復号さ れなかった帯域部分を復号する、
請求項 8記載の復号装置。
[12] 前記帯域拡張パラメータは、ピッチ係数及びフィルタリング係数の少なくとも一方を 含む、
請求項 5から 11の!/、ずれかに記載の復号装置。
[13] 入力信号のうち所定周波数より低い帯域である低域の部分を符号化して第 1符号 化データを生成する第 1符号化ステップと、
前記第 1符号化データを復号して第 1復号信号を生成する復号ステップと、 前記入力信号と前記第 1復号信号との残差信号の所定の帯域部分を符号化して 第 2符号化データを生成する第 2符号化ステップと、
前記第 1復号信号、または、前記第 1復号信号を用いて算出される算出信号、の前 記低域の部分をフィルタリングして、前記入力信号の前記所定周波数より高レ、帯域 である高域の部分を得るための帯域拡張パラメータを得るフィルタリングステップと、 を有する符号化方法。
[14] r階層(rは 2以上の整数)のレイヤ構成のスケーラブルコーデックを用いた復号方法 であって、
符号化装置で第 mレイヤ (mは r以下の整数)の復号信号を用いて算出された帯域 拡張パラメータを受信する受信ステップと、
第 nレイヤ (nは r以下の整数)の復号信号の低域成分に対して前記帯域拡張パラメ ータを用いることにより高域成分を生成する復号ステップと、
を具備する復号方法。
[15] 符号化装置から送信された、前記符号化装置における入力信号のうち所定周波数 より低い帯域である低域の部分を符号化した第 1符号化データと、前記第 1符号化デ 一タを復号して得られた第 1復号スペクトルと前記入力信号のスペクトルとの残差の 所定の帯域部分を符号化した第 2符号化データと、前記第 1復号スペクトル、または 、前記第 1復号スペクトルと前記第 2符号化データを復号して得られた第 2復号スぺク トルとを加算した第 1加算スペクトル、の前記低域の部分をフィルタリングして前記入 力信号の前記所定周波数より高い帯域である高域の部分を得るための帯域拡張パ ラメータと、を受信するステップと、
前記第 1符号化データを復号して前記低域における第 3復号スペクトルを生成する 第 1復号ステップと、
前記第 2符号化データを復号して前記所定の帯域部分における第 4復号スぺクト ルを生成する第 2復号ステップと、
前記第 1復号ステップおよび前記第 2復号ステップで復号されなかった帯域部分を 、前記帯域拡張パラメータを用いて、前記第 3復号スペクトル、前記第 4復号スぺクト ル、およびその両方を用いて生成される第 5復号スペクトル、のうちいずれか一つを 帯域拡張することにより復号する第 3復号ステップと、
を有する復号方法。
PCT/JP2007/074141 2006-12-15 2007-12-14 符号化装置、復号装置およびこれらの方法 WO2008072737A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP07850645.8A EP2101322B1 (en) 2006-12-15 2007-12-14 Encoding device, decoding device, and method thereof
CN2007800444142A CN101548318B (zh) 2006-12-15 2007-12-14 编码装置、解码装置以及其方法
US12/518,371 US8560328B2 (en) 2006-12-15 2007-12-14 Encoding device, decoding device, and method thereof
JP2008549379A JP5339919B2 (ja) 2006-12-15 2007-12-14 符号化装置、復号装置およびこれらの方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006338341 2006-12-15
JP2006-338341 2006-12-15
JP2007-053496 2007-03-02
JP2007053496 2007-03-02

Publications (1)

Publication Number Publication Date
WO2008072737A1 true WO2008072737A1 (ja) 2008-06-19

Family

ID=39511750

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2007/074141 WO2008072737A1 (ja) 2006-12-15 2007-12-14 符号化装置、復号装置およびこれらの方法

Country Status (5)

Country Link
US (1) US8560328B2 (ja)
EP (1) EP2101322B1 (ja)
JP (1) JP5339919B2 (ja)
CN (1) CN101548318B (ja)
WO (1) WO2008072737A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012046447A1 (ja) * 2010-10-06 2012-04-12 パナソニック株式会社 符号化装置、復号装置、符号化方法及び復号方法
WO2013035257A1 (ja) * 2011-09-09 2013-03-14 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP5565914B2 (ja) * 2009-10-23 2014-08-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置およびこれらの方法

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2198426A4 (en) * 2007-10-15 2012-01-18 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING A SIGNAL
JP5098569B2 (ja) * 2007-10-25 2012-12-12 ヤマハ株式会社 帯域拡張再生装置
CN103366755B (zh) * 2009-02-16 2016-05-18 韩国电子通信研究院 对音频信号进行编码和解码的方法和设备
WO2010137300A1 (ja) 2009-05-26 2010-12-02 パナソニック株式会社 復号装置及び復号方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5295380B2 (ja) * 2009-10-20 2013-09-18 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6073215B2 (ja) * 2010-04-14 2017-02-01 ヴォイスエイジ・コーポレーション Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック
JPWO2011158657A1 (ja) * 2010-06-17 2013-08-19 シャープ株式会社 画像フィルタ装置、復号装置、符号化装置、および、データ構造
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012053150A1 (ja) * 2010-10-18 2012-04-26 パナソニック株式会社 音声符号化装置および音声復号化装置
JP5992427B2 (ja) * 2010-11-10 2016-09-14 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 信号におけるピッチおよび/または基本周波数に関するパターンを推定する方法および装置
CN103443856B (zh) * 2011-03-04 2015-09-09 瑞典爱立信有限公司 音频编码中的后量化增益校正
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
WO2013162450A1 (en) * 2012-04-24 2013-10-31 Telefonaktiebolaget L M Ericsson (Publ) Encoding and deriving parameters for coded multi-layer video sequences
CN103971691B (zh) * 2013-01-29 2017-09-29 鸿富锦精密工业(深圳)有限公司 语音信号处理系统及方法
MX353240B (es) * 2013-06-11 2018-01-05 Fraunhofer Ges Forschung Dispositivo y método para extensión de ancho de banda para señales acústicas.
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US10468035B2 (en) * 2014-03-24 2019-11-05 Samsung Electronics Co., Ltd. High-band encoding method and device, and high-band decoding method and device
JP6798312B2 (ja) * 2014-09-08 2020-12-09 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN105513601A (zh) * 2016-01-27 2016-04-20 武汉大学 一种音频编码带宽扩展中频带复制的方法及装置
PL3443557T3 (pl) * 2016-04-12 2020-11-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio do kodowania sygnału audio, sposób kodowania sygnału audio i program komputerowy, z uwzględnieniem wykrytego regionu widmowego pełnego w wyższym pasmie częstotliwości
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
WO2006049204A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、符号化方法及び復号化方法
JP2006338341A (ja) 2005-06-02 2006-12-14 Hitachi Ltd ストレージシステム及び構成変更方法
JP2007053496A (ja) 2005-08-16 2007-03-01 Sony Corp 映像表示方法、映像表示方法のプログラム、映像表示方法のプログラムを記録した記録媒体及び映像表示装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP2964879B2 (ja) * 1994-08-22 1999-10-18 日本電気株式会社 ポストフィルタ
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
JP3255047B2 (ja) * 1996-11-19 2002-02-12 ソニー株式会社 符号化装置および方法
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
EP1132892B1 (en) * 1999-08-23 2011-07-27 Panasonic Corporation Speech encoding and decoding system
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
DE60233032D1 (de) * 2001-03-02 2009-09-03 Panasonic Corp Audio-kodierer und audio-dekodierer
JP3888097B2 (ja) * 2001-08-02 2007-02-28 松下電器産業株式会社 ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
EP1701340B1 (en) * 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
US7752052B2 (en) * 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
JP4789430B2 (ja) * 2004-06-25 2011-10-12 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
WO2006041055A1 (ja) * 2004-10-13 2006-04-20 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
BRPI0517513A (pt) * 2004-10-26 2008-10-14 Matsushita Electric Ind Co Ltd aparelho de codificação de som e processo de sua realização
JP4859670B2 (ja) * 2004-10-27 2012-01-25 パナソニック株式会社 音声符号化装置および音声符号化方法
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
EP1876586B1 (en) * 2005-04-28 2010-01-06 Panasonic Corporation Audio encoding device and audio encoding method
EP1990800B1 (en) * 2006-03-17 2016-11-16 Panasonic Intellectual Property Management Co., Ltd. Scalable encoding device and scalable encoding method
US20080059154A1 (en) * 2006-09-01 2008-03-06 Nokia Corporation Encoding an audio signal
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
CN101771417B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、系统
CA2770287C (en) * 2010-06-09 2017-12-12 Panasonic Corporation Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
WO2006049204A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、符号化方法及び復号化方法
JP2006338341A (ja) 2005-06-02 2006-12-14 Hitachi Ltd ストレージシステム及び構成変更方法
JP2007053496A (ja) 2005-08-16 2007-03-01 Sony Corp 映像表示方法、映像表示方法のプログラム、映像表示方法のプログラムを記録した記録媒体及び映像表示装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KATAOKA A. ET AL.: "G.729 o Kosei Yoso to shite Mochiiru Scalable Kotaiiki Onsei Fugoka", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS D-II, vol. J86-D-II, no. 3, 1 March 2003 (2003-03-01), pages 379 - 387, XP002996342 *
MASAHIRO OSHIKIRI; HIROYUKI EHARA; KOJI YOSHIDA: "Improvement of the super-wideband scalable coder using pitch filtering based spectrum coding", ANNUAL MEETING OF ACOUSTIC SOCIETY OF JAPAN 2-4-13, September 2004 (2004-09-01), pages 297 - 298
OSHIKIRI M. ET AL.: "AMR o Core ni shita Kyotaiiki/Kotaiiki Scalable Onsei Fugoka Hoshiki", THE ACOUSTICAL SOCIETY OF JAPAN (ASJ) KOEN RONBUNSHU CD-ROM, no. 1-Q-28, 7 March 2006 (2006-03-07), pages 389 - 390 *
See also references of EP2101322A4

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5565914B2 (ja) * 2009-10-23 2014-08-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置およびこれらの方法
US8898057B2 (en) 2009-10-23 2014-11-25 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus and methods thereof
WO2012046447A1 (ja) * 2010-10-06 2012-04-12 パナソニック株式会社 符号化装置、復号装置、符号化方法及び復号方法
JPWO2012046447A1 (ja) * 2010-10-06 2014-02-24 パナソニック株式会社 符号化装置、復号装置、符号化方法及び復号方法
US9117461B2 (en) 2010-10-06 2015-08-25 Panasonic Corporation Coding device, decoding device, coding method, and decoding method for audio signals
WO2013035257A1 (ja) * 2011-09-09 2013-03-14 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US9384749B2 (en) 2011-09-09 2016-07-05 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
JP2017027069A (ja) * 2011-09-09 2017-02-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置および符号化方法
US9741356B2 (en) 2011-09-09 2017-08-22 Panasonic Intellectual Property Corporation Of America Coding apparatus, decoding apparatus, and methods
US9886964B2 (en) 2011-09-09 2018-02-06 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, and methods
US10269367B2 (en) 2011-09-09 2019-04-23 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, and methods
US10629218B2 (en) 2011-09-09 2020-04-21 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, and methods

Also Published As

Publication number Publication date
EP2101322A1 (en) 2009-09-16
US8560328B2 (en) 2013-10-15
JPWO2008072737A1 (ja) 2010-04-02
US20100017198A1 (en) 2010-01-21
EP2101322A4 (en) 2011-08-31
CN101548318B (zh) 2012-07-18
EP2101322B1 (en) 2018-02-21
JP5339919B2 (ja) 2013-11-13
CN101548318A (zh) 2009-09-30

Similar Documents

Publication Publication Date Title
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5328368B2 (ja) 符号化装置、復号装置、およびこれらの方法
RU2488897C1 (ru) Кодирующее устройство, декодирующее устройство и способ
JP5230782B2 (ja) 符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
JP5404418B2 (ja) 符号化装置、復号装置および符号化方法
US8554549B2 (en) Encoding device and method including encoding of error transform coefficients
JP5030789B2 (ja) サブバンド符号化装置およびサブバンド符号化方法
EP2012305B1 (en) Audio encoding device, audio decoding device, and their method
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP5511785B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2009113316A1 (ja) 符号化装置、復号装置およびこれらの方法
WO2009093466A1 (ja) 符号化装置、復号装置およびこれらの方法
KR20080049085A (ko) 음성 부호화 장치 및 음성 부호화 방법
US20100017199A1 (en) Encoding device, decoding device, and method thereof
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
WO2008053970A1 (fr) Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés
WO2013057895A1 (ja) 符号化装置及び符号化方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2011045927A1 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200780044414.2

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 07850645

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2008549379

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 12518371

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2007850645

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE