WO2005027095A1 - 符号化装置および復号化装置 - Google Patents

符号化装置および復号化装置 Download PDF

Info

Publication number
WO2005027095A1
WO2005027095A1 PCT/JP2004/013455 JP2004013455W WO2005027095A1 WO 2005027095 A1 WO2005027095 A1 WO 2005027095A1 JP 2004013455 W JP2004013455 W JP 2004013455W WO 2005027095 A1 WO2005027095 A1 WO 2005027095A1
Authority
WO
WIPO (PCT)
Prior art keywords
spectrum
frequency band
decoding
high frequency
low frequency
Prior art date
Application number
PCT/JP2004/013455
Other languages
English (en)
French (fr)
Inventor
Masahiro Oshikiri
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34308695&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=WO2005027095(A1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to DE602004021266T priority Critical patent/DE602004021266D1/de
Priority to US10/571,761 priority patent/US7844451B2/en
Priority to JP2005513947A priority patent/JP4789622B2/ja
Priority to EP04787895A priority patent/EP1657710B1/en
Priority to BRPI0414444A priority patent/BRPI0414444B1/pt
Publication of WO2005027095A1 publication Critical patent/WO2005027095A1/ja
Priority to US12/700,583 priority patent/US8738372B2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Definitions

  • the present invention relates to a coding device mounted in a wireless communication device etc. that performs coding of audio signals, audio signals and the like, and a decoding device that decodes this coding signal.
  • Code technology that compresses voice signals, audio signals, etc. to low bit rate signals is useful for mobile communication systems, effectively using transmission channel capacity (channel capacity) such as radio waves and recording media.
  • transmission channel capacity channel capacity
  • the point of view is particularly important.
  • ITU-T International Telecommunication Union
  • G726, G729, etc. standards that are standardized in the Telecommunications Union Telecommunications Standardization sector.
  • narrow band signals 300 Hz-3.4 kHz
  • high quality encoding can be performed at a bit rate of 8 kbit / s-32 kbit / s.
  • such a narrow band signal has a narrow frequency band up to 3.4 kHz, so that the quality gives the listener the impression that the sound is jammed, and there is a problem that the sense of reality is lacking.
  • a wideband speech signal can be coded at 6.6 kbit / s-64 kbit / s.
  • the target signal of the code is voice
  • the wideband signal has relatively high quality, it is intended for audio signal or when even more realistic quality is required for the audio signal. Is not enough.
  • FIG. 1A to FIG. 1D are diagrams showing an outline of processing for replacing the spectrum of the high band with the spectrum of the low band.
  • FIG. 1A shows the spectrum of an original signal band-limited to the frequency band power O ⁇ k ⁇ FH
  • FIG. 1B shows the spectrum when the signal is band-limited to 0 ⁇ k ⁇ FL
  • FL FH Fig. 1C shows the spectrum obtained by replacing the high frequency (high frequency band) spectrum using the low frequency (low frequency band) extra space by the above-mentioned technique
  • Fig. 1D shows the spectrum after replacement.
  • the horizontal axis represents frequency
  • the vertical axis represents spectral intensity.
  • the spectrum of the original signal in the frequency band power O ⁇ k ⁇ FH (FIG. 1A) can be expressed using the low band spectrum in the frequency band 0 ⁇ k ⁇ FL (FIG. 1B).
  • the high frequency spectrum (FL ⁇ k ⁇ FH) is replaced by the low frequency spectrum (0 ⁇ k ⁇ FL).
  • a spectrum as shown in FIG. 1C is obtained.
  • the amplitude value of the high band spectrum of the spectrum of FIG. 1C is adjusted, and a spectrum as shown in FIG. 1D is obtained. This is the spectrum which estimated the spectrum of the original signal.
  • Patent Document 1 JP 2001-521648A (page 15, FIG. 1, FIG. 2)
  • FIG. 2A and FIG. 2B are diagrams for explaining the problems of the prior art.
  • FIG. 2A is a spectrum obtained by spectrally analyzing an audio signal.
  • FIG. 2B is a spectrum obtained as a result of estimating the spectrum of the original signal according to the above-mentioned technique. Comparing these two spectra, the spectrum in FIG. 2B shows that the low frequency spectrum S1 of the substitution source and the high frequency spectrum S2 of the substitution destination maintain the harmonic structure, but the low frequency spectrum S1 and the high frequency spectrum S2 It is known that the harmonic structure is broken at the connection (spectrum S3).
  • the disturbance of the harmonic structure causes the listener to perceive quality deterioration, which is a problem.
  • the disturbance of the harmonic structure is due to the replacement being performed without considering the shape of the harmonic structure.
  • the object of the present invention is to provide a code device capable of generating high quality codes at a low bit rate without disturbing the harmonic structure of the spectrum, and a code device thereof. It is an object of the present invention to provide a decoding device capable of decoding a signal.
  • the code device of the present invention is an acquisition means for acquiring a spectrum divided into two bands, a low frequency band and a high frequency band, and the acquired spectrum of the low frequency band and the acquired high frequency band Calculation means for calculating a parameter indicating the degree of similarity to the spectrum based on the harmonic structure of the spectrum, and a parameter indicating the calculated degree of similarity instead of the acquired spectrum of the high frequency band
  • a configuration is provided that includes code and code means.
  • the decoding apparatus of the present invention comprises spectrum acquisition means for acquiring the spectrum of the low frequency band of the spectrum divided into two bands of the low frequency band and the high frequency band, and the spectrum of the low frequency band.
  • Parameter indicating the degree of similarity between the spectrum and the spectrum in the high frequency band A parameter acquiring unit that acquires a parameter; and a decoding unit that decodes the spectrum of a low frequency band and a high frequency band using the acquired spectrum of the low frequency band and the parameters.
  • an acquisition step of acquiring a spectrum divided into two bands of a low frequency band and a high frequency band, the acquired spectrum of the low frequency band and the acquired high frequency band Calculating a parameter indicating the degree of similarity to the spectrum based on the harmonic structure of the spectrum, and indicating the calculated degree of similarity instead of the acquired vector of the high frequency band It has been made to include a step of coding a parameter.
  • the decoding method comprises a spectrum acquisition step of acquiring a spectrum of a low frequency band of a spectrum divided into two bands of a low frequency band and a high frequency band; A parameter acquiring step of acquiring a parameter indicating a similarity between the outer ring and the spectrum of the high frequency band, and the acquired low frequency band and the parameter of the low frequency band and the high frequency band using the acquired parameter; And a decoding step of decoding the spectrum.
  • the present invention it is possible to code a spectrum with high quality at a low bit rate without breaking the harmonic structure of the spectrum.
  • the sound quality at the time of decoding this encoded signal can be improved.
  • FIG. 1 A diagram showing an outline of processing for replacing the spectrum of the conventional high band part with the spectrum of the low band part
  • FIG. 3 shows the main configuration of the wireless transmission device according to the first embodiment-[Fig. 4] shows the internal configuration of the code device according to the first embodiment-[Fig. 5] relates to the first embodiment
  • Fig. 6 shows an internal configuration of a spectrum encoding unit-[Fig. 6]
  • Figure 7 Figure for explaining how the spectrum of the estimated value of the second spectrum changes as the pitch coefficient T changes.
  • FIG. 9 A flow chart showing an example of a series of algorithms of each processing performed in the filtering unit, search unit, and pitch coefficient setting unit according to the first embodiment.
  • FIG. 10 shows the main configuration of the radio reception apparatus according to the first embodiment-[Fig. 11] shows the internal configuration of the decoding apparatus according to the first embodiment-[Fig. 12] spectrum according to the first embodiment
  • Fig. 13 shows an internal configuration of a decoding unit-[Fig. 13] A diagram showing a decoded spectrum generated by the filtering unit according to the first embodiment.
  • FIG. 14A A block diagram showing the main configuration of the transmitting side when the coding apparatus according to Embodiment 1 is applied to a wired communication system.
  • FIG. 14B A block diagram showing the main configuration of the receiving side when the decoding apparatus according to Embodiment 1 is applied to a wired communication system.
  • FIG. 15 A block diagram showing the main configuration of a spectrum encoding unit according to Embodiment 2.
  • FIG. 16 For explaining an outline of filtering using a filter according to Embodiment 2.
  • FIG. 17 shows the main configuration of a spectral code interface according to Embodiment 3
  • FIG. 18 shows the main configuration of a spectrum decoding interface according to Embodiment 4
  • FIG. 19 Showing the main configuration of the spectral decoding system according to mode 5-the best mode for carrying out the invention
  • the present inventor has noted the characteristics of an audio signal, an audio signal, and the like (hereinafter collectively referred to as an acoustic signal), that is, the point that the acoustic signal forms a harmonic structure in the frequency axis direction, The present inventors have found that it is possible to code the spectrum of the remaining band using the spectrum of a part of the spectrum of the entire frequency band, and to make the present invention.
  • the gist of the present invention when encoding the signal spectrum divided into two frequency bands, that is, the high band and the low band, for example, the gist of the present invention is not limited to the high band for the spectrum of the high band.
  • the similarity of the spectrum of both the part and the low band is obtained, and the parameter itself representing this similarity is encoded.
  • FIG. 3 is a block diagram showing the main configuration of radio transmitting apparatus 130 when the code apparatus according to Embodiment 1 of the present invention is mounted on the transmitting side of the radio communication system.
  • the wireless transmission device 130 includes an encoding device 120, an input device 131, an AZD conversion device 132, an RF modulation device 133, and an antenna 134.
  • the input device 131 converts the sound wave W11 heard by the human ear into an analog signal which is an electrical signal, and outputs the analog signal to the AZD conversion device 132.
  • the AZD converter 132 converts this analog signal into a digital signal and outputs the digital signal to the encoder 120.
  • the coder 120 codes the input digital signal to generate a coder signal, which is output to the RF modulator 133.
  • the RF modulator 133 modulates the coded signal to generate a modulated coded signal, and outputs the modulated coded signal to the antenna 134.
  • the antenna 134 transmits the modulation coded signal as radio wave W12
  • FIG. 4 is a block diagram showing an internal configuration of the above-mentioned coder device 120. As shown in FIG. Here, the case of hierarchical coding (scalable coding) will be described as an example.
  • Code decoding apparatus 120 includes input terminal 121, downsampling section 122, first layer code decoding section 123, first layer decoding section 124, upsampling section 125, delay section 126, and spectrum. It has an encoding unit 100, a multiplexing unit 127, and an output terminal 128.
  • a signal with an effective frequency band of 0 ⁇ k ⁇ FH is input to the input terminal 121 from the AZD conversion device 132.
  • the down-sampling unit 122 down-samples the signal input through the input terminal 121 to generate and output a signal with a low sampling rate.
  • the first layer coder unit 123 codes the down-sampled signal and outputs the obtained coder code to the multiplexer unit (multiplexer) 127 and performs first layer decoding. Also output to section 124.
  • the first layer decoding unit 124 generates a decoded signal of the first layer based on this code ⁇ code.
  • the up-sampling unit 125 increases the sampling rate of the decoded signal of the first layer coding unit 123.
  • delay section 126 delays the signal input via input terminal 121 by a predetermined length.
  • the magnitude of this delay is equal to the time delay that occurs when the signal passes through the downsampling unit 122, the first layer coding unit 123, the first layer decoding unit 124, and the upsampling unit 125.
  • a spectral code input unit 100 generates a spectral code signal by using the signal output from the up-sampling unit 125 as the first signal and the signal output from the delay unit 126 as the second signal, and generates the code
  • the ⁇ code is output to the multiplexing unit 127.
  • the multiplexing unit 127 multiplexes the code obtained with the first layer code 123 and the code obtained with the spectrum code unit 100, and outputs the result as an output code through the output terminal 128. .
  • This output code is given to the RF modulator 133.
  • FIG. 5 is a block diagram showing an internal configuration of the above-mentioned spectrum coding unit 100. As shown in FIG.
  • Spectrum coding section 100 includes input terminals 102 and 103, frequency domain conversion sections 104 and 105, internal state setting section 106, filtering section 107, search section 108, pitch coefficient setting section 109, and filter coefficient calculation section 110. , And an output terminal 111.
  • the first signal from the up-sampling unit 125 is input to the input terminal 102.
  • This first signal is a signal decoded by the first layer decoding unit 124 using the coding parameters encoded by the first layer coding unit 123, and the effective frequency band is 0 ⁇ k ⁇ It is FL.
  • the second signal of effective frequency band power SO ⁇ k ⁇ FH (but, FL and FH) is input from the delay unit 126.
  • the frequency domain conversion unit 104 performs frequency conversion on the first signal input from the input terminal 102, and calculates a first spectrum Sl (k). Further, the frequency domain conversion unit 105 performs frequency conversion on the second signal input from the input terminal 103 to calculate a second spectrum S2 (k).
  • a method of frequency conversion discrete Fourier transform (DFT), discrete cosine transform (DCT), modified discrete cosine transform (MDCT), etc. are applied.
  • the internal state setting unit 106 sets the internal state of the filter used by the filtering unit 107 using the first spectrum Sl (k) whose effective frequency band is 0 ⁇ k ⁇ FL. This setting will be explained again later.
  • Pitch coefficient setting section 109 searches pitch coefficient T in a predetermined search range T.
  • the signal is sequentially output to the filtering unit 107 while changing it little by little at max of min-1 T.
  • the filtering unit 107 performs filtering of the second spectrum based on the internal state of the filter set by the internal state setting unit 106 and the pitch coefficient T output from the pitch coefficient setting unit 109. Calculate the estimated value S'2 (k) of the spectrum. Details of this filtering process will be described later.
  • the search unit 108 calculates the similarity between the second spectrum S 2 (k) output from the frequency domain conversion unit 105 and the estimated value S ′ 2 (k) of the second spectrum output from the filtering unit 107.
  • the degree of similarity which is a parameter to be shown, is calculated. The degree of similarity will be described in detail later.
  • the calculation process of the similarity is performed every time the pitch coefficient T is given from the pitch coefficient setting unit 109, and the pitch coefficient T ′ (T
  • the range of min T T is the filter coefficient calculation max
  • the filter coefficient calculation unit 110 obtains the filter coefficient j 8 using the pitch coefficient T, which is given from the search unit 108, and outputs the filter coefficient j 8 via the output terminal 111. At this time, the pitch coefficient T 'is simultaneously output via the output terminal 111.
  • FIG. 6 is a diagram for describing an overview of the filtering process of the filtering unit 107.
  • Equation 1 ⁇ ⁇ conversion variable
  • a coefficient given by the pitch coefficient setting unit 109
  • 1.
  • the first spectrum Sl (k) is stored as the internal state of the filter.
  • the estimated value S'2 (k) of the second spectrum obtained by the following procedure is stored in the range of FL ⁇ k ⁇ FH of S (k).
  • S '2 (k) a spectrum S (k-T) of a frequency lower than k by T is separated by a filtering process into a spectrum S (k-T i) in the vicinity separated by i about this spectrum.
  • the filter coefficient beta and beta iota regarded as 0, the following equation based on the least square error method
  • FIG. 7A-FIG. 7E show that as the pitch coefficient T changes, the estimated value S '2 (k) of the second spectrum It is a figure for demonstrating how a spectrum changes.
  • FIG. 7A is a diagram showing a first spectrum having a harmonic structure stored as an internal state. Also, Fig. 7B-Fig. 7D show that three pitch coefficients T, T, T are used to
  • FIG. 16 is a diagram showing the spectrum of the estimated value S′2 (k) of the second spectrum calculated by performing the through filtering.
  • FIG. 7E shows the second spectrum S2 (k) for comparison with the spectrum of the estimated value S'2 (k).
  • FIGS. 8A-8E are also similar to FIGS. 7A-7E.
  • the phase of the first spectrum stored as the internal state is different from FIGS. 7A-7E.
  • the pitch coefficient T at which the harmonic structure is maintained is T.
  • changing the pitch coefficient T and finding the T with the highest similarity means finding the pitch (or its integer multiple) of the harmonic structure of the spectrum with a '' and '' error.
  • the coding apparatus calculates the estimated value S'2 (k) of the second spectrum based on the pitch of the harmonic structure, so that the section between the first spectrum and the estimated spectrum is calculated.
  • the pitch coefficient T represents an integer multiple (integer value) of the frequency interval of the spectrum data.
  • the pitch of an actual harmonic structure is often a non-integer value. Therefore, the pitch of the harmonic structure of the non-integer value in the range from TM to T + M can be obtained by weighting and adding M neighboring data around T around T by selecting an appropriate weighting coefficient
  • FIG. 9 is a flow chart showing an example of a series of algorithm of each processing performed in filtering section 107, search section 108 and pitch coefficient setting section 109. Since the outline of these processes has already been described, the detailed description of the flow is omitted.
  • the filter coefficient calculation unit 110 uses the pitch coefficient T provided from the search unit 108 to calculate
  • the filter coefficient calculation unit 110 has a plurality of combinations of
  • 8 (i ⁇ 1, 0, 1) as a data table in advance, and the square distortion E of the above (Equation 4) is Determine the combination of
  • 8 (i -l, 0, 1) to be minimized and output its index.
  • the shape of the high-pass spectrum is estimated using the filtering unit 107 having the low-pass spectrum as the internal state with respect to the spectrum of ⁇ , and the parameters representing the filter characteristics of the filtering unit 107 are used instead of the high-pass spectrum. Since the code is outputted, it is possible to code the space with high quality at a low bit rate.
  • pitch coefficient setting section 109 determines the low-pass vector used as a reference for estimation and the high-pass vector. Since the frequency difference with the low-pass spectrum, that is, the pitch coefficient T, is variously changed and outputted, the search unit 108 detects T where the similarity between the low-pass spectrum and the high-pass spectrum is maximum. Based on the pitch of the wave structure, the shape of the high band spectrum can be estimated, and coding can be performed while maintaining the harmonic structure of the whole spectrum.
  • the bandwidth of the low-pass spectrum can be arbitrarily set so as not to be equal to the pitch of the harmonic structure (or its integral multiple). According to the above configuration, the spectrum is smoothly connected at the connection portion between the low band spectrum and the high band spectrum, even if the operation for aligning to the pitch of the harmonic structure is not performed.
  • the coding apparatus performing hierarchical coding has been described as an example in the present embodiment, the above-described spectrum coding section 100 performs coding in another system. It is also possible to implement in the
  • spectral code input unit 100 has frequency domain conversion units 104 and 105
  • these are necessary when using a time domain signal as an input signal.
  • the frequency domain conversion unit is not necessary.
  • the description is given using the low-pass spectrum, that is, the low-pass spectrum as a reference, and the high-pass spectrum as an example.
  • the method of setting the reference spectrum is not limited to this.
  • is a code of the low-pass spectrum using the high-pass spectrum.
  • FIG. 10 is a block diagram showing a main configuration of wireless reception device 180 that receives a signal transmitted from wireless transmission device 130.
  • the wireless receiver 180 includes an antenna 181, an RF demodulator 182, a decoder 170, a DZA converter 183, and an output device 184.
  • the antenna 181 receives a digital encoded acoustic signal as the radio wave W12, generates a digital reception code of the electric signal, and generates an acoustic signal, and supplies it to the RF demodulator 182.
  • the RF demodulator 182 demodulates the received coded acoustic signal from the antenna 181 to generate a demodulated coded acoustic signal and supplies it to the decoder 170.
  • Decoding device 170 receives the digital demodulated and encoded acoustic signal from RF demodulator 182 and performs a decoding process to generate a digital decoded audio signal to generate DZA converter 183. give.
  • the DZA converter 183 converts the digital decoded audio signal from the decoder 170 into an analog decoded audio signal and supplies it to the output device 184.
  • the output device 184 converts an analog decoded sound signal, which is an electrical signal, into air vibration and outputs it as a sound wave W13 so as to be heard by the human ear.
  • FIG. 11 is a block diagram showing an internal configuration of the decoding device 170 described above.
  • the case of decoding a hierarchically encoded signal will be described as an example.
  • the decoding apparatus 170 includes an input terminal 171, a separating unit 172, a first layer decoding unit 173, an gap sampling unit 174, a spectrum decoding unit 150, and output terminals 176 and 177.
  • a digital demodulation code ⁇ ⁇ acoustic signal from the RF demodulator 182 is input to the input terminal 171.
  • the separation unit 172 separates the demodulated coded acoustic signal input through the input terminal 171, and generates a code code for the first layer decoding unit 173 and a coding code for the spectrum decoding unit 150.
  • First layer decoding section 173 decodes the decoded signal in signal band 0 ⁇ k ⁇ FL using the coding code obtained in demultiplexing section 172, and supplies this decoded signal to upsampling section 174. .
  • the other output is connected to the output terminal 176. As a result, when it is necessary to output the first layer decoded signal generated by the first layer decoding unit 173, the signal can be output through the output terminal 176.
  • the up-sampling unit 174 raises the sampling frequency of the first layer decoded signal supplied from the first layer decoding unit 173.
  • Spectrum decoding section 150 is supplied with the code code separated by separation section 172 and the up-sampled first layer decoded signal generated by up sampling section 174.
  • Spectrum decoding section 150 performs spectrum decoding, which will be described later, to generate a decoded signal of signal band 0 ⁇ k ⁇ FH, and outputs the decoded signal via output terminal 177.
  • Spectrum decoding section 150 processes the up-sampled first layer decoded signal supplied from up-sampling section 174 as a first signal.
  • the first layer decoded signal generated by first layer decoding section 173 when it is necessary to output the first layer decoded signal generated by first layer decoding section 173, it can be output from output terminal 176. Also, when it is necessary to output the output signal of the higher quality spectrum decoding unit 150, it can be output from the output terminal 177.
  • the signal from either the output terminal 176 or the output terminal 177 is output from the decoding device 170 and supplied to the DZA converter 183. . Which signal is output is based on the setting of the application or the user's decision.
  • FIG. 12 is a block diagram showing an internal configuration of spectrum decoding section 150 described above.
  • Spectrum decoding section 150 includes input terminals 152 and 153, frequency domain conversion section 154, internal state setting section 155, filtering section 156, time domain conversion section 158, and output terminal 1.
  • An input terminal 152 is inputted through a filter coefficient force separating unit 172 representing a code ⁇ code encoded by the spectrum code 100 unit 100. Furthermore, a first signal with an effective frequency band of 0 ⁇ k ⁇ FL is input to the input terminal 153. This first signal is obtained by upsampling by the upsampling unit 174 the first layer decoded signal decoded by the first layer decoding unit 173.
  • the frequency domain conversion unit 154 performs frequency conversion on the time domain signal input from the input terminal 153 to calculate a first space Sl (k).
  • the frequency conversion method uses discrete Fourier transform (DFT), discrete cosine transform (DCT), modified discrete cosine transform (MDCT) or the like.
  • the internal state setting unit 155 sets the internal state of the filter to be used by the filtering unit 156, using the first spectrum Sl (k).
  • Filtering section 156 performs filtering of the first spectrum based on the internal state of the filter set by internal state setting section 155, pitch coefficient T given from input terminal 152, and filter coefficient j8, Calculate the estimated value S'2 (k) of the second spectrum.
  • the filtering unit 156 uses the filter function described in (Expression 1).
  • the time domain conversion unit 158 converts the decoded spectrum S ′ (k) obtained by the filtering unit 156 into a signal in the time domain, and outputs the signal via the output terminal 159.
  • appropriate processing such as windowing and superposition addition is performed as necessary to avoid discontinuities occurring between frames.
  • FIG. 13 is a diagram showing the decoded spectrum S ′ (k) generated in the filtering unit 156.
  • the decoded spectrum S ′ (k) of the frequency band 0 ⁇ k ⁇ FL is constituted by the first spectrum Sl (k), and the decoding of the frequency band FL ⁇ k ⁇ FH
  • the spectrum S '(k) is constituted by the estimate S'2 (k) of the second spectrum.
  • the encoding apparatus or the decoding apparatus according to the present embodiment is applied to a wireless communication system
  • the coding apparatus or the decoding apparatus according to the present embodiment is described.
  • the standardization device can also be applied to a wired communication system as described below.
  • FIG. 14A is a block diagram showing the main configuration on the transmitting side when the coding apparatus according to the present embodiment is applied to a wired communication system.
  • the same components as those shown in FIG. 3 are designated by the same reference numerals, and the description thereof will be omitted.
  • the wired transmission device 140 has an encoding device 120, an input device 131, and an AZD conversion device 132, and the output is connected to the network N1.
  • the input terminal of the AZD conversion device 132 is connected to the output terminal of the input device 131.
  • the input terminal of the code device 120 is connected to the output terminal of the AZD converter 132.
  • the output terminal of the code device 120 is connected to the network N1.
  • the input device 131 converts the sound wave W11 that can be heard by the human ear into an analog signal that is an electrical signal, and supplies the analog signal to the AZD conversion device 132.
  • the AZD converter 132 converts an analog signal into a digital signal and supplies the digital signal to the coder 120.
  • the coder unit 120 codes the input digital signal to generate a code, and outputs the code to the network N1.
  • FIG. 14B is a block diagram showing the main configuration on the receiving side when the decoding apparatus according to the present embodiment is applied to a wired communication system.
  • the same components as those shown in FIG. 10 are designated by the same reference numerals, and the description thereof will be omitted.
  • Wired receiver 190 has receiver 191 connected to network N 1, decoder 170, DZA converter 183, and output device 184.
  • An input terminal of the receiving device 191 is connected to the network N1.
  • the input terminal of the decoder 170 is connected to the output terminal of the receiver 191.
  • the input terminal of the DZA converter 183 is connected to the output terminal of the decoder 170.
  • the input terminal of the output device 184 is connected to the output terminal of the DZA converter 183.
  • Receiving apparatus 191 receives the digital coded audio signal from network Nl, generates a digital received audio signal, and provides it to decoding apparatus 170.
  • Decoding apparatus 170 receives the received acoustic signal from receiving apparatus 191, performs decoding processing on the received acoustic signal, generates a digital decoded audio signal, and provides DZA converting apparatus 183.
  • the DZA conversion unit 183 converts the digital decoded speech signal from the decoding unit 170 to generate an analog decoded speech signal and supplies it to the output unit 184.
  • the output device 184 converts an analog decoded acoustic signal, which is an electrical signal, into air vibration and outputs it as a sound wave W13 so as to be heard by the human ear.
  • FIG. 15 is a block diagram showing the main configuration of spectrum coding section 200 in the coding apparatus according to Embodiment 2 of the present invention.
  • the spectrum coding unit 200 has the same basic configuration as the spectrum coding unit 100 shown in FIG. 5, and the same components are denoted by the same reference numerals and the description thereof will be described. I omit it.
  • a feature of the present embodiment is to make the filter function used in the filtering unit simpler than that of the first embodiment.
  • the filter function used in filtering section 201 is
  • FIG. 16 is a diagram for describing an overview of filtering using the above-described filter.
  • the estimated value S ′ 2 (k) of the second spectrum is obtained by sequentially copying low-pass spectra separated by ⁇ . Further, the search unit 108 determines the optimum pitch coefficient T ′ by searching for the pitch coefficient T that minimizes E in (Expression 3) as in the first embodiment.
  • the pitch coefficient T 'thus obtained is output through the output terminal 111. This configuration allows the The characteristics of the pitch will be determined only by the pitch factor T.
  • the filter of the present embodiment is an adaptive codebook (adaptive codebook) which is one of the components of the CE LP (Code-Excited Linear Prediction) system, which is a typical technology of low rate speech codes. It is characterized in that it operates in the same way as).
  • CE LP Code-Excited Linear Prediction
  • This spectrum decoding unit has the same configuration as spectrum decoding unit 150 shown in FIG. 12, and thus detailed description will be omitted, but it has the following features. . That is, when calculating the estimated value S ′ 2 (k) of the second spectrum, the filtering unit 156 uses not the filter function described in (Expression 1) but the filter function described in (Expression 5). Only the pitch coefficient T 'is given from the input terminal 152. That is, which of the filter functions described in (Expression 1) or (Expression 5) is used depends on the type of the filter function used on the side of the code, and the same filter function as the filter function is used. .
  • the filter function used in the filtering unit can be simplified, so that it is not necessary to install the filter coefficient calculation unit, and the second spectrum can be generated with a small amount of calculation. It is possible to estimate (high frequency spectrum) and to reduce / scale the circuit size.
  • FIG. 17 is a block diagram showing the main configuration of spectrum coding section 300 in the coding apparatus according to Embodiment 3 of the present invention.
  • the spectrum coding unit 300 has the same basic configuration as the spectrum coding unit 100 shown in FIG. 5, and the same components are denoted by the same reference numerals and the description thereof will be described. I omit it.
  • the feature of the present embodiment is that it further includes an envelope calculation unit 301 and a multiplexing unit 302, and further performs encoding of envelope information of the second spectrum after estimation of the second vector is performed. I will.
  • the search unit 108 outputs the optimum pitch coefficient T ′ to the multiplexing unit 302 and outlines the estimated value S ′ 2 (k) of the second spectrum generated using this pitch coefficient T ′. Output to calculation unit 301.
  • the rough shape calculation unit 301 receives the second spectrum S2 (k).
  • the envelope information of the second spectrum S2 (k) is calculated based on.
  • this envelope information is represented by a spectral band for each sub-band, and the case where the frequency band FL ⁇ k ⁇ FH is divided into J sub-bands will be described as an example.
  • the spectral bandwidth of the j-th subband is
  • B (j) S2 (kf (equation 6) where BL1 represents the minimum frequency of the j-th subband and BH (j) represents the maximum frequency of the j-th subband.
  • Subband information of the second spectrum obtained in this way is regarded as spectral envelope information of the second spectrum.
  • the variation V (j) is sign-coded to obtain the variation V (j) after the sign, and the index is sent to the multiplexing unit 302.
  • the multiplexing unit 302 multiplexes the optimum pitch coefficient T ′ obtained from the searching unit 108 and the index of the fluctuation amount V (j) output from the rough shape calculating unit 301 and outputs the multiplexed result via the output terminal 111.
  • the envelope information of the high band spectrum is also encoded after estimation of the high band spectrum, so that the accuracy of the estimated value of the high band spectrum is improved.
  • FIG. 18 shows spectrum decoding unit 550 in the decoding apparatus according to the fourth embodiment of the present invention. It is a block diagram showing the main composition.
  • the spectrum decoding unit 550 has the same basic configuration as the spectrum decoding unit 150 shown in FIG. 12, and the same components are denoted by the same reference numerals and the description thereof will be described. I omit it.
  • a feature of the present embodiment is that it further includes a separating unit 551, a spectral envelope decoding unit 552, and a spectrum adjusting unit 553.
  • the separating unit 551 separates the encoded code input through the input terminal 152, provides the information on the filtering coefficient to the filtering unit 156, and the information on the spectral envelope to the spectral envelope decoding unit 552. give.
  • Spectrum envelope decoding section 552 decodes variation amount V (j) obtained by coding variation amount V (j) from the spectrum envelope information given from separation unit 551. Ask.
  • Spectrum adjusting section 553 sets the decoded spectrum S ′ (k) obtained from filtering section 156 to the variation V (j) of each decoded subband obtained from spectrum envelope decoding section 552 by the following equation
  • the spectral envelope information given from separating section 551 is a value obtained by coding the amount of fluctuation V (j) for each subband shown in (Expression 8).
  • the power spectrum envelope information described with the case of (j) as an example is not limited to this.
  • FIG. 19 shows a spectrum decoding unit 650 in the decoding apparatus according to the fifth embodiment of the present invention. It is a block diagram showing the main composition.
  • the spectrum decoding unit 650 has the same basic configuration as the spectrum decoding unit 550 shown in FIG. 18, and the same components are denoted by the same reference numerals, and the description thereof is omitted. Do.
  • the feature of the present embodiment is further provided with an LPC spectrum calculation unit 652, and after the second spectrum is estimated using the LPC spectrum calculated by the LPC coefficient as spectrum envelope information, the second spectrum is obtained. By multiplying the LPC spectrum by the LPC spectrum, a more accurate estimate of the second spectrum is obtained.
  • LPC spectrum calculation unit 652 calculates LPC spectrum env (k) from LPC coefficient oc (j) input through input terminal 651 by the following equation
  • NP represents the order of LPC coefficients.
  • the LPC spectrum env (k) can also be determined by changing the characteristics of the LPC spectrum using the variable ⁇ (0 ⁇ 1). In this case, the LPC spectrum env (k) is
  • can be defined as a fixed value or can be variable for each frame.
  • the LPC spectrum env (k) thus calculated is output to the spectrum adjustment unit 553.
  • Spectrum adjusting section 553 sets LPC spectrum env (k) obtained from LPC spectrum calculating section 652 to decoded spectrum S '(k) obtained from filtering section 156 by the following equation
  • the spectrum is adjusted in the frequency band FL ⁇ k ⁇ FH of the decoded spectrum S ′ (k) to generate the adjusted decoded spectrum S3 (k).
  • the adjusted decoded spectrum S3 (k) is supplied to the time domain conversion unit 158 and converted to a time domain signal.
  • the LPC spectrum is used as spectrum envelope information, it is possible to obtain a more accurate estimated value of the second spectrum.
  • the code device or the decoding device according to the present invention can also be mounted on a communication terminal device and a base station device in a mobile communication system, and thereby has the same operation effect as described above.
  • a communication terminal apparatus and a base station apparatus can be provided.
  • the coding apparatus and the decoding apparatus according to the present invention have an effect of coding at a low bit rate, and can be applied to applications such as a wireless communication system.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Closures For Containers (AREA)

Abstract

 スペクトルの調波構造に乱れを生じさせず、低ビットレートで高品質にスペクトルを符号化することができる符号化装置。この装置において、内部状態設定部(106)は、第1スペクトルS1(k)を使ってフィルタリング部(107)の内部状態を設定する。ピッチ係数設定部(109)は、ピッチ係数Tを少しずつ変化させながら出力する。フィルタリング部(107)は、ピッチ係数Tに基づいて第2スペクトルS2(k)の推定値S'2(k)を算出する。探索部(108)は、S2(k)とS'2(k)の類似度を算出する。このとき、算出される類似度が最大となるピッチ係数T’がフィルタ係数算出部(110)に与えられる。フィルタ係数算出部(110)は、このピッチ係数T’を用いてフィルタ係数βiを求める。  

Description

明 細 書
符号化装置および復号化装置
技術分野
[0001] 本発明は、無線通信装置等に搭載され、音声信号、オーディオ信号等の符号化を 行う符号ィ匕装置およびこの符号ィ匕信号の復号を行う復号ィ匕装置に関する。
背景技術
[0002] 音声信号、オーディオ信号等を低ビットレートの信号に圧縮する符号ィ匕技術は、移 動体通信システムにお 、ては、電波等の伝送路容量(回線容量)および記録媒体を 有効利用するという観点力 特に重要である。
[0003] 音声信号を符号化する音声符号化の方式に、 ITU-T (International
Telecommunication Union Telecommunication Standardization sector)で規格ィ匕 れ ている G726、 G729等の方式が存在する。これらの方式は、狭帯域信号 (300Hz— 3.4kHz)を符号化の対象とし、 8kbit/s— 32kbit/sのビットレートで高品質な符号化を 行うことができる。しかし、このような狭帯域信号は周波数帯域が最大 3.4kHzまでと狭 いため、その品質は聴取者に音がこもっている印象を与え、臨場感に欠けるという問 題がある。
[0004] また、広帯域信号 (50Hz— 7kHz)を符号化の対象とする音声符号化方式も存在する 。この代表的な例として、 ITU—Tの G722、 G722. 1や、 3GPP(The 3rd Generation Partnership Project)の AMR— WB等がある。これらの方式は、ビットレートが
6.6kbit/s— 64kbit/sで広帯域音声信号の符号ィ匕を行うことができる。しかし、符号ィ匕 の対象とする信号が音声の場合、広帯域信号は比較的高品質であるものの、オーデ ィォ信号を対象とした場合や音声信号でもさらに高臨場感な品質が求められる場合 には十分ではない。
[0005] 一方、一般的には、信号の最大周波数が 10— 15kHz程度までであると、 FMラジオ 相当の臨場感が得られ、 20kHz程度までであれば CD (コンパクト 'ディスク)並みの品 質が得られる。このような信号に対しては、 MPEG (Moving Picture Expert Group)で 規格ィ匕されているレイヤ III方式や AAC方式等に代表されるオーディオ符号ィ匕が適し ている。しかし、これらのオーディオ符号ィ匕方式は、符号ィ匕の対象となる信号の周波 数帯域が広くなるため、符号化された信号のビットレートが大きくなるという問題があ る。
[0006] 従来の符号化技術として、周波数帯域の広!ヽ信号を低ビットレートで符号化する技 術がある (例えば、特許文献 1参照)。これによれば、入力信号を低域部の信号と高 域部の信号とに分け、高域部の信号のスペクトルを低域部の信号のスペクトルで置 換することにより符号ィ匕して、全体のビットレートを低減させる。
[0007] 図 1A—図 1Dは、上記の高域部のスペクトルを低域部のスペクトルで置換する処理 の概要を示す図である。なお本来は、この処理は符号化処理と組み合わせて行われ るものであるが、ここでは説明を簡単にするために、原信号に上記の処理を施す場 合を例にとって述べる。
[0008] 図 1Aは、周波数帯域力O≤k<FHに帯域制限された原信号のスペクトル、図 1B は、同信号を 0≤k<FLに帯域制限したときのスペクトル (ただし、 FLく FH)、図 1C は、上記の技術により低域 (低周波帯域)のスぺ外ルを用いて高域 (高周波帯域)の スペクトルを置換して得られたスペクトル、図 1Dは、置換後のスペクトルをスペクトル 包絡情報に従い置換スペクトルの形状を整えることにより得られるスペクトルを表して いる。これらの図において、横軸は周波数、縦軸はスペクトル強度を表す。
[0009] この技術では、周波数帯域力O≤k<FHの原信号のスペクトル(図 1A)を周波数帯 域が 0≤k<FLの低域のスペクトル(図 1B)を用いて表現することが行われる。具体 的には、高域のスペクトル(FL≤k<FH)が、低域のスペクトル (0≤k<FL)によって 置換される。この処理の結果、図 1Cに示すようなスペクトルが得られる。なお、ここで は、説明を簡単にするために、 FL = FHZ2の関係である場合を例にとって説明して いる。そして、原信号のスペクトル包絡情報に従い、図 1Cのスペクトルの高域のスぺ タトルの振幅値が調整され、図 1Dに示すようなスペクトルが得られる。これが原信号 のスペクトルを推定したスペクトルである。
特許文献 1 :特表 2001-521648号公報 (第 15頁、第 1図、第 2図)
発明の開示
発明が解決しょうとする課題 [0010] 一般に、音声信号、オーディオ信号等のスペクトルは、ある周波数の整数倍に(所 定のピッチごとに)スペクトルのピークが現れる調波構造を持つことが知られている。 この調波構造は、音声信号、オーディオ信号等の品質を保つ上で重要な情報であり 、調波構造に乱れが生じると品質の劣化が聴取者に知覚されることとなる。
[0011] 図 2Aおよび図 2Bは、従来技術の問題点を説明するための図である。
[0012] 図 2Aは、オーディオ信号をスペクトル分析することにより得られたスペクトルである。
この図からわ力るように、原信号には周波数軸上の間隔 Tからなる調波構造が見られ る。一方、図 2Bは、上記の技術に従い、原信号のスペクトルを推定した結果得られた スペクトルである。これら 2つのスペクトルを比較すると、図 2Bのスペクトルは、置換元 の低域スペクトル S1と置換先の高域スペクトル S2では調波構造が保持されているが 、低域スペクトル S1と高域スペクトル S2の接続部 (スペクトル S3)では調波構造が崩 れていることがわ力る。
[0013] この推定スペクトルを時間信号に変換して試聴すると、このような調波構造の乱れ によって、聴取者は品質劣化を知覚することとなり問題である。この調波構造の乱れ は、調波構造の形状を考慮せずに置換が行われたことに起因して 、る。
[0014] 本発明の目的は、スペクトルの調波構造に乱れを生じさせず、低ビットレートで高品 質にスぺ外ルを符号ィ匕することができる符号ィ匕装置およびこの符号ィ匕信号を復号 することができる復号ィ匕装置を提供することである。
課題を解決するための手段
[0015] 本発明の符号ィ匕装置は、低周波帯域および高周波帯域の 2つの帯域に分けられ たスペクトルを取得する取得手段と、取得された低周波帯域の前記スペクトルと取得 された高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトル の調波構造に基づいて算出する算出手段と、取得された高周波帯域の前記スぺタト ルの代わりに、算出された前記類似具合を示すパラメータを符号ィ匕する符号ィ匕手段 と、を具備する構成を採る。
[0016] 本発明の復号ィ匕装置は、低周波帯域および高周波帯域の 2つの帯域に分けられ たスペクトルのうちの低周波帯域のスペクトルを取得するスペクトル取得手段と、低周 波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメ一 タを取得するパラメータ取得手段と、取得された低周波帯域の前記スペクトルおよび 前記パラメータを用いて低周波帯域および高周波帯域の前記スペクトルを復号する 復号化手段と、を具備する構成を採る。
[0017] 本発明の符号ィ匕方法は、低周波帯域および高周波帯域の 2つの帯域に分けられ たスペクトルを取得する取得ステップと、取得された低周波帯域の前記スペクトルと取 得された高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スぺタト ルの調波構造に基づいて算出する算出ステップと、取得された高周波帯域の前記ス ベクトルの代わりに、算出された前記類似具合を示すパラメータを符号ィ匕する符号ィ匕 ステップと、を具備するようにした。
[0018] 本発明の復号ィ匕方法は、低周波帯域および高周波帯域の 2つの帯域に分けられ たスペクトルのうちの低周波帯域のスペクトルを取得するスペクトル取得ステップと、 低周波帯域の前記スぺ外ルと高周波帯域の前記スペクトルとの類似具合を示すパ ラメータを取得するパラメータ取得ステップと、取得された低周波帯域の前記スぺタト ルおよび前記パラメータを用いて低周波帯域および高周波帯域の前記スペクトルを 復号する復号化ステップと、を具備するようにした。
発明の効果
[0019] 本発明によれば、スペクトルの調波構造を崩さずに、低ビットレートで高品質にスぺ タトルを符号ィ匕することができる。また、この符号化信号を復号した際の音質も向上さ せることができる。
図面の簡単な説明
[0020] [図 1]従来の高域部のスペクトルを低域部のスペクトルで置換する処理の概要を示す 図
[図 2]従来技術の問題点を説明するための図
[図 3]実施の形態 1に係る無線送信装置の主要な構成を示- [図 4]実施の形態 1に係る符号ィ匕装置の内部構成を示- [図 5]実施の形態 1に係るスペクトル符号ィ匕部の内部構成を示- [図 6]実施の形態 1に係るフィルタリング部のフィルタリング処理の概要を説明するた めの図 [図 7]ピッチ係数 Tが変化するに伴 、第 2スペクトルの推定値のスペクトルがどのように 変化するかを説明するための図
[図 8]ピッチ係数 Τが変化するに伴 、第 2スペクトルの推定値のスペクトルがどのように 変化するかを説明するための図
[図 9]実施の形態 1に係るフィルタリング部、探索部、ピッチ係数設定部において行わ れる各処理の一連のアルゴリズムの一例を示したフロー図
[図 10]実施の形態 1に係る無線受信装置の主要な構成を示- [図 11]実施の形態 1に係る復号化装置の内部構成を示- [図 12]実施の形態 1に係るスペクトル復号ィ匕部の内部構成を示- [図 13]実施の形態 1に係るフィルタリング部において生成される復号スペクトルを示し た図
[図 14A]実施の形態 1に係る符号化装置が有線通信システムに適用された場合の送 信側の主要な構成を示したブロック図
[図 14B]実施の形態 1に係る復号ィ匕装置が有線通信システムに適用された場合の受 信側の主要な構成を示したブロック図
[図 15]実施の形態 2に係るスペクトル符号ィ匕部の主要な構成を示すブロック図
[図 16]実施の形態 2に係るフィルタを用いたフィルタリングの概要を説明するための
[図 17]実施の形態 3に係るスペクトル符号ィ匕部の主要な構成を示- [図 18]実施の形態 4に係るスペクトル復号ィ匕部の主要な構成を示- [図 19]実施の形態 5に係るスペクトル復号ィ匕部の主要な構成を示- 発明を実施するための最良の形態
[0021] 本発明者は、音声信号、オーディオ信号等 (以下、総称して音響信号という)の特 性、すなわち、音響信号が周波数軸方向に調波構造を形成している点に着目し、全 周波数帯域のスペクトルのうち、一部の帯域のスペクトルを用いて残りの帯域のスぺ タトルを符号ィ匕できることを見出して本発明をするに至った。
[0022] すなわち、本発明の骨子は、例えば、高域部および低域部の 2つの周波数帯域に 分けられた信号スペクトルを符号化する際に、高域部のスペクトルに対しては、高域 部および低域部の双方のスペクトルの類似具合を求め、この類似具合を表すパラメ ータ自体を符号化することである。
[0023] 以下、本発明の実施の形態について、図面を参照して詳細に説明する。
[0024] (実施の形態 1)
図 3は、本発明の実施の形態 1に係る符号ィ匕装置が無線通信システムの送信側に 搭載された場合の無線送信装置 130の主要な構成を示すブロック図である。
[0025] この無線送信装置 130は、符号化装置 120、入力装置 131、 AZD変換装置 132 、 RF変調装置 133、およびアンテナ 134を有する。
[0026] 入力装置 131は、人間の耳に聞こえる音波 W11を電気的信号であるアナログ信号 に変換し、 AZD変換装置 132に出力する。 AZD変換装置 132は、このアナログ信 号をディジタル信号に変換し、符号化装置 120に出力する。符号ィ匕装置 120は、入 力されたディジタル信号を符号ィ匕して符号ィ匕信号を生成し、 RF変調装置 133に出 力する。 RF変調装置 133は、符号化信号を変調して変調符号化信号を生成し、アン テナ 134に出力する。アンテナ 134は、変調符号化信号を電波 W12として送信する
[0027] 図 4は、上記の符号ィ匕装置 120の内部構成を示すブロック図である。ここでは、階 層符号化 (スケーラブル符号化)を行う場合を例にとって説明する。
[0028] 符号ィ匕装置 120は、入力端子 121、ダウンサンプリング部 122、第 1レイヤ符号ィ匕 部 123、第 1レイヤ復号ィ匕部 124、アップサンプリング部 125、遅延部 126、スぺタト ル符号化部 100、多重化部 127および出力端子 128を有する。
[0029] 入力端子 121には、 AZD変換装置 132から有効周波数帯域が 0≤k<FHの信号 が入力される。ダウンサンプリング部 122は、入力端子 121を介し入力された信号に ダウンサンプリングを施してサンプリングレートの低い信号を生成し、出力する。第 1レ ィャ符号ィ匕部 123は、このダウンサンプリング後の信号を符号ィ匕し、得られた符号ィ匕 コードを多重化部(マルチプレクサ) 127に出力すると共に、第 1レイヤ復号ィ匕部 124 にも出力する。第 1レイヤ復号ィ匕部 124は、この符号ィ匕コードを基に第 1レイヤの復号 信号を生成する。アップサンプリング部 125は、第 1レイヤ符号ィ匕部 123の復号信号 のサンプリングレートを上げる。 [0030] 一方、遅延部 126は、入力端子 121を介し入力される信号に対し、所定の長さの遅 延を与える。この遅延の大きさは、信号がダウンサンプリング部 122、第 1レイヤ符号 化部 123,第 1レイヤ復号ィ匕部 124、およびアップサンプリング部 125を介した際に 生じる時間遅れと同値とする。スペクトル符号ィ匕部 100は、アップサンプリング部 125 力も出力される信号を第 1信号として、また遅延部 126から出力される信号を第 2信 号としてスペクトル符号ィ匕を行 ヽ、生成した符号ィ匕コードを多重化部 127に出力する 。多重化部 127は、第 1レイヤ符号ィ匕部 123で求められる符号ィ匕コードとスペクトル符 号ィ匕部 100で求められる符号ィ匕コードを多重化し、出力コードとして出力端子 128を 介し出力する。この出力コードは、 RF変調装置 133に与えられる。
[0031] 図 5は、上記のスペクトル符号ィ匕部 100の内部構成を示すブロック図である。
[0032] スペクトル符号ィ匕部 100は、入力端子 102、 103、周波数領域変換部 104、 105、 内部状態設定部 106、フィルタリング部 107、探索部 108、ピッチ係数設定部 109、 フィルタ係数算出部 110、および出力端子 111を有する。
[0033] 入力端子 102には、アップサンプリング部 125から第 1信号が入力される。この第 1 信号は、第 1レイヤ符号ィ匕部 123で符号化された符号ィ匕パラメータを用いて第 1レイ ャ復号化部 124にて復号された信号であり、有効周波数帯域が 0≤ k< FLになって いる。また、入力端子 103には、遅延部 126から有効周波数帯域力 SO≤k<FH (ただ し、 FLく FH)の第 2信号が入力される。
[0034] 周波数領域変換部 104は、入力端子 102から入力される第 1信号に周波数変換を 行い、第 1スペクトル Sl(k)を算出する。また、周波数領域変換部 105は、入力端子 1 03から入力される第 2信号に周波数変換を行い、第 2スペクトル S2(k)を算出する。こ こで周波数変換の方法は、離散フーリエ変換 (DFT)、離散コサイン変換 (DCT)、変 形離散コサイン変換 (MDCT)等を適用する。
[0035] 内部状態設定部 106は、有効周波数帯域が 0≤k<FLの第 1スペクトル Sl(k)を使 つてフィルタリング部 107で用いられるフィルタの内部状態を設定する。この設定につ いては、後ほど再度説明する。
[0036] ピッチ係数設定部 109は、ピッチ係数 Tを予め定められた探索範囲 T
min一 T の中 max で少しずつ変化させながら、フィルタリング部 107に順次出力する。 [0037] フィルタリング部 107は、内部状態設定部 106で設定されたフィルタの内部状態と、 ピッチ係数設定部 109から出力されるピッチ係数 Tとに基づいて第 2スペクトルのフィ ルタリングを行い、第 1スペクトルの推定値 S'2(k)を算出する。このフィルタリング処理 の詳細については後述する。
[0038] 探索部 108は、周波数領域変換部 105から出力される第 2スペクトル S2(k)とフィル タリング部 107から出力される第 2スペクトルの推定値 S'2(k)との類似性を示すパラメ ータである類似度を算出する。この類似度については、後ほど詳述する。この類似度 の算出処理は、ピッチ係数設定部 109からピッチ係数 Tが与えられる度に行われ、算 出される類似度が最大となるピッチ係数 T' (T
min一 T の範囲)が、フィルタ係数算 max
出部 110に与えられる。
[0039] フィルタ係数算出部 110は、探索部 108から与えられるピッチ係数 T,を用いて、フ ィルタ係数 j8を求め、出力端子 111を介し出力する。このとき、ピッチ係数 T'も同時 に出力端子 111を介し出力される。
[0040] 次いで、スペクトル符号ィ匕部 100の主要な各部の具体的な動作について、数式を 交えながら以下詳細に説明する。
[0041] 図 6は、フィルタリング部 107のフィルタリング処理の概要を説明するための図であ る。
[0042] ここでは、全周波数帯域 (0≤k<FH)のスペクトルを便宜的に S(k)と呼び、フィルタ 関数は次式
[数 1] ) = ^ ——
1 _ βί Ζ~τ+ι … (式 1 ) で表されるものを使用する。この式において、 ζは ζ変換変数を表しており、 Τはピッ チ係数設定部 109より与えられた係数を表しており、また Μ= 1とする。
[0043] この図に示すように、 S(k)の 0≤k<FLの帯域には、第 1スペクトル Sl(k)がフィルタ の内部状態として格納されている。一方、 S(k)の FL≤k<FHの帯域には、以下の手 順により求められた第 2スペクトルの推定値 S'2(k)が格納される。 [0044] S'2(k)には、フィルタリング処理により、 kより Tだけ低い周波数のスペクトル S(k— T) に、このスペクトルを中心として iだけ離れた近傍のスペクトル S(k— T i)に所定の重み 付け係数 j8を乗じたスペクトル j8,S(k— T i)を全て加算したスペクトル、すなわち、 次式
[数 2]
S'2(k) = j fii - S{k - T - i) ... (式 2 ) により表されるスペクトルが代入される。このとき、このフィルタに与えられる入力信 号はゼロとしている。すなわち(式 2)は(式 1)のゼロ入力応答を表す。そして上記の 演算を、周波数の低い方 (k=FL)から順に kを FL≤k<FHの範囲で変化させて行 うことにより、 FL≤k<FHにおける第 2スペクトルの推定値 S'2(k)が算出される。
[0045] 以上のフィルタリング処理は、ピッチ係数設定部 109からピッチ係数 Tが与えられる 度に、 FL≤k<FHの範囲において、その都度 S(k)をゼロクリアして行われる。すな わち、ピッチ係数 Tが変化するたびに S(k)は算出され、探索部 108に出力される。
[0046] 次に、探索部 108において行われる類似度の算出処理および最適なピッチ係数 T の導出処理にっ 、て説明する。
[0047] まず、類似度には、様々な定義が存在する。ここでは、フィルタ係数 β および β ι を 0とみなして、最小 2乗誤差法に基づいて次式
[数 3]
E = … (式 3 )
Figure imgf000011_0001
によって定義される類似度を用いる場合を例にとって説明する。この類似度を使用 した場合、最適なピッチ係数 τを算出した後にフィルタ係数 β iを決定すること〖こなる。 ここで、 Eは、 S2(k)と S'2(k)との間の 2乗誤差を表す。この式において右辺第 1項は、 ピッチ係数 Tに関係ない固定値となるので、右辺第 2項を最大とする S'2(k)を生成す るピッチ係数 Tが探索される。この式の右辺第 2項を類似度と呼ぶことにする。
[0048] 図 7A—図 7Eは、ピッチ係数 Tが変化するに伴 、第 2スペクトルの推定値 S ' 2(k)の スペクトルがどのように変化するかを説明するための図である。
[0049] 図 7Aは、内部状態として格納されている、調波構造を有する第 1スペクトルを示し た図である。また、図 7B—図 7Dは、 3種類のピッチ係数 T、 T、 Tを用いて、それぞ
0 1 2
れフィルタリングを行うことにより算出される第 2スペクトルの推定値 S'2(k)のスぺタト ルを示した図である。なお、図 7Eは、推定値 S'2(k)のスペクトルと比較するために第 2スペクトル S2(k)を示したものである。
[0050] この図に示す例では、図 7Cに示すスペクトルと図 7Eに示すスペクトルとが類似して いるため、 Tを用いて算出する類似度が最も高い値を示すことがわかる。すなわち、 調波構造を保つことのできるピッチ係数 Tとしては Tが最適である。
[0051] 図 8A—図 8Eも、図 7A—図 7Eと同様の図である力 ここでは内部状態として格納 されている第 1スペクトルの位相が図 7A—図 7Eとは異なっている。し力し、この図に 示す例においても、調波構造が保持されるピッチ係数 Tは Tのときである。
[0052] このように、ピッチ係数 Tを変化させ、類似度が最大となる Tを見つけることは、スぺ タトルの調波構造のピッチ (またはその整数倍)をトライ 'アンド'エラーで見つけること に相当している。そして、本実施の形態の符号化装置は、この調波構造のピッチに 基づいて第 2スペクトルの推定値 S'2(k)を算出するので、第 1スペクトルと推定スぺク トルとの間の接続部において調波構造が崩れない。これは、接続部である k=FLの 場合の推定値 S'2(k)は調波構造のピッチ (またはその整数倍) Tだけ離れた第 1スぺ タトルに基づ ヽて算出されることを考えても容易に理解される。
[0053] また、ピッチ係数 Tは、スペクトルデータの周波数間隔の整数倍 (整数値)を表して いる。しかし、実際の調波構造のピッチは非整数値であることが多い。よって、 Tを中 心に前後 M個の近傍データを、適当な重み付け係数 |8を選んで重み付き加算する ことにより、 T Mから T+Mまでの範囲の非整数値の調波構造のピッチを表現するこ とが可能となる。
[0054] 図 9は、フィルタリング部 107、探索部 108、ピッチ係数設定部 109において行われ る各処理の一連のアルゴリズムの一例を示したフロー図である。これらの処理の概要 については既に説明したので、フローの詳細な説明は省略する。
[0055] 次に、フィルタ係数算出部 110におけるフィルタ係数の算出処理について説明する [0056] フィルタ係数算出部 110は、探索部 108から与えられるピッチ係数 T,を用いて次式 画
2
1 / 、\'
Ε = Ϋ I S2(k) - Υ ββ^ ~ τ' -
(式 4 ) k^FL \ d ノ
に従い、この式の 2乗歪 Eを最小にするようなフィルタ係数 j8を求める。なお、フィル タ係数算出部 110は、複数個の |8 (i=-l, 0, 1)の組合せを予めデータテーブルと して持っており、上記の(式 4)の 2乗歪 Eを最小とする |8 (i=-l, 0, 1)の組合せを 決定し、そのインデックスを出力する。
[0057] このように、本実施の形態の符号ィ匕装置によれば、低域部(0≤k<FL)および高 域部 (FL≤k<FH)の 2つに分けられた入力信号のスペクトルに対し、低域スぺタト ルを内部状態として有するフィルタリング部 107を用いて高域スペクトルの形状を推 定し、フィルタリング部 107のフィルタ特性を表すパラメータ自体を、高域スペクトルの 代わりに符号ィ匕して出力するため、低ビットレートで高品質にスぺ外ルを符号ィ匕する ことができる。
[0058] また、以上の構成において、フィルタリング部 107が低域スペクトルを用いて高域ス ベクトルの形状を推定する際に、ピッチ係数設定部 109は、推定の基準とする低域ス ベクトルと高域スペクトルとの周波数差、すなわち、ピッチ係数 Tを様々に変化させ出 力し、探索部 108は、低域スペクトルと高域スペクトルの類似度が最大となる Tを検出 するので、スペクトル全体の調波構造のピッチに基づ!/、て高域スペクトルの形状を推 定することができ、スペクトル全体の調波構造を維持したまま符号ィ匕を行うことができ る。
[0059] また、低域スペクトルの帯域幅を調波構造のピッチに基づ 、て設定する必要もな ヽ 。すなわち、低域スぺ外ルの帯域幅を調波構造のピッチ (または、その整数倍)に揃 える必要はなぐ任意に帯域幅を設定できる。調波構造のピッチに揃える操作を行わ なくても、以上の構成によれば、低域スペクトルと高域スペクトルとの接続部において 、スペクトルは滑らかに接続されるからである。 [0060] なお、本実施の形態では、(式 1)において M= 1とする場合を例にとって説明した iS Mはこれに限定されることは無ぐ 0以上の整数(自然数)を用いることが可能であ る。
[0061] また、本実施の形態では、階層符号化 (スケーラブル符号化)を行う符号化装置を 例にとって説明したが、上記のスペクトル符号ィ匕部 100は、他の方式の符号化を行う 符号化装置に実装することも可能である。
[0062] また、本実施の形態では、スペクトル符号ィ匕部 100が周波数領域変換部 104、 105 を有する場合を例にとって説明したが、これらは時間領域信号を入力信号とする場 合に必要な構成要素であり、スペクトル符号ィ匕部 100に直接スペクトルが入力される 態様においては、周波数領域変換部は必要ない。
[0063] さらに、本実施の形態では、低域のスペクトルを用いて、すなわち、低域のスぺタト ルを符号ィ匕の基準として、高域のスペクトルを符号ィ匕する場合を例にとって説明した 1S この基準となるスペクトルの設定の仕方はこれに限定されず、例えば、エネルギ 一を有効に利用すると 、う観点からは望ましくな 、が、高域のスペクトルを用いて低 域のスペクトルを符号ィ匕したり、または中間周波数帯域のスペクトルを符号ィ匕の基準 とし他の領域のスペクトルを符号ィ匕することも可能である。
[0064] 図 10は、無線送信装置 130から送信された信号を受信する無線受信装置 180の 主要な構成を示すブロック図である。
[0065] この無線受信装置 180は、アンテナ 181、 RF復調装置 182、復号化装置 170、 D ZA変換装置 183、および出力装置 184を有している。
[0066] アンテナ 181は、電波 W12としてのディジタルの符号化音響信号を受けて電気信 号のディジタルの受信符号ィ匕音響信号を生成して RF復調装置 182に与える。 RF復 調装置 182は、アンテナ 181からの受信符号化音響信号を復調して復調符号化音 響信号を生成して復号ィ匕装置 170に与える。
[0067] 復号ィ匕装置 170は、 RF復調装置 182からのディジタルの復調符号化音響信号を 受けて復号ィ匕処理を行ってディジタルの復号ィ匕音響信号を生成して DZA変換装置 183〖こ与える。 DZ A変換装置 183は、復号ィ匕装置 170からのディジタルの復号ィ匕 音声信号を変換してアナログの復号化音声信号を生成して出力装置 184に与える。 出力装置 184は、電気的信号であるアナログの復号ィヒ音声信号を空気の振動に変 換して音波 W13として人間の耳に聴こえるように出力する。
[0068] 図 11は、上記の復号ィ匕装置 170の内部構成を示すブロック図である。ここでは、階 層符号化された信号を復号する場合を例にとって説明する。
[0069] この復号化装置 170は、入力端子 171、分離部 172、第 1レイヤ復号化部 173、ァ ップサンプリング部 174、スペクトル復号ィ匕部 150、および出力端子 176、 177を有 する。
[0070] 入力端子 171には、 RF復調装置 182からディジタルの復調符号ィ匕音響信号が入 力される。分離部 172は、入力端子 171を介し入力された復調符号化音響信号を分 離し、第 1レイヤ復号化部 173用の符号ィ匕コードとスペクトル復号ィ匕部 150用の符号 化コードとを生成する。第 1レイヤ復号ィ匕部 173は、分離部 172で得られた符号化コ ードを用いて信号帯域 0≤k<FLの復号信号を復号し、この復号信号をアップサン プリング部 174に与える。また、他方の出力は、出力端子 176に接続されている。こ れにより、第 1レイヤ復号ィ匕部 173で生成される第 1レイヤ復号信号を出力する必要 が生じた場合には、この出力端子 176を介し出力させることができる。
[0071] アップサンプリング部 174は、第 1レイヤ復号ィ匕部 173から与えられる第 1レイヤ復 号信号のサンプリング周波数を上げる。スペクトル復号ィ匕部 150には、分離部 172で 分離された符号ィ匕コードとアップサンプリング部 174で生成されたアップサンプリング 後の第 1レイヤ復号信号とが与えられる。スペクトル復号ィ匕部 150は、後述するスぺク トル復号化を行い、信号帯域 0≤k<FHの復号信号を生成し、出力端子 177を介し これを出力する。スペクトル復号ィ匕部 150では、アップサンプリング部 174から与えら れるアップサンプリング後の第 1レイヤ復号信号を第 1信号とみなして処理を行うこと になる。
[0072] この構成によれば、第 1レイヤ復号ィ匕部 173で生成される第 1レイヤ復号信号を出 力する必要がある場合には、出力端子 176より出力させることができる。また、より品 質の高いスペクトル復号ィ匕部 150の出力信号を出力する必要がある場合には、出力 端子 177より出力させることができる。復号ィ匕装置 170からは、出力端子 176もしくは 出力端子 177のいずれか一方の信号が出力され、 DZA変換装置 183に与えられる 。どちらの信号が出力されるかは、アプリケーションの設定やユーザの判断に基づく。
[0073] 図 12は、上記のスペクトル復号ィ匕部 150の内部構成を示すブロック図である。
[0074] このスペクトル復号ィ匕部 150は、入力端子 152、 153、周波数領域変換部 154、内 部状態設定部 155、フィルタリング部 156、時間領域変換部 158、および出力端子 1
59を有する。
[0075] 入力端子 152には、スペクトル符号ィ匕部 100にて符号ィ匕された符号ィ匕コードを表す フィルタ係数力 分離部 172を介して入力される。さらに、入力端子 153には、有効 周波数帯域が 0≤k<FLの第 1信号が入力される。この第 1信号は、第 1レイヤ復号 化部 173で復号された第 1レイヤ復号信号をアップサンプリング部 174にてアップサ ンプリングしたものである。
[0076] 周波数領域変換部 154は、入力端子 153から入力された時間領域信号に周波数 変換を行い、第 1スぺ外ル Sl(k)を算出する。周波数変換法は、離散フーリエ変換( DFT)、離散コサイン変換 (DCT)、変形離散コサイン変換 (MDCT)等を使用する。
[0077] 内部状態設定部 155は、第 1スペクトル Sl(k)を使って、フィルタリング部 156で用 V、られるフィルタの内部状態を設定する。
[0078] フィルタリング部 156は、内部状態設定部 155で設定されたフィルタの内部状態と、 入力端子 152から与えられるピッチ係数 T,およびフィルタ係数 j8に基づき第 1スぺク トルのフィルタリングを行い、第 2スペクトルの推定値 S'2(k)を算出する。この場合、フ ィルタリング部 156では、(式 1)に記載のフィルタ関数が用いられる。
[0079] 時間領域変換部 158は、フィルタリング部 156により得られた復号スペクトル S'(k)を 時間領域の信号に変換し、出力端子 159を介し出力する。ここでは、必要に応じて、 適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を 回避する。
[0080] 図 13は、フィルタリング部 156において生成される復号スペクトル S'(k)を示した図 である。
[0081] この図にあるように、周波数帯域 0≤k<FLの復号スペクトル S'(k)は、第 1スぺタト ル Sl(k)によって構成され、周波数帯域 FL≤k<FHの復号スペクトル S'(k)は、第 2 スペクトルの推定値 S'2(k)によって構成される。 [0082] このように、本実施の形態の復号ィ匕装置によれば、本実施の形態に係る符号化方 法に対応した構成を有しているため、少ないビット数で効率よく符号化された音響信 号を復号することができ、良好な音響信号を出力することができる。
[0083] なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信シ ステムに適用される場合を例にとって説明したが、本実施の形態に係る符号ィ匕装置 または復号化装置は、以下に示すように、有線通信システムにも適用することができ る。
[0084] 図 14Aは、本実施の形態に係る符号化装置が有線通信システムに適用された場 合の送信側の主要な構成を示したブロック図である。なお、図 3に示した構成要素と 同一のものには同一の符号を付し、その説明を省略する。
[0085] 有線送信装置 140は、符号化装置 120、入力装置 131、および AZD変換装置 13 2を有し、出力がネットワーク N1に接続されている。
[0086] AZD変換装置 132の入力端子は、入力装置 131の出力端子に接続されている。
符号ィ匕装置 120の入力端子は、 AZD変換装置 132の出力端子に接続されている。 符号ィ匕装置 120の出力端子はネットワーク N1に接続されている。
[0087] 入力装置 131は、人間の耳に聞こえる音波 W11を電気的信号であるアナログ信号 に変換して AZD変換装置 132に与える。 AZD変換装置 132は、アナログ信号をデ イジタル信号に変換して符号ィ匕装置 120に与える。符号ィ匕装置 120は、入力されてく るディジタル信号を符号ィ匕してコードを生成し、ネットワーク N1に出力する。
[0088] 図 14Bは、本実施の形態に係る復号化装置が有線通信システムに適用された場 合の受信側の主要な構成を示したブロック図である。なお、図 10に示した構成要素 と同一のものには同一の符号を付し、その説明を省略する。
[0089] 有線受信装置 190は、ネットーク N1に接続されている受信装置 191、復号化装置 170、 DZA変換装置 183、および出力装置 184を有している。
[0090] 受信装置 191の入力端子は、ネットワーク N1に接続されている。復号化装置 170 の入力端子は、受信装置 191の出力端子に接続されている。 DZA変換装置 183の 入力端子は、復号ィ匕装置 170の出力端子に接続されている。出力装置 184の入力 端子は、 DZA変換装置 183の出力端子に接続されている。 [0091] 受信装置 191は、ネットワーク Nlからのディジタルの符号ィ匕音響信号を受けてディ ジタルの受信音響信号を生成して復号ィ匕装置 170に与える。復号ィ匕装置 170は、受 信装置 191からの受信音響信号を受けてこの受信音響信号に復号ィ匕処理を行って ディジタルの復号ィ匕音響信号を生成して DZA変換装置 183に与える。 DZA変換 装置 183は、復号ィ匕装置 170からのディジタルの復号音声信号を変換してアナログ の復号音声信号を生成して出力装置 184に与える。出力装置 184は、電気的信号 であるアナログの復号音響信号を空気の振動に変換して音波 W13として人間の耳 に聴こえるように出力する。
[0092] このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有 する有線送受信装置を提供することができる。
[0093] (実施の形態 2)
図 15は、本発明の実施の形態 2に係る符号ィ匕装置内のスペクトル符号ィ匕部 200の 主要な構成を示すブロック図である。なお、このスペクトル符号ィ匕部 200は、図 5に示 したスペクトル符号ィ匕部 100と同様の基本的構成を有しており、同一の構成要素に は同一の符号を付し、その説明を省略する。
[0094] 本実施の形態の特徴は、フィルタリング部で用いられるフィルタ関数を実施の形態 1 よりも簡易なものにすることである。
[0095] フィルタリング部 201で用いられるフィルタ関数は、次式
[数 5]
1
-Τ (式 5 )
1 - Z- のように簡略化したものを用いる。この式は、(式 1)において Μ = 0、 β = 1
0 としたフ ィルタ関数に相当している。
[0096] 図 16は、上記のフィルタを用いたフィルタリングの概要を説明するための図である。
[0097] 第 2スペクトルの推定値 S'2(k)は、 Τだけ離れた低域のスペクトルを順次コピーする ことにより求められる。また、探索部 108は、最適なピッチ係数 T'を実施の形態 1と同 様に(式 3)の Eを最小とするピッチ係数 Tを探索することにより決定する。このようにし て求められたピッチ係数 T'を出力端子 111を介し出力する。この構成により、フィル タの特性はピッチ係数 Tのみで決定されることになる。
[0098] なお、本実施の形態のフィルタは、低レート音声符号ィ匕の代表的な技術である CE LP (Code-Excited Linear Prediction)方式の構成要素の一つである適応符号帳( adaptive codebook)と同じように動作するという特徴がある。
[0099] 次いで、上記のスペクトル符号ィ匕部 200によって符号ィ匕された信号を復号するスぺ タトル復号ィ匕部について説明する(図示せず)。
[0100] このスペクトル復号ィ匕部は、図 12に示したスペクトル復号ィ匕部 150と同様の構成を 有しているので、詳しい説明は省略するが、次のような特徴を有している。すなわち、 フィルタリング部 156は、第 2スペクトルの推定値 S'2(k)を算出する場合に、(式 1)に 記載のフィルタ関数ではなく(式 5)に記載のフィルタ関数を用いる。入力端子 152か ら与えられるのは、ピッチ係数 T'のみとなる。すなわち、(式 1)または(式 5)に記載の フィルタ関数のどちらを利用するかは、符号ィ匕側で用いられたフィルタ関数の種類に 依存し、そのフィルタ関数と同一のフィルタ関数を用いる。
[0101] このように、本実施の形態によれば、フィルタリング部で用いられるフィルタ関数をよ り簡易なものとするため、フィルタ係数算出部を設置する必要がなくなり、少ない演算 量によって第 2スペクトル (高域スペクトル)の推定を行うことができ、また、回路規模も 縮/ Jヽすることができる。
[0102] (実施の形態 3)
図 17は、本発明の実施の形態 3に係る符号ィ匕装置内のスペクトル符号ィ匕部 300の 主要な構成を示すブロック図である。なお、このスペクトル符号ィ匕部 300は、図 5に示 したスペクトル符号ィ匕部 100と同様の基本的構成を有しており、同一の構成要素に は同一の符号を付し、その説明を省略する。
[0103] 本実施の形態の特徴は、概形算出部 301および多重化部 302をさらに有し、第 2ス ベクトルの推定が行われた後に第 2スペクトルの包絡情報をさらに符号ィヒすることで める。
[0104] 探索部 108は、最適なピッチ係数 T'を多重化部 302に出力すると共に、このピッチ 係数 T'を用いて生成される第 2スペクトルの推定値 S'2(k)を概形算出部 301に出力 する。概形算出部 301は、周波数領域変換部 105から与えられる第 2スペクトル S2(k )に基づいて第 2スペクトル S2(k)の包絡情報を算出する。なお、ここでは、この包絡情 報をサブバンド毎のスペクトルパヮで表し、周波数帯域 FL≤k< FHを J個のサブバン ドに分割する場合を例にとって説明する。このとき、第 jサブバンドのスペクトルパヮは 次式
[数 6]
BHU)
B(j) = S2(kf … (式 6 ) で表される。この式において、 BL①は、第 jサブバンドの最小周波数、 BH(j)は、第 j サブバンドの最大周波数を表す。このようにして求めた第 2スペクトルのサブバンド情 報を第 2スペクトルのスペクトル包絡情報とみなす。
[0105] 同様に、第 2スペクトルの推定値 S'2(k)のサブバンド情報 B' (j)を次式
[数 7]
B U) 、―
B'U) = S'2{kf … (式ァ)
k=BL{j)
に従い算出し、サブバンド毎の変動量 V(j)を次式
[数 8] … (式 8 )
B \J、)
に従い算出する。
[0106] 次に、変動量 V(j)を符号ィ匕して符号ィ匕後の変動量 V (j)を求め、そのインデックスを 多重化部 302に送る。多重化部 302は、探索部 108から得られる最適なピッチ係数 T'と概形算出部 301から出力される変動量 V(j)のインデックスを多重化して出力端 子 111を介し出力する。
[0107] このように、本実施の形態によれば、高域スペクトルの推定を行った後に、さらに高 域スペクトルの包絡情報も符号ィ匕するため、高域スペクトルの推定値の精度を向上さ せることができる。
[0108] (実施の形態 4)
図 18は、本発明の実施の形態 4に係る復号ィ匕装置内のスペクトル復号ィ匕部 550の 主要な構成を示すブロック図である。なお、このスペクトル復号ィ匕部 550は、図 12に 示したスペクトル復号ィ匕部 150と同様の基本的構成を有しており、同一の構成要素 には同一の符号を付し、その説明を省略する。
[0109] 本実施の形態の特徴は、分離部 551、スペクトル包絡復号ィ匕部 552、およびスぺク トル調整部 553をさらに有することである。これにより、実施の形態 3で示したスぺタト ル符号ィ匕部 300等によって高域スペクトルの推定スペクトルの符号ィ匕に併せて包絡 情報も符号化された符号化コードの復号を行うことができる。
[0110] 分離部 551は、入力端子 152を介し入力された符号化コードを分離し、フィルタリン グ係数に関する情報はフィルタリング部 156に与えると共に、スペクトル包絡に関する 情報はスペクトル包絡復号ィ匕部 552に与える。
[0111] スペクトル包絡復号ィ匕部 552は、分離部 551から与えられたスペクトル包絡情報か ら、変動量 V(j)を符号ィ匕して得られる変動量 V (j)を復号することにより求める。
[0112] スペクトル調整部 553は、フィルタリング部 156から得られる復号スペクトル S'(k)に、 スペクトル包絡復号ィ匕部 552から得られる復号されたサブバンド毎の変動量 V (j)を 次式
[数 9]
S3(k) = S'(k)- Vq{j) (BL(j)≤k <
Figure imgf000021_0001
for all j) … (式 9 ) に従い乗じることにより、復号スペクトル S'(k)の周波数帯域 FL≤k<FHにおけるス ベクトル形状を調整し、調整後の復号スペクトル S3(k)を生成する。この調整後の復 号スペクトル S3(k)は、時間領域変換部 158に出力され、時間領域信号に変換される
[0113] このように、本実施の形態によれば、包絡情報も併せて符号ィ匕されている符号ィ匕コ 一ドを復号することができる。
[0114] なお、本実施の形態では、分離部 551から与えられるスペクトル包絡情報が、(式 8 )に示されるサブバンド毎の変動量 V(j)を符号ィ匕して求められた値 V (j)である場合を 例にとって説明した力 スペクトル包絡情報はこれに限定されない。
[0115] (実施の形態 5)
図 19は、本発明の実施の形態 5に係る復号ィ匕装置内のスペクトル復号ィ匕部 650の 主要な構成を示すブロック図である。なお、このスペクトル復号ィ匕部 650は、図 18に 示したスペクトル復号化部 550と同様の基本的構成を有しており、同一の構成要素 には同一の符号を付し、その説明を省略する。
[0116] 本実施の形態の特徴は、 LPCスペクトル算出部 652をさらに有し、 LPC係数により 算出される LPCスペクトルをスペクトル包絡情報として利用し、第 2スペクトルの推定 を行った後に、第 2スペクトルに LPCスペクトルを乗じることにより、より精度の高い第 2スペクトルの推定値を得ることである。
[0117] LPCスペクトル算出部 652は、入力端子 651を介し入力された LPC係数 oc (j)から L PCスペクトル env(k)を、次式
[数 10]
(式 1 0 )
Figure imgf000022_0001
に従い算出する。ここで、 NPは LPC係数の次数を表す。また、変数 γ (0< γく 1) を用い、 LPCスペクトルの特性を変化させることにより LPCスペクトル env(k)を求める こともできる。この場合、 LPCスペクトル env(k)は、次式
[数 11]
(式 1 1 )
Figure imgf000022_0002
のように表される。ここで γは固定値として規定することもできるし、フレーム毎に可 変な値をとることもできる。このように算出された LPCスペクトル env(k)は、スペクトル 調整部 553に出力される。
[0118] スペクトル調整部 553は、フィルタリング部 156から得られる復号スペクトル S'(k)に、 LPCスペクトル算出部 652から得られる LPCスペクトル env(k)を、次式
[数 12] S3(k) = S'(k)- env(k) (FL≤k < FH) … (式 l 2 )
に従い乗じ、復号スペクトル S'(k)の周波数帯域 FL≤k<FHにおけるスペクトルを 調整し、調整後の復号スペクトル S3(k)を生成する。この調整後の復号スペクトル S3( k)は、時間領域変換部 158に与えられ、時間領域信号に変換される。
[0119] このように、本実施の形態によれば、 LPCスペクトルをスペクトル包絡情報として利 用するため、より精度の高い第 2スペクトルの推定値を得ることができる。
[0120] 本発明に係る符号ィ匕装置または復号ィ匕装置は、移動体通信システムにおける通信 端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作 用効果を有する通信端末装置および基地局装置を提供することができる。
[0121] なお、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明したが、ソ フトウェアで実現することも可能である。
[0122] 本明細書は、 2003年 9月 16日出願の特願 2003— 323658に基づく。この内容は 全てここに含めておく。
産業上の利用可能性
[0123] 本発明に係る符号化装置および復号化装置は、低ビットレートで符号化する効果 を有し、無線通信システム等の用途にも適用できる。

Claims

請求の範囲
[1] 低周波帯域および高周波帯域の 2つの帯域に分けられたスペクトルを取得する取 得手段と、
取得された低周波帯域の前記スペクトルと取得された高周波帯域の前記スペクトル との類似具合を示すパラメータを前記スぺ外ルの調波構造に基づいて算出する算 出手段と、
取得された高周波帯域の前記スペクトルの代わりに、算出された前記類似具合を 示すパラメータを符号化する符号化手段と、
を具備する符号化装置。
[2] 前記算出手段は、
高周波帯域の前記スペクトルから周波数軸上で調波構造のピッチの整数倍だけ離 れた、低周波帯域の前記スペクトルに基づ 、て高周波帯域の前記スペクトルの類似 スペクトルを生成する生成手段と、
前記類似スペクトルと高周波帯域の前記スペクトルとが最も類似する際の前記類似 スペクトルの特性を示すパラメータを検出する検出手段と、
を具備する請求の範囲 1記載の符号化装置。
[3] 前記符号化手段は、
取得された高周波帯域の前記スペクトルの包絡線に関する情報も併せて符号ィ匕す る、
請求の範囲 1記載の符号化装置。
[4] 前記算出手段は、取得された低周波帯域の前記スぺ外ルを内部状態として有す るフィルタを用いて、取得された高周波帯域の前記スペクトルを推定する推定手段と 、前記フィルタの特性を示すパラメータを出力する出力手段と、を具備し、
前記フィルタのフィルタ関数は、次の式によって表され、
前記推定手段は、前記フィルタのゼロ入力応答を用いて前記推定を行う、 請求の範囲 1記載の符号化装置。
[数 1] 1
Figure imgf000025_0001
ただし、
P(z) :フィルタ関数
z : z変換変数
M : 1Z2倍されたフィルタ次数
β:重み付け係数
Τ:ピッチ係数
[5] 前記フィルタ関数において、 Μ = 0および |8 = 1である請求の範囲 4記載の符号ィ匕
[6] 低周波帯域の前記スペクトルは、
階層符号ィ匕において下位レイヤで符号化された後に復号された信号カゝら得られる 請求の範囲 1記載の符号化装置。
[7] 請求項 1記載の符号化装置を具備する送受信装置。
[8] 低周波帯域および高周波帯域の 2つの帯域に分けられたスペクトルのうちの低周 波帯域のスペクトルを取得するスペクトル取得手段と、
低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示す パラメータを取得するパラメータ取得手段と、
取得された低周波帯域の前記スペクトルおよび前記パラメータを用いて低周波帯 域および高周波帯域の前記スペクトルを復号する復号化手段と、
を具備する復号化装置。
[9] 高周波帯域の前記スペクトルの包絡線に関する情報を取得する包絡線情報取得 手段をさらに具備し、
前記復号化手段は、
取得された前記包絡線に関する情報も用いて前記復号を行う、
請求の範囲 8記載の復号化装置。
[10] 前記復号化手段は、取得された低周波帯域の前記スペクトルを内部状態として有 し、取得された前記パラメータをフィルタ特性とするフィルタを用いて、高周波帯域の 前記スペクトルを推定する推定手段を具備し、
前記フィルタのフィルタ関数は、次の式によって表され、
前記推定手段は、前記フィルタのゼロ入力応答を用いて前記推定を行う、 請求の範囲 8記載の復号化装置。
[数 2] ) = ^ ——
β, ζ ~τ+ί ただし、
P(z) :フィルタ関数
z : z変換変数
M : 1Z2倍されたフィルタ次数
β:重み付け係数
Τ:ピッチ係数
[11] 前記フィルタ関数において、 Μ = 0および |8 = 1である請求の範囲 10記載の復号
0
化装置。
[12] 低周波帯域の前記スペクトルは、
階層符号ィ匕において下位レイヤで復号された信号カゝら生成される、
請求の範囲 8記載の復号化装置。
[13] 請求の範囲 8復号化装置を具備する送受信装置。
[14] 低周波帯域および高周波帯域の 2つの帯域に分けられたスペクトルを取得する取 得ステップと、
取得された低周波帯域の前記スペクトルと取得された高周波帯域の前記スペクトル との類似具合を示すパラメータを前記スぺ外ルの調波構造に基づいて算出する算 出ステップと、
取得された高周波帯域の前記スペクトルの代わりに、算出された前記類似具合を 示すパラメータを符号化する符号化ステップと、
を具備する符号化方法。
[15] 低周波帯域および高周波帯域の 2つの帯域に分けられたスペクトルのうちの低周 波帯域のスペクトルを取得するスペクトル取得ステップと、
低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示す ノ ラメータを取得するパラメータ取得ステップと、
取得された低周波帯域の前記スペクトルおよび前記パラメータを用いて低周波帯 域および高周波帯域の前記スペクトルを復号する復号化ステップと、
を具備する復号化方法。
PCT/JP2004/013455 2003-09-16 2004-09-15 符号化装置および復号化装置 WO2005027095A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE602004021266T DE602004021266D1 (de) 2003-09-16 2004-09-15 Kodier- und dekodierapparat
US10/571,761 US7844451B2 (en) 2003-09-16 2004-09-15 Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
JP2005513947A JP4789622B2 (ja) 2003-09-16 2004-09-15 スペクトル符号化装置、スケーラブル符号化装置、復号化装置、およびこれらの方法
EP04787895A EP1657710B1 (en) 2003-09-16 2004-09-15 Coding apparatus and decoding apparatus
BRPI0414444A BRPI0414444B1 (pt) 2003-09-16 2004-09-15 aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação
US12/700,583 US8738372B2 (en) 2003-09-16 2010-02-04 Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003-323658 2003-09-16
JP2003323658 2003-09-16

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US10571761 A-371-Of-International 2004-09-15
US12/700,583 Continuation US8738372B2 (en) 2003-09-16 2010-02-04 Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band

Publications (1)

Publication Number Publication Date
WO2005027095A1 true WO2005027095A1 (ja) 2005-03-24

Family

ID=34308695

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/013455 WO2005027095A1 (ja) 2003-09-16 2004-09-15 符号化装置および復号化装置

Country Status (6)

Country Link
EP (3) EP2264700A1 (ja)
JP (2) JP4789622B2 (ja)
CN (3) CN101783141B (ja)
BR (1) BRPI0414444B1 (ja)
DE (2) DE602004032587D1 (ja)
WO (1) WO2005027095A1 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008120437A1 (ja) * 2007-03-02 2008-10-09 Panasonic Corporation 符号化装置、復号装置およびそれらの方法
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
JP2011154383A (ja) * 2007-03-02 2011-08-11 Panasonic Corp 音声符号化装置、音声復号装置およびそれらの方法
JP2012208514A (ja) * 2006-06-21 2012-10-25 Samsung Electronics Co Ltd 符号化方法及び復号化方法
WO2013035257A1 (ja) * 2011-09-09 2013-03-14 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP5171256B2 (ja) * 2005-08-31 2013-03-27 パナソニック株式会社 ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
KR101263970B1 (ko) 2005-08-04 2013-05-13 아벤티스 파마 소시에떼아노님 7-치환된 아자-인다졸, 그를 함유한 조성물, 그의 제조방법 및 그의 용도
JP2013148920A (ja) * 2009-01-16 2013-08-01 Dolby International Ab クロス生成物により向上された高調波転換
JP2014142653A (ja) * 2008-12-15 2014-08-07 Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev オーディオエンコーダおよび帯域幅拡張デコーダ
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
WO2016013164A1 (ja) * 2014-07-25 2016-01-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
RU2658892C2 (ru) * 2013-06-11 2018-06-25 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для расширения диапазона частот для акустических сигналов
JP2019070823A (ja) * 2014-07-25 2019-05-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
US11170797B2 (en) 2014-07-28 2021-11-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
US12183360B2 (en) 2018-10-26 2024-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Directional loudness map based audio processing

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
CN101552005A (zh) * 2008-04-03 2009-10-07 华为技术有限公司 编码方法、解码方法、系统及装置
CN101662288B (zh) * 2008-08-28 2012-07-04 华为技术有限公司 音频编码、解码方法及装置、系统
CN101436407B (zh) * 2008-12-22 2011-08-24 西安电子科技大学 音频编解码方法
JP5707842B2 (ja) * 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN105761723B (zh) 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) * 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JPH08123495A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 広帯域音声復元装置
JPH09258787A (ja) * 1996-03-21 1997-10-03 Kokusai Electric Co Ltd 狭帯域音声信号の周波数帯域拡張回路
JPH11144382A (ja) * 1997-11-12 1999-05-28 Victor Co Of Japan Ltd 符号情報処理方法及び装置、符号情報の記録媒体への記録方法
JP2001521648A (ja) 1997-06-10 2001-11-06 コーディング テクノロジーズ スウェーデン アクチボラゲット スペクトル帯域複製を用いた原始コーディングの強化
JP2002132298A (ja) * 2000-10-24 2002-05-09 Kenwood Corp 周波数補間装置、周波数補間方法及び記録媒体
JP2002175092A (ja) * 2000-12-07 2002-06-21 Kenwood Corp 信号補間装置、信号補間方法及び記録媒体
JP2002528777A (ja) * 1998-10-27 2002-09-03 ボイスエイジ コーポレイション オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
JP2002536679A (ja) * 1999-01-27 2002-10-29 コーディング テクノロジーズ スウェーデン アクチボラゲット 情報源符号化システムの性能向上方法と装置
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3283413B2 (ja) * 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0101175D0 (sv) * 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
EP1444688B1 (en) * 2001-11-14 2006-08-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
JP2003323658A (ja) 2002-05-07 2003-11-14 Fujitsu Ltd 可動壁付き紙幣収納装置,可動壁制御方法および紙幣入出金機

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) * 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JPH08123495A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 広帯域音声復元装置
JPH09258787A (ja) * 1996-03-21 1997-10-03 Kokusai Electric Co Ltd 狭帯域音声信号の周波数帯域拡張回路
JP2001521648A (ja) 1997-06-10 2001-11-06 コーディング テクノロジーズ スウェーデン アクチボラゲット スペクトル帯域複製を用いた原始コーディングの強化
JPH11144382A (ja) * 1997-11-12 1999-05-28 Victor Co Of Japan Ltd 符号情報処理方法及び装置、符号情報の記録媒体への記録方法
JP2002528777A (ja) * 1998-10-27 2002-09-03 ボイスエイジ コーポレイション オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
JP2002536679A (ja) * 1999-01-27 2002-10-29 コーディング テクノロジーズ スウェーデン アクチボラゲット 情報源符号化システムの性能向上方法と装置
JP2002132298A (ja) * 2000-10-24 2002-05-09 Kenwood Corp 周波数補間装置、周波数補間方法及び記録媒体
JP2002175092A (ja) * 2000-12-07 2002-06-21 Kenwood Corp 信号補間装置、信号補間方法及び記録媒体
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1657710A4

Cited By (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101263970B1 (ko) 2005-08-04 2013-05-13 아벤티스 파마 소시에떼아노님 7-치환된 아자-인다졸, 그를 함유한 조성물, 그의 제조방법 및 그의 용도
JP5171256B2 (ja) * 2005-08-31 2013-03-27 パナソニック株式会社 ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
JP2012208514A (ja) * 2006-06-21 2012-10-25 Samsung Electronics Co Ltd 符号化方法及び復号化方法
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US9847095B2 (en) 2006-06-21 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
CN102385866B (zh) * 2007-03-02 2013-05-08 松下电器产业株式会社 语音编码装置、解码装置和语音编码方法、解码方法
CN102394066B (zh) * 2007-03-02 2013-10-09 松下电器产业株式会社 语音编码装置、解码装置和语音编码方法、解码方法
JP2011154384A (ja) * 2007-03-02 2011-08-11 Panasonic Corp 音声符号化装置、音声復号装置およびそれらの方法
JP2009042733A (ja) * 2007-03-02 2009-02-26 Panasonic Corp 符号化装置、復号装置およびそれらの方法
JP2011154383A (ja) * 2007-03-02 2011-08-11 Panasonic Corp 音声符号化装置、音声復号装置およびそれらの方法
WO2008120437A1 (ja) * 2007-03-02 2008-10-09 Panasonic Corporation 符号化装置、復号装置およびそれらの方法
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8935161B2 (en) 2007-03-02 2015-01-13 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, and method thereof for secifying a band of a great error
US8543392B2 (en) 2007-03-02 2013-09-24 Panasonic Corporation Encoding device, decoding device, and method thereof for specifying a band of a great error
CN102394066A (zh) * 2007-03-02 2012-03-28 松下电器产业株式会社 语音编码装置、解码装置和语音编码方法、解码方法
KR101363793B1 (ko) 2007-03-02 2014-02-14 파나소닉 주식회사 부호화 장치, 복호 장치 및 그 방법
EP2747080A3 (en) * 2007-03-02 2014-08-06 Panasonic Intellectual Property Corporation of America Encoding device, decoding device, and method thereof
US8935162B2 (en) 2007-03-02 2015-01-13 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, and method thereof for specifying a band of a great error
EP2747079A3 (en) * 2007-03-02 2014-08-13 Panasonic Intellectual Property Corporation of America Encoding device, decoding device, and method thereof
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
JP2014142653A (ja) * 2008-12-15 2014-08-07 Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev オーディオエンコーダおよび帯域幅拡張デコーダ
US10229696B2 (en) 2008-12-15 2019-03-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and bandwidth extension decoder
US9799346B2 (en) 2009-01-16 2017-10-24 Dolby International Ab Cross product enhanced harmonic transposition
US11031025B2 (en) 2009-01-16 2021-06-08 Dolby International Ab Cross product enhanced harmonic transposition
US12165666B2 (en) 2009-01-16 2024-12-10 Dolby International Ab Cross product enhanced harmonic transposition
US12119011B2 (en) 2009-01-16 2024-10-15 Dolby International Ab Cross product enhanced harmonic transposition
US10192565B2 (en) 2009-01-16 2019-01-29 Dolby International Ab Cross product enhanced harmonic transposition
US11935551B2 (en) 2009-01-16 2024-03-19 Dolby International Ab Cross product enhanced harmonic transposition
JP2013148920A (ja) * 2009-01-16 2013-08-01 Dolby International Ab クロス生成物により向上された高調波転換
US10586550B2 (en) 2009-01-16 2020-03-10 Dolby International Ab Cross product enhanced harmonic transposition
US11682410B2 (en) 2009-01-16 2023-06-20 Dolby International Ab Cross product enhanced harmonic transposition
US9886964B2 (en) 2011-09-09 2018-02-06 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, and methods
US10629218B2 (en) 2011-09-09 2020-04-21 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, and methods
US10269367B2 (en) 2011-09-09 2019-04-23 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, and methods
US9741356B2 (en) 2011-09-09 2017-08-22 Panasonic Intellectual Property Corporation Of America Coding apparatus, decoding apparatus, and methods
US9384749B2 (en) 2011-09-09 2016-07-05 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
WO2013035257A1 (ja) * 2011-09-09 2013-03-14 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
RU2688247C2 (ru) * 2013-06-11 2019-05-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для расширения диапазона частот для акустических сигналов
RU2658892C2 (ru) * 2013-06-11 2018-06-25 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для расширения диапазона частот для акустических сигналов
US10157622B2 (en) 2013-06-11 2018-12-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for bandwidth extension for audio signals
US10522161B2 (en) 2013-06-11 2019-12-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for bandwidth extension for audio signals
RU2669706C2 (ru) * 2014-07-25 2018-10-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство кодирования аудиосигнала, устройство декодирования аудиосигнала, способ кодирования аудиосигнала и способ декодирования аудиосигнала
US11521625B2 (en) 2014-07-25 2022-12-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
EP3413307A1 (en) 2014-07-25 2018-12-12 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio signal coding apparatus, audio signal decoding device, and methods thereof
US10643623B2 (en) 2014-07-25 2020-05-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
KR102165403B1 (ko) 2014-07-25 2020-10-14 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법
EP3723086A1 (en) 2014-07-25 2020-10-14 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
AU2015291897B2 (en) * 2014-07-25 2019-02-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Acoustic signal encoding device, acoustic signal decoding device, method for encoding acoustic signal, and method for decoding acoustic signal
KR20170035827A (ko) 2014-07-25 2017-03-31 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법
US10311879B2 (en) 2014-07-25 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
JP2019070823A (ja) * 2014-07-25 2019-05-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
JPWO2016013164A1 (ja) * 2014-07-25 2017-04-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
WO2016013164A1 (ja) * 2014-07-25 2016-01-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
US11922961B2 (en) 2014-07-28 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
US11170797B2 (en) 2014-07-28 2021-11-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
US12183360B2 (en) 2018-10-26 2024-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Directional loudness map based audio processing

Also Published As

Publication number Publication date
EP1657710A4 (en) 2007-10-31
CN101800049B (zh) 2012-05-23
JPWO2005027095A1 (ja) 2007-11-08
EP1657710B1 (en) 2009-05-27
CN101800049A (zh) 2010-08-11
CN101783141A (zh) 2010-07-21
DE602004021266D1 (de) 2009-07-09
CN100590712C (zh) 2010-02-17
JP5171922B2 (ja) 2013-03-27
JP2011039553A (ja) 2011-02-24
DE602004032587D1 (de) 2011-06-16
BRPI0414444B1 (pt) 2020-05-05
EP2071565B1 (en) 2011-05-04
EP1657710A1 (en) 2006-05-17
EP2071565A3 (en) 2009-07-08
EP2264700A1 (en) 2010-12-22
EP2071565A2 (en) 2009-06-17
CN1849648A (zh) 2006-10-18
JP4789622B2 (ja) 2011-10-12
CN101783141B (zh) 2012-06-20
BRPI0414444A (pt) 2006-11-14

Similar Documents

Publication Publication Date Title
JP5171922B2 (ja) 符号化装置、復号化装置、およびこれらの方法
JP4822843B2 (ja) スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
US8738372B2 (en) Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
EP1742202B1 (en) Encoding device, decoding device, and method thereof
WO2003091989A1 (en) Coding device, decoding device, coding method, and decoding method
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
JP4958780B2 (ja) 符号化装置、復号化装置及びこれらの方法
JP2003323199A (ja) 符号化装置、復号化装置及び符号化方法、復号化方法
WO2006003891A1 (ja) 音声信号復号化装置及び音声信号符号化装置
KR20060135699A (ko) 신호 복호화 장치 및 신호 복호화 방법
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
CN103366750A (zh) 一种声音编解码装置及其方法
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4287840B2 (ja) 符号化装置
JP2004301954A (ja) 音響信号の階層符号化方法および階層復号化方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200480025964.6

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BW BY BZ CA CH CN CO CR CU CZ DK DM DZ EC EE EG ES FI GB GD GE GM HR HU ID IL IN IS JP KE KG KP KZ LC LK LR LS LT LU LV MA MD MK MN MW MX MZ NA NI NO NZ PG PH PL PT RO RU SC SD SE SG SK SY TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SZ TZ UG ZM ZW AM AZ BY KG MD RU TJ TM AT BE BG CH CY DE DK EE ES FI FR GB GR HU IE IT MC NL PL PT RO SE SI SK TR BF CF CG CI CM GA GN GQ GW ML MR SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DPEN Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2004787895

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2005513947

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 318/MUMNP/2006

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 2006251178

Country of ref document: US

Ref document number: 10571761

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2004787895

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10571761

Country of ref document: US

ENP Entry into the national phase

Ref document number: PI0414444

Country of ref document: BR