WO2005112001A1 - 符号化装置、復号化装置、およびこれらの方法 - Google Patents

符号化装置、復号化装置、およびこれらの方法 Download PDF

Info

Publication number
WO2005112001A1
WO2005112001A1 PCT/JP2005/008963 JP2005008963W WO2005112001A1 WO 2005112001 A1 WO2005112001 A1 WO 2005112001A1 JP 2005008963 W JP2005008963 W JP 2005008963W WO 2005112001 A1 WO2005112001 A1 WO 2005112001A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain
spectrum
encoding
decoding
frequency
Prior art date
Application number
PCT/JP2005/008963
Other languages
English (en)
French (fr)
Inventor
Masahiro Oshikiri
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to JP2006513605A priority Critical patent/JP5013863B2/ja
Priority to DE602005006551T priority patent/DE602005006551D1/de
Priority to EP05744114A priority patent/EP1742202B1/en
Priority to CN2005800158368A priority patent/CN1954363B/zh
Priority to US11/596,254 priority patent/US8463602B2/en
Priority to BRPI0510400-9A priority patent/BRPI0510400A/pt
Priority to EP16186271.9A priority patent/EP3118849B1/en
Publication of WO2005112001A1 publication Critical patent/WO2005112001A1/ja
Priority to US13/889,983 priority patent/US8688440B2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Definitions

  • Encoding device decoding device, and methods thereof
  • the present invention relates to an encoding device, a decoding device, and a method thereof for encoding a spectrum of a wideband audio signal, an audio signal, or the like.
  • the maximum frequency of a signal can be widened to about 10 to 15 kHz, a realistic feeling equivalent to FM radio can be obtained, and if it can be widened to about 20 kHz, CD-like quality can be obtained.
  • the coding method for audio signals such as the Layer 3 method standardized by the Moving Picture Expert Group (MPEG) and the Advanced Audio Coding (AAC) method is suitable. ing.
  • MPEG Moving Picture Expert Group
  • AAC Advanced Audio Coding
  • Patent Document 1 as a technique for encoding a broadband signal spectrum at a low bit rate with high quality, the high-band spectrum in the wide-band spectrum is replaced by duplicating the low-band spectrum.
  • a technique for reducing the overall bit rate while suppressing quality degradation by performing envelope adjustment later is disclosed.
  • Patent Document 2 a spectrum is divided into a plurality of subbands, a gain vector is generated for each subband, a gain vector is generated, and the gain vector is vector quantized to obtain a bit rate.
  • Patent Document 1 JP 2001-521648 (Page 15, Fig. 1, Fig. 2)
  • Patent Document 2 JP-A-5-265487
  • FIGS. 1A to 1D are diagrams showing respective spectra when the technique disclosed in Patent Document 1 is applied to an original signal in a frequency band 0 ⁇ k ⁇ FH.
  • Fig. 1A shows the spectrum of the original signal
  • Fig. 1B shows the low-frequency spectrum after removing the high-frequency part (FL ⁇ k ⁇ FH) of the spectrum of the original signal
  • Fig. 1C shows the low-frequency spectrum of Fig. 1B
  • Fig. 1D shows the spectrum after adjusting the envelope of the high frequency band.
  • the envelope adjustment is performed after the high-frequency spectrum is replaced with the replica of the low-frequency spectrum, because the outline of the newly generated high-frequency spectrum (replicated spectrum) is the high frequency of the original signal.
  • the fact that the quality of the vector is very different from the outline of the vector will cause significant quality degradation. Therefore, it is very important to improve the similarity between the high frequency spectrum of the original signal and the newly generated spectrum by adjusting the outline of the newly generated high frequency spectrum.
  • the replica spectrum may be multiplied by an adjustment coefficient (gain) so that the energy of the replica spectrum matches the energy of the high-frequency spectrum of the original signal.
  • gain an adjustment coefficient
  • FIG. 2A is a diagram showing the outline of the spectrum of the original signal
  • FIG. 2B is a diagram showing the outline of the spectrum after the outline adjustment.
  • the spectrum obtained has the following problems. That is, discontinuity occurs at the connection between the low-frequency spectrum and the high-frequency spectrum, causing abnormal noise. This is because the entire high-frequency spectrum is multiplied by the same gain, so the energy of the high-frequency spectrum matches that of the original signal, but continuity between the low-frequency spectrum and the high-frequency spectrum is maintained. It is not limited. Also, if there is any characteristic shape in the outline of the low-frequency spectrum, a uniform gain is used. Just multiplying it will leave the characteristic shape inadequate in the high frequency area, which also contributes to sound quality degradation.
  • Patent Document 2 may be applied to the above-described spectrum outline adjustment, that is, the outline adjustment may be performed by adjusting the gain for each subband after subband division.
  • Conceivable. 3A and 3B are diagrams showing an example of the outline of the spectrum obtained by this processing.
  • FIG. 3A is a diagram showing an outline of the spectrum of the original signal
  • FIG. 3B is a diagram showing an outline of the spectrum when the gain of each subband is adjusted after subband division.
  • an object of the present invention is to realize the similarity between the high-frequency spectrum of the original signal and the newly generated spectrum while realizing a low bit rate when encoding the spectrum of the wideband signal. It is an object of the present invention to provide a sign key apparatus and a sign key method that can be improved.
  • the encoder apparatus includes an acquisition unit that acquires at least a spectrum divided into a low band and a high band, a first encoding unit that encodes the low band spectrum, and the high band.
  • the invention's effect [0018] According to the present invention, when the spectrum of a wideband signal is encoded, the similarity between the high frequency spectrum of the original signal and the newly generated spectrum is improved while realizing a low bit rate error. That's right.
  • FIG. 1A Diagram showing the spectrum of the original signal
  • FIG. 1C Diagram showing the spectrum of the entire band obtained by inserting a replica of the low-frequency spectrum into the high-frequency region.
  • FIG. 1D A diagram showing the spectrum after adjusting the envelope of the high frequency band
  • FIG. 4 is a block diagram showing the main configuration of a wireless transmission apparatus according to Embodiment 1
  • FIG. 5 is a block diagram showing a main configuration inside the sign key device according to Embodiment 1.
  • FIG. 6 is a block diagram showing the main configuration inside the high-frequency code section according to the first embodiment.
  • FIG. 7 is a block diagram showing the main components inside the gain code key section according to the first embodiment.
  • FIG. 8A is a diagram for explaining a series of processes related to interpolation calculation according to Embodiment 1.
  • FIG. 8B is a diagram for explaining a series of processes related to the interpolation calculation according to the first embodiment.
  • FIG. 11 is a block diagram showing another variation of the sign key device according to Embodiment 1.
  • FIG. 12 is a block diagram showing the main configuration of a high frequency code key section according to Embodiment 1
  • FIG. 13 is a block diagram showing the main configuration of the radio receiving apparatus according to Embodiment 1
  • FIG. 14 is a block diagram showing the main configuration inside the decoding device according to the first embodiment.
  • FIG. 15 is a block diagram showing the main configuration inside the high frequency decoding key section according to Embodiment 1
  • FIG. 16 shows a configuration of a decoding apparatus according to Embodiment 1.
  • FIG. 17 is a block diagram showing a main configuration of a high frequency decoding key unit according to Embodiment 1
  • FIG. 18A is a block diagram showing a main configuration on the transmission side when the coding apparatus according to Embodiment 1 is applied to a wired communication system.
  • FIG. 18B is a block diagram showing a main configuration on the receiving side when the decoding device according to Embodiment 1 is applied to a wired communication system.
  • FIG. 19 is a block diagram showing the main configuration of the hierarchical coding apparatus according to the second embodiment.
  • FIG. 20 is a block diagram showing the main configuration inside the spectrum code key section according to Embodiment 2.
  • FIG. 21 is a block diagram showing the main configuration inside the extension band gain code key section according to the second embodiment.
  • FIG. 22A is a diagram for explaining the outline of processing of the extension band gain code key section according to Embodiment 2;
  • FIG. 22B is a diagram for explaining the outline of the processing of the extension band gain code key section according to Embodiment 2
  • FIG. 23 is a block diagram showing an internal configuration of the hierarchical decoding device according to the second embodiment.
  • FIG. 24 is a block diagram showing an internal configuration of a spectrum decoding unit according to Embodiment 2.
  • FIG. 25 is a block diagram showing the main configuration inside the extended band gain decoding unit according to the second embodiment.
  • FIG. 26 is a block diagram showing the main configuration of the extension band gain code key section according to the third embodiment.
  • FIG. 27 is a diagram for explaining a method for calculating a reference amplitude value.
  • FIG. 28 is a diagram for explaining the interpolation processing of the interpolation unit according to the third embodiment.
  • FIG. 29 is a diagram for explaining a configuration of a decoding device according to the third embodiment.
  • FIG. 30 is a block diagram showing the main configuration of an extension band gain code key section according to the fourth embodiment.
  • FIG. 31 is a diagram for explaining a method of arranging gain candidates for the interpolation unit according to the fourth embodiment.
  • FIG. 32 is a diagram for explaining an extended band gain decoding unit according to the fourth embodiment.
  • the target of code Z decoding is an audio signal or audio signal
  • the present invention can be broadly divided into a first case applied to normal encoding (non-scalable code ⁇ ) and a second case applied to scalable code ⁇ . Therefore, the first case will be described in the first embodiment, and the second case will be described in the second embodiment.
  • FIG. 4 is a block diagram showing the main configuration of radio transmitting apparatus 130 when the coding apparatus according to Embodiment 1 of the present invention is mounted on the transmitting side of the radio communication system.
  • the wireless transmission device 130 includes an encoding device 100, an input device 131, an AZD conversion device 132, an RF modulation device 133, and an antenna 134.
  • the input device 131 converts the sound wave W11 that can be heard by the human ear into an analog signal that is an electrical signal, and outputs the analog signal to the AZD conversion device 132.
  • the AZD conversion device 132 converts this analog signal into a digital signal and outputs it to the encoding device 100.
  • the encoding device 100 encodes the input digital signal to generate a encoding signal, and outputs it to the RF modulation device 133.
  • the RF modulation device 133 modulates the encoded signal to generate a modulated encoded signal and outputs it to the antenna 134.
  • the antenna 134 transmits the modulated encoded signal as a radio wave W12.
  • FIG. 5 is a block diagram showing a main configuration inside the above-described sign key device 100.
  • a time domain digital signal is input, this signal is converted into a frequency domain signal, and the force is coded.
  • Code encoder 100 includes input terminal 101, frequency domain transform section 102, dividing section 103, low frequency encoding section 104, high frequency encoding section 105, multiplexing section 106, and output terminal 107. Have.
  • Frequency domain transform section 102 performs conversion to the frequency domain on the time domain digital signal input from input terminal 101, and generates a spectrum that is a frequency domain signal. Note that the effective frequency band of this spectrum is 0 ⁇ k ⁇ FH.
  • discrete Fourier transform, discrete cosine transform, modified discrete cosine transform, wavelet transform, etc. are used as the method of conversion to the frequency domain.
  • Dividing section 103 divides the spectrum obtained by frequency domain transforming section 102 into two frequency band (band) spectra, a low-frequency spectrum and a high-frequency spectrum, and performs a split scan.
  • the vector is supplied to the low frequency code key unit 104 and the high frequency code key unit 105.
  • the dividing unit 103 converts the spectrum output from the frequency domain transform unit 102 into a low-frequency spectrum with an effective frequency band 0 ⁇ k ⁇ FL and a high-frequency spectrum with an effective frequency band FL ⁇ k ⁇ FH.
  • the obtained low-frequency spectrum is given to the low-frequency code key unit 104 and the high-frequency spectrum is given to the high-frequency code key unit 105.
  • the low frequency code unit 104 performs code processing of the low frequency spectrum output from the dividing unit 103, and outputs the obtained code key information to the multiplexing unit 106.
  • the low frequency encoding unit 104 has more bits than the high frequency encoding unit 105.
  • MPEG layer 3 method, AAC method, TwinVQ Transform domain Weighted Iterieave Vector Quantization method, etc.
  • the high frequency code unit 105 performs encoding processing described later on the high frequency spectrum output from the dividing unit 103, and multiplexes the obtained code key information (gain information). Output to. Details of the code key method in the high frequency code key unit 105 will be described later.
  • the multiplexing unit 106 receives information on the low-frequency spectrum from the low-frequency code key unit 104, while the high-frequency code key unit 105 receives a gain necessary for obtaining an outline of the high-frequency spectrum. Information is entered. The multiplexing unit 106 multiplexes these pieces of information and outputs them from the output terminal 107.
  • FIG. 6 is a block diagram showing a main configuration inside the high frequency code key unit 105.
  • the spectrum shape encoding unit 112 is given the spectrum S (k) of the effective frequency FL ⁇ k ⁇ FH of the input signal through the input terminal 111, and encodes the shape of this spectrum. Specifically, the spectrum shape code unit 112 encodes the spectrum shape so that the audible distortion is minimized, and the code shape information relating to this spectrum shape is multiplexed by the multiplexer 114 and the spectrum shape. This is given to the decryption unit 116.
  • E ⁇ w (k)-(S (k)-C (i, k)) (Equation 1)
  • C (i, k) represents the i-th code vector included in the codebook
  • w (k) represents a weighting factor corresponding to the auditory importance of the frequency k
  • FL and FH represent indices corresponding to the minimum and maximum frequencies of the high-frequency spectrum, respectively.
  • the spectrum shape code key unit 112 may output a code vector C (i, k) that minimizes (Equation 2).
  • the spectrum shape decoding unit 116 decodes the code information related to the spectrum shape output from the spectrum shape code unit 112, and gains the obtained code vector C (i, k). This is given to the sign key 113.
  • the gain code key unit 113 codes the code vector C (i so that the spectral outline of the code vector C (i, k) is close to the spectral outline of the input spectrum S (k) that is the target signal. , k) is encoded, and the encoded information is provided to the multiplexing unit 114. The processing of the gain code key unit 113 will be described in detail later.
  • the multiplexing unit 114 multiplexes the code key information output from the spectrum shape code key unit 112 and the gain code key unit 113, and outputs this through the output terminal 115.
  • FIG. 7 is a block diagram showing a main configuration inside gain sign key section 113 described above.
  • the gain code key unit 113 receives the shape of the high-frequency spectrum from the spectrum shape decoding key unit 116 via the input terminal 121, and also receives the input spectrum via the input terminal 127.
  • the subband amplitude calculation unit 122 calculates the amplitude value of each subband for the spectrum shape input from the spectrum shape decoding unit 116.
  • the multiplication unit 123 adjusts the amplitude by multiplying the amplitude value of each subband of the spectrum shape output from the subband amplitude calculation unit 122 by the gain (described later) of each subband from which the interpolation unit 126 output is also output. After, search section Output to 124.
  • the subband amplitude calculation unit 128 calculates the amplitude value of each subband with respect to the input spectrum of the target signal input from the input terminal 127 and outputs it to the search unit 124.
  • Search section 124 calculates a distortion between the subband amplitude value output from multiplication section 123 and the subband amplitude value of the high-frequency spectrum provided from subband amplitude calculation section 128. Specifically, a plurality of gain quantization value candidates g (j) are registered in advance in the gain codebook 125, and the search unit 124 selects the plurality of gain quantization value candidates g (j). Specify one of them and calculate the above distortion (square distortion).
  • j is an index for identifying each gain quantization value candidate.
  • the gain codebook 125 gives the gain candidate g (j) designated by the search unit 124 to the interpolation unit 126.
  • the interpolation unit 126 uses the gain candidate g (j) to calculate the gain value of the subband for which the gain has not yet been determined by interpolation calculation. Then, the interpolation unit 126 gives the gain candidate given from the gain codebook 125 and the calculated interpolation gain candidate to the multiplication unit 123.
  • the processing of the multiplication unit 123, the search unit 124, the gain codebook 125, and the interpolation unit 126 is a feedback loop, and the search unit 124 includes all gain quanta registered in the gain codebook 125.
  • the above distortion (square distortion) is calculated for the candidate for the conversion value g1.
  • the search unit 124 outputs the gain index j that minimizes the square distortion through the output terminal 129.
  • the search unit 124 first selects a specific value from the gain quantization value candidates g (j) registered in the gain codebook 125, and uses this to store the remaining value.
  • a pseudo high-frequency spectrum is generated by interpolating the gain quantization value of the signal.
  • the search unit 124 uses the gain quantization used first.
  • a gain quantized value that gives the best similarity between two spectra is selected, and an index j indicating this gain quantized value is output.
  • FIGS. 8A and 8B are diagrams for explaining a series of processing related to the above-described interpolation calculation of the gain code key unit 113.
  • j represents an index for identifying gain candidates.
  • the gain codebook 125 is designed by using a sufficiently long learning data. Therefore, an appropriate gain candidate has already been stored.
  • the gain candidate G (j) may be either a scalar value or a vector value, but here it will be described as a two-dimensional vector.
  • the interpolation unit 126 uses the gain candidate G (j) to calculate the gain for the subband for which the gain has not yet been determined by interpolation.
  • the interpolation process is performed as shown in FIG. 8B.
  • the gain of the 0th subband is given by gO1
  • the gain of the 7th subband is given by gl (j)
  • the gain power of other subbands 1 ⁇ 2 0 (j) and gl (j) are linearly interpolated. Is given as an inset.
  • the input wideband spectrum to be encoded is divided into at least a low-frequency spectrum and a high-frequency spectrum, and is converted into a high-frequency vector.
  • this spectrum is further divided into a plurality of subbands, some of the subbands are selected, and only the gain of the selected subband is encoded (quantized). To do. Therefore, since not all subbands are coded, the gain can be coded efficiently with a small code amount.
  • the above processing is performed on the high frequency spectrum when the input signal is an audio signal, audio signal, etc., the high frequency data is less important than the low frequency data. Because of this.
  • the coding apparatus interpolates the selected gains with respect to the gains of the subbands not selected in the high frequency spectrum. It expresses by doing. Therefore, the gain can be determined while smoothly approximating the change in the spectrum outline while maintaining the code amount at a certain level. In other words, the generation of abnormal noise can be suppressed with a small number of bits, and the quality is improved. Therefore, when encoding the spectrum of a wideband signal, it is possible to improve the similarity between the high-frequency spectrum of the original signal and the newly generated spectrum while realizing a low bit rate.
  • the present invention focuses on the fact that the outline of the spectrum changes smoothly in the frequency axis direction. Using this property, the points to be encoded (quantization points) are limited to a part, and this Only the quantization points are encoded, and for the remaining subbands, the gains of the quantization points are interpolated with each other. It is what we wanted more.
  • the transmission apparatus equipped with the coding apparatus according to the present embodiment transmits only the quantization gain of the selected subband, and does not transmit the gain obtained by interpolation.
  • the decoding device mounted on the receiving device receives and decodes the transmitted quantized gain and transmits it to the sub-band gain. Gains are obtained by interpolating each other.
  • the interpolation method is not limited to this, and for example, interpolation is performed with a function other than a linear function due to spectrum characteristics. If it is clear that the sign key performance is improved by performing the above, the function may be used for the complement calculation.
  • the position of the quantization point is not necessarily limited to these settings, but it is expected that an error due to interpolation will be reduced by satisfying the following conditions.
  • the position of gO (j) is set to a position near the frequency FL, which is the connection between the low-frequency spectrum and the high-frequency spectrum, in order to maintain continuity between the low-frequency spectrum and the high-frequency spectrum. It is desirable.
  • gl (j) is set to the position of the subband of the maximum frequency of the high-frequency vector (in short, the right end of the high-frequency spectrum), at least the gain at this location can be specified, although the rough shape of the entire spectrum may not be accurate, it can be expressed efficiently.
  • the position of glG) may be, for example, an intermediate position between FL and FH.
  • FIG. 9 is a diagram showing a case where there is only one quantization point glG).
  • SL represents the low-frequency spectrum
  • SH represents the high-frequency spectrum.
  • the gain value of the subband of the maximum frequency in the low frequency spectrum can be expected not to be significantly different from the gain value of the subband of the minimum frequency of the high frequency spectrum.
  • the gain value of the subband at the maximum frequency is used. As a result, the above gain interpolation can be performed without obtaining gO (j).
  • the number of quantization points may be three or more.
  • Figures 10A and B show the case where there are three quantization points.
  • the subband gains determined for the three subbands are used, and the gains of the other subbands are determined by interpolation.
  • at least one point is the center of the high-frequency spectrum, even though 2 points are used to represent the gain of the high-frequency spectrum edge (FL or FH). It can be placed on the part (the part other than the end). Therefore, even if there is a characteristic part of the outline of the high-frequency spectrum, for example, a peak (maximum point) or a valley (minimum point), by assigning one quantization point to this peak or valley, It is possible to generate coding parameters that well represent the outline of the high-frequency spectrum. However, if the number of quantization points is increased to 3 or more, small changes in the spectral outline can be signified more faithfully, but the code efficiency is reduced by a trade-off.
  • the encoding method includes a step of selecting a part of quantization points from a plurality of subbands, and a step of obtaining the gain of the remaining gains by interpolation calculation.
  • the low bit rate error can be achieved even by limiting the quantization points to a part, so the interpolation calculation step is omitted when high code performance is not required.
  • only the step of selecting a part of the quantization points may be used.
  • the input digital signal is directly converted into the frequency domain to Although the case where the split is performed has been described as an example, the present invention is not limited to this.
  • FIG. 11 is a block diagram showing another variation (encoding apparatus 100a) of encoding apparatus 100 described above.
  • symbol is attached
  • a configuration may be adopted in which an input digital signal is band-divided by filtering.
  • FIG. 12 is a block diagram showing a main configuration of high frequency code key section 105a in code key apparatus 100a. It should be noted that the same components as those in the high-frequency code unit 105 are denoted by the same reference numerals.
  • the difference between the high frequency code key unit 105 and the high frequency code key unit 105a is where the frequency domain transform unit is installed.
  • FIG. 13 is a block diagram showing the main configuration of radio receiving apparatus 180 that receives a signal transmitted from radio transmitting apparatus 130 according to the present embodiment.
  • the wireless reception device 180 includes an antenna 181, an RF demodulation device 182, a decoding device 150, a DZA conversion device 183, and an output device 184.
  • the antenna 181 receives a digital encoded acoustic signal as the radio wave W 12, generates a digital reception code / acoustic signal of an electric signal, and supplies the generated signal to the RF demodulator 182.
  • the RF demodulator 182 demodulates the received encoded acoustic signal from the antenna 181 to generate a demodulated encoded acoustic signal and supplies it to the decoding apparatus 150.
  • Decoding unit 150 receives the digital demodulated encoded acoustic signal from RF demodulator 182 and performs a decoding process to generate a digital decoded acoustic signal to generate a DZA conversion unit 183. give.
  • the DZA conversion device 183 converts the digital decoded audio signal from the decoding device 150 to generate an analog decoded audio signal, and provides it to the output device 184.
  • the output device 184 converts the analog decoded audio signal, which is an electrical signal, into air vibration and outputs it as a sound wave W13 so that it can be heard by the human ear.
  • FIG. 14 is a block diagram showing the main configuration inside decoding apparatus 150 described above.
  • Separating section 152 receives a low-frequency code from the demodulated encoded acoustic signal input via input terminal 151.
  • the encoding parameter and the high frequency decoding key parameter are separated, and each encoding parameter is given to the low frequency decoding unit 153 and the high frequency decoding key unit 154, respectively.
  • the low frequency decoding unit 153 generates a low frequency decoding spectrum by decoding the encoding parameters obtained by the encoding process of the low frequency encoding unit 104, and provides the resultant to the combining unit 155.
  • Highband decoding key section 154 performs a decoding process using the highband code key parameters, generates a highband decoding spectrum, and provides it to combining section 155.
  • Combining section 155 combines the low-frequency decoded spectrum and the high-frequency decoded spectrum, and provides the combined spectrum to time domain transforming section 156.
  • the time domain conversion unit 156 converts the combined spectrum into the time domain, performs processing such as windowing and superposition addition so that discontinuity is less likely to occur between consecutive frames, and outputs from the output terminal 157. To do.
  • FIG. 15 is a block diagram showing a main configuration inside highband decoding key section 154.
  • Separating section 162 separates the spectrum shape code and the gain code from the high-frequency encoding parameter input via input terminal 161, and separates the spectrum shape code and the gain code from each of the spectrum shape decoding section 163 and the gain. This is given to the decryption key 164.
  • the spectrum shape decoding unit 163 selects the codebook power code vector C (i, k) with reference to the spectrum shape code, and supplies the code strength code vector C (i, k) to the multiplication unit 165.
  • Gain decoding section 164 decodes the gain based on the gain code, and provides the result to multiplication section 165. Details of the gain decoding unit 164 will be described in detail in the second embodiment.
  • Multiplication section 165 multiplies code vector C (i, k) selected by spectrum shape decoding section 163 by the gain decoded by gain decoding section 164, and outputs the result via output terminal 166. To do.
  • the configuration on the sign key side is a structure that performs band division into a low frequency signal and a high frequency signal by a band division filter, as in the code key device 100a shown in FIG.
  • the configuration of the corresponding decoding device is the configuration (decoding device 150a) shown in FIG.
  • symbol is attached
  • FIG. 17 is a block diagram showing the main configuration of highband decoding section 154a in decoding apparatus 150a.
  • the same components as those in the high frequency decoding unit 154 are denoted by the same reference numerals.
  • the difference between the high frequency decoding unit 154 and the high frequency decoding unit 154a is in which position the frequency domain transform unit is installed.
  • the decoding apparatus described above it is possible to decode information encoded by the encoding apparatus according to the present embodiment.
  • the case where the frequency band of the input signal is divided into two bands has been described as an example.
  • the present invention is not limited to this, and the frequency band of the input signal is divided into two or more bands.
  • the signal in the power frequency domain described as an example where the signal in the time domain is input may be directly input.
  • the encoding apparatus or decoding apparatus according to the present embodiment is applied to a wireless communication system has been described as an example, but the encoding apparatus or decoding according to the present embodiment has been described.
  • the conversion apparatus can also be applied to a wired communication system as shown below.
  • FIG. 18A is a block diagram showing the main configuration on the transmission side when the coding apparatus according to the present embodiment is applied to a wired communication system.
  • the same components as those already shown in FIG. 4 are denoted by the same reference numerals, and the description thereof is omitted.
  • the wired transmission device 140 includes an encoding device 100, an input device 131, and an AZD conversion device 132, and an output is connected to the network N1.
  • the input terminal of the AZD conversion device 132 is connected to the output terminal of the input device 131.
  • the input terminal of the encoding device 100 is connected to the output terminal of the AZD conversion device 132.
  • the output terminal of the encoder 100 is connected to the network N1.
  • the input device 131 converts the sound wave W11 that can be heard by the human ear into an analog signal that is an electrical signal, and provides the analog signal to the AZD conversion device 132.
  • the AZD conversion device 132 converts the analog signal into a digital signal and gives the digital signal to the encoding device 100.
  • the encoding device 100 encodes an input digital signal to generate a code, and outputs the code to the network N1.
  • FIG. 18B is a block diagram showing a main configuration on the reception side when the decoding apparatus according to the present embodiment is applied to a wired communication system.
  • the same components as those already shown in FIG. 13 are denoted by the same reference numerals, and the description thereof is omitted.
  • the wired receiving device 190 includes a receiving device 191 connected to the network N1, a decoding device 150, a DZA conversion device 183, and an output device 184.
  • the input terminal of the reception device 191 is connected to the network N1.
  • Decryption device 150 Are connected to the output terminal of the receiving device 191.
  • the input terminal of the DZA conversion device 183 is connected to the output terminal of the decoding device 150.
  • the input terminal of the output device 184 is connected to the output terminal of the DZA converter 183.
  • Receiving device 191 receives the digital coded acoustic signal from network N1, generates a digital received acoustic signal, and provides it to decoding device 150.
  • the decoding apparatus 150 receives the received acoustic signal from the receiving apparatus 191, performs a decoding process on the received acoustic signal, generates a digital decoded acoustic signal, and provides the digital decoded acoustic signal to the DZA converter 183.
  • the DZA conversion device 183 converts the digital decoded speech signal from the decoding device 150 to generate an analog decoded speech signal, and provides it to the output device 184.
  • the output device 184 converts an analog decoded acoustic signal, which is an electrical signal, into vibration of the air and outputs it as a sound wave W13 so that it can be heard by the human ear.
  • the feature of the present embodiment is that the encoding device and decoding device of the present invention are applied to a band scalable code having scalability in the frequency axis direction.
  • FIG. 19 is a block diagram showing the main configuration of hierarchical coding apparatus 200 according to Embodiment 2 of the present invention.
  • Hierarchical code encoder 200 includes an input terminal 221, a downsampling unit 222, a first layer encoding unit 223, a first layer decoding unit 224, a delay unit 226, a spectral encoding unit 210, A multiplexing unit 227 and an output terminal 228 are provided.
  • a signal having an effective frequency band of 0 ⁇ k ⁇ FH is input to the input terminal 221 from the AZD converter 132.
  • the downsampling unit 222 performs downsampling on the signal input via the input terminal 221 to generate and output a signal having a low sampling rate.
  • the first layer encoding unit 223 encodes the signal after the downsampling, outputs the obtained encoding parameter to the multiplexing unit (multiplexer) 227, and also performs the first layer decoding. Also output to buttock 224.
  • First layer decoding section 224 generates a decoded signal of the first layer based on this encoding parameter.
  • the delay unit 226 gives a delay of a predetermined length to the signal input via the input terminal 221.
  • the magnitude of this delay is the same as the time delay that occurs when the signal passes through the downsampling unit 222, the first layer encoding unit 223, and the first layer decoding unit 224.
  • the spectrum code key unit 210 performs spectrum code keying using the signal output from the first layer decoding key unit 224 as the first signal and the signal output from the delay unit 226 as the second signal,
  • the generated coding parameters are output to multiplexing section 227.
  • Multiplexing section 227 multiplexes the coding parameter obtained by first layer coding section 223 and the coding parameter obtained by spectrum coding section 210, and outputs it as an output code via output terminal 228. .
  • This output code is provided to the RF modulator 133.
  • FIG. 20 is a block diagram showing a main configuration inside spectrum code key unit 210 described above.
  • Spectrum code key unit 210 has input terminals 201 and 204, frequency domain transform units 202 and 205, extended band spectrum estimation unit 203, extended band gain code key unit 206, multiplexing unit 207, and output terminal Has 208.
  • Input terminal 201 receives the signal decoded by first layer decoding section 224.
  • the effective frequency band of this signal is 0 ⁇ k ⁇ FL.
  • the second signal having an effective frequency band of 0 ⁇ k ⁇ FH (where FL and FH) is input from the delay unit 226 to the input terminal 204.
  • Frequency domain transform section 202 performs frequency transform on the first signal input from input terminal 201 to calculate first spectrum Sl (k).
  • the frequency domain conversion unit 205 performs frequency conversion on the second signal input from the input terminal 204, and calculates the second spectrum S2 (k).
  • DFT discrete Fourier transform
  • DCT discrete cosine transform
  • MDCT modified discrete cosine transform
  • the extended band spectrum estimation unit 203 estimates the spectrum to be included in the band FL ⁇ k ⁇ FH of the first spectrum Sl (k) using the second spectrum S2 (k) as a reference signal, and estimates the estimated spectrum E (k) (where FL ⁇ k ⁇ FH).
  • the estimated spectrum E (k) is estimated based on the spectrum included in the low band (0 ⁇ k ⁇ FL) of the first spectrum Sl (k).
  • the extended band gain sign unit 206 codes the gain to be multiplied by the estimated spectrum E (k) using the estimated spectrum E (k) and the second spectrum S2 (k). How little processing is done here It is important to make the spectral outline of the estimated spectrum E (k) in the extended band efficiently close to the spectral outline of the second vector S2 (k) with a large code amount. The sound quality is greatly affected by this success or failure.
  • the multiplexing unit 207 receives information on the estimated spectrum of the extension band from the extension band spectrum estimation unit 203 and obtains the spectral outline of the extension band from the extension band gain code unit 206. Necessary gain information is input. This information is multiplexed and output from output terminal 208.
  • FIG. 21 is a block diagram showing a main configuration inside extension band gain code key section 206 described above.
  • the extended band gain code unit 206 includes input terminals 211 and 217, subband amplitude calculation units 212 and 218, gain codebook 215, interpolation unit 216, multiplication unit 213, search unit 214, and output terminal 219.
  • the estimated spectrum E (k) is input from the input terminal 211, and the second spectrum S2 (k) is input from the input terminal 217.
  • Subband amplitude calculation section 212 divides the extended band into subbands and calculates the amplitude value of estimated spectrum E (k) for each subband.
  • the extension band is expressed as FL ⁇ k ⁇ F H
  • the bandwidth BW of the extension band is expressed as (Equation 3).
  • the minimum frequency FL (n) of the nth subband is expressed as (Equation 5), and the maximum frequency FH (n) of the nth subband is expressed as (Equation 6).
  • the amplitude value AE (n) of the estimated spectrum E (k) is calculated according to (Equation 7) for each subband defined in this way.
  • subband amplitude calculation section 218 calculates amplitude value AS2 (n) for each subband of second spectrum S2 (k) according to (Equation 8).
  • gain codebook 215 has J gain quantized value candidates G (j) (where 0 ⁇ j ⁇ J), and performs the following processing on all gain candidates: .
  • the gain codebook 215 is designed in advance using a sufficiently long learning data. Therefore, the appropriate gain candidate is already stored.
  • FIGS. 22A and 22B are diagrams for explaining the outline of the processing of the extended band gain code unit 206.
  • the first element gO (j) of gain candidate G1 is the 0th subband gain
  • the second element gl (j) is the 7th subband gain
  • each is the 1st subband. And in the 7th subband.
  • Interpolation section 216 uses this gain candidate G (j) to calculate the gain for the sub-band by interpolation when the gain is still determined.
  • the 0th subband gain is given by gO1
  • the 7th subband gain is given by gl (j)
  • the other subband gains are given by gO (j) and gl (j)
  • the gain p (j, n) of the nth subband can be expressed as (Equation 9).
  • the subband gain candidate p (j, n) calculated in this way is given to the multiplier 213.
  • Multiplication section 213 multiplies subband amplitude value AE (n) given from subband amplitude calculation section 212 and subband gain candidate p (j, n) given from interpolation section 216 for each element.
  • AE ′ (n) is calculated according to (Equation 10) and given to search section 214.
  • Search unit 214 calculates the distortion between subband amplitude value AE, (n) after multiplication and subband amplitude value AS2 (k) of the second spectrum given by subband amplitude calculation unit 218.
  • the definition of force distortion which is explained by taking the case of using square distortion as an example, is achieved by using, for example, a distance scale that performs weighting based on auditory sensitivity for each element.
  • Search section 214 calculates square distortion D of AE ′ (n) and AS2 (n) according to (Equation 11).
  • the square distortion D may be set as (Equation 12).
  • w (n) represents a weight function based on auditory sensitivity.
  • gain quantized value candidates G (j) included in gain codebook 215 square distortion D is calculated in accordance with the above processing, and when square distortion D is the smallest among them, The gain index j is output via output terminal 219.
  • the gain is determined by performing interpolation based on the magnitude of the subband amplitude.
  • the interpolation is performed based on the subband logarithmic energy instead of the subband amplitude. It may be.
  • the gain is determined so that the spectral outline changes smoothly in the logarithmic energy region that matches the human auditory characteristics, so that the quality is improved more audibly and the effect is obtained.
  • FIG. 23 is a block diagram showing an internal configuration of hierarchical decoding apparatus 250 that decodes the information encoded by hierarchical encoding apparatus 200 described above.
  • a description will be given by taking as an example the case of decoding a hierarchically encoded encoding meter.
  • the hierarchical decoding device 250 has an input terminal 171, a separation unit 172, a first layer decoding unit 173, a spectrum decoding unit 260, and output terminals 176 and 177.
  • a digital demodulated code signal is input to the input terminal 171 from the RF demodulator 182.
  • Separating section 172 separates the demodulated encoded acoustic signal input via input terminal 171 and generates a coding key parameter for first layer decoding section 173 and a coding parameter for spectrum decoding key section 260.
  • First layer decoding section 173 decodes the decoded signal of signal band 0 ⁇ k ⁇ FL by using the coding parameter obtained by separating section 172, and provides this decoded signal to the spectrum decoding section .
  • the other output is connected to the output terminal 176.
  • the spectrum decoding unit 260 is provided with the code key parameter separated by the separating unit 172 and the first layer decoded signal obtained from the first layer decoding unit.
  • the spectrum decoding unit 260 performs spectrum decoding to be described later, generates a decoded signal having a signal band 0 ⁇ k ⁇ FH, and outputs this via an output terminal 177.
  • the spectrum decoding unit 260 performs processing by regarding the first layer decoded signal given from the first layer decoding unit as the first signal.
  • the first layer decoded signal generated by first layer decoding section 173 when it is necessary to output the first layer decoded signal generated by first layer decoding section 173, it can be output from output terminal 176. Further, when it is necessary to output the output signal of the spectrum decoding unit 260 having higher quality, it can be output from the output terminal 177. Either one of the output terminal 176 or the output terminal 177 is output from the hierarchical decoding device 250 and is supplied to the DZA conversion device 183. It is done. Which signal is output is based on the settings and judgment results of the application and user.
  • FIG. 24 is a block diagram showing an internal configuration of the spectrum decoding unit 260 described above.
  • This spectrum decoding unit 260 is composed of input terminals 251, 253, separation unit 252, frequency domain conversion unit 254, extended band estimation spectrum adding unit 255, extended band gain decoding unit 256, multiplication. Section 257, time domain conversion section 258, and output terminal 259.
  • the code key parameter encoded by the spectrum code key unit 210 is input from the input terminal 251, and the extension band estimation spectrum giving unit 255 and the extension band gain decoding key unit are connected via the separation unit 252.
  • the sign parameter is input to 256 respectively.
  • a first signal having an effective frequency band power ⁇ ⁇ k ⁇ FL is input to the input terminal 25 3.
  • This first signal is a first layer decoded signal decoded by first layer decoding section 173.
  • the frequency domain transform unit 254 performs frequency transform on the time domain signal input from the input terminal 253, and calculates the first span Sl (k).
  • the frequency transform method uses discrete Fourier transform (DFT), discrete cosine transform (DCT), modified discrete cosine transform (MDCT), or the like.
  • Extension band estimation spectrum assigning section 255 is a coding parameter obtained from separating section 252 for the spectrum included in extension band FL ⁇ k ⁇ FH of first spectrum Sl (k) given by frequency domain transform section 254. Generate based on This generation method depends on the estimation method of the extended band spectrum used on the encoding side, but here the estimated spectrum E (k) included in the extended band is generated using the first spectrum Sl (k). Shall. Therefore, the combined spectrum F (k) output from the extended band estimation spectrum assigning unit 255 is the first spectrum Sl (k) in the band 0 ⁇ k ⁇ FL, and the extended band in the band FL ⁇ k ⁇ FH. Consists of estimated spectrum E (k).
  • the extended band gain decoding unit 256 is a subband gain multiplied by the spectrum included in the extended band FL ⁇ k ⁇ FH of the combined spectrum F (k) based on the sign key parameter given by the separating unit 252.
  • Generate p (j, n) A method for generating the subband gain p (j, n) will be described later.
  • Multiplier 257 includes an extended band gain for each subband in the spectrum included in extended band FL ⁇ k ⁇ FH of combined spectrum F (k) given from extended band estimation spectrum giving section 255.
  • the decoding spectrum F, (k) is generated by multiplying the subband gain p (j, n) given by the decoding decoding unit 256.
  • the decoded spectrum F ′ (k) can be expressed as (Equation 13).
  • Time domain conversion section 258 converts the decoded spectrum F ′ (k) obtained from multiplication section 257 into a time domain signal and outputs it through output terminal 259.
  • processing such as appropriate windowing and overlay addition is performed as necessary to avoid discontinuities between frames.
  • FIG. 25 is a block diagram showing the main configuration inside extension band gain decoding unit 256 described above.
  • the index j determined by the extension band gain code key unit 206 on the code key side is input from the input terminal 261, and the gain G (j) is selected from the gain code book 262 based on this index information. Selected and output.
  • the gain G (j) is given to the interpolation unit 263, and the interpolation unit 263 generates a subband gain p (j, n) by performing interpolation according to the method described above, and outputs it from the output terminal 264.
  • the decoding apparatus of the present embodiment since it has a configuration corresponding to the encoding method according to the present embodiment, it is efficiently encoded with a small number of bits.
  • the sound signal can be decoded and a good sound signal can be output.
  • FIG. 26 is a block diagram showing a main configuration of extension band gain code key section 301 in the code key apparatus according to Embodiment 3 of the present invention.
  • the extended band gain code unit 301 has the same basic configuration as the extended band gain encoding unit 206 shown in the second embodiment, and the same components are assigned the same reference numerals. The description is omitted.
  • the feature of this embodiment is that the order of the gain quantized value candidate G (j) included in the gain codebook is 1, that is, a scalar value, and gain interpolation uses a reference amplitude value given from the input terminal. This is because it is performed between the reference gain obtained based on the basis and the gain quantization value candidate G (j). According to this configuration, since the number of gains to be quantized is reduced to 1, an effect of enabling a low bit rate error is obtained.
  • the reference gain calculation unit 303 is supplied with the reference subband amplitude value in the lowest band among the reference amplitude value input from the input terminal 302 and the subband amplitude value calculated by the subband amplitude calculation unit 212.
  • the reference gain calculation unit 303 determines the reference gain so that the assumption that the reference amplitude value and the lowest band subband amplitude value are satisfied. If the reference amplitude value is Ab and the lowest subband amplitude value is AE (O), the reference gain g b is expressed as (Equation 14).
  • the extended band gain decoding unit 350 has the same basic configuration as the extended band gain decoding unit 256 (see FIG. 25) shown in Embodiment 2, and the same components The same reference numerals are attached and the description thereof is omitted.
  • a reference amplitude value Ab is given from the input terminal 351, and a subband amplitude value AE (O) of the lowest subband in the estimated spectrum of the extension band is given from the input terminal 352.
  • the reference amplitude value includes the vector force included in the band adjacent to the extension band.
  • the reference gain calculation unit 353 assumes that the reference amplitude value and the lowest subband amplitude value match. The reference gain is determined so that
  • the number of gains to be quantized is reduced to 1, and a further low bit rate error is possible.
  • FIG. 30 is a block diagram showing the main configuration of extension band gain encoding section 4001 in the encoding apparatus according to Embodiment 4 of the present invention.
  • the extended band gain code unit 401 has the same basic configuration as the extended band gain encoding unit 206 shown in the second embodiment, and the same components are denoted by the same reference numerals. The description is omitted.
  • the feature of the present embodiment is that the subband having the most characteristic (for example, the maximum value or the minimum value of the gain) of the subbands included in the extension band is necessarily the target of the gain codebook search.
  • the point is to include. According to this configuration, since the subband most affected by the gain can be included in the search target of the gain codebook, the effect of improving the quality can be obtained. However, in this configuration, it is necessary to code additional information indicating which subband has been selected.
  • the subband determination unit 402 uses the subband amplitude value AE (n) of the estimated spectrum E (k) obtained by the subband amplitude calculation unit 212 and the second scan obtained by the subband amplitude calculation unit 218.
  • the ideal gain value go pt (n) is calculated according to (Equation 15) using the subband amplitude value AS2 (n) of the petal S2 (k).
  • the subband having the maximum (or minimum) ideal gain gopt (n) is obtained, and the subband number is output from the output terminal.
  • extension band gain decoding section 450 in the decoding apparatus for decoding the signal encoded by the encoding apparatus according to the present embodiment will be described using FIG.
  • the extended band gain decoding unit 450 has the same basic configuration as the extended band gain decoding unit 256 shown in the second embodiment, and the same components are denoted by the same reference numerals. The description is omitted.
  • the code encoding performance can be further improved. it can.
  • the spectral coding apparatus according to the present invention is not limited to Embodiments 1 to 4 above, and can be implemented with various modifications.
  • the coding apparatus and decoding apparatus according to the present invention can be mounted on a communication terminal apparatus and a base station apparatus in a mobile communication system, and thereby have the same operational effects as described above.
  • a communication terminal device and a base station device can be provided.
  • the present invention can be implemented with software.
  • the encoding method and the decoding method according to the present invention are described in a programming language, the program is stored in a memory, and is then executed by an information processing means, so that the coding according to the present invention is performed. Functions similar to those of the key device and the decoding key device can be realized.
  • each functional block used in the description of each of the above embodiments is typically realized as an LSI that is an integrated circuit. These may be individually made into one chip, or may be made into one chip so as to include some or all of them.
  • the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general-purpose processors is also possible.
  • FPGA Field that can be programmed after LSI manufacturing
  • the encoding device, the decoding device, and these methods according to the present invention can be applied to applications such as a communication terminal device in a mobile communication system.

Abstract

 広帯域信号のスペクトルを符号化する際に、低ビットレート化を実現しつつ、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度を向上させることができる符号化装置を開示する。広帯域信号から得られる高域スペクトルに対し、この装置のサブバンド振幅算出部(122、128)は、各サブバンドの振幅を算出する。探索部(124)およびゲイン符号帳(125)は、複数のサブバンドの中から一部のサブバンドを選択し、選択されたサブバンドのゲインのみを符号化対象とする。補間部(126)は、選択されなかったサブバンドのゲインを、選択されたゲインを互いに補間することにより表す。

Description

符号化装置、復号化装置、およびこれらの方法
技術分野
[0001] 本発明は、広帯域の音声信号、オーディオ信号等のスペクトルを符号化する符号 化装置、復号化装置、およびこれらの方法に関する。
背景技術
[0002] 音声符号化の分野にお!ヽて、 50Hz〜7kHzの広帯域信号を符号化する代表的な 方法として、 ITU— Tの規格 G722、 G722. 1、または 3GPP (The 3rd Generation Partnership Project)が提唱する AMR— WB等がある。これらの符号化方式によれば 、ビットレートが 6. 6kbitZs〜64kbitZsと広帯域の音声信号の符号化を行うことが できる。しかし、この広帯域信号の音質は、狭帯域信号に比べれば高いものの、ォー ディォ信号を対象とした場合や音声信号でもさらに高臨場感な品質が求められる場 合には充分でない。
[0003] 一般に、信号の最大周波数を 10〜 15kHz程度まで広帯域ィ匕できれば、 FMラジオ 相当の臨場感を得ることができ、 20kHz程度まで広帯域ィ匕できれば CD並みの品質 を得ることができる。このような広帯域信号の符号化には、 MPEG (Moving Picture Expert Group)で規格化されているレイヤ 3方式や AAC (Advanced audio coding)方 式等に代表されるオーディオ信号に対する符号ィ匕方式が適している。しかし、これら のオーディオ符号ィ匕方式は、符号ィ匕対象の周波数帯域が広いため、符号ィ匕パラメ一 タのビットレートは大きくなる。
[0004] 特許文献 1には、広帯域信号のスペクトルを低ビットレートで高品質に符号ィ匕する 技術として、広帯域スペクトルのうち高域部のスペクトルを、低域部のスペクトルの複 製で置換した後に包絡線調整を行うことにより、品質劣化を抑えつつ全体のビットレ ートを低減させる技術が開示されている。
[0005] また、特許文献 2には、スペクトルを複数のサブバンドに分割し、サブバンド毎にゲ インを算出してゲインベクトルを生成し、このゲインベクトルをベクトル量子化すること により、ビットレートを低減する技術が開示されている。 特許文献 1 :特表 2001— 521648号公報 (第 15頁、第 1図、第 2図) 特許文献 2:特開平 5 - 265487号公報
発明の開示
発明が解決しょうとする課題
[0006] 図 1A〜Dは、特許文献 1に開示されている技術を周波数帯域 0≤k<FHの原信 号に適用したときの各スペクトルを示す図である。
[0007] 図 1Aは、原信号のスペクトル、図 1Bは、原信号のスペクトルの高域部(FL≤k<F H)を削除した後の低域スペクトル、図 1Cは、図 1Bの低域スペクトルの複製を高域部 に挿入することにより得られる全帯域のスペクトル、図 1Dは、高域部の包絡線調整を した後のスペクトルを示して 、る。
[0008] このように、高域スペクトルを低域スペクトルの複製で置換した後に包絡線調整を行 うのは、新たに生成される高域スペクトル (複製スペクトル)の概形が原信号の高域ス ベクトルの概形と大きく異なっていると、大きな品質劣化が生じることがわ力つている カゝらである。そのため、新たに生成される高域スペクトルの概形を調整することにより 、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度を向上させること は非常に重要なことである。
[0009] 高域スペクトルの概形を調整する方法としては、例えば、複製スペクトルのエネルギ 一が原信号の高域スペクトルのエネルギーと一致するように、複製スペクトルに調整 係数 (ゲイン)を乗じることが考えられる。図 2A、 Bは、この複製スペクトルにゲインを 乗じる処理によって得られるスペクトルの概形の一例を示す図である。
[0010] 図 2Aは、原信号のスペクトルの概形を示す図、図 2Bは、概形調整後のスペクトル の概形を示す図である。
[0011] この図からわ力るように、上記のスペクトル概形調整を行うと、得られるスペクトルに は次の不具合がある。すなわち、低域スペクトルと高域スペクトルとの接続部におい て不連続が発生し、異音の原因となる。これは、高域スペクトル全体に一律の同一ゲ インを乗じるため、高域スペクトルのエネルギーは原信号のそれに一致するものの、 低域スペクトルと高域スペクトルとの間の連続性が保たれるとは限らないからである。 また、低域スペクトルの概形に何か特徴的な形状があった場合、一律の同一ゲインを 乗じるだけではその特徴的な形状が高域部に不適切なまま残ってしまい、これも音 質劣化の一因となる。
[0012] 例えば、上記のスペクトルの概形調整に特許文献 2の技術を応用すること、すなわ ち、サブバンド分割後に各サブバンドごとにゲインを調整することにより概形調整を行 うことも考えられる。図 3A、 Bは、この処理によって得られるスペクトルの概形の一例 を示す図である。
[0013] 図 3Aは、原信号のスペクトルの概形を示す図、図 3Bは、サブバンド分割後に各サ ブバンドのゲインを調整した場合のスペクトルの概形を示す図である。
[0014] この図からわ力るように、特許文献 2の技術を応用した場合、高域スペクトルの形状 が不正確であること(元の原信号の形状を精度良く再現できないこと)が起こり得る。 これは、サブバンドごとにゲインを調整する方法は、精度良く符号ィ匕を行うためには サブバンド数を増加させ本来多くのビット数を必要とするところ、充分なビット数が配 分されないために生じる。そもそも、高域スペクトルを低域スペクトルの複製で置換す るのは、低ビットレートイ匕を目的とするものであるから、この状況は当然起こり得ること である。
[0015] 以上説明したように、従来の方法では、広帯域信号のスペクトルを符号ィ匕する際に 、低ビットレートイ匕を実現しつつ、原信号の高域スペクトルと新たに生成されるスぺタト ルとの類似度を向上させることは困難である。
[0016] よって、本発明の目的は、広帯域信号のスペクトルを符号ィ匕する際に、低ビットレー ト化を実現しつつ、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度 を向上させることができる符号ィ匕装置および符号ィ匕方法を提供することである。
課題を解決するための手段
[0017] 本発明の符号ィ匕装置は、少なくとも低域と高域とに分けられたスペクトルを取得する 取得手段と、前記低域のスペクトルを符号化する第 1の符号化手段と、前記高域のス ベクトルの形状を符号化する第 2の符号化手段と、前記高域のスペクトルの特定の位 置のゲインのみを符号化する第 3の符号化手段と、前記第 1、第 2、および第 3の符 号化手段で得られる符号化情報を出力する出力手段と、を具備する構成を採る。 発明の効果 [0018] 本発明によれば、広帯域信号のスペクトルを符号ィ匕する際に、低ビットレートイ匕を実 現しつつ、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度を向上 させることがでさる。
図面の簡単な説明
[0019] [図 1A]原信号のスペクトルを示す図
[図 1B]原信号のスペクトルの高域部を削除した後の低域スペクトルを示す図
[図 1C]低域スペクトルの複製を高域部に挿入することにより得られる全帯域のスぺク トルを示す図
[図 1D]高域部の包絡線調整をした後のスペクトルを示す図
[図 2A]原信号のスペクトルの概形を示す図
[図 2B]概形調整後のスペクトルの概形を示す図
[図 3A]原信号のスペクトルの概形を示す図
[図 3B]サブバンド分割後に各サブバンドのゲインを調整した場合のスペクトルの概形 を示す図
[図 4]実施の形態 1に係る無線送信装置の主要な構成を示すブロック図
[図 5]実施の形態 1に係る符号ィ匕装置内部の主要な構成を示すブロック図
[図 6]実施の形態 1に係る高域符号ィ匕部内部の主要な構成を示すブロック図
[図 7]実施の形態 1に係るゲイン符号ィ匕部内部の主要な構成を示すブロック図
[図 8A]実施の形態 1に係る補間演算関連の一連の処理を説明するための図
[図 8B]実施の形態 1に係る補間演算関連の一連の処理を説明するための図
[図 9]量子化点が gl(j)の 1点のみである場合を示した図
[図 10A]量子化点が 3点の場合を示した図
[図 10B]量子化点が 3点の場合を示した図
[図 11]実施の形態 1に係る符号ィ匕装置の別のバリエーションを示すブロック図
[図 12]実施の形態 1に係る高域符号ィ匕部の主要な構成を示すブロック図
[図 13]実施の形態 1に係る無線受信装置の主要な構成を示すブロック図
[図 14]実施の形態 1に係る復号ィ匕装置内部の主要な構成を示すブロック図
[図 15]実施の形態 1に係る高域復号ィ匕部内部の主要な構成を示すブロック図 [図 16]実施の形態 1に係る復号化装置の構成を示す図
[図 17]実施の形態 1に係る高域復号ィ匕部の主要な構成を示すブロック図
[図 18A]実施の形態 1に係る符号化装置が有線通信システムに適用された場合の送 信側の主要な構成を示すブロック図
[図 18B]実施の形態 1に係る復号ィ匕装置が有線通信システムに適用された場合の受 信側の主要な構成を示すブロック図
[図 19]実施の形態 2に係る階層符号ィ匕装置の主要な構成を示すブロック図
[図 20]実施の形態 2に係るスペクトル符号ィ匕部内部の主要な構成を示すブロック図
[図 21]実施の形態 2に係る拡張帯域ゲイン符号ィ匕部内部の主要な構成を示すブロッ ク図
[図 22A]実施の形態 2に係る拡張帯域ゲイン符号ィ匕部の処理の概要を説明するため の図
[図 22B]実施の形態 2に係る拡張帯域ゲイン符号ィ匕部の処理の概要を説明するため の図
[図 23]実施の形態 2に係る階層復号ィ匕装置の内部構成を示すブロック図
[図 24]実施の形態 2に係るスペクトル復号ィ匕部の内部構成を示すブロック図
[図 25]実施の形態 2に係る拡張帯域ゲイン復号ィ匕部内部の主要な構成を示すブロッ ク図
[図 26]実施の形態 3に係る拡張帯域ゲイン符号ィ匕部の主要な構成を示すブロック図
[図 27]基準振幅値の算出方法を説明するための図
[図 28]実施の形態 3に係る補間部の補間処理を説明するための図
[図 29]実施の形態 3に係る復号ィ匕装置の構成について説明する図
[図 30]実施の形態 4に係る拡張帯域ゲイン符号ィ匕部の主要な構成を示すブロック図
[図 31]実施の形態 4に係る補間部のゲイン候補の配置方法を説明するための図
[図 32]実施の形態 4に係る拡張帯域ゲイン復号ィ匕部について説明する図 発明を実施するための最良の形態
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお 、ここでは符号ィ匕 Z復号ィ匕対象がオーディオ信号または音声信号である場合を例に とって説明する。また、本発明は大別して、通常の符号化 (スケーラブルでない符号 ィ匕)に適用される第 1のケースと、スケーラブル符号ィ匕に適用される第 2のケースと、 が考えられる。そこで、実施の形態 1では第 1のケースについて、実施の形態 2では 第 2のケースについて説明する。
[0021] (実施の形態 1)
図 4は、本発明の実施の形態 1に係る符号ィ匕装置が無線通信システムの送信側に 搭載された場合の無線送信装置 130の主要な構成を示すブロック図である。
[0022] この無線送信装置 130は、符号化装置 100、入力装置 131、 AZD変換装置 132 、 RF変調装置 133、およびアンテナ 134を有する。
[0023] 入力装置 131は、人間の耳に聞こえる音波 W11を電気的信号であるアナログ信号 に変換し、 AZD変換装置 132に出力する。 AZD変換装置 132は、このアナログ信 号をディジタル信号に変換し、符号化装置 100に出力する。符号ィ匕装置 100は、入 力されたディジタル信号を符号ィ匕して符号ィ匕信号を生成し、 RF変調装置 133に出 力する。 RF変調装置 133は、符号化信号を変調して変調符号化信号を生成し、アン テナ 134に出力する。アンテナ 134は、変調符号化信号を電波 W12として送信する
[0024] 図 5は、上記の符号ィ匕装置 100内部の主要な構成を示すブロック図である。ここで は、時間領域のディジタル信号が入力され、この信号を周波数領域の信号に変換し て力も符号ィ匕を行う場合を例にとって説明する。
[0025] 符号ィ匕装置 100は、入力端子 101、周波数領域変換部 102、分割部 103、低域符 号化部 104、高域符号ィ匕部 105、多重化部 106、および出力端子 107を有する。
[0026] 周波数領域変換部 102は、入力端子 101から入力された時間領域のディジタル信 号に対し、周波数領域への変換を施し、周波数領域の信号であるスペクトルを生成 する。なお、このスペクトルの有効周波数帯域を 0≤k<FHとする。周波数領域への 変換方法は、離散フーリエ変換、離散コサイン変換、変形離散コサイン変換、ゥエー ブレット変換等を用いる。
[0027] 分割部 103は、周波数領域変換部 102で得られたスペクトルを、低域スペクトルお よび高域スペクトルの 2つの周波数帯域 (バンド)のスペクトルに分割し、分割後のス ベクトルを低域符号ィ匕部 104および高域符号ィ匕部 105に与える。具体的には、分割 部 103は、周波数領域変換部 102から出力されたスペクトルを、有効周波数帯域 0 ≤k<FLの低域スペクトルと、有効周波数帯域 FL≤k<FHの高域スペクトルとに分 割し、得られた低域スペクトルを低域符号ィ匕部 104に、高域スぺ外ルを高域符号ィ匕 部 105にそれぞれ与える。
[0028] 低域符号ィ匕部 104は、分割部 103から出力された低域スペクトルの符号ィ匕を行い、 得られた符号ィ匕情報を多重化部 106に出力する。なお、オーディオ 'データまたは音 声データの場合、低域のデータが高域のデータより重要であるため、低域符号化部 104には高域符号ィ匕部 105と比較してより多くのビットが配分され、高品質に符号ィ匕 される。具体的な符号化方法としては、 MPEGレイヤ 3方式、 AAC方式、 TwinVQ ( Transform domain Weighted INterieaveVector Quantizationノ方式等を禾 lj用する。
[0029] 高域符号ィ匕部 105は、分割部 103から出力された高域スペクトルに対し、後述の符 号化処理を施し、得られた符号ィ匕情報 (ゲイン情報)を多重化部 106に出力する。高 域符号ィ匕部 105における符号ィ匕方法の詳細については、後述する。
[0030] 多重化部 106は、低域符号ィ匕部 104から低域スペクトルに関する情報が入力され、 一方、高域符号ィ匕部 105からは高域スペクトルの概形を得るために必要なゲイン情 報が入力される。多重化部 106は、これらの情報を多重化した後に出力端子 107か ら出力する。
[0031] 図 6は、上記の高域符号ィ匕部 105内部の主要な構成を示すブロック図である。
[0032] スペクトル形状符号化部 112は、入力端子 111を介して、入力信号の有効周波数 FL≤k<FHのスペクトル S(k)が与えられ、このスペクトルの形状の符号化を行う。具 体的には、スペクトル形状符号ィ匕部 112は、聴感的な歪が最も小さくなるようにスぺク トル形状を符号化し、このスペクトル形状に関する符号ィ匕情報を多重化部 114および スペクトル形状復号化部 116に与える。
[0033] なお、スペクトル形状の符号化方法としては、例えば、(式 1)で表される 2乗歪 Eを 最小とするときのコードベクトル C(i, k)を求め、このコードベクトル C(i, k)を出力する。
[数 1]
E = ^ w(k) - {S(k) - C(i, k)) … (式 1 ) ここで、 C(i, k)は符号帳に含まれる第 i番目のコードベクトルを表し、 w(k)は周波数 kの聴感的な重要度の対応する重み係数を表す。また、 FLおよび FHはそれぞれ高 域スペクトルの最小周波数および最大周波数に対応するインデックスを表す。また、 スペクトル形状符号ィ匕部 112は、(式 2)を最小とするコードベクトル C(i, k)を出力して も良い。
Figure imgf000010_0001
この式の右辺第 1項は定数項なので、右辺第 2項を最大とするコードベクトルを出 力すると考えても良い。
[0034] スペクトル形状復号ィ匕部 116は、スペクトル形状符号ィ匕部 112から出力されたスぺ タトル形状に関する符号ィ匕情報を復号ィ匕し、得られるコードベクトル C(i, k)をゲイン 符号ィ匕部 113に与える。
[0035] ゲイン符号ィ匕部 113は、目標信号である入力スペクトル S(k)のスペクトル概形に、コ ードベクトル C(i, k)のスペクトル概形が近くなるように、コードベクトル C(i, k)のゲイン を符号化し、符号化情報を多重化部 114に与える。ゲイン符号ィ匕部 113の処理につ いては、後ほど詳述する。
[0036] 多重化部 114は、スペクトル形状符号ィ匕部 112およびゲイン符号ィ匕部 113から出 力される符号ィ匕情報を多重化し、出力端子 115を介してこれを出力する。
[0037] 図 7は、上記のゲイン符号ィ匕部 113内部の主要な構成を示すブロック図である。ゲ イン符号ィ匕部 113には、入力端子 121を介し、スペクトル形状復号ィ匕部 116から高域 スペクトルの形状が入力され、また、入力端子 127を介し、入力スペクトルが入力され る。
[0038] サブバンド振幅算出部 122は、スペクトル形状復号ィ匕部 116から入力されたスぺク トル形状に対し、各サブバンドの振幅値を算出する。乗算部 123は、サブバンド振幅 算出部 122から出力されるスペクトル形状の各サブバンドの振幅値に、補間部 126 力も出力される各サブバンドのゲイン (後述)を乗算して振幅の調整をした後、探索部 124に出力する。一方、サブバンド振幅算出部 128は、入力端子 127から入力され た目標信号の入力スペクトルに対し、各サブバンドの振幅値を算出し、探索部 124に 出力する。
[0039] 探索部 124は、乗算部 123から出力されるサブバンド振幅値と、サブバンド振幅算 出部 128から与えられる高域スペクトルのサブバンド振幅値との間の歪を算出する。 具体的には、ゲイン符号帳 125には、複数のゲイン量子化値の候補 g(j)が予め登録 されており、探索部 124は、この複数のゲイン量子化値の候補 g(j)のうちの 1つを指 定して、これについて上記の歪み(2乗歪み)を算出する。ここで、 jは各ゲイン量子化 値の候補を識別するためのインデックスである。ゲイン符号帳 125は、探索部 124に 指定されたゲイン候補 g(j)を補間部 126に与える。補間部 126は、このゲイン候補 g(j) を用いて、未だゲインが決定されていないサブバンドのゲイン値を補間演算により算 出する。そして、補間部 126は、ゲイン符号帳 125から与えられたゲイン候補と、算出 された補間ゲイン候補と、を乗算部 123に与える。
[0040] 上記の乗算部 123、探索部 124、ゲイン符号帳 125、および補間部 126の処理は 帰還ループとなっており、探索部 124は、ゲイン符号帳 125に登録されている全ての ゲイン量子化値の候補 g①について上記の歪み(2乗歪み)を算出する。そして、探索 部 124は、最も 2乗歪みが最小となるゲインのインデックス jを出力端子 129を介して 出力する。上記の処理を換言すると、探索部 124は、まずゲイン符号帳 125に登録さ れて 、るゲイン量子化値の候補 g(j)のうちのある特定の値を選択し、これを用いて残 りのゲイン量子化値を補間することにより、擬似的な高域スペクトルを生成する。そし て、この生成されたスペクトルと目標信号の高域スペクトルとを比較して 2つのスぺタト ルの類似具合を判断し、探索部 124は、最終的には、最初に用いたゲイン量子化値 の候補ではなぐ 2つのスペクトルの類似具合が最も良くなるゲイン量子化値を選択 し、このゲイン量子化値を示すインデックス jを出力する。
[0041] 図 8A、 Bは、ゲイン符号ィ匕部 113の上記の補間演算関連の一連の処理を説明す るための図である。ここでは、高域スペクトルがサブバンド数 N = 8のサブバンド力もな る場合を例にとって説明する。ゲイン符号帳 125は、第 0サブバンドのゲイン候補 gO ( j)と第 7サブバンドのゲイン候補 gl (j)を要素として持つゲイン候補 G(j)= {gO(j), gl( j)}を有する。ここで jは、ゲイン候補を識別するためのインデックスを表す。ゲイン符号 帳 125は、充分な長さの学習用データを用いてあら力じめ設計されている。そのため 、適切なゲイン候補が既に格納されて 、る状態にある。
[0042] ゲイン候補 G(j)は、スカラー値であってもベクトル値であっても良!、が、ここでは 2次 元ベクトルとして説明する。補間部 126は、このゲイン候補 G(j)を用いて、未だゲイン が決定されていないサブバンドに対するゲインを補間により算出する。
[0043] 具体的には、補間処理は、図 8Bに示すように行われる。第 0サブバンドのゲインは gO①、第 7サブバンドのゲインは gl(j)で与えられ、それ以外のサブバンドのゲイン力 ½ 0(j)および gl(j)を線形補間することにより、内挿値として与えられる。
[0044] このように、本実施の形態に係る符号化装置によれば、入力された符号化対象の 広帯域のスペクトルを少なくとも低域のスペクトルと高域のスペクトルとに分け、高域ス ベクトルに対しては、さらにこのスペクトルを複数のサブバンドに分割し、この複数の サブバンドの中から一部のサブバンドを選択し、選択されたサブバンドのゲインのみ を符号化(量子化)対象とする。よって、全てのサブバンドについて符号ィ匕するわけで はないので、少ない符号量で効率的にゲインを符号ィ匕することができる。なお、ここで 、高域スペクトルに対して上記の処理を施すのは、入力信号がオーディオ信号、音 声信号等である場合、高域のデータは、低域のデータに比べて重要度が低いためで ある。
[0045] また、以上の構成において、本実施の形態に係る符号ィ匕装置は、高域スペクトルに おいて、選択されなかったサブバンドのゲインに対しては、選択されたゲインを互い に補間することにより表す。よって、符号量をあるレベルで維持したまま、スペクトル概 形の変化を滑らかに近似しながらゲインを決定することができる。すなわち、少ないビ ット数で異音の発生を抑えることができ、品質が向上する。よって、広帯域信号のスぺ タトルを符号化する際に、低ビットレート化を実現しつつ、原信号の高域スペクトルと 新たに生成されるスペクトルとの類似度を向上させることができる。
[0046] 本発明は、スペクトルの概形が周波数軸方向に滑らかに変化する点に着目し、この 性質を利用して、符号化対象の点 (量子化点)を一部に限定し、この量子化点のみを 符号化し、残りのサブバンドについては、量子化点のゲインを相互に補間することに より求めることとしたものである。
[0047] また、以上の構成において、本実施の形態に係る符号ィ匕装置を搭載した送信装置 は、選択されたサブバンドの量子化ゲインのみを送信し、補間によって得られるゲイ ンは送信しない。一方、受信装置に搭載された復号ィ匕装置は、送信された量子化ゲ インを受信して復号化すると共に、送信されて 、な 、サブバンドのゲインにつ!、ては 、送信されたゲインを互いに補間することにより得る。これらの構成を採ることにより、 送受信装置間の伝送レートが低下するため、通信システムの負荷を軽減することが できる。
[0048] なお、本実施の形態では、ゲインを線形補間する場合を例にとって説明したが、補 間方法はこれに限定されず、例えば、スペクトルの特性上、 1次関数以外の関数で補 間を行った方が符号ィ匕性能が向上することがわ力 ている場合には、その関数を補 間演算に用いても良い。
[0049] また、本実施の形態では、量子化点として上記の位置のサブバンドのゲインを選択 する場合、すなわち、 gO(j)が高域スペクトルの最小周波数のサブバンドのゲインであ り、 gl(j)が高域スペクトルの最高周波数のサブバンドのゲインである場合を例にとつ て説明した。量子化点の位置は、必ずしもこれらの設定に限定されるわけではないが 、以下の条件を満たすことにより、補間による誤差が小さくなることが期待される。特 に、 gO(j)の位置は、低域スペクトルと高域スペクトルとの連続性を維持するために、 低域スペクトルと高域スペクトルとの接続部である周波数 FLの近傍の位置に設定す ることが望ましい。しかし、 gO①の位置をこのように設定しても低域スペクトルと (新た に生成される)高域スペクトルとが滑らかに接続されるとは限らない。だが、連続性を 少なくとも維持すれば、大きな音質劣化はないものと考えられる。また、 gl(j)を高域ス ベクトルの最大周波数のサブバンド (要は高域スペクトルの右端)の位置に設定する ことにより、少なくともこの位置のゲインを特定できれば、一般的には、高域スペクトル 全体の概形を粗い精度である力もしれないが効率よく表現できると考えられる。し力し 、 glG)の位置は、例えば、 FLと FHの中間位置であっても良い。
[0050] また、本実施の形態では、量子化点が gO(j)と gl(j)との 2点である場合を例にとって 説明したが、量子化点は 1点であっても良い。以下、力かる場合について図面を用い て詳細に説明する。
[0051] 図 9は、量子化点が glG)の 1点のみである場合を示した図である。この図で、 SLは 低域スペクトル、 SHは高域スペクトルを表している。このように、低域スペクトルの最 大周波数のサブバンドのゲイン値は、高域スペクトルの最小周波数のサブバンドのゲ イン値と大きく変わらないことが期待できるので、 gO①の代わりに低域スペクトルの最 大周波数のサブバンドのゲイン値を用いる。これにより、 gO(j)を求めなくても上記のゲ イン補間が可能となる。
[0052] また、量子化点は 3点以上であっても良い。図 10A、 Bは、量子化点が 3点の場合 を示した図である。
[0053] この図に示されるように、 3つのサブバンドで決定されたサブバンドゲインを用い、そ れ以外のサブバンドのゲインを補間により決定する。このように、 3以上の量子化点を 利用することで、 2点は高域スペクトルの端部 (FLまたは FH)のゲインを表すために 使用するとしても、少なくとも 1点は高域スペクトルの中央部 (端部以外の部分)に配 置することができる。よって、高域スペクトルの概形に特徴的な部分、例えば、山(極 大点)もしくは谷 (極小点)が存在する場合でも、この山もしくは谷に量子化点 1つを 割り当てることにより、精度良く高域スペクトルの概形を表現した符号化パラメータを 生成することが可能となる。ただし、量子化点を 3以上に増やすと、スペクトル概形の 細かい変化はより忠実に符号ィ匕することができるが、トレードオフで符号ィ匕効率は低 下する。
[0054] また、本実施の形態では、符号化方法が、複数のサブバンドの中から量子化点を 一部選択するステップと、残りのゲインについては補間演算によってそのゲインを得 るステップとからなる場合を例にとって説明したが、量子化点を一部に限定することの みでも、低ビットレートイ匕は実現できるため、高い符号ィ匕性能が要求されない場合に は、補間演算のステップは省略し、量子化点を一部選択するステップのみでも良い。
[0055] また、本実施の形態では、帯域を等間隔に分割してサブバンドを生成する場合を 例にとって説明したが、これに限定されず、例えば Barkスケールを用いた非線形な 分割法を適用しても良い。
[0056] また、本実施の形態では、入力ディジタル信号を周波数領域に直接変換し帯域分 割を行っている場合を例にとって説明したが、これに限定されない。
[0057] 図 11は、上記の符号化装置 100の別のバリエーション (符号化装置 100a)を示す ブロック図である。なお、同一の構成要素には同一の符号を付している。
[0058] この図に示すように、入力ディジタル信号をフィルタ処理によって帯域分割する構 成を採っても良い。この場合、多相(Polyphase)フィルタ、直交鏡像(Quadrature
Mirror)フィルタ等を用いて帯域分割を行う。
[0059] 図 12は、符号ィ匕装置 100a内の高域符号ィ匕部 105aの主要な構成を示すブロック 図である。なお、高域符号ィ匕部 105と同一の構成要素には同一の符号を付している
。高域符号ィ匕部 105と高域符号ィ匕部 105aの違いは、周波数領域変換部がどこに設 置されているかである。
[0060] 以上、符号化側の構成にっ 、て詳細に説明した。次 、で、復号化側の構成にっ ヽ て以下詳細に説明する。
[0061] 図 13は、本実施の形態に係る無線送信装置 130から送信された信号を受信する 無線受信装置 180の主要な構成を示すブロック図である。
[0062] この無線受信装置 180は、アンテナ 181、 RF復調装置 182、復号化装置 150、 D ZA変換装置 183、および出力装置 184を有している。
[0063] アンテナ 181は、電波 W12としてのディジタルの符号化音響信号を受けて電気信 号のディジタルの受信符号ィ匕音響信号を生成して RF復調装置 182に与える。 RF復 調装置 182は、アンテナ 181からの受信符号化音響信号を復調して復調符号化音 響信号を生成して復号ィ匕装置 150に与える。
[0064] 復号ィ匕装置 150は、 RF復調装置 182からのディジタルの復調符号化音響信号を 受けて復号ィ匕処理を行ってディジタルの復号ィ匕音響信号を生成して DZA変換装置 183〖こ与える。 DZ A変換装置 183は、復号ィ匕装置 150からのディジタルの復号ィ匕 音声信号を変換してアナログの復号ィ匕音声信号を生成して出力装置 184に与える。 出力装置 184は、電気的信号であるアナログの復号ィヒ音声信号を空気の振動に変 換して音波 W13として人間の耳に聴こえるように出力する。
[0065] 図 14は、上記の復号ィ匕装置 150内部の主要な構成を示すブロック図である。
[0066] 分離部 152は、入力端子 151を介して入力された復調符号化音響信号から低域符 号化パラメータと高域符号ィ匕パラメータとを分離し、各符号化パラメータを低域復号 化部 153と高域復号ィ匕部 154とにそれぞれ与える。低域復号ィ匕部 153は、低域符号 化部 104の符号化処理により得られる符号化パラメータを復号して低域復号スぺクト ルを生成し結合部 155に与える。高域復号ィ匕部 154は、高域符号ィ匕パラメータを用 いて復号処理を行い、高域復号スペクトルを生成して結合部 155に与える。なお、こ の高域復号ィ匕部 154の詳細については後述する。結合部 155は、低域復号スぺクト ルと高域復号スペクトルとを結合し、結合後のスペクトルを時間領域変換部 156に与 える。時間領域変換部 156は、結合後のスペクトルを時間領域に変換し、かつ連続 するフレーム間で不連続が生じにくくなるように窓掛けおよび重ね合わせ加算等の処 理を行い、出力端子 157から出力する。
[0067] 図 15は、高域復号ィ匕部 154内部の主要な構成を示すブロック図である。
[0068] 分離部 162は、入力端子 161を介して入力された高域符号化パラメータから、スぺ タトル形状コードとゲインコードとを分離し、各々をスペクトル形状復号ィ匕部 163およ びゲイン復号ィ匕部 164に与える。スペクトル形状復号ィ匕部 163は、スペクトル形状コ ードを参照して符号帳力 コードベクトル C(i, k)を選択し、乗算部 165に与える。ゲイ ン復号ィ匕部 164は、ゲインコードに基づいてゲインを復号し乗算部 165に与える。な お、このゲイン復号ィ匕部 164の詳細については実施の形態 2において詳述する。乗 算部 165は、スペクトル形状復号ィ匕部 163で選択されたコードベクトル C(i, k)と、ゲイ ン復号化部 164で復号されたゲインとを乗算し、出力端子 166を介して出力する。
[0069] なお、符号ィ匕側の構成が図 11に示した符号ィ匕装置 100aのように、帯域分割フィル タによる低域信号と高域信号とへの帯域分割を行う構成である場合には、対応する 復号ィ匕装置の構成は、図 16に示される構成 (復号ィ匕装置 150a)となる。なお、同一 の構成要素には同一の符号を付している。また、図 17は、復号化装置 150a内の高 域復号化部 154aの主要な構成を示すブロック図である。高域復号化部 154と同一 の構成要素には同一の符号を付して ヽる。高域復号化部 154と高域復号ィ匕部 154a の違いは、周波数領域変換部がどの位置に設置されるかである。
[0070] このように、上記の復号化装置によれば、本実施の形態に係る符号化装置によって 符号化された情報を復号ィ匕することができる。 [0071] なお、本実施の形態では、入力信号の周波数帯域を 2つの帯域に分割する場合を 例にとって説明したが、これに限定されず、 2以上の帯域に分割して、そのうちの 1ま たは複数の帯域に対して、既に説明した上記のスペクトルの符号ィ匕処理を行うことが 可能である。
[0072] また、本実施の形態では、時間領域の信号が入力される場合を例にとって説明した 力 周波数領域の信号が直接入力されても良い。
[0073] なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信シ ステムに適用される場合を例にとって説明したが、本実施の形態に係る符号ィ匕装置 または復号化装置は、以下に示すように、有線通信システムにも適用することができ る。
[0074] 図 18Aは、本実施の形態に係る符号化装置が有線通信システムに適用された場 合の送信側の主要な構成を示したブロック図である。なお、図 4に既に示した構成要 素と同一のものには同一の符号を付し、その説明を省略する。
[0075] 有線送信装置 140は、符号化装置 100、入力装置 131、および AZD変換装置 13 2を有し、出力がネットワーク N1に接続されている。
[0076] AZD変換装置 132の入力端子は、入力装置 131の出力端子に接続されている。
符号ィ匕装置 100の入力端子は、 AZD変換装置 132の出力端子に接続されている。 符号ィ匕装置 100の出力端子はネットワーク N1に接続されて 、る。
[0077] 入力装置 131は、人間の耳に聞こえる音波 W11を電気的信号であるアナログ信号 に変換して AZD変換装置 132に与える。 AZD変換装置 132は、アナログ信号をデ イジタル信号に変換して符号ィ匕装置 100に与える。符号ィ匕装置 100は、入力されてく るディジタル信号を符号ィ匕してコードを生成し、ネットワーク N1に出力する。
[0078] 図 18Bは、本実施の形態に係る復号化装置が有線通信システムに適用された場 合の受信側の主要な構成を示したブロック図である。なお、図 13に既に示した構成 要素と同一のものには同一の符号を付し、その説明を省略する。
[0079] 有線受信装置 190は、ネットーク N1に接続されている受信装置 191、復号化装置 150、 DZ A変換装置 183、および出力装置 184を有している。
[0080] 受信装置 191の入力端子は、ネットワーク N1に接続されている。復号化装置 150 の入力端子は、受信装置 191の出力端子に接続されている。 DZA変換装置 183の 入力端子は、復号ィ匕装置 150の出力端子に接続されている。出力装置 184の入力 端子は、 DZA変換装置 183の出力端子に接続されている。
[0081] 受信装置 191は、ネットワーク N1からのディジタルの符号ィ匕音響信号を受けてディ ジタルの受信音響信号を生成して復号ィ匕装置 150に与える。復号ィ匕装置 150は、受 信装置 191からの受信音響信号を受けてこの受信音響信号に復号ィ匕処理を行って ディジタルの復号ィ匕音響信号を生成して DZA変換装置 183に与える。 DZA変換 装置 183は、復号ィ匕装置 150からのディジタルの復号音声信号を変換してアナログ の復号音声信号を生成して出力装置 184に与える。出力装置 184は、電気的信号 であるアナログの復号音響信号を空気の振動に変換して音波 W13として人間の耳 に聴こえるように出力する。
[0082] このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有 する有線送受信装置を提供することができる。
[0083] (実施の形態 2)
本実施の形態の特徴は、本発明の符号化装置および復号化装置が、周波数軸方 向にスケーラビリティを有する帯域スケーラブル符号ィ匕に適用されて 、る点である。
[0084] 図 19は、本発明の実施の形態 2に係る階層符号化装置 200の主要な構成を示す ブロック図である。
[0085] 階層符号ィ匕装置 200は、入力端子 221、ダウンサンプリング部 222、第 1レイヤ符 号ィ匕部 223、第 1レイヤ復号ィ匕部 224、遅延部 226、スペクトル符号ィ匕部 210、多重 化部 227、および出力端子 228を有する。
[0086] 入力端子 221には、 AZD変換装置 132から有効周波数帯域が 0≤k<FHの信号 が入力される。ダウンサンプリング部 222は、入力端子 221を介し入力された信号に ダウンサンプリングを施してサンプリングレートの低い信号を生成し、出力する。第 1レ ィャ符号ィ匕部 223は、このダウンサンプリング後の信号を符号ィ匕し、得られた符号ィ匕 ノ ラメータを多重化部(マルチプレクサ) 227に出力すると共に、第 1レイヤ復号ィ匕部 224にも出力する。第 1レイヤ復号ィ匕部 224は、この符号化パラメータを基に第 1レイ ャの復号信号を生成する。 [0087] 一方、遅延部 226は、入力端子 221を介し入力される信号に対し、所定の長さの遅 延を与える。この遅延の大きさは、信号がダウンサンプリング部 222、第 1レイヤ符号 化部 223,第 1レイヤ復号ィ匕部 224を介した際に生じる時間遅れと同値とする。スぺ タトル符号ィ匕部 210は、第 1レイヤ復号ィ匕部 224から出力される信号を第 1信号として 、また遅延部 226から出力される信号を第 2信号としてスペクトル符号ィ匕を行い、生 成した符号化パラメータを多重化部 227に出力する。多重化部 227は、第 1レイヤ符 号ィ匕部 223で求められる符号化パラメータとスペクトル符号ィ匕部 210で求められる符 号化パラメータとを多重化し、出力コードとして出力端子 228を介し出力する。この出 力コードは、 RF変調装置 133に与えられる。
[0088] 図 20は、上記のスペクトル符号ィ匕部 210内部の主要な構成を示すブロック図であ る。
[0089] スペクトル符号ィ匕部 210は、入力端子 201、 204、周波数領域変換部 202、 205、 拡張帯域スペクトル推定部 203、拡張帯域ゲイン符号ィ匕部 206、多重化部 207、お よび出力端子 208を有する。
[0090] 入力端子 201には、第 1レイヤ復号化部 224にて復号された信号が入力される。こ の信号の有効周波数帯域は 0≤k<FLである。また、入力端子 204には、遅延部 22 6から有効周波数帯域が 0≤k<FH (ただし、 FLく FH)の第 2信号が入力される。
[0091] 周波数領域変換部 202は、入力端子 201から入力される第 1信号に周波数変換を 行い、第 1スペクトル Sl(k)を算出する。一方、周波数領域変換部 205は、入力端子 2 04から入力される第 2信号に周波数変換を行い、第 2スペクトル S2(k)を算出する。こ こで周波数変換の方法は、離散フーリエ変換 (DFT)、離散コサイン変換 (DCT)、変 形離散コサイン変換 (MDCT)等を適用する。
[0092] 拡張帯域スペクトル推定部 203は、第 2スペクトル S2(k)を参照信号として第 1スぺク トル Sl(k)の帯域 FL≤k<FHに含めるべきスペクトルを推定し、推定スペクトル E(k) ( ただし、 FL≤k<FH)を求める。ここで推定スペクトル E(k)は、第 1スペクトル Sl(k)の 低域 (0≤k<FL)に含まれるスペクトルに基づいて推定される。
[0093] 拡張帯域ゲイン符号ィ匕部 206は、推定スペクトル E(k)に乗ずべきゲインを推定スぺ タトル E(k)と第 2スペクトル S2(k)とを用いて符号ィ匕する。ここでの処理は、いかに少な い符号量で効率よく拡張帯域における推定スペクトル E(k)のスペクトル概形を第 2ス ベクトル S2(k)のスペクトル概形に近づけるかが重要である。この成否により、音質が 大きく左右される。
[0094] 多重化部 207は、拡張帯域スペクトル推定部 203から拡張帯域の推定スペクトルに 関する情報が入力され、かつ拡張帯域ゲイン符号ィ匕部 206から拡張帯域のスぺタト ル概形を得るために必要なゲイン情報が入力される。これらの情報を多重化した後 に出力端子 208から出力する。
[0095] 図 21は、上記の拡張帯域ゲイン符号ィ匕部 206内部の主要な構成を示すブロック図 である。
[0096] この拡張帯域ゲイン符号ィ匕部 206は、入力端子 211、 217、サブバンド振幅算出部 212、 218、ゲイン符号帳 215、補間部 216、乗算部 213、探索部 214、および出力 端子 219を有する。
[0097] 入力端子 211から推定スペクトル E(k)が入力され、入力端子 217から第 2スペクトル S2(k)が入力される。サブバンド振幅算出部 212では、拡張帯域をサブバンドに分割 し、サブバンド毎の推定スペクトル E(k)の振幅値を算出する。拡張帯域を FL≤k<F Hと表すと、拡張帯域の帯域幅 BWは (式 3)と表される。
BW = FH-FL+ 1 …(式 3)
この拡張帯域を N個のサブバンドに分割すると、各サブバンドのバンド幅 BWSは( 式 4)と表される。
BWS = (FH-FL+D/N …(式 4)
よって、第 nサブバンドの最小周波数 FL(n)は (式 5)と表され、第 nサブバンドの最 大周波数 FH(n)は (式 6)と表される。
FL(n) = FL + n-BWS · · · (式 5)
FH(n) = FL + (n+ 1) - BWS— 1 · · · (式 6)
このように規定されるサブバンド毎に推定スペクトル E(k)の振幅値 AE(n)を (式 7)に 従い算出する。
[数 3] (式 7 )
Figure imgf000021_0001
同様に、サブバンド振幅算出部 218は、第 2スペクトル S2(k)のサブバンド毎の振幅 値 AS2(n)を (式 8)に従って算出する。
[数 4]
(式 8 )
Figure imgf000021_0002
[0099] 一方、ゲイン符号帳 215は、 J個のゲイン量子化値の候補 G(j) (ただし、 0≤j <J)を 有し、全てのゲイン候補について次に示すような処理を施す。ゲイン候補 G(j)はスカ ラー値であってもベクトル値であっても良いが、ここでは説明のために 2次元のベタト ルであるものとする(すなわち、 g(j) = {gO(j), gl(j)})。ゲイン符号帳 215は、充分な 長さの学習用データを用いてあらかじめ設計されている。そのため、適切なゲイン候 補が既に格納されている状態にある。
[0100] 図 22A、 Bは、拡張帯域ゲイン符号ィ匕部 206の処理の概要を説明するための図で ある。ここでも、サブバンド数 N = 8の場合を例にとって説明する。
[0101] 図 22Aに示されるように、ゲイン候補 G①の第 1要素 gO(j)を第 0サブバンドゲイン、 第 2要素 gl(j)を第 7サブバンドゲインとして、それぞれを第 1サブバンドおよび第 7サ ブバンドに配置する。
[0102] 補間部 216は、このゲイン候補 G(j)を用いて、未だゲインが決定されて ヽな 、サブ バンドに対するゲインを補間により算出する。
[0103] 具体的には、その様子を図 22Bに示す。第 0サブバンドのゲインは gO①、第 7サブ バンドのゲインは gl(j)で与えられ、それ以外のサブバンドのゲインは gO(j)および gl(j
)の内挿値として与えられる。このような考えに基づくと、第 nサブバンドのゲイン p(j , n) は、(式 9)のように表すことができる。
[数 5] PU,n) = gO(j)+ 8 jl~g0{j -n (0≤nN-l) … (式 9)
N-l
[0104] このように算出されたサブバンドゲインの候補 p(j, n)は乗算部 213に与えられる。乗 算部 213では、サブバンド振幅算出部 212より与えられるサブバンド振幅値 AE(n)と 、補間部 216から与えられるサブバンドゲインの候補 p(j, n)とを要素ごとに乗算する。 乗算後のサブバンド振幅値を AE'(n)と表すと、 AE'(n)は (式 10)に従って算出され 、探索部 214に与えられる。
AE'(n) = AE(n)-p(j, n) ··· (式 10)
[0105] 探索部 214は、乗算後のサブバンド振幅値 AE,(n)とサブバンド振幅算出部 218よ り与えられる第 2スペクトルのサブバンド振幅値 AS2(k)との間の歪を算出する。なお 、ここでは説明の簡単のため、 2乗歪みを用いる場合を例にとって説明する力 歪み の定義としては、例えば要素ごとに聴覚感度に基づいた重み付けを行う距離尺度等 を用いることちでさる。
[0106] 探索部 214は、 AE'(n)と AS2(n)の 2乗歪 Dを、(式 11)に従い算出する。
[数 6]
D = ... (式 i i )
Figure imgf000022_0001
または、 2乗歪 Dを (式 12)としても良い。
[数 7]
D = … (式 1 2)
Figure imgf000022_0002
この場合、 w(n)は聴覚感度に基づ ヽた重み関数を表す。
[0107] ゲイン符号帳 215に含まれる全てのゲイン量子化値の候補 G(j)について、上記処 理に従い 2乗歪 Dを算出し、その中で最も 2乗歪 Dが最小となるときのゲインのインデ ックス jを出力端子 219を介して出力する。
[0108] このような処理に基づくと、スペクトル概形の変化を滑らかに近似しながらゲインを 決定することができるため、少ないビット数であっても異音の発生が抑えられ品質が 改善する。 [0109] また、本実施の形態では、サブバンド振幅の大きさを基準に補間を行いゲインを決 定して 、るが、サブバンド振幅の代わりにサブバンド対数エネルギーを基準に補間を 行う構成であっても良い。この場合、人間の聴覚特性に適合する対数エネルギーの 領域でスペクトル概形が滑らかに変化するようゲインを決定するので、より聴感的に 品質が改善されると 、う効果が得られる。
[0110] 図 23は、上記の階層符号化装置 200で符号化された情報を復号化する階層復号 化装置 250の内部構成を示すブロック図である。ここでは、階層符号化された符号化 ノ メータを復号する場合を例にとって説明する。
[0111] この階層復号ィ匕装置 250は、入力端子 171、分離部 172、第 1レイヤ復号ィ匕部 173 、スペクトル復号ィ匕部 260、および出力端子 176、 177を有する。
[0112] 入力端子 171には、 RF復調装置 182からディジタルの復調符号ィ匕音響信号が入 力される。分離部 172は、入力端子 171を介し入力された復調符号化音響信号を分 離し、第 1レイヤ復号化部 173用の符号ィ匕パラメータとスペクトル復号ィ匕部 260用の 符号化パラメータとを生成する。第 1レイヤ復号ィ匕部 173は、分離部 172で得られた 符号化パラメータを用 Vヽて信号帯域 0≤ k < FLの復号信号を復号し、この復号信号 をスペクトル復号ィ匕部に与える。また、他方の出力は、出力端子 176に接続されてい る。これにより、第 1レイヤ復号ィ匕部 173で生成される第 1レイヤ復号信号を出力する 必要が生じた場合には、この出力端子 176を介し出力させることができる。
[0113] スペクトル復号ィ匕部 260には、分離部 172で分離された符号ィ匕パラメータと第 1レイ ャ復号ィ匕部より得られる第 1レイヤ復号信号とが与えられる。スペクトル復号ィ匕部 260 は、後述するスペクトル復号ィ匕を行い、信号帯域 0≤k<FHの復号信号を生成し、 出力端子 177を介しこれを出力する。スペクトル復号ィ匕部 260では、第 1レイヤ復号 化部より与えられる第 1レイヤ復号信号を第 1信号とみなして処理を行うことになる。
[0114] この構成によれば、第 1レイヤ復号ィ匕部 173で生成される第 1レイヤ復号信号を出 力する必要がある場合には、出力端子 176より出力させることができる。また、より品 質の高いスペクトル復号ィ匕部 260の出力信号を出力する必要がある場合には、出力 端子 177より出力させることができる。階層復号化装置 250からは、出力端子 176も しくは出力端子 177のいずれか一方の信号が出力され、 DZA変換装置 183に与え られる。どちらの信号が出力されるかは、アプリケーションやユーザの設定や判定結 果に基づく。
[0115] 図 24は、上記のスペクトル復号ィ匕部 260の内部構成を示すブロック図である。
[0116] このスペクトル復号ィ匕部 260は、入力端子 251、 253、分離部 252、周波数領域変 換部 254、拡張帯域推定スぺ外ル付与部 255、拡張帯域ゲイン復号化部 256、乗 算部 257、時間領域変換部 258、および出力端子 259を有する。
[0117] 入力端子 251から、スペクトル符号ィ匕部 210にて符号ィ匕された符号ィ匕パラメータが 入力され、分離部 252を介して拡張帯域推定スペクトル付与部 255および拡張帯域 ゲイン復号ィ匕部 256にそれぞれ符号ィ匕パラメータが入力される。さらに、入力端子 25 3には、有効周波数帯域力^≤k<FLの第 1信号が入力される。この第 1信号は、第 1レイヤ復号化部 173で復号された第 1レイヤ復号信号である。
[0118] 周波数領域変換部 254は、入力端子 253から入力された時間領域信号に周波数 変換を行い、第 1スぺ外ル Sl(k)を算出する。周波数変換法は、離散フーリエ変換( DFT)、離散コサイン変換 (DCT)、変形離散コサイン変換 (MDCT)等を使用する。
[0119] 拡張帯域推定スペクトル付与部 255は、周波数領域変換部 254より与えられる第 1 スペクトル Sl(k)の拡張帯域 FL≤k<FHに含まれるスペクトルを分離部 252より得ら れる符号化パラメータを基に生成する。この生成の方法は、符号化側で用いた拡張 帯域スペクトルの推定法に依存するが、ここでは第 1スペクトル Sl(k)を用いて拡張帯 域に含まれる推定スペクトル E(k)を生成するものとする。よって、拡張帯域推定スぺク トル付与部 255より出力される結合スペクトル F(k)は、帯域 0≤k<FLにおいては第 1スペクトル Sl(k)、帯域 FL≤k<FHにおいては拡張帯域推定スペクトル E(k)により 構成される。
[0120] 拡張帯域ゲイン復号ィ匕部 256は、分離部 252より与えられる符号ィ匕パラメータを基 に結合スペクトル F(k)の拡張帯域 FL≤ k< FHに含まれるスペクトルに乗算されるサ ブバンドゲイン p(j, n)を生成する。サブバンドゲイン p(j, n)を生成する方法について は後述する。
[0121] 乗算部 257は、拡張帯域推定スペクトル付与部 255より与えられる結合スペクトル F (k)の拡張帯域 FL≤k<FHに含まれるスペクトルにサブバンド単位に拡張帯域ゲイ ン復号ィ匕部 256より与えられるサブバンドゲイン p(j, n)を乗算し、復号スペクトル F,(k )を生成する。復号スペクトル F' (k)は、(式 13)のように表すことができる。
[数 8] ≤k < FL + (n + l) - BWS)
Figure imgf000025_0001
… (式 1 3 )
[0122] 時間領域変換部 258は、乗算部 257より得られた復号スペクトル F' (k)を時間領域 の信号に変換し、出力端子 259を介し出力する。ここでは、必要に応じて、適切な窓 掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する
[0123] 図 25は、上記の拡張帯域ゲイン復号ィ匕部 256内部の主要な構成を示すブロック図 である。
[0124] 入力端子 261から、符号ィ匕側の拡張帯域ゲイン符号ィ匕部 206で決定されたインデ ックス jが入力され、このインデックス情報を基にゲイン符号帳 262よりゲイン G(j)が選 択され出力される。このゲイン G(j)は補間部 263に与えられ、補間部 263では、前述 の方法に従って補間を行いサブバンドゲイン p(j, n)を生成し、出力端子 264より出力 する。
[0125] この構成によれば、スペクトル概形の変化を滑らかに近似しながら決定されたゲイン を復号することができるため、異音の発生等が抑えられ品質が改善するという効果が 得られる。
[0126] このように、本実施の形態の復号ィヒ装置によれば、本実施の形態に係る符号化方 法に対応した構成を有しているため、少ないビット数で効率よく符号化された音響信 号を復号することができ、良好な音響信号を出力することができる。
[0127] (実施の形態 3)
図 26は、本発明の実施の形態 3に係る符号ィ匕装置内の拡張帯域ゲイン符号ィ匕部 3 01の主要な構成を示すブロック図である。なお、この拡張帯域ゲイン符号ィ匕部 301 は、実施の形態 2で示した拡張帯域ゲイン符号化部 206と同様の基本的構成を有し ており、同一の構成要素には同一の符号を付し、その説明を省略する。 [0128] 本実施形態の特徴は、ゲイン符号帳に含まれるゲイン量子化値の候補 G(j)の次数 が 1、つまりスカラー値であり、ゲインの補間は入力端子より与えられる基準振幅値を 基に求められる基準ゲインとゲイン量子化値の候補 G(j)との間で行われる点にある。 この構成によれば、量子化の対象となるゲインの数が 1へと削減されるため、低ビット レートイ匕が可能になるという効果が得られる。
[0129] 基準ゲイン算出部 303には、入力端子 302から入力される基準振幅値とサブバンド 振幅算出部 212で算出されたサブバンド振幅値の内、最低域のサブバンド振幅値が 与えられる。ここで基準振幅値には、図 27に示されるように、拡張帯域に隣接する帯 域に含まれるスペクトル力も算出されるものとする。基準ゲイン算出部 303は、基準振 幅値と最低域サブバンド振幅値が一致するという仮定が成り立つよう基準ゲインを決 定する。基準振幅値を Ab、最低域サブバンド振幅値を AE(O)と表すと、基準ゲイン g bは(式 14)のように表される。
gb = AbZAE(O) . . . (式 14)
[0130] 補間部 304は、基準ゲイン算出部 303で求められる基準ゲイン gbと、ゲイン符号帳 215から得られるゲイン量子化値の候補 g(j)とを用い、図 28に示すように、補間により ゲインが未定義となっているサブバンドのゲインを生成する。なお、この図では、サブ バンド数 N = 8となっており、また補間によりゲインが生成されるサブバンドは第 1〜第 6サブバンドとなる。
[0131] 次いで、本実施の形態に係る符号化装置によって符号化された信号を復号する復 号ィ匕装置の構成について図 29を用いて説明する。この拡張帯域ゲイン復号ィ匕部 35 0は、実施の形態 2で示した拡張帯域ゲイン復号ィ匕部 256 (図 25参照)と同様の基本 的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する
[0132] 入力端子 351より基準振幅値 Abと、入力端子 352から拡張帯域の推定スペクトル の内の最低域サブバンドのサブバンド振幅値 AE(O)が与えられる。ここで基準振幅 値には、図 27を用いて既に説明したように、拡張帯域に隣接する帯域に含まれるス ベクトル力も算出されるものとする。基準ゲイン算出部 353は、拡張帯域ゲイン符号 化部で説明したように、基準振幅値と最低域サブバンド振幅値が一致するという仮定 が成り立つよう基準ゲインを決定する。
[0133] このように、本実施の形態によれば、量子化の対象となるゲインの数を 1へと削減さ れ、さらなる低ビットレートイ匕が可能となる。
[0134] (実施の形態 4)
図 30は、本発明の実施の形態 4に係る符号化装置内の拡張帯域ゲイン符号化部 4 01の主要な構成を示すブロック図である。なお、この拡張帯域ゲイン符号ィ匕部 401 は、実施の形態 2で示した拡張帯域ゲイン符号化部 206と同様の基本的構成を有し ており、同一の構成要素には同一の符号を付し、その説明を省略する。
[0135] 本実施の形態の特徴は、拡張帯域に含まれるサブバンドの内のゲインに最も特徴 のある(例えばゲインの最大値もしくは最小値)サブバンドをゲイン符号帳の探索の対 象に必ず含めるようにする点にある。この構成によれば、最もゲインの影響を受ける サブバンドをゲイン符号帳の探索の対象に含めることができるため、品質改善が図れ るという効果が得られる。ただしこの構成では、どのサブバンドを選択したかという付 加情報を符号ィ匕する必要がある。
[0136] サブバンド決定部 402は、サブバンド振幅算出部 212で求められた推定スペクトル E(k)のサブバンド振幅値 AE(n)と、サブバンド振幅算出部 218で求められた第 2スぺ タトル S2(k)のサブバンド振幅値 AS2(n)とを用いて、(式 15)に従い理想ゲイン値 go pt(n)を算出する。
gopt(n) = AS2(n)/AE(n) · · · (式 15)
[0137] 次に、理想ゲイン gopt(n)が最大 (もしくは最小)となるサブバンドを求め、そのサブ バンド番号を出力端子より出力する。
[0138] 補間部 403は、ゲイン符号帳 215から得られるゲイン候補 G(j)= {g0(j), gl(j), g2(j ) }とサブバンド選択部 402から得られるサブバンド情報を基に、図 31に示すようにゲ イン候補を配置し、ゲインが決定されていないサブバンドについては、補間によりゲイ ンを決定する。この図では、第 0サブバンド、第 7サブバンドはデフォルトでゲイン候補 を配置し、第 1〜第 6サブバンドの内、最も特徴的なゲインを有するサブバンド (この 図では第 2サブバンド)にゲイン候補を配置し、それ以外のサブバンドのゲインは補 間により決定している。 [0139] 次いで、本実施の形態に係る符号化装置によって符号化された信号を復号する復 号ィ匕装置内の拡張帯域ゲイン復号ィ匕部 450について図 32を用いて説明する。なお 、この拡張帯域ゲイン復号ィ匕部 450は、実施の形態 2で示した拡張帯域ゲイン復号 化部 256と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し 、その説明を省略する。
[0140] 補間部 263は、ゲイン符号帳 262から得られるゲイン G(j)= {g0(j), gl(j), g2(j)}と 、入力端子 451を介して入力されるサブバンド情報から、第 0サブフレームに gO①、 第 7サブフレームに g2①、そしてサブバンド情報により示されるサブバンドに gl①を 配置し、それ以外のサブバンドのゲインは補間により決定する。このようにして復号さ れたサブバンドゲインを出力端子 264から出力する。
[0141] このように、本実施の形態によれば、最もゲインの影響を受けるサブバンドをゲイン 符号帳の探索の対象に含めて符号ィ匕するため、符号ィ匕性能をさらに向上させること ができる。
[0142] 以上、本発明に係る実施の形態について説明した。
[0143] 本発明に係るスペクトル符号ィ匕装置は、上記の実施の形態 1〜4に限定されず、種 々変更して実施することが可能である。
[0144] 本発明に係る符号ィ匕装置および復号ィ匕装置は、移動体通信システムにおける通 信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の 作用効果を有する通信端末装置および基地局装置を提供することができる。
[0145] なお、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明したが、本 発明はソフトウェアで実現することも可能である。例えば、本発明に係る符号化方法 および復号ィ匕方法のアルゴリズムをプログラミング言語によって記述し、このプロダラ ムをメモリに記憶してぉ 、て情報処理手段によって実行させることにより、本発明に係 る符号ィ匕装置および復号ィ匕装置と同様の機能を実現することができる。
[0146] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路 である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部または 全てを含むように 1チップィ匕されても良い。
[0147] また、ここでは LSIとした力 集積度の違いによって、 IC、システム LSI、スーパー L SI、ウノレ卜ラ LSI等と呼称されることちある。
[0148] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッ サで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field
Programmable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可 能なリコンフィギユラブル ·プロセッサを利用しても良!、。
[0149] さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回 路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行って も良い。バイオ技術の適応等が可能性としてあり得る。
[0150] 本明細書は、 2004年 5月 19日出願の特願 2004— 148901に基づく。この内容は すべてここに含めておく。
産業上の利用可能性
[0151] 本発明に係る符号化装置、復号化装置、およびこれらの方法は、移動体通信シス テムにおける通信端末装置等の用途に適用できる。

Claims

請求の範囲
[1] 少なくとも低域と高域とに分けられたスペクトルを取得する取得手段と、
前記低域のスぺ外ルを符号ィ匕する第 1の符号ィ匕手段と、
前記高域のスぺ外ルの形状を符号ィ匕する第 2の符号ィ匕手段と、
前記高域のスペクトルの特定の位置のゲインのみを符号ィヒする第 3の符号ィヒ手段 と、
前記第 1、第 2、および第 3の符号化手段で得られる符号化情報を出力する出力手 段と、
を具備する符号化装置。
[2] 前記第 3の符号化手段は、
前記高域のスペクトルの前記特定の位置のゲインを決定する決定手段と、 前記高域のスペクトルにおける前記特定の位置以外の位置のゲインを、前記特定 の位置のゲインを補間して求める補間手段と、
前記決定手段および前記補間手段の双方で求まったゲインで表されるスペクトルを 前記高域のスペクトルと比較し、これらのスペクトルの類似具合に応じて、前記決定 手段によって決定されたゲインを変更する変更手段と、
を具備し、前記変更手段によって変更された後のゲインを符号化する、 請求項 1記載の符号化装置。
[3] 前記第 3の符号化手段は、
前記高域のスペクトルの最低周波数近傍のゲインを符号ィ匕する、
請求項 1記載の符号化装置。
[4] 前記第 3の符号化手段は、
前記高域のスペクトルの最高周波数近傍のゲインを符号ィ匕する、
請求項 1記載の符号化装置。
[5] 前記第 3の符号化手段は、
前記高域のスペクトルの極小点または極大点のゲインを符号ィヒする、
請求項 1記載の符号化装置。
[6] 前記第 3の符号化手段で使用された前記特定の位置のうちの少なくとも 1つの位置 に関する情報を符号ィ匕する第 4の符号ィ匕手段をさらに具備し、
前記出力手段は、
前記第 4の符号ィ匕手段で得られる符号ィ匕情報も併せて出力する、
請求項 1記載の符号化装置。
[7] 周波数軸方向にスケーラビリティを有する符号化情報を生成する階層符号化装置 であって、請求項 1記載の符号ィ匕装置を拡張レイヤの符号ィ匕に使用する階層符号ィ匕 装置。
[8] 少なくとも低域と高域とに分けられたスペクトルに関する符号ィ匕情報を復号ィ匕する 復号化装置であって、
前記低域のスぺ外ルに関する符号ィ匕情報を復号ィ匕する第 1の復号ィ匕手段と、 前記高域のスぺ外ルの特定の位置のゲインに関する符号ィ匕情報を復号ィ匕する第 2の復号化手段と、
前記第 2の復号ィヒ手段によって得られたゲインを用いて前記高域のスペクトルを復 号化する第 3の復号化手段と、
を具備する復号化装置。
[9] 請求項 1記載の符号化装置を具備する通信端末装置。
[10] 請求項 8記載の復号化装置を具備する通信端末装置。
[11] 請求項 1記載の符号化装置を具備する基地局装置。
[12] 請求項 8記載の復号化装置を具備する基地局装置。
[13] 少なくとも低域と高域とに分けられたスペクトルを取得する取得ステップと、
前記低域のスペクトルを符号ィ匕する第 1の符号化ステップと、
前記高域のスペクトルの形状を符号ィヒする第 2の符号化ステップと、
前記高域のスペクトルの特定の位置のゲインのみを符号ィ匕する第 3の符号化ステツ プと、
前記第 1、第 2、および第 3の符号化ステップで得られる符号ィヒ情報を出力する出 力ステップと、
を具備する符号化方法。
[14] 少なくとも低域と高域とに分けられたスペクトルに関する符号ィ匕情報を復号ィ匕する 復号化方法であって、
前記低域のスペクトルに関する符号ィヒ情報を復号ィヒする第 1の復号化ステップと、 前記高域のスぺ外ルの特定の位置のゲインに関する符号ィ匕情報を復号ィ匕する第 2の復号化ステップと、
前記第 2の復号化ステップで得られたゲインを用いて前記高域のスペクトルを復号 化する第 3の復号化ステップと、
を具備する復号化方法。
PCT/JP2005/008963 2004-05-19 2005-05-17 符号化装置、復号化装置、およびこれらの方法 WO2005112001A1 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2006513605A JP5013863B2 (ja) 2004-05-19 2005-05-17 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法
DE602005006551T DE602005006551D1 (de) 2004-05-19 2005-05-17 Kodierungs-, dekodierungsvorrichtung und methode dafür
EP05744114A EP1742202B1 (en) 2004-05-19 2005-05-17 Encoding device, decoding device, and method thereof
CN2005800158368A CN1954363B (zh) 2004-05-19 2005-05-17 编码装置和编码方法
US11/596,254 US8463602B2 (en) 2004-05-19 2005-05-17 Encoding device, decoding device, and method thereof
BRPI0510400-9A BRPI0510400A (pt) 2004-05-19 2005-05-17 dispositivo de codificação, dispositivo de decodificação e método dos mesmos
EP16186271.9A EP3118849B1 (en) 2004-05-19 2005-05-17 Encoding device, decoding device, and method thereof
US13/889,983 US8688440B2 (en) 2004-05-19 2013-05-08 Coding apparatus, decoding apparatus, coding method and decoding method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004148901 2004-05-19
JP2004-148901 2004-05-19

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US11/596,254 A-371-Of-International US8463602B2 (en) 2004-05-19 2005-05-17 Encoding device, decoding device, and method thereof
US13/889,983 Continuation US8688440B2 (en) 2004-05-19 2013-05-08 Coding apparatus, decoding apparatus, coding method and decoding method

Publications (1)

Publication Number Publication Date
WO2005112001A1 true WO2005112001A1 (ja) 2005-11-24

Family

ID=35394381

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/008963 WO2005112001A1 (ja) 2004-05-19 2005-05-17 符号化装置、復号化装置、およびこれらの方法

Country Status (9)

Country Link
US (2) US8463602B2 (ja)
EP (3) EP1742202B1 (ja)
JP (2) JP5013863B2 (ja)
KR (1) KR20070012832A (ja)
CN (2) CN102280109B (ja)
AT (1) ATE394774T1 (ja)
BR (1) BRPI0510400A (ja)
DE (1) DE602005006551D1 (ja)
WO (1) WO2005112001A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007135786A1 (ja) * 2006-05-22 2007-11-29 Oki Electric Industry Co., Ltd. 帯域外信号生成装置及び周波数帯域拡張装置
WO2008072737A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
JP2009042739A (ja) * 2007-03-02 2009-02-26 Panasonic Corp 符号化装置、復号装置およびそれらの方法
JP2009116245A (ja) * 2007-11-09 2009-05-28 Yamaha Corp 音声強調装置
EP1926084A3 (en) * 2006-11-24 2011-08-10 Fujitsu Limited Decoding apparatus and decoding method
JP2013057843A (ja) * 2011-09-09 2013-03-28 National Institute Of Information & Communication Technology 音声処置装置、音声合成装置、音声特徴量の生産方法、およびプログラム
JP2016027411A (ja) * 2011-05-25 2016-02-18 ▲ホア▼▲ウェイ▼技術有限公司 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
GB2448201A (en) 2007-04-04 2008-10-08 Zarlink Semiconductor Inc Cancelling non-linear echo during full duplex communication in a hands free communication system.
US8149752B2 (en) * 2007-07-06 2012-04-03 Alcatel Lucent Media-access-control protocol for a network employing multi-user wireless channels
BRPI0722269A2 (pt) * 2007-11-06 2014-04-22 Nokia Corp Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
US20100274555A1 (en) * 2007-11-06 2010-10-28 Lasse Laaksonen Audio Coding Apparatus and Method Thereof
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JPWO2011048741A1 (ja) * 2009-10-20 2013-03-07 日本電気株式会社 マルチバンドコンプレッサ
JP5746974B2 (ja) * 2009-11-13 2015-07-08 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置およびこれらの方法
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
AU2015202393B2 (en) * 2010-12-29 2016-06-16 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high-frequency bandwidth extension
BR112013016438B1 (pt) * 2010-12-29 2021-08-17 Samsung Electronics Co., Ltd Método de codificação, método de decodificação, e mídia de gravação legível por computador não transitória
JP2012163919A (ja) * 2011-02-09 2012-08-30 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
US9100466B2 (en) * 2013-05-13 2015-08-04 Intel IP Corporation Method for processing an audio signal and audio receiving circuit
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
RU2665281C2 (ru) * 2013-09-12 2018-08-28 Долби Интернэшнл Аб Временное согласование данных обработки на основе квадратурного зеркального фильтра
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
US10410645B2 (en) 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
KR102400016B1 (ko) 2014-03-24 2022-05-19 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
CN110444216B (zh) 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
JP6401521B2 (ja) * 2014-07-04 2018-10-10 クラリオン株式会社 信号処理装置及び信号処理方法
PL3163571T3 (pl) * 2014-07-28 2020-05-18 Nippon Telegraph And Telephone Corporation Kodowanie sygnału dźwiękowego
JP2016038435A (ja) 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP3274992B1 (en) 2015-03-27 2020-11-04 Dolby Laboratories Licensing Corporation Adaptive audio filtering
US10825465B2 (en) * 2016-01-08 2020-11-03 Nec Corporation Signal processing apparatus, gain adjustment method, and gain adjustment program
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
JP7016660B2 (ja) * 2017-10-05 2022-02-07 キヤノン株式会社 符号化装置、その制御方法、および制御プログラム、並びに撮像装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001095496A1 (fr) * 2000-06-06 2001-12-13 Sakai, Yasue Procede et appareil de compression, procede et appareil d'expansion, systeme de compression expansion
JP2002123298A (ja) * 2000-10-18 2002-04-26 Nippon Telegr & Teleph Corp <Ntt> 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2003255973A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004004530A (ja) * 2002-01-30 2004-01-08 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置およびその方法
JP2004101720A (ja) * 2002-09-06 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法
JP2004198485A (ja) * 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
JP2005004119A (ja) * 2003-06-16 2005-01-06 Victor Co Of Japan Ltd 音響信号符号化装置及び音響信号復号化装置

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US5765127A (en) 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3237178B2 (ja) 1992-03-18 2001-12-10 ソニー株式会社 符号化方法及び復号化方法
JPH0685607A (ja) * 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3106749B2 (ja) * 1992-12-10 2000-11-06 ソニー株式会社 適応型ダイナミックレンジ符号化装置
WO1997017692A1 (en) * 1995-11-07 1997-05-15 Euphonics, Incorporated Parametric signal modeling musical synthesizer
US5687191A (en) * 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
EP0880235A1 (en) * 1996-02-08 1998-11-25 Matsushita Electric Industrial Co., Ltd. Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium
TW326070B (en) * 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
US7139700B1 (en) * 1999-09-22 2006-11-21 Texas Instruments Incorporated Hybrid speech coding and system
US7039581B1 (en) * 1999-09-22 2006-05-02 Texas Instruments Incorporated Hybrid speed coding and system
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
EP1701340B1 (en) 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
DE60202881T2 (de) * 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
DE60323331D1 (de) * 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
EP1489599B1 (en) 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP4227772B2 (ja) * 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
CN1328707C (zh) * 2002-07-19 2007-07-25 日本电气株式会社 音频解码设备以及解码方法
DE60303689T2 (de) * 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5265487B2 (ja) 2009-09-03 2013-08-14 光洋自動機株式会社 掘進装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001095496A1 (fr) * 2000-06-06 2001-12-13 Sakai, Yasue Procede et appareil de compression, procede et appareil d'expansion, systeme de compression expansion
JP2002123298A (ja) * 2000-10-18 2002-04-26 Nippon Telegr & Teleph Corp <Ntt> 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2004004530A (ja) * 2002-01-30 2004-01-08 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置およびその方法
JP2003255973A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004101720A (ja) * 2002-09-06 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法
JP2004198485A (ja) * 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
JP2005004119A (ja) * 2003-06-16 2005-01-06 Victor Co Of Japan Ltd 音響信号符号化装置及び音響信号復号化装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007135786A1 (ja) * 2006-05-22 2007-11-29 Oki Electric Industry Co., Ltd. 帯域外信号生成装置及び周波数帯域拡張装置
EP1926084A3 (en) * 2006-11-24 2011-08-10 Fujitsu Limited Decoding apparatus and decoding method
US8788275B2 (en) 2006-11-24 2014-07-22 Fujitsu Limited Decoding method and apparatus for an audio signal through high frequency compensation
JP5339919B2 (ja) * 2006-12-15 2013-11-13 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2008072737A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
US8560328B2 (en) 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
JP2009042739A (ja) * 2007-03-02 2009-02-26 Panasonic Corp 符号化装置、復号装置およびそれらの方法
JP2009116245A (ja) * 2007-11-09 2009-05-28 Yamaha Corp 音声強調装置
JP2016027411A (ja) * 2011-05-25 2016-02-18 ▲ホア▼▲ウェイ▼技術有限公司 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
JP2017191341A (ja) * 2011-05-25 2017-10-19 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
JP2021060618A (ja) * 2011-05-25 2021-04-15 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
JP7177185B2 (ja) 2011-05-25 2022-11-22 ▲ホア▼▲ウェイ▼技術有限公司 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
JP2013057843A (ja) * 2011-09-09 2013-03-28 National Institute Of Information & Communication Technology 音声処置装置、音声合成装置、音声特徴量の生産方法、およびプログラム

Also Published As

Publication number Publication date
EP1742202A1 (en) 2007-01-10
JP2011248378A (ja) 2011-12-08
US8688440B2 (en) 2014-04-01
JPWO2005112001A1 (ja) 2008-03-27
EP1742202B1 (en) 2008-05-07
CN102280109A (zh) 2011-12-14
CN102280109B (zh) 2016-04-27
JP5230782B2 (ja) 2013-07-10
CN1954363B (zh) 2011-10-12
BRPI0510400A (pt) 2007-10-23
US20130246075A1 (en) 2013-09-19
EP1742202A4 (en) 2007-10-10
US8463602B2 (en) 2013-06-11
JP5013863B2 (ja) 2012-08-29
CN1954363A (zh) 2007-04-25
DE602005006551D1 (de) 2008-06-19
EP1939862A1 (en) 2008-07-02
ATE394774T1 (de) 2008-05-15
US20080262835A1 (en) 2008-10-23
EP3118849A1 (en) 2017-01-18
EP3118849B1 (en) 2020-01-01
EP1939862B1 (en) 2016-10-05
KR20070012832A (ko) 2007-01-29

Similar Documents

Publication Publication Date Title
JP5230782B2 (ja) 符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法
JP4822843B2 (ja) スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
US7769584B2 (en) Encoder, decoder, encoding method, and decoding method
KR101120911B1 (ko) 음성신호 복호화 장치 및 음성신호 부호화 장치
JP5171922B2 (ja) 符号化装置、復号化装置、およびこれらの方法
US20100138219A1 (en) Coding Apparatus and Decoding Apparatus
KR20140050054A (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2006513605

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 11596254

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2005744114

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 200580015836.8

Country of ref document: CN

Ref document number: 1020067024188

Country of ref document: KR

Ref document number: 1385/MUMNP/2006

Country of ref document: IN

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Ref document number: DE

WWP Wipo information: published in national office

Ref document number: 2005744114

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020067024188

Country of ref document: KR

ENP Entry into the national phase

Ref document number: PI0510400

Country of ref document: BR

WWG Wipo information: grant in national office

Ref document number: 2005744114

Country of ref document: EP