WO2013118834A1 - 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 - Google Patents

符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 Download PDF

Info

Publication number
WO2013118834A1
WO2013118834A1 PCT/JP2013/052913 JP2013052913W WO2013118834A1 WO 2013118834 A1 WO2013118834 A1 WO 2013118834A1 JP 2013052913 W JP2013052913 W JP 2013052913W WO 2013118834 A1 WO2013118834 A1 WO 2013118834A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal sequence
range
normalized signal
samples
gain
Prior art date
Application number
PCT/JP2013/052913
Other languages
English (en)
French (fr)
Inventor
勝宏 福井
祐介 日和▲崎▼
登 原田
守谷 健弘
優 鎌本
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2013557573A priority Critical patent/JP5800920B2/ja
Publication of WO2013118834A1 publication Critical patent/WO2013118834A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Definitions

  • the present invention relates to a technique for encoding a sound signal such as speech or music with a small amount of information, and more particularly, to an encoding technique for improving quantization accuracy.
  • Non-Patent Document 1 an outline of an encoding device and a decoding device disclosed in Non-Patent Document 1 is shown in FIG.
  • the quantized value of the global gain (gain that affects the quantization accuracy of the normalized input signal sequence) is calculated in the time domain.
  • the energy of the signal in the time domain is equal to the energy of the signal in the frequency domain, even if the quantized value of the global gain is obtained in the frequency domain, this result is not different from that in the time domain. Therefore, here, a case where the quantized value of the global gain and the decoded value thereof are calculated in the frequency domain is illustrated.
  • the frequency domain transform unit 101 receives an input time domain signal sequence x F (t) in frame units composed of a plurality of consecutive samples included in the time domain input signal x (t).
  • the frequency domain transform unit 101 converts the frequency component at the L point (L is a positive integer, for example, 256) corresponding to the input time domain signal sequence x F (t) of one frame to the input frequency domain signal sequence X ( ⁇ ).
  • Output [ ⁇ ⁇ 0,..., L-1 ⁇ ].
  • t represents an index of discrete time
  • represents an index of discrete frequency.
  • MDCT Modified Discrete Cosine Transform
  • DCT Discrete Cosine Transform
  • the normalization unit 102 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and an input frequency domain signal sequence X ( ⁇ ) obtained by the gain control unit 104 described later.
  • a gain hereinafter referred to as a global gain
  • g that determines the quantization accuracy of each component of [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is input.
  • the normalization unit 102 divides each component of the input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by the global gain g, or the input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by multiplying each component of [ ⁇ ⁇ 0,..., L-1 ⁇ ] by the reciprocal of the global gain g, respectively.
  • ⁇ ] Is normalized, and a normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is output.
  • the quantizing unit 103 receives the normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ].
  • the quantization unit 103 quantizes the normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by a predetermined method, and the normalized signal sequence X Q ( ⁇ ) Quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1] which is a series of quantized values of each component of [ ⁇ ⁇ 0,.
  • a normalized signal code that is a code corresponding to the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], and the bits of the normalized signal code Number (hereinafter referred to as the number of consumed bits). Further, when receiving from the gain control unit 104 command information for outputting a quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a normalized signal code Then, the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and the normalized signal code are output.
  • the gain control unit 104 receives the number of consumed bits.
  • the gain control unit 104 adjusts the global gain g so that the number of consumed bits approaches a maximum value that is less than or equal to the number of bits allocated in advance to the normalized signal code (hereinafter referred to as the specified number of bits).
  • the global gain g is output as a new global gain g.
  • a process of increasing the global gain g when the number of consumed bits is larger than the specified number of bits and decreasing the global gain g otherwise can be exemplified.
  • the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0, ..., L-1 ⁇ ] and the normalized signal code are Command information to be output is output to the quantization unit 103.
  • the global gain encoding unit 105 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0. ,..., L-1 ⁇ ] is input.
  • the global gain encoding unit 105 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a quantum among a plurality of preset global gain quantization values.
  • the normalized signal code and the global gain code which are output codes of the encoding device, are transmitted to the decoding device and input to the decoding device.
  • a global gain code is input to the global gain decoding unit 106.
  • the global gain decoding unit 106 applies a decoding process corresponding to the encoding process performed by the global gain encoding unit 105 to decode the global gain code, and outputs a decoded global gain g ⁇ .
  • ⁇ Normalized signal decoding unit 107 A normalized signal code is input to the normalized signal decoding unit 107.
  • the normalized signal decoding unit 107 applies a decoding method corresponding to the encoding method performed by the quantization unit 103 of the encoding device, decodes the normalized signal code, and generates a decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] is output.
  • the decoded frequency component calculation unit 108 receives the decoded global gain g ⁇ and the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ].
  • the decoded frequency component calculation unit 108 is obtained by multiplying each component of the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and the decoded global gain g ⁇ .
  • the sequence is output as a decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ].
  • ⁇ Time domain conversion unit 109 Decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is input to time domain transform section 109.
  • the time domain transform unit 109 applies a frequency-time transform to the decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], and outputs an output time domain signal sequence in units of frames.
  • the frequency-time conversion method is an inverse conversion corresponding to the time-frequency conversion method used in the frequency domain conversion unit 101.
  • the frequency-time conversion method here is IMDCT (Inverse Modified Discrete Cosine Transform) or IDCT (Inverse Discrete Cosine Transform).
  • the global gain is adjusted to appropriately control the coarseness of quantization of the normalized signal sequence, so that the number of bits consumed, which is the code amount of the normalized signal code, is the specified number of bits. Control is performed so that the following maximum value is obtained. For this reason, when the number of bits consumed is smaller than the specified number of bits, there is a problem in that the encoding process that makes full use of the number of bits allocated in advance for the normalized signal sequence cannot be performed.
  • an object of the present invention is to provide an encoding technique that improves the quantization accuracy of a normalized signal sequence with a small increase in code amount and a decoding technique thereof.
  • An encoding method is an encoding technique for encoding an input signal sequence in units of frames configured by a plurality of input signal samples, and each input signal sample included in the input signal sequence is normalized.
  • Normalized signal encoding processing for obtaining a normalized signal code obtained by encoding a sequence of the received signal and a quantized normalized signal sequence corresponding to the normalized signal code, and a gain corresponding to the input signal sequence
  • a global gain encoding process for obtaining a quantized global gain and a global gain code corresponding to the quantized global gain, and a quantized normalized signal sequence in N ranges (N is an integer of 2 or more) Segmentation processing to be segmented, correction gain obtained by correcting the quantized global gain with the gain correction amount for each segmented range, and each sample of the quantized normalized signal sequence Gain correction to obtain a gain correction amount code for specifying the gain correction amount for each divided range, in which the correlation between the signal sequence obtained by multiplying the signal value and the input signal sequence is
  • the correction gain is, for example, (1) a value obtained by adding the quantized global gain and the gain correction amount, and (2) a square of the values of all the samples in the frame of the quantized global gain and the quantized normalized signal sequence.
  • the number of samples in which the energy of the samples in the frame of the quantized normalized signal sequence is larger than a predetermined value the energy of the samples in the divided range of the quantized normalized signal sequence is larger than the predetermined value.
  • the gain correction amount includes a pre-quantization width gain correction amount included in a gain correction amount code book in which candidates for pre-quantization width gain correction amounts are stored in advance, and a quantization step width corresponding to a quantized global gain. And a value obtained by multiplying.
  • a decoding method is a decoding technique for obtaining an output signal sequence by decoding a frame-by-frame code, and decoding a normalized signal code included in the code to obtain a decoded normalized signal sequence
  • Signal processing segmentation processing that divides the decoded normalized signal sequence into N ranges (N is an integer of 2 or more), and gain corresponding to each range by decoding the gain correction amount code included in the code
  • N is an integer of 2 or more
  • a gain correction amount decoding process for obtaining a correction amount, a global gain decoding process for obtaining a decoded global gain by decoding a global gain code included in the code, and a decoding global gain is corrected by a gain correction amount for each divided range.
  • nth range (n is an integer from 1 to N-1) of the decoded normalized signal sequence, (a) N of the sum of squares of the values of all samples included in the first range to the nth range of the decoded normalized signal sequence and the sum of squares of the values of all samples of the decoded normalized signal sequence So that n and min are the closest Or (b) The sum of absolute values of all sample values included in the first range to the nth range of the decoded normalized signal sequence and the sum of absolute values of all sample values of the decoded normalized signal sequence So that n of N is the closest Or (c) All samples in which the total number of samples from the first range to the nth range of the decoded normalized signal sequence is included in the first range to the nth range of the decoded normalized signal sequence So
  • the correction gain is, for example, (1) a value obtained by adding the decoding global gain and the gain correction amount, and (2) decoding the sum of squares of the values of the decoding global gain and all samples in the frame of the decoded normalized signal sequence.
  • the gain correction amount includes a gain correction amount before quantization width included in a gain correction amount codebook in which candidates for a gain correction amount before quantization width multiplication are stored in advance, a quantization step width corresponding to a decoded global gain, It is good also as a value obtained by multiplying.
  • the acoustic signal handled in each embodiment is a signal such as a sound, a sound such as a musical sound, and a video.
  • the acoustic signal is a time domain signal.
  • the time domain signal may be converted into a frequency domain signal or a frequency domain signal may be converted into a time domain signal by a known technique as necessary. You can also. Therefore, the signal to be encoded may be a time domain signal or a frequency domain signal (in the following description, the frequency domain signal is treated for the sake of concrete explanation).
  • the signal input as the target of the encoding process is a sequence (sample sequence) composed of a plurality of samples, and the encoding process is normally executed in units of frames. I will call it.
  • each component included in the input signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], the quantized global gain g ⁇ , and the quantized normalized signal The relationship between the components included in the sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] can be expressed by Expression (1).
  • e g is the quantization error between the global gain g and the quantized global gain g ⁇
  • e XQ is the normalized input signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0, ..., L-1 ⁇ ].
  • Quantization normalized signal sequence X ⁇ Q ( ⁇ ) represents a quantization error between corresponding components (components having the same value of ⁇ ) included in [ ⁇ ⁇ 0, ..., L-1 ⁇ ] .
  • the number of bits consumed by a normalized signal code that is a code corresponding to a quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] is Depending on the input signal sequence, a part of the predetermined number of bits predetermined for the normalized signal code often remains as unused bits. Therefore, the excess one or more bits (hereinafter, referred to as surplus bits) utilizing the reduction of the quantization error e g and e XQ. Furthermore, not only the surplus bits, but also one or a plurality of bits prepared in advance for reducing the quantization error may be used.
  • the entire sequence of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] is divided into a plurality of ranges.
  • An easily conceivable method for dividing the same signal sequence B into N ranges by the encoding device and the decoding device is to specify a range such as the boundary position of adjacent ranges and the number of components included in each range.
  • information is output from the encoding device.
  • a large number of bits are required to output information specifying the range.
  • the coding apparatus and the decoding apparatus perform classification according to the same standard without using the information specifying the range as the output of the coding apparatus, that is, without consuming bits.
  • the gain correction bits that is, the amount of information for correcting the quantized global gain
  • the components of the quantized normalized signal sequence included in each range It is desirable that the amount of information be as uniform as possible. Therefore, the “criteria for classifying so that the energy in each range is as equal as possible” is adopted as a criterion for series division. A specific classification method based on this criterion will be described in detail later.
  • the encoding apparatus 1 (see FIG. 2) of the first embodiment includes a normalized signal encoding unit 120, a global gain encoding unit 105, a gain correction amount encoding unit 140, and a sorting unit 150.
  • the classification unit 150 is illustrated as a component of the gain correction amount encoding unit 140.
  • the classification unit 150 includes the gain correction amount. It may be a component different from the encoding unit 140.
  • the encoding device 1 may include a frequency domain transform unit 101 and a synthesis unit 160 as necessary.
  • the input signal sequence of the encoding device 1 is an input signal sequence X ( ⁇ that is a frequency component of L points (L is a positive integer, for example, 256) corresponding to the acoustic signal x (t) in units of frames. ) [ ⁇ ⁇ L min ,..., L max ⁇ ]
  • t is an index of discrete time
  • is an index of discrete frequency
  • L min is an index of minimum discrete frequency among frequency components at L point
  • L max is a maximum discrete frequency among frequency components at L point. Represents the index.
  • the frame-wise acoustic signal x (t) itself may be used as the input signal sequence of the encoding device 1, or a residual signal obtained by performing linear prediction analysis on the frame-wise acoustic signal x (t) is encoded. 1 may be used as the input signal sequence, or a frequency component at L point (L is a positive integer, for example, 256) corresponding to the residual signal may be used as the input signal sequence.
  • the encoding device 1 may include a frequency domain transform unit 101 as a preprocessing unit of the encoding device 1 or in the encoding device 1.
  • the frequency domain transform unit 101 generates frequency components at L points (L is a positive integer, for example, 256) corresponding to the time domain acoustic signal x (t) in units of frames, and the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ]
  • MDCT Modified Discrete Cosine Transform
  • DCT Discrete Cosine Transform
  • a residual signal obtained by linear prediction analysis of the time domain acoustic signals in units of frames may be set as x (t).
  • the normalized signal encoding unit 120 encodes a sequence based on a signal obtained by normalizing each component of the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] in units of frames.
  • the quantized signal code and the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] corresponding to the normalized signal code are output (step S1e).
  • the normalization signal encoding unit 120 is realized by, for example, the normalization unit 102, the quantization unit 103, and the gain control unit 104 in FIG. Each of the normalization unit 102, the quantization unit 103, and the gain control unit 104 operates as described in the [Background Art] column.
  • the global gain encoding unit 105 supports a quantized global gain g ⁇ that is a gain corresponding to the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and a quantized global gain g ⁇ .
  • the global gain code to be obtained is obtained (step S2e).
  • the global gain encoding unit 105 also obtains a quantization step width corresponding to the quantized global gain g ⁇ as necessary.
  • the global gain encoding unit 105 operates, for example, as described in the “Background art” column.
  • the global gain encoding unit 105 includes a table storing a plurality of sets of quantized global gain candidates and global gain codes corresponding to the candidates, and the global gain obtained by the normalized signal encoding unit 120
  • the candidate for the quantized global gain closest to the gain g may be set as the quantized global gain g ⁇ , and the global gain code corresponding to the candidate may be output.
  • the global gain coding unit 105 multiplies each component of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and the gain and obtains a signal.
  • Quantized global gain g ⁇ obtained on the basis of the maximum correlation or minimum error between the sequence and the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and this quantization
  • a global gain code corresponding to the global gain may be obtained and output.
  • the quantization step width corresponding to the quantized global gain ⁇ is also the gain correction amount code. Is output to the conversion unit 140.
  • the classifying unit 150 classifies the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] with “a criterion for classifying the energy of each range to be as equal as possible”
  • the range is divided into N ranges (where N is a predetermined integer equal to or greater than 2) (step S3e).
  • a set of discrete frequency indices of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L max ⁇ ] is represented by ⁇ L min , ..., L max ⁇
  • the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] corresponds to the entire sequence B
  • division information Information relating to the division into N ranges obtained by this division processing (hereinafter referred to as division information) is output from the division unit 150 and provided to the gain correction amount encoding unit 140.
  • the gain correction amount encoding unit 140 includes an input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ], a quantized global gain g ⁇ , and a quantized normalized signal sequence X ⁇ Q. ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and classification information are input.
  • the gain correction amount encoding unit 140 uses a gain correction amount code book stored in a storage unit (not shown) to correct the quantization global gain for each range divided by the gain correction amount, Quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] multiplied by the value of each sample and the input signal sequence X ( ⁇ ) [ ⁇
  • a gain correction amount code which is a code for specifying the gain correction amount for each divided range, in which the correlation with ⁇ ⁇ L min ,..., L max ⁇ ] is maximum or the error is minimum is output (step S4e). ).
  • the synthesis unit 160 outputs a bit stream in which the normalized signal code, the gain correction amount code, and the global gain code are collected.
  • the bit stream is transmitted to the decoding device 2.
  • the classification process based on the “criteria for classifying the energy of each range to be as equal as possible” includes, for example, the nth range (n is an integer from 1 to N ⁇ 1) of the quantized normalized signal sequence, (a) Sum of squares of values of all samples included in the first range to nth range of the quantized normalized signal sequence and sum of squares of values of all samples of the quantized normalized signal sequence So that n of N is the closest Or (b) The absolute value sum of the values of all samples included in the first range to the nth range of the quantized normalized signal sequence and the absolute value of all samples of the quantized normalized signal sequence As n of N of the sum of values is closest, Or (c) All of the total number of samples from the first range to the nth range of the quantized normalized signal sequence are included in the first range to the nth range of the quantized normalized signal sequence So that the sum of squares of the values of the samples
  • the classification process exemplified above is realized by a method of sequentially determining the classification based on the “criteria for classifying so that the energy of each range is as equal as possible” sequentially from the first range. According to the classification process exemplified above, it is possible to realize the classification based on the “standard for classifying the energy in each range so as to be as equal as possible” with a small amount of calculation processing.
  • FIG. 1 A first example of the sorting process will be described with reference to FIGS. 4, 5, and 6.
  • FIG. The sorting process of the first example corresponds to the above (a).
  • the division processing of the first example is performed by changing the nth range (n is an integer from 1 to N ⁇ 1) of the quantized normalized signal sequence to the nth range from the first range of the quantized normalized signal sequence.
  • the square sum of the values of all the samples included up to the range of n and the nth of the square sum of the values of all the samples of the quantized normalized signal sequence are determined to be closest to each other, and the quantization normalization is performed.
  • a range other than the first range to the (N ⁇ 1) th range of the completed signal sequence is set as the Nth range of the quantized normalized signal sequence, so that the quantized normalized signal sequence is converted into N This is a process of dividing into ranges.
  • Quantization normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L max ⁇ ] to be classified is changed to X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L mid -1 ⁇ . ]
  • X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L mid ,..., L max ⁇ ] are divided into two ranges, specifically, the first range is the low range and the second range.
  • L mid which is the sample number on the lowest frequency side of the second range, is determined as information representing the boundary with the high frequency range.
  • quantized normalized signal sequence was determined by the equation (2) X ⁇ Q [ ⁇ ⁇ L min, ..., L max ⁇ ] All samples X ⁇ Q (L min) of, ..., X ⁇ Q ( L max ) of the sum of squares and all samples X ⁇ Q (L min ), ..., X ⁇ Q (L mid -1) included in the first range of the quantized normalized signal sequence Lmid , which is the sample number on the lowest side of the second range, is obtained so that the difference from the sum of squares of the values of the second value is minimized. That is, L mid is obtained by the equation (3). Accordingly, the first range is determined as X ⁇ Q [ ⁇ ⁇ L min ,..., L mid ⁇ 1 ⁇ ].
  • quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ L mid, ..., L max ⁇ ] Is the second range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information identifying circuit 150 outputs may be the L mid, may be a value obtained by calculating the predetermined value in the L mid, number of samples L mid -L min of the first range Alternatively, the number of samples in the second range may be L max ⁇ L mid +1. In short, any information that can identify the first range and the second range may be used.
  • FIG. 5 shows an example of dividing the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] to be divided into four ranges, specifically, the first L (1) , which is the lowest sample number of the second range, is determined as information indicating the boundary between the second range and the second range, and the boundary between the second range and the third range is determined.
  • L (2) which is the sample number on the lowest side of the third range, is determined as information to be expressed, and the lowest range of the fourth range is set as information indicating the boundary between the third range and the fourth range. This is an example of determining L (3) which is the sample number on the side.
  • quantized normalized signal sequence was determined by the equation (2) X ⁇ Q [ ⁇ ⁇ L min, ..., L max ⁇ ] All samples X ⁇ Q (L min) of, ..., X ⁇ Q ( L max ) of the sum of squares and all samples X ⁇ Q (L min ), ..., X ⁇ Q (L (1) -in the first range of the quantized normalized signal sequence L (1) obtained so as to minimize the difference from the sum of squares of the value of 1) is set as the sample number on the lowest side of the second range. Thereby, X ⁇ Q [ ⁇ ⁇ L min ,..., L (1) ⁇ 1 ⁇ ] is determined as the first range.
  • the quantization normalized signal sequence was determined by the equation (2) X ⁇ Q [ ⁇ ⁇ L min, ..., L max ⁇ ] All samples X ⁇ Q (L min) of, ..., X ⁇ Q (L max ) sum of squares (ie, half) and all samples X ⁇ Q (L min ) included in the first to second ranges of the quantized normalized signal sequence , ..., and X ⁇ Q (L (2) -1) sample number in the difference between the square sum of the values of determined so as to minimize L (2) to the lowest frequency side of the third range . Thereby, X ⁇ Q [ ⁇ ⁇ L (1) ,..., L (2) ⁇ 1 ⁇ ] is determined as the second range.
  • the quantization normalized signal sequence was determined by the equation (2) X ⁇ Q [ ⁇ ⁇ L min, ..., L max ⁇ ] All samples X ⁇ Q (L min) of, ..., X ⁇ Q (L max ) of the square sum of squares and all samples X ⁇ Q (L min ), ..., X ⁇ Q (L in the first to third ranges of the quantized normalized signal sequence (3) L (3) obtained so that the difference from the sum of squares of the value of -1) is minimized is the sample number on the lowest side of the fourth range. Thereby, X ⁇ Q [ ⁇ ⁇ L (2) ,..., L (3) ⁇ 1 ⁇ ] is determined as the third range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is in a range other than the first to third ranges, that is, X ⁇ Q [ ⁇ ⁇ L ( 3) ,..., L max ⁇ ] is the fourth range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into four ranges.
  • Sorting information identifying circuit 150 outputs may be a L (1) and L (2) and L (3), predetermined to each of the L (1) and L (2) and L (3)
  • the calculated value may be the number of samples in each range, or anything insofar as it is information that can identify all four ranges.
  • FIG. 6 shows an example of dividing the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] to be divided into N ranges, specifically, the nth
  • L (n) which is a sample number on the lowest side of the (n + 1) th range, is determined as information indicating the boundary between the (n + 1) th range and the (n + 1) th range.
  • L min is assumed to be L (0) .
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is in a range other than the first range to the (N ⁇ 1) th range, that is, X ⁇ Q [ ⁇ ⁇ L (N ⁇ 1) ,..., L max ⁇ ] is the Nth range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into N ranges.
  • Sorting information identifying circuit 150 is output, L (n) (n is the integer from 1 to N-1) may be a, L (n) (each n is an integer from 1 to N-1 ) May be a value obtained by calculating a predetermined value, may be the number of samples in each range, or may be anything as long as it is information that can specify all N ranges.
  • the second example of the sorting process corresponds to the above (b).
  • the sorting process of the second example is the same method as the sorting process of the first example, except that “sum of squares” in the sorting process of the first example is replaced with “sum of absolute values”. According to the sorting process of the second example, it is possible to perform the sorting process with a smaller amount of calculation processing than the sorting process of the first example because the square calculation performed in the sorting process of the first example can be omitted.
  • FIG. 7 A third example of the sorting process will be described with reference to FIGS. 7, 8, and 9.
  • FIG. The classification process of the third example corresponds to the above (c).
  • the segmenting process of the third example includes the nth range (n is an integer from 1 to N ⁇ 1) of the quantized normalized signal sequence, and the nth range from the first range of the quantized normalized signal sequence. Is the sum of the squares of the values of all samples included in the first range to the nth range of the quantized normalized signal sequence.
  • Quantization normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L max ⁇ ] to be classified is changed to X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L mid -1 ⁇ . ]
  • X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L mid ,..., L max ⁇ ] are divided into two ranges, specifically, the first range is the low range and the second range.
  • L mid which is the sample number on the lowest frequency side of the second range, is determined as information representing the boundary with the high frequency range.
  • the square sum p low is p low ⁇ pow / 2 while the number of the index omega discrete frequency increased from L min in order from L min of the quantization normalized signal sequence X ⁇ Q ( ⁇ ) to the index
  • the first range is up to the index ⁇ of the discrete frequency when p low ⁇ pow / 2 is satisfied for the first time, and the value obtained by adding 1 to the index ⁇ is the lowest range in the second range Output as the index L mid which is the sample number on the side. Accordingly, the first range is determined as X ⁇ Q [ ⁇ ⁇ L min ,..., L mid ⁇ 1 ⁇ ].
  • FIG. 7 is a flowchart for realizing the above processing.
  • the initial value of the discrete frequency index ⁇ is set to L min
  • the initial value of the low frequency energy p low is set to
  • the value obtained by adding is a new p low .
  • p low ⁇ pow / 2 is satisfied, a value obtained by adding 1 to the index ⁇ of the discrete frequency at that time is output as the index L mid .
  • quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ L mid, ..., L max ⁇ ] Is the second range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information identifying circuit 150 outputs may be the L mid, may be a value obtained by calculating the predetermined value in the L mid, number of samples L mid -L min of the first range Alternatively, the number of samples in the second range may be L max ⁇ L mid +1. In short, any information that can identify the first range and the second range may be used.
  • FIG. 8 shows an example in which the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] to be classified is divided into four ranges, specifically, the first L (1) , which is the lowest sample number of the second range, is determined as information indicating the boundary between the second range and the second range, and the boundary between the second range and the third range is determined.
  • L (2) which is the sample number on the lowest side of the third range, is determined as information to be expressed, and the lowest range of the fourth range is set as information indicating the boundary between the third range and the fourth range. This is an example of determining L (3) which is the sample number on the side.
  • the sum of squares of the values of all the samples X ⁇ Q ( Lmin ), ..., X ⁇ Q (L (1) -1) included in the first range of the quantized normalized signal sequence is (2) determined quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] All samples X ⁇ Q (L min) of, ..., X ⁇ Q of (L max)
  • a signal that is equal to or more than a quarter of the sum of squares and that is obtained by excluding one sample at the highest frequency side of the first range from all samples included in the first range of the quantized normalized signal sequence sequence X ⁇ Q (L min), ..., X ⁇ Q (L (1) -2) square sum of the values of the formula (2) obtained quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] is less than a quarter of the sum of squares of all samples X ⁇ Q ( Lmin ), ..., X ⁇ Q ( L
  • the squares of the values of all samples X ⁇ Q ( Lmin ), ..., X ⁇ Q (L (2) -1) included in the first range to the second range of the quantized normalized signal sequence sum, quantized normalized signal sequence was determined by the equation (2) X ⁇ Q [ ⁇ ⁇ L min, ..., L max ⁇ ] All samples X ⁇ Q (L min) of, ..., X ⁇ Q ( L max ) is equal to or greater than two-quarters of the sum of squares (ie, half), and the first of all the samples included in the second range from the first range of the quantized normalized signal sequence.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is in a range other than the first to third ranges, that is, X ⁇ Q [ ⁇ ⁇ L ( 3) ,..., L max ⁇ ] is the fourth range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into four ranges.
  • Sorting information identifying circuit 150 outputs may be a L (1) and L (2) and L (3), predetermined to each of the L (1) and L (2) and L (3)
  • the calculated value may be the number of samples in each range, or anything insofar as it is information that can identify all four ranges.
  • FIG. 9 shows an example of dividing the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] to be divided into N ranges, specifically, the nth
  • L (n) which is a sample number on the lowest side of the (n + 1) th range, is determined as information indicating the boundary between the (n + 1) th range and the (n + 1) th range.
  • this processing can be realized by, for example, the following.
  • the energy pow is obtained by equation (2).
  • X ⁇ Q [ ⁇ ⁇ L min ,..., L (1) ⁇ 1 ⁇ ] is determined as the first range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is in a range other than the first range to the (N ⁇ 1) th range, that is, X ⁇ Q [ ⁇ ⁇ L (N ⁇ 1) ,..., L max ⁇ ] is the Nth range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into N ranges.
  • Sorting information identifying circuit 150 is output, L (n) (n is the integer from 1 to N-1) may be a, L (n) (each n is an integer from 1 to N-1 ) May be a value obtained by calculating a predetermined value, may be the number of samples in each range, or may be anything as long as it is information that can specify all N ranges.
  • the fourth example of the sorting process corresponds to the above (d).
  • the sorting process of the fourth example is the same method as the sorting process of the third example, except that “sum of squares” in the sorting process of the third example is replaced with “sum of absolute values”.
  • the classification process of the fourth example it is possible to perform the classification process with a smaller calculation processing amount than the classification process of the third example because the square calculation performed in the classification process of the third example can be omitted.
  • a fifth example of the sorting process will be described with reference to FIG. 10, FIG. 11, and FIG.
  • the classification process of the fifth example corresponds to the above (e).
  • the partition processing of the fifth example is performed by changing the nth range (n is an integer from 1 to N ⁇ 1) of the quantized normalized signal sequence to the nth range from the first range of the quantized normalized signal sequence. Is the sum of the squares of the values of all samples included in the first range to the nth range of the quantized normalized signal sequence.
  • Quantization normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L max ⁇ ] to be classified is changed to X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L mid -1 ⁇ . ]
  • X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L mid ,..., L max ⁇ ] are divided into two ranges, specifically, the first range is the low range and the second range.
  • L mid which is the sample number on the lowest frequency side of the second range, is determined as information representing the boundary with the high frequency range.
  • the square sum p low is p low ⁇ pow / 2 while the number of the index omega discrete frequency increased from L min in order from L min of the quantization normalized signal sequence X ⁇ Q ( ⁇ ) to the index determines whether they meet the first time from p low ⁇ pow / when 2 is not satisfied discrete frequency index ⁇ to the discrete frequency obtained by subtracting 1 to the first range, the most the index ⁇ second range Output as the index L mid which is the sample number on the low frequency side. Accordingly, the first range is determined as X ⁇ Q [ ⁇ ⁇ L min ,..., L mid ⁇ 1 ⁇ ].
  • FIG. 10 is a flowchart for realizing the above processing.
  • the initial value of the discrete frequency index ⁇ is set to L min
  • the initial value of the low frequency energy p low is set to
  • p low ⁇ pow / 2 is the one plus the index of discrete frequency omega as a new omega, energy to p low X ⁇ Q ( ⁇ )
  • quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] first range outside the range of, namely, X ⁇ Q [ ⁇ ⁇ L mid, ..., L max ⁇ ] Is the second range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information identifying circuit 150 outputs may be the L mid, may be a value obtained by calculating the predetermined value in the L mid, number of samples L mid -L min of the first range Alternatively, the number of samples in the second range may be L max ⁇ L mid +1. In short, any information that can identify the first range and the second range may be used.
  • FIG. 11 shows an example of dividing the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] to be divided into four ranges, specifically, the first L (1) , which is the lowest sample number of the second range, is determined as information indicating the boundary between the second range and the second range, and the boundary between the second range and the third range is determined.
  • L (2) which is the sample number on the lowest side of the third range, is determined as information to be expressed, and the lowest range of the fourth range is set as information indicating the boundary between the third range and the fourth range. This is an example of determining L (3) which is the sample number on the side.
  • the sum of squares of the values of all the samples X ⁇ Q ( Lmin ), ..., X ⁇ Q (L (1) -1) included in the first range of the quantized normalized signal sequence is (2) determined quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] All samples X ⁇ Q (L min) of, ..., X ⁇ Q of (L max)
  • the sum of the squares of the values of the formula (2) obtained quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] is greater than a quarter of the sum of squares of all samples X ⁇ Q ( Lmin ), ..., X ⁇ Q ( L
  • the squares of the values of all the samples X ⁇ Q ( Lmin ), ..., X ⁇ Q (L (3) -1) included in the first to third ranges of the quantized normalized signal sequence sum, quantized normalized signal sequence was determined by the equation (2) X ⁇ Q [ ⁇ ⁇ L min, ..., L max ⁇ ] All samples X ⁇ Q (L min) of, ..., X ⁇ Q ( L max ) is less than or equal to three-quarters of the square sum, and all samples included in the first range to the third range of the quantized normalized signal sequence include the lowest side of the fourth range.
  • Quantized normalized signal sequence obtained by the formula (2) is the sum of squares of the signal sequence X ⁇ Q ( Lmin ), ..., X ⁇ Q (L (3) )
  • X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] is greater than three quarters of the sum of squares of all samples X ⁇ Q (L min ), ..., X ⁇ Q (L max ), L (3 )
  • X ⁇ Q [ ⁇ ⁇ L (2) ,..., L (3) ⁇ 1 ⁇ ] is determined as the third range.
  • This process can be specifically realized by, for example, the following.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is in a range other than the first to third ranges, that is, X ⁇ Q [ ⁇ ⁇ L ( 3) ,..., L max ⁇ ] is the fourth range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into four ranges.
  • Sorting information identifying circuit 150 outputs may be a L (1) and L (2) and L (3), predetermined to each of the L (1) and L (2) and L (3)
  • the calculated value may be the number of samples in each range, or anything insofar as it is information that can identify all four ranges.
  • FIG. 12 shows an example of dividing the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] to be divided into N ranges, specifically, the nth
  • L (n) which is a sample number on the lowest side of the (n + 1) th range, is determined as information indicating the boundary between the (n + 1) th range and the (n + 1) th range.
  • this processing can be realized by, for example, the following.
  • the energy pow is obtained by equation (2).
  • X ⁇ Q [ ⁇ ⁇ L min ,..., L (1) ⁇ 1 ⁇ ] is determined as the first range.
  • quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min , ..., L max ⁇ ] first range from a range other than the N-1 in the range of, namely, X ⁇ Q [ ⁇ ⁇ L (N ⁇ 1) ,..., L max ⁇ ] is the Nth range.
  • the quantized normalized signal sequence X ⁇ Q [ ⁇ ⁇ L min ,..., L max ⁇ ] is divided into N ranges.
  • Sorting information identifying circuit 150 is output, L (n) (n is the integer from 1 to N-1) may be a, L (n) (each n is an integer from 1 to N-1 ) May be a value obtained by calculating a predetermined value, may be the number of samples in each range, or may be anything as long as it is information that can specify all N ranges.
  • the sixth example of the sorting process corresponds to the above (f).
  • the sorting process of the sixth example is the same method as the sorting process of the fifth example, except that “sum of squares” in the sorting process of the fifth example is replaced with “sum of absolute values”. According to the sorting process of the sixth example, it is possible to perform the sorting process with a smaller calculation processing amount than the sorting process of the fifth example, because the square calculation performed in the sorting process of the fifth example can be omitted.
  • the gain correction amount encoding unit 140 uses a gain correction amount codebook stored in a storage unit (not shown) to correct the quantized global gain g ⁇ for each divided range with a gain correction amount.
  • the signal sequence obtained by multiplying the gain and the value of each sample of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and the input signal sequence X ( ⁇ )
  • a gain correction amount code which is a code for specifying a gain correction amount for each divided range, in which the correlation with [ ⁇ ⁇ L min ,..., L max ⁇ ] is maximum or the error is minimum is output.
  • the first example of the gain correction amount encoding process is an example in which the gain obtained by adding the quantized global gain g ⁇ and the gain correction amount is used as the correction gain.
  • a code for specifying a gain correction amount candidate ⁇ low (m) in the first range, a gain correction amount candidate ⁇ high (m) in the second range, and candidates for these gain correction amounts M sets of idx (m) are stored (M is a predetermined integer of 2 or more). Specifically, a set of ⁇ low (1), ⁇ high (1) and idx (1), a set of ⁇ low (2), ⁇ high (2) and idx (2), ..., ⁇ A set of low (M), ⁇ high (M), and idx (M) is stored in the storage unit as a gain correction amount codebook.
  • the gain correction amount encoding unit 140 adds a quantized global gain g ⁇ and a gain correction amount candidate ⁇ low (m) in the first range for each m from 1 to M.
  • the first range of quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L mid -1 ⁇ ]
  • the input signal series X ( ⁇ ) in the range of 1 [ ⁇ ⁇ L min ,..., L mid ⁇ 1 ⁇ ] and the sum of squares of the difference between corresponding samples, the quantized global gain g ⁇ and the second range of the gain correction amount candidate ⁇ high (m) and a value obtained by adding the second range of quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L mid, ..., L max ⁇ ] multiplied by the value of each sample and the corresponding samples of the second range of input signal sequences X ( ⁇ ) [ ⁇ ⁇ L mid ,..., L max ⁇ ]
  • a code idx (m) corresponding to m that minimizes the added value is output as a gain correction amount code idx. That is, the gain correction amount code idx is obtained by the equation (13).
  • equation (13) corresponds to vector quantization based on the criterion that minimizes the error, but vector quantization based on the criterion that maximizes the correlation, and the criterion based on the criterion that minimizes the error or maximizes the correlation.
  • a technique such as scalar quantization may be applied.
  • a gain correction amount candidate ⁇ 1 (m) in the first range, a gain correction amount candidate ⁇ 2 (m) in the second range, and a gain correction amount candidate ⁇ in the third range are stored.
  • ⁇ 1 (1), ⁇ 2 (1), ⁇ 3 (1), ⁇ 4 (1), and idx (1) pairs, ⁇ 1 (2), ⁇ 2 (2), and ⁇ 3 (2), ⁇ 4 (2), and idx (2), ..., ⁇ 1 (M), ⁇ 2 (M), ⁇ 3 (M), ⁇ 4 (M), and idx (M ) Is stored in the storage unit as a gain correction amount code book.
  • the gain correction amount coding unit first adds a value obtained by adding the quantized global gain g ⁇ and the gain correction amount candidate ⁇ 1 (m) in the first range for each of 1 to M.
  • a signal sequence obtained by multiplying the value of each sample of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L (1) ⁇ 1 ⁇ ] in the first range; The sum of squares of the difference between the corresponding samples of the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L (1) ⁇ 1 ⁇ ] in the first range and the quantized global gain g ⁇
  • a code idx (m) corresponding to m that minimizes the added value is output as a gain correction amount code idx. That is, the gain correction amount code idx is obtained by the equation (15).
  • Equation (15) corresponds to the vector quantization based on the criterion that minimizes the error, but the vector quantization based on the criterion that maximizes the correlation and the criterion based on the criterion that minimizes the error or maximizes the correlation.
  • a technique such as scalar quantization may be applied.
  • gain correction amount candidates ⁇ 1 (m),..., ⁇ N (m) in the first to Nth ranges and codes idx () for specifying these gain correction amount candidates M sets (m) are stored (M is a predetermined integer of 2 or more). Specifically, a set of ⁇ 1 (1), ..., ⁇ N (1) and idx (1), a set of ⁇ 1 (2), ..., ⁇ N (2) and idx (2), ..., ⁇ 1 (M),..., ⁇ N (M) and idx (M) are stored in the storage unit as a gain correction amount code book.
  • the gain correction amount encoding unit firstly, for each m of 1 to M, the quantized global gain g ⁇ for each of the first range to the Nth range and the gain correction amount candidate ⁇ for the nth range.
  • the added value is obtained by equation (16).
  • a code idx (m) corresponding to m that minimizes the added value is output as a gain correction amount code idx. That is, the gain correction amount code idx is obtained by the equation (17).
  • equation (17) corresponds to vector quantization based on the criterion that minimizes the error.
  • the vector quantization based on the criterion that maximizes the correlation and the criterion based on the criterion that minimizes the error or maximizes the correlation.
  • a technique such as scalar quantization may be applied.
  • the quantized global gain g ⁇ and the square sum of the values of all samples in the frame of the quantized normalized signal sequence are divided into quantized normalized signal sequences.
  • a value obtained by multiplying the gain correction amount by a value obtained by dividing the value of all the samples within the range by the sum of squares is used as the correction gain.
  • the storage unit (not shown) stores the gain correction amount candidates ⁇ 1 (m),..., ⁇ N (m) of the first to Nth ranges and the gain correction amounts.
  • M sets (M is a predetermined integer equal to or greater than 2) are stored with a set of codes idx (m) for specifying candidates.
  • a set of ⁇ 1 (1), ..., ⁇ N (1) and idx (1), a set of ⁇ 1 (2), ..., ⁇ N (2) and idx (2), ..., ⁇ 1 (M),..., ⁇ N (M) and idx (M) are stored in the storage unit as a gain correction amount code book.
  • the gain correction amount encoding unit For each of the first range to the Nth range, all samples X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L (0) ,..., L (N) ⁇ 1 ⁇ in the frame of the quantized normalized signal sequence ] All the samples X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L (n ⁇ 1) ,..., L (n) ⁇ 1 ⁇ within the partitioned range of the quantized normalized signal sequence ], When the value obtained by dividing the sum of squares by s (n) is defined as s (n), the gain correction amount encoding unit firstly, for each m of 1 to M, for each of the first range to the Nth range.
  • a code idx (m) corresponding to m that minimizes the added value is output as a gain correction amount code idx. That is, the gain correction amount code idx can be obtained from the equation (20).
  • equation (20) corresponds to vector quantization based on the criterion that minimizes the error, but vector quantization based on the criterion that maximizes the correlation, and the criterion based on the criterion that minimizes the error or maximizes the correlation.
  • a technique such as scalar quantization may be applied.
  • the quantized global gain g ⁇ and the number of samples in which the energy of the sample in the frame of the quantized normalized signal sequence is larger than a predetermined value are represented by the quantized normalized signal.
  • a correction gain is obtained by adding a value obtained by multiplying a gain correction amount by a value obtained by dividing the energy of a sample within a series-divided range by the number of samples greater than a predetermined value.
  • the storage unit (not shown) stores the gain correction amount candidates ⁇ 1 (m),..., ⁇ N (m) of the first to Nth ranges and the gain correction amounts.
  • M sets (M is a predetermined integer equal to or greater than 2) are stored with a set of codes idx (m) for specifying candidates.
  • a set of ⁇ 1 (1), ..., ⁇ N (1) and idx (1), a set of ⁇ 1 (2), ..., ⁇ N (2) and idx (2), ..., ⁇ 1 (M),..., ⁇ N (M) and idx (M) are stored in the storage unit as a gain correction amount code book.
  • the predetermined value may be 0 or a value greater than or equal to 0, or may be a value obtained by multiplying the quantized global gain g ⁇ by a predetermined value ⁇ .
  • the gain correction amount encoding unit 140 first, for each m of 1 to M, the quantized global gain g ⁇ for each of the first range to the Nth range and the gain correction amount for the nth range. And a value obtained by adding the product of the candidates ⁇ n (m) and s (n), and the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L ( n ⁇ 1) ,..., L (n) ⁇ 1 ⁇ ] multiplied by the value of each sample and the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L (n ⁇ 1) ,..., L (n) ⁇ 1 ⁇ ], the sum of squares of the difference between the values of the corresponding samples is obtained for all the first to Nth ranges. The added value is obtained by equation (22).
  • a code idx (m) corresponding to m that minimizes the added value is output as a gain correction amount code idx. That is, the gain correction amount code idx is obtained by the equation (23).
  • equation (23) corresponds to vector quantization based on the criterion that minimizes the error, but vector quantization based on the criterion that maximizes the correlation, and the criterion based on the criterion that minimizes the error or maximizes the correlation.
  • a technique such as scalar quantization may be applied.
  • the pre-quantization width multiplication gain candidates ⁇ 1 (m),..., ⁇ N (m) of the first range to the Nth range and their pre-quantization width multiplication gains are stored.
  • M sets (M is a predetermined integer equal to or greater than 2) are stored as M sets of codes idx (m) that specify correction amount candidates.
  • a set of ⁇ 1 (1), ..., ⁇ N (1) and idx (1), a set of ⁇ 1 (2), ..., ⁇ N (2) and idx (2), ..., ⁇ 1 (M),..., ⁇ N (M) and idx (M) are stored in the storage unit as a gain correction amount code book.
  • the gain correction amount encoding unit 140 uses the quantization step width step corresponding to the quantized global gain g ⁇ to first, for each m from 1 to M, for each of the first range to the Nth range.
  • a code idx (m) corresponding to m that minimizes the added value is output as a gain correction amount code idx. That is, the gain correction amount code idx is obtained by the equation (25).
  • equation (25) corresponds to vector quantization based on the criterion that minimizes the error, but vector quantization based on the criterion that maximizes the correlation, and the criterion based on the criterion that minimizes the error or maximizes the correlation.
  • a technique such as scalar quantization may be applied.
  • the quantization step width step corresponding to the quantized global gain g ⁇ is a difference value between adjacent candidates of the quantized global gain in the global gain encoder 105.
  • the quantization step width step and the product of the quantization width pre-multiplication gain correction amount candidate ⁇ n (m) whose absolute value is less than 1 are added to the quantized global gain g ⁇ .
  • the pre-quantization width multiplication gain candidate ⁇ n (m) included in the gain correction amount codebook stored in a storage unit may be generated by learning. In this case, but it may also include those that are not less than 1 candidate before quantization width multiplied gain correction amount ⁇ n (m). However, even contain even those that are not less than 1 to the quantization width multiplied before gain correction amount candidate delta n (m), the candidate quantization step width step and the quantization width multiplied before gain correction amount delta n ( The distance between the quantized global gain g ⁇ and the adjacent quantized global gain candidates is corrected by correcting the quantized global gain so that the product of m) is added to the quantized global gain g ⁇ . That is, correction depending on the quantization step width can be performed on the quantization global gain.
  • the modified example of the fourth example obtains a gain correction amount depending on the quantization step width corresponding to the quantized global gain g ⁇ , and the quantized global gain g ⁇ and all the quantized normalized signal sequences in the frame. Corrected by adding the gain correction amount multiplied by the value obtained by dividing the sum of squares of the sample values by the sum of squares of the values of all the samples in the divided range of the quantized normalized signal sequence. Either the gain or the quantized global gain g ⁇ and the number of samples in which the energy of the sample in the frame of the quantized normalized signal sequence is greater than a predetermined value is divided into the quantized normalized signal sequence. In this example, the gain obtained by adding the gain correction amount to the value obtained by dividing the energy of the sample within the range by the number of samples larger than a predetermined value is used as the correction gain.
  • the absolute values of all the values of the gain correction amount candidates ⁇ n (m) before quantization width multiplication included in the gain correction amount codebook stored in a storage unit (not shown) are set to 1 / N Keep it below. That is, the gain correction amount codebook stores candidates for gain correction amount before quantization width multiplication as ⁇ n (m).
  • the addition value is obtained by the expression (26) using s (n) of the second example or the third example, and the expression is replaced by the expression (25) of the fourth example.
  • the gain correction amount code idx is obtained from (27).
  • equation (27) corresponds to vector quantization based on the criterion that minimizes the error, but vector quantization based on the criterion that maximizes the correlation, and the criterion based on the criterion that minimizes the error or maximizes the correlation.
  • a technique such as scalar quantization may be applied.
  • the average value of s (n) in the second example or the third example is N. Therefore, for example, the product of the quantization step width step and the candidate ⁇ n (m) of the gain correction amount before the quantization width whose absolute value is less than 1 / N and s (n) whose average value is N is quantized.
  • the gain obtained by correcting the quantized global gain g ⁇ with the gain correction amount is the quantized global gain g ⁇ . It is possible to be between quantized global gain candidates adjacent to.
  • the pre-quantization width multiplication gain candidate ⁇ n (m) included in the gain correction amount codebook stored in a storage unit may be generated by learning.
  • the gain correction amount candidate before quantization width multiplication ⁇ n (m) is not less than 1 / N.
  • the quantization step width step and the gain correction amount candidate ⁇ before quantization width multiplication ⁇ By correcting the quantized global gain so that the product of n (m) and s (n) is added to the quantized global gain g ⁇ , the quantized global gain g ⁇ and the adjacent quantized gain Correction depending on the distance to the global gain candidate, that is, the quantization step width can be performed on the quantized global gain.
  • combination part 160 is recorded on a recording medium, and the said information read from the said recording medium Is also allowed to be input to the decoding device 2.
  • the decoding device 2 (see FIG. 13) of the first embodiment includes a normalized signal decoding unit 107, a global gain decoding unit 106, a gain correction amount decoding unit 230, a decoded signal sequence generation unit 250, and a sorting unit 260.
  • the decoding device 2 may include a separation unit 210 and a time domain conversion unit 270 as necessary.
  • the bit stream transmitted from the encoding device 1 is input to the decoding device 2.
  • the separation unit 210 extracts a normalized signal code, a global gain code, and a gain correction amount code from the bit stream.
  • ⁇ Normalized signal decoding unit 107 A normalized signal code is input to the normalized signal decoding unit 107.
  • the normalized signal decoding unit 107 applies a decoding method corresponding to the encoding method performed by the normalized signal encoding unit 120 of the encoding device 1 to decode the normalized signal code and decode the normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained (step S1d).
  • represents an index of discrete frequency
  • the normalized signal decoding unit 107 performs the same operation as the normalized signal decoding unit 107 of FIG. 1 described in the “Background Art” column.
  • the sorting unit 260 classifies the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] as “a criterion for sorting the energy of each range to be as equal as possible”. It is divided into a plurality of ranges (where N is a predetermined integer of 2 or more) (step S2d). Consistent with the above description, the set of discrete frequency indexes of the decoded normalized signal sequence X ⁇ Q ( ⁇ ) is ⁇ L min , ..., L max ⁇ , and the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min, ...
  • the number of partitions N is set in advance in, for example, the partition unit 150 of the encoding device 1 and the partition unit 260 of the decoding device 2 so as to have a value common to the number of partitions N in the partition unit 150 of the encoding device 1. .
  • the partitioning process performed by the partitioning unit 260 on the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] The segmentation unit 150 and the decoding device 2 of the encoding device 1 are performed so that the same processing as the segmentation processing performed on the completed signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is performed. Is set in advance with the sorting unit 260.
  • ⁇ Details of Sorting Process Performed by Sorting Unit 260> The partitioning process performed by the segmenting unit 260 on the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is performed by the segmenting unit 150 of the encoding device 1 by quantization normalization. This is the same as the segmentation process performed on the completed signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ]. That is, the classification process based on the “criteria for classifying the energy of each range to be as equal as possible” includes, for example, the nth range (n is an integer from 1 to N ⁇ 1) of the decoded normalized signal sequence.
  • the classification process exemplified above is realized by a method of sequentially determining the classification based on the “criteria for classifying so that the energy of each range is as equal as possible” sequentially from the first range. According to the classification process exemplified above, it is possible to realize the classification based on the “standard for classifying the energy in each range so as to be as equal as possible” with a small amount of calculation processing.
  • Specific examples of the sorting process performed by the sorting unit 260 are specific examples of “first example of sorting process” to “sixth example of sorting process” that are specific examples of the sorting process performed by the sorting unit 150 of the encoding device 1.
  • the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is decoded and decoded normalized signal series X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min , ..., L max ⁇ ].
  • ⁇ Gain correction amount decoding unit 230 A gain correction amount code is input to the gain correction amount decoding unit 230.
  • the gain correction amount decoding unit 230 decodes the gain correction amount code to obtain a gain correction amount corresponding to each divided range (step S3d).
  • gain correction amount candidates ⁇ 1 (m),..., ⁇ N (m) in the first to Nth ranges and codes idx () for specifying these gain correction amount candidates M sets (m) are stored (M is a predetermined integer of 2 or more).
  • M is a predetermined integer of 2 or more.
  • a set of ⁇ 1 (1), ..., ⁇ N (1) and idx (1), a set of ⁇ 1 (2), ..., ⁇ N (2) and idx (2), ..., ⁇ 1 (M),..., ⁇ N (M) and idx (M) are stored in the storage unit as a gain correction amount code book.
  • the gain correction amount code book stored in the storage unit is the same as the gain correction amount code book stored in the storage unit of the encoding device 1.
  • the gain correction amount decoding unit 230 refers to the gain correction amount code book, and from the first range associated with idx (I) that is the same code as the gain correction amount code idx in the gain correction amount code book. Gain correction amounts ⁇ 1 (I),..., ⁇ N (I) corresponding to the respective Nth ranges are obtained.
  • the decoding process performed by the gain correction amount decoding unit 230 is basically a process corresponding to the encoding process performed by the gain correction amount encoding unit 140. Further, it may be a vector quantization decoding process or a scalar quantization decoding process.
  • a global gain code is input to the global gain decoding unit 106.
  • the global gain decoding unit 160 decodes the global gain code and outputs a decoded global gain g ⁇ (step S4d).
  • the decoding process performed by the global gain decoding unit 106 is a process corresponding to the encoding process performed by the global gain encoding unit 105, and the global gain decoding unit in the [Background Technology] column. This is a well-known technique as described in 106.
  • ⁇ Decoded signal sequence generation unit 250> The decoded signal sequence generation unit 250, a decoding normalized signal sequence X ⁇ Q ( ⁇ ), and the gain correction amount delta n (I), decoding global gain g ⁇ is input.
  • the decoded signal sequence generation unit 250 corrects the decoding gain obtained by correcting the decoding global gain g ⁇ by the gain correction amount ⁇ n (I) and decoding for each range obtained by the processing of ⁇ Step S2d> in the sorting unit 260.
  • a signal sequence obtained by multiplying the value of each sample of the normalized signal sequence X ⁇ Q ( ⁇ ) is output as an output signal sequence X ⁇ ( ⁇ ) (step S5d). Since this output signal sequence X ⁇ ( ⁇ ) corresponds to the input signal sequence X ( ⁇ ) of the encoding device 1, it can also be said to be a decoded signal sequence.
  • the first example of the decoded signal sequence generation processing is an example in which a correction gain is obtained by adding the decoded global gain g ⁇ and the gain correction amount.
  • the decoded signal sequence generation unit 250 includes a decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and a gain correction amount ⁇ n (I) [n ⁇ ⁇ 1, .., N ⁇ ], the decoding global gain g ⁇ , and the classification information.
  • the sample number on the lowest side of the nth range specified by the classification information is L (n-1)
  • L min is L (0)
  • L max is L (N) -1.
  • the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (n ⁇ 1) , .., L (n) -1 ⁇ ] represents each sample of the correction gain obtained by correcting the decoded global gain g ⁇ with the gain correction amount ⁇ n (I) and the decoded normalized signal sequence X ⁇ Q ( ⁇ ). It is obtained by multiplying by the value of. That is, the value of each sample of the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (n ⁇ 1) ,..., L (n) ⁇ 1 ⁇ ] in the n-th range is obtained by Expression (28). .
  • X ⁇ ( ⁇ ) (g ⁇ + ⁇ n (I)) X ⁇ Q ( ⁇ ) (28)
  • the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (0) ,..., L (N) ⁇ 1 ⁇ ] that is, X ⁇ ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained.
  • the decoded global gain g ⁇ and the sum of squares of the values of all the samples in the frame of the decoded normalized signal sequence are included in the divided range of the decoded normalized signal sequence.
  • a value obtained by multiplying a value obtained by dividing the value of all the samples by the sum of squares by a gain correction amount is added as a correction gain.
  • the decoded signal sequence generation unit 250 includes a decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and a gain correction amount ⁇ n (I) [n ⁇ ⁇ 1, .., N ⁇ ], the decoding global gain g ⁇ , and the classification information.
  • the sample number on the lowest side of the nth range specified by the classification information is L (n-1)
  • L min is L (0)
  • L max is L (N) -1
  • the classification part Each of the first range to the Nth range obtained in 260 will be described as the nth range.
  • the decoding global gain g ⁇ and the multiplication value of the nth range gain correction amount ⁇ n (I) and s (n) are added.
  • the signal sequence obtained in this way is the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (n ⁇ 1) ,..., L (n) ⁇ 1 ⁇ ] in the n-th range .
  • the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (0) ,..., L (N) ⁇ 1 ⁇ ] that is, X ⁇ ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained.
  • the decoded global gain g ⁇ and the number of samples in which the energy of the samples in the frame of the decoded normalized signal sequence is larger than a predetermined value are classified into the decoded normalized signal sequence.
  • the gain obtained by adding the value obtained by multiplying the gain correction amount by the value obtained by dividing the energy of the sample within the range by the number of samples larger than the predetermined value is used as the correction gain.
  • the decoded signal sequence generation unit 250 includes a decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and a gain correction amount ⁇ n (I) [n ⁇ ⁇ 1, .., N ⁇ ], the decoding global gain g ⁇ , and the classification information.
  • the sample number on the lowest side of the nth range specified by the classification information is L (n-1)
  • L min is L (0)
  • L max is L (N) -1
  • the classification part Each of the first range to the Nth range obtained in 260 will be described as the nth range.
  • the number of samples c (n) whose energy is greater than a predetermined value is obtained. Further, the sum of c (1) to c (N) is obtained. This sum is a sample of all samples X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L (0) ,..., L (N) -1 ⁇ ] of the decoded normalized signal sequence whose energy is greater than a predetermined value.
  • the number of The predetermined value may be 0 or a value greater than or equal to 0, or may be a value obtained by multiplying the decoded global gain g ⁇ by a predetermined value ⁇ .
  • the decoding global gain g ⁇ and the multiplication value of the nth range gain correction amount ⁇ n (I) and s (n) are added.
  • the signal sequence obtained in this way is the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (n ⁇ 1) ,..., L (n) ⁇ 1 ⁇ ] in the n-th range .
  • the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (0) ,..., L (N) ⁇ 1 ⁇ ] that is, X ⁇ ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained.
  • the sample number on the lowest side of the nth range specified by the classification information is L (n-1)
  • L min is L (0)
  • L max is L (N) -1.
  • the pre-quantization width multiplication gain candidates ⁇ 1 (m),..., ⁇ N (m) of the first range to the Nth range and their pre-quantization width multiplication gains are stored.
  • M sets (M is a predetermined integer equal to or greater than 2) are stored as M sets of codes idx (m) that specify correction amount candidates.
  • a set of ⁇ 1 (1), ..., ⁇ N (1) and idx (1), a set of ⁇ 1 (2), ..., ⁇ N (2) and idx (2), ..., ⁇ 1 (M),..., ⁇ N (M) and idx (M) are stored in the storage unit as a gain correction amount code book.
  • the decoded signal sequence generation unit 250 When the decoded signal sequence generation unit 250 performs the decoded signal sequence generation processing of the fourth example, for example, candidates for gain correction amount before quantization width multiplication included in a gain correction amount codebook stored in a storage unit (not shown) The absolute value of all values of ⁇ n (m) is set to be less than 1.
  • the gain correction amount code book stored in the storage unit is the same as the gain correction amount code book stored in the storage unit of the encoding device 1.
  • the gain correction amount decoding unit 230 refers to the gain correction amount code book and performs gain correction in the gain correction amount code book.
  • the decoded signal sequence generation unit 250 uses the quantization step width step of the decoded global gain g ⁇ in the global gain decoding unit 106 to determine the decoded global gain g ⁇ and the first number for each of the first range to the Nth range.
  • the signal sequence obtained by multiplying the value of each sample of Q ( ⁇ ) [ ⁇ ⁇ L (n ⁇ 1) ,..., L (n) ⁇ 1 ⁇ ]] is the output signal sequence X ⁇ in the nth range.
  • the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (0) ,..., L (N) ⁇ 1 ⁇ ] that is, X ⁇ ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained.
  • the quantization step width step corresponding to the decoded global gain g ⁇ is a difference value between the decoded global gain and the adjacent candidates in the global gain decoding unit 106.
  • the decoding global gain is corrected by correcting the decoding global gain so that the product of this quantization step width step and ⁇ n (I) whose absolute value is less than 1 is added to the decoding global gain g ⁇ .
  • the gain obtained by correcting g ⁇ with the gain correction amount can be between the decoded global gain g ⁇ and a candidate for the decoded global gain adjacent thereto.
  • the pre-quantization width multiplication gain correction amount candidate ⁇ n (m) stored in a storage unit may be generated by learning. In this case, but it may also include those that are not less than 1 candidate before quantization width multiplied gain correction amount ⁇ n (m).
  • the candidate quantization step width step and the quantization width multiplied before gain correction amount delta n By correcting the decoding global gain so that the product of m) is added to the decoding global gain g ⁇ , the distance between the decoding global gain g ⁇ and the decoding global gain candidate adjacent thereto, that is, the quantum It is possible to perform correction depending on the conversion step width on the decoded global gain.
  • the modified example of the fourth example obtains a gain correction amount depending on the quantization step width corresponding to the decoded global gain g ⁇ , and calculates the decoded global gain g ⁇ and all the samples in the frame of the decoded normalized signal sequence. Whether the value obtained by dividing the sum of squares of the values by the sum of squares of the values of all the samples within the divided range of the decoded normalized signal sequence and the value obtained by multiplying the gain correction amount is used as the correction gain.
  • the number of samples whose energy of samples in a frame of the decoded normalized signal sequence is larger than a predetermined value is the number of samples whose energy of samples in the divided range of the decoded normalized signal sequence is larger than a predetermined value.
  • a value obtained by multiplying the value obtained by dividing the gain correction amount by the gain correction amount is used as the correction gain.
  • the pre-quantization width multiplication gain candidates ⁇ 1 (m),..., ⁇ N (m) of the first range to the Nth range and their pre-quantization width multiplication gains are stored.
  • M sets (M is a predetermined integer equal to or greater than 2) are stored as M sets of codes idx (m) that specify correction amount candidates.
  • a set of ⁇ 1 (1), ..., ⁇ N (1) and idx (1), a set of ⁇ 1 (2), ..., ⁇ N (2) and idx (2), ..., ⁇ 1 (M),..., ⁇ N (M) and idx (M) are stored in the storage unit as a gain correction amount code book.
  • the absolute values of all the values of the gain correction amount candidates ⁇ n (m) before quantization width multiplication included in the gain correction amount codebook stored in a storage unit are set to 1 / N Keep it below.
  • the gain correction amount code book stored in the storage unit is the same as the gain correction amount code book stored in the storage unit of the encoding device 1.
  • the gain correction amount decoding unit 230 refers to the gain correction amount code book and stores the gain correction amount code book in the gain correction amount code book.
  • the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ in the nth range is obtained by the expression (34) using s (n) of the second example or the third example.
  • L (n ⁇ 1) ,..., L (n) ⁇ 1 ⁇ ] are obtained.
  • X ⁇ ( ⁇ ) (g ⁇ + step s (n) ⁇ n (I)) X ⁇ Q ( ⁇ ) (34)
  • the output signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ L (0) ,..., L (N) ⁇ 1 ⁇ ] that is, X ⁇ ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained.
  • the average value of s (n) in the second example or the third example is N. Therefore, for example, the product of the quantization step width step, the candidate ⁇ n (m) of the gain correction amount before the quantization width whose absolute value is less than 1 / N, and s (n) whose average value is N is decoded.
  • the gain obtained by correcting the decoding global gain g ⁇ with the gain correction amount is the decoding global gain g ⁇ and the decoding adjacent to the decoding global gain g ⁇ . Can be between global gain candidates.
  • the pre-quantization width multiplication gain candidate ⁇ n (m) included in the gain correction amount codebook stored in a storage unit may be generated by learning.
  • the gain correction amount candidate before quantization width multiplication ⁇ n (m) is not less than 1 / N.
  • the quantization step width step and the gain correction amount candidate ⁇ before quantization width multiplication ⁇ By correcting the decoding global gain so that the product of n (m) and s (n) is added to the decoding global gain g ⁇ , the decoding global gain g ⁇ and a decoding global gain candidate adjacent thereto are corrected. It is possible to perform correction on the decoded global gain depending on the distance between the decoded global gain and the quantization step width.
  • the output signal sequence X ⁇ ( ⁇ ) is input to the time domain conversion unit 270 provided as necessary.
  • the time domain transform unit 270 applies a frequency-time transform to the output signal sequence X ⁇ ( ⁇ ) and outputs a time domain signal sequence z F (t) in units of frames.
  • the frequency-time conversion method is an inverse conversion corresponding to the time-frequency conversion method used in the frequency domain conversion unit 101.
  • the frequency-time conversion method here is IMDCT (Inverse Modified Discrete Cosine Transform) or IDCT (Inverse Discrete Cosine Transform).
  • Second Embodiment the surplus bits of the normalized signal code are used as the gain correction amount code.
  • the number of consumed bits may be smaller than the specified number of bits. is there.
  • the normalized signal encoding unit 120 outputs the surplus bit number U obtained by subtracting the number of consumed bits from the specified number of bits to the gain correction amount encoding unit 140.
  • the gain correction amount encoding unit 140 outputs a U-bit gain correction amount code based on the input surplus bit number U.
  • the gain correction amount candidate number M used in the gain correction amount encoding unit 140 may be set to 2 U, and the code idx (m) for specifying each gain correction amount candidate may be set to U bits.
  • the normalized signal decoding unit 107 uses the consumption bits that are the number of bits of the actual normalized signal code from the specified number of bits defined as the maximum value of the number of bits of the normalized signal code.
  • the surplus bit number U obtained by subtracting the number is output to the gain correction amount decoding unit 230.
  • the gain correction amount decoding unit 230 can decode the input U-bit gain correction amount code. Specifically, the gain correction amount candidate number M included in the gain correction amount codebook used in the gain correction amount decoding unit 230 is set to 2 U, and the code idx (m) for specifying each gain correction amount candidate is set to U bits. It is sufficient to obtain idx (I) that is the same code as the U-bit gain correction amount code idx.
  • bits that are prepared for the normalized signal code but are not actually used for the normalized signal code are used for the gain correction amount code.
  • the third embodiment is an example in which information corresponding to the number N of divided ranges is transmitted from the encoding device 1 to the decoding device 2.
  • the sorting unit 150 of the encoding device 1 determines the number N of ranges after sorting based on some standard or information transmitted from outside the sorting unit 150, and performs sorting processing so that the number of ranges after sorting becomes N. .
  • the division unit 150 of the encoding device 1 also outputs an auxiliary code that can specify N, which is the number of ranges after the division.
  • the sorting unit 260 of the decoding device 2 receives the auxiliary code, and performs the sorting process so that the number of ranges after the division becomes the number N specified by the auxiliary code.
  • the encoding device, the encoding method, the decoding device, and the decoding method according to the present invention are not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention. Is possible.
  • the processing described in the above embodiment may be executed not only in time series according to the order of description but also in parallel or individually as required by the processing capability of the apparatus that executes the processing. .
  • the processing functions in the encoding device / decoding device are realized by a computer
  • the processing contents of the functions that the encoding device / decoding device should have are described by a program.
  • the processing functions of the encoding device / decoding device are realized on the computer.
  • the program describing the processing contents can be recorded on a computer-readable recording medium.
  • a computer-readable recording medium for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
  • a magnetic recording device a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only) Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording media, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.
  • this program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
  • a computer that executes such a program first stores a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device.
  • the computer reads a program stored in its own recording medium and executes a process according to the read program.
  • the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer.
  • the processing according to the received program may be executed sequentially.
  • the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes a processing function only by an execution instruction and result acquisition. It is good.
  • the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
  • the encoding device and the decoding device are configured by executing a predetermined program on the computer.
  • at least a part of the processing contents may be realized by hardware. Good.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 符号化方法は、入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、正規化信号符号に対応する量子化正規化済み信号系列とを得る正規化信号符号化処理と、入力信号系列に対応する量子化グローバルゲインと、量子化グローバルゲインに対応するグローバルゲイン符号とを得るグローバルゲイン符号化処理と、量子化正規化済み信号系列を複数個の範囲に区分する区分処理と、区分された範囲ごとに量子化グローバルゲインをゲイン補正量で補正して得られる補正ゲインと量子化正規化済み信号系列の各サンプルの値とを乗算して得られる信号系列と入力信号系列との相関が最大又は誤差が最小となる、区分された範囲毎のゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化処理とを有する。

Description

符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
 本発明は、音声や音楽などの音響信号を少ない情報量で符号化するための技術に関し、より詳しくは、量子化精度を向上させる符号化技術に関する。
 現在、音声や音楽などの音響信号を離散化したディジタルの入力信号を高能率に符号化する技術として、例えば、入力信号に含まれる5から200ms程度の一定間隔の各区間(フレーム)の入力信号系列を処理対象として、1フレームの入力信号系列に時間-周波数変換を適用して得られた周波数領域信号を符号化することが知られている。このような従来技術のうち、非特許文献1に開示されている符号化装置と復号装置の概要を図1に示す。
 なお、非特許文献1によるとグローバルゲイン(正規化された入力信号系列の量子化精度に影響を及ぼすゲイン)の量子化値は時間領域で計算されている。しかし、時間領域における信号のエネルギーと周波数領域における信号のエネルギーは等しいため、グローバルゲインの量子化値を周波数領域で求めてもこの結果は時間領域におけるそれと異ならない。従って、ここでは、グローバルゲインの量子化値およびその復号値を周波数領域で計算する場合を例示する。
 以下、符号化装置での処理を説明する。
<周波数領域変換部101>
 周波数領域変換部101には、時間領域の入力信号x(t)に含まれる連続する複数サンプルからなるフレーム単位の入力時間領域信号系列xF(t)が入力される。周波数領域変換部101は、1フレームの入力時間領域信号系列xF(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分を入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]として出力する。ここで、tは離散時間のインデックス、ωは離散周波数のインデックスを表す。時間-周波数変換方法として、例えばMDCT(Modified Discrete Cosine Transform)またはDCT(Discrete Cosine Transform)を用いることができる。
<正規化部102>
 正規化部102には、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と、後述するゲイン制御部104で求められた入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分の量子化精度を決定するゲイン(以下、グローバルゲインという)gが入力される。正規化部102は、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分をグローバルゲインgでそれぞれ除することによって、もしくは入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分にグローバルゲインgの逆数をそれぞれ乗ずることによって、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の正規化を行い、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]を出力する。
<量子化部103>
 量子化部103には、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]が入力される。量子化部103は、事前に定められた方法で正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]の量子化を行い、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]の各成分の量子化値による系列である量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]、および量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に対応する符号である正規化信号符号を生成し、正規化信号符号のビット数(以下、消費ビット数という)を出力する。また、ゲイン制御部104から、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する指令情報を受けた場合には、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する。
<ゲイン制御部104>
 ゲイン制御部104には、消費ビット数が入力される。ゲイン制御部104は、消費ビット数が正規化信号符号に対して事前に割り当てられたビット数(以下、規定ビット数という)以下の最大値に近づくようにグローバルゲインgを調整し、調整後のグローバルゲインgを新たなグローバルゲインgとして出力する。グローバルゲインgの調整の一例として、消費ビット数が規定ビット数より大きい場合にはグローバルゲインgを大きくし、そうでなければグローバルゲインgを小さくする処理を例示できる。消費ビット数が規定ビット数以下の最大値となった場合には、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する指令情報を量子化部103に対して出力する。
<グローバルゲイン符号化部105>
 グローバルゲイン符号化部105には、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]が入力される。グローバルゲイン符号化部105は、予め設定されたグローバルゲインの量子化値の複数の候補のうち、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の各成分とグローバルゲインの量子化値の候補との乗算値による系列と、の間の相関が最大または誤差が最小となるグローバルゲインの量子化値の候補g^に対応する符号をグローバルゲイン符号として出力する。
 符号化装置の出力符号である正規化信号符号とグローバルゲイン符号は、復号装置に向けて送信され、復号装置に入力される。
 以下、復号装置での処理を説明する。
<グローバルゲイン復号部106>
 グローバルゲイン復号部106には、グローバルゲイン符号が入力される。グローバルゲイン復号部106は、グローバルゲイン符号化部105が行う符号化処理に対応する復号処理を適用して当該グローバルゲイン符号を復号し、復号グローバルゲインg^を出力する。
<正規化信号復号部107>
 正規化信号復号部107には、正規化信号符号が入力される。正規化信号復号部107は、符号化装置の量子化部103で行われる符号化方法と対応する復号方法を適用して当該正規化信号符号を復号し、復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]を出力する。
<復号周波数成分計算部108>
 復号周波数成分計算部108には、復号グローバルゲインg^と復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]が入力される。復号周波数成分計算部108は、復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の各成分と復号グローバルゲインg^とをそれぞれ乗算して得られる系列を復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]として出力する。
<時間領域変換部109>
 時間領域変換部109には、復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]が入力される。時間領域変換部109は、復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]に対して周波数-時間変換を適用して、フレーム単位の出力時間領域信号系列zF(t)を出力する。周波数-時間変換方法は、周波数領域変換部101で用いられた時間-周波数変換方法に対応する逆変換である。上述の例であれば、ここでの周波数-時間変換方法は、IMDCT(Inverse Modified Discrete Cosine Transform)またはIDCT(Inverse Discrete Cosine Transform)である。
Guillaume Fuchs, Markus Multrus, Max Neuendorf and Ralf Geiger, "MDCT-BASED CODER FOR HIGHLY ADAPTIVE SPEECH AND AUDIO CODING," 17th European Signal Processing Conference (EUSIPCO 2009), Glasgow, Scotland, August 24-28, 2009.
 上述のような符号化方法では、グローバルゲインを調整して正規化済み信号系列の量子化の粗さを適宜制御し、このことによって正規化信号符号の符号量である消費ビット数が規定ビット数以下の最大値となるように制御を行っている。このため、規定ビット数より消費ビット数が小さい場合は、正規化済み信号系列のために事前に割り当てられたビット数を十分に生かした符号化処理を行えていないという問題がある。
 このような状況に鑑みて、本発明は、正規化済み信号系列の量子化精度を少ない符号量の増加で改善する符号化技術とその復号技術を提供することを目的とする。
 本発明の一態様による符号化方法は、複数の入力信号サンプルにより構成されるフレーム単位の入力信号系列を符号化する符号化技術であって、入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、正規化信号符号に対応する量子化正規化済み信号系列と、を得る正規化信号符号化処理と、入力信号系列に対応するゲインである量子化グローバルゲインと、量子化グローバルゲインに対応するグローバルゲイン符号と、を得るグローバルゲイン符号化処理と、量子化正規化済み信号系列をN個の範囲(Nは2以上の整数)に区分する区分処理と、区分された範囲ごとに量子化グローバルゲインをゲイン補正量で補正して得られる補正ゲインと量子化正規化済み信号系列の各サンプルの値とを乗算して得られる信号系列と入力信号系列との相関が最大又は誤差が最小となる、区分された範囲毎のゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化処理とを有し、
 区分処理は、
 量子化正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、
(a)量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように、
または、
(b)量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和と、量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のnと、が最も近付くように、
または、
(c)量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように、
または、
(d)量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以上となる最小のサンプル数になるように、
または、
(e)量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように、
または、
(f)量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以下となる最大のサンプル数になるように、
求め、
 量子化正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、量子化正規化済み信号系列の第Nの範囲とする
ことで、量子化正規化済み信号系列をN個の範囲に区分する
ことにより行なわれる。
 補正ゲインは、例えば、(1)量子化グローバルゲインとゲイン補正量とを加算した値、(2)量子化グローバルゲインと、量子化正規化済み信号系列のフレーム内の全てのサンプルの値の二乗和を量子化正規化済み信号系列の区分された範囲内の全てのサンプルの値の二乗和で除算した値をゲイン補正量に乗算した値と、を加算した値、(3)量子化グローバルゲインと、量子化正規化済み信号系列のフレーム内のサンプルのエネルギーが所定値より大きいサンプルの個数を量子化正規化済み信号系列の区分された範囲内のサンプルのエネルギーが当該所定値より大きいサンプルの個数で除算した値をゲイン補正量に乗算した値と、を加算した値、のいずれかである。
 ゲイン補正量は、量子化幅乗算前ゲイン補正量の候補が予め格納されたゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量と、量子化済みグローバルゲインに対応する量子化ステップ幅と、を乗算して得られる値としてもよい。
 本発明の一態様による復号方法は、フレーム単位の符号を復号して出力信号系列を得る復号技術であって、符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号処理と、復号正規化済み信号系列をN個の範囲(Nは2以上の整数)に区分する区分処理と、符号に含まれるゲイン補正量符号を復号して各範囲に対応するゲイン補正量を得るゲイン補正量復号処理と、符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号処理と、区分された範囲ごとに、復号グローバルゲインをゲイン補正量で補正して得られる補正ゲインと復号正規化済み信号系列の各サンプルの値とを乗算して得られる信号系列を出力信号系列とする復号信号系列生成処理とを有し、
 区分処理は、
 復号正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、
(a)復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように、
または、
(b)復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和と、復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のnと、が最も近付くように、
または、
(c)復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように、
または、
(d)復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以上となる最小のサンプル数になるように、
または、
(e)復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように、
または、
(f)復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以下となる最大のサンプル数になるように、
求め、
 復号正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、復号正規化済み信号系列の第Nの範囲とする
ことで、復号正規化済み信号系列をN個の範囲に区分する
ことにより行なわれる。
 補正ゲインは、例えば、(1)復号グローバルゲインとゲイン補正量とを加算した値、(2)復号グローバルゲインと、復号正規化済み信号系列のフレーム内の全てのサンプルの値の二乗和を復号正規化済み信号系列の区分された範囲内の全てのサンプルの値の二乗和で除算した値をゲイン補正量に乗算した値と、を加算した値、(3)復号グローバルゲインと、復号正規化済み信号系列のフレーム内のサンプルのエネルギーが所定値より大きいサンプルの個数を復号正規化済み信号系列の区分された範囲内のサンプルのエネルギーが当該所定値より大きいサンプルの個数で除算した値をゲイン補正量に乗算した値と、を加算した値、のいずれかである。
 ゲイン補正量は、量子化幅乗算前ゲイン補正量の候補が予め格納されたゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量と、復号グローバルゲインに対応する量子化ステップ幅と、を乗算して得られる値としてもよい。
 符号を要することなく符号化側と復号側で同一の方法でフレームを複数の範囲に区分し、複数の範囲のそれぞれにおいて、フレームの帯域全体に適用される量子化グローバルゲインを補正することによって、少ない符号量の増加でゲインの量子化精度が向上し、ミュージカルノイズや量子化ノイズなどに起因する音質劣化を軽減できる。
従来技術に関わる符号化装置と復号装置の機能構成例を示すブロック図。 第1実施形態に係る符号化装置の機能構成例を示すブロック図。 第1実施形態に係る符号化処理の処理フローを示す図。 区分処理の第1例の具体例1の処理フローを示す図。 区分処理の第1例の具体例2の処理フローを示す図。 区分処理の第1例の一般化の処理フローを示す図。 区分処理の第3例の具体例1の処理フローを示す図。 区分処理の第3例の具体例2の処理フローを示す図。 区分処理の第3例の一般化の処理フローを示す図。 区分処理の第5例の具体例1の処理フローを示す図。 区分処理の第5例の具体例2の処理フローを示す図。 区分処理の第5例の一般化の処理フローを示す図。 第1実施形態に係る復号装置の機能構成例を示すブロック図。 第1実施形態に係る復号処理の処理フローを示す図。
 本発明の実施形態を、図面を参照して説明する。同一構成要素ないし同一処理には同一符号を割り当てて重複説明を省略する場合がある。なお、各実施形態で扱う音響信号は音声や楽音などの音響、映像などの信号である。ここでは音響信号が時間領域信号であることを想定しているが、必要に応じて周知技術によって時間領域信号を周波数領域信号に変換することも、或いは周波数領域信号を時間領域信号に変換することもできる。従って、符号化処理の対象となる信号は、時間領域信号でも周波数領域信号でもよい(以下の説明では、説明を具体的にするため、周波数領域信号を扱う)。符号化処理の対象として入力される信号は複数のサンプルで構成される系列(サンプル系列)であり、符号化処理は通常、フレーム単位で実行されることから、処理対象の信号を入力信号系列と呼称することにする。
 例えば図1に示す技術を参考にすると、入力信号系列X(ω) [ω∈{0,…,L-1}]に含まれる各成分、量子化グローバルゲインg^および量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に含まれる各成分の間の関係は式(1)で表すことができる。ここで、egはグローバルゲインgと量子化グローバルゲインg^との量子化誤差を、eXQは正規化入力信号系列XQ(ω) [ω∈{0,…,L-1}]と量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に含まれる対応する成分同士(同じωの値の成分同士)の量子化誤差を表している。
Figure JPOXMLDOC01-appb-M000001
 通常の量子化では、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に対応する符号である正規化信号符号に消費される消費ビット数は入力信号系列に依存し、正規化信号符号用に予め定められた規定ビット数の一部が未使用のビットとして残る場合が多い。そこで、この余った一つまたは複数のビット(以下、余剰ビットという)を量子化誤差egとeXQの低減に利用する。さらに言えば、余剰ビットに限らず、量子化誤差の低減のために事前に用意された一つまたは複数のビットを利用してもよい。以下で説明する実施形態では、余剰ビットまたは事前に用意された一つまたは複数のビットのうち一部または全部を量子化誤差egの低減に利用することを説明する。例えば、余剰ビットまたは事前に用意された一つまたは複数のビットのうち、量子化誤差eXQの低減に使われなかった残りのビットを量子化誤差egの低減に利用することができる。もちろん、量子化誤差egの低減のためだけに利用される一つまたは複数のビットを事前に用意しておいてもよい。以下、量子化誤差egの低減に利用可能なビットを「ゲイン修正ビット」と呼称する。ゲイン修正ビットのビット数をUとする。
 「量子化誤差egを低減する」ことは、換言すると、「量子化グローバルゲインを補正する」ことに他ならない。量子化グローバルゲインの補正に関して、一つのフレームに関する離散周波数のインデックスω∈{0,1,2,…,L-1}の全体、つまり系列全体、に共通の量子化グローバルゲインを補正する方法が考えられる。しかし、音響信号の特性を考慮すると、系列全体に共通の量子化グローバルゲインを補正するよりも、系列全体BをN個(ただし、Nは2以上の予め定められた整数である)の範囲{Bnn=1 N={B1,…,Bn,…,BN}に区分した後、各範囲に対応するゲインを、量子化グローバルゲインを補正することによって求める方が、音声品質の向上を期待できる。このような観点から、実施形態における適応量子化では、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の系列全体が複数の範囲に区分される。
 符号化装置と復号装置とで同じ信号系列BをN個の範囲に区分するために容易に考えられる方法は、隣接する範囲の境界位置や各範囲に含まれる成分数のような範囲を特定する情報を符号化装置の出力とする方法である。しかし、範囲を特定する情報を出力するためには大量のビット数が必要となる。範囲を特定する情報を符号化装置の出力とすることなく、すなわち、ビットを消費することなく、符号化装置と復号装置とで同じ基準で区分を行なう。また、各範囲に対してなるべく均等にゲイン修正ビット、すなわち、量子化グローバルゲインを修正するための情報量、を与えることを想定し、各範囲に含まれる量子化正規化済み信号系列の成分の情報量がなるべく均等となることが望ましい。そこで、系列区分の基準として「各範囲のエネルギーがなるべく等しくなるように区分する基準」を採用する。この基準による具体的な区分方法については、後に詳述する。
 実施形態の詳細を以下に説明する。
《第1実施形態》
 第1実施形態の符号化装置1(図2参照)は、正規化信号符号化部120、グローバルゲイン符号化部105、ゲイン補正量符号化部140、区分部150を含む。図1に示す符号化装置1では、区分部150はゲイン補正量符号化部140の構成要素として図示されているが、後述の説明から容易に推測されるように、区分部150がゲイン補正量符号化部140と異なる構成要素であってもよい。符号化装置1は、必要に応じて、周波数領域変換部101と合成部160を含んでもよい。
 まず、符号化装置1(encoder)が行う符号化処理を説明する(図3参照)。
 ここでは、符号化装置1の入力信号系列は、フレーム単位の音響信号x(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分である入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]であるとして説明する。ここで、tは離散時間のインデックス、ωは離散周波数のインデックス、LminはL点の周波数成分のうちの最小の離散周波数のインデックス、LmaxはL点の周波数成分のうちの最大の離散周波数のインデックス、を表す。ただし、フレーム単位の音響信号x(t)そのものを符号化装置1の入力信号系列としてもよいし、フレーム単位の音響信号x(t)に対して線形予測分析をした残差信号を符号化装置1の入力信号系列としてもよいし、その残差信号に対応するL点(Lは、正整数で例えば256である)の周波数成分を入力信号系列としてもよい。
<周波数領域変換部101>
 符号化装置1は、符号化装置1の前処理部として、または符号化装置1内に、周波数領域変換部101を備えてもよい。この場合は、周波数領域変換部101がフレーム単位の時間領域の音響信号x(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分を生成して入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]として出力する。時間-周波数変換方法として、例えばMDCT(Modified Discrete Cosine Transform)やDCT(Discrete Cosine Transform)を用いることができる。この場合も、フレーム単位の時間領域の音響信号に代えて、フレーム単位の時間領域の音響信号を線形予測分析して得られる残差信号をx(t)としてもよい。
<正規化信号符号化部120>
 正規化信号符号化部120は、フレーム単位の入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]の各成分が正規化された信号による系列を符号化して得られる正規化信号符号と、この正規化信号符号に対応する量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を出力する(ステップS1e)。
 正規化信号符号化部120は、例えば、図1の正規化部102、量子化部103、ゲイン制御部104により実現される。正規化部102、量子化部103、ゲイン制御部104のそれぞれは、[背景技術]欄で説明した通りに動作する。
<グローバルゲイン符号化部105>
 グローバルゲイン符号化部105が、入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]に対応するゲインである量子化グローバルゲインg^と、量子化グローバルゲインg^に対応するグローバルゲイン符号とを得る(ステップS2e)。また、グローバルゲイン符号化部105は、必要に応じて量子化グローバルゲインg^に対応する量子化ステップ幅も得る。
 グローバルゲイン符号化部105は、例えば、[背景技術]欄で説明した通りに動作する。
 また、例えば、グローバルゲイン符号化部105は、量子化グローバルゲインの候補とその候補に対応するグローバルゲイン符号の組を複数組格納したテーブルを備え、正規化信号符号化部120で得られたグローバルゲインgと最も近い量子化グローバルゲインの候補を量子化グローバルゲインg^とし、その候補に対応するグローバルゲイン符号を出力してもよい。
 要は、グローバルゲイン符号化部105は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の各成分とゲインとを乗算して得られる信号系列と入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]との相関が最大または誤差が最小となるような基準で求められた量子化グローバルゲインg^とこの量子化グローバルゲインに対応するグローバルゲイン符号を求めて出力すればよい。
 なお、ゲイン補正量符号化部140が量子化グローバルゲインg^に対応する量子化ステップ幅を用いた処理を行う場合は、量子化グローバルゲインg^に対応する量子化ステップ幅もゲイン補正量符号化部140に対して出力される。
<区分部150>
 区分部150が、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を、「各範囲のエネルギーがなるべく等しくなるように区分する基準」で、N個の範囲(ただし、Nは2以上の予め定められた整数である)に区分する(ステップS3e)。既述の説明と整合させると、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の離散周波数インデックスの集合を{Lmin,…,Lmax}として、量子化正規化済み信号系列X^Q(ω)[ω∈{Lmin,…,Lmax}]が系列全体Bに相当し、区分部150は、量子化正規化済み信号系列X^Q(ω)[ω∈{Lmin,…,Lmax}]を、「各範囲のエネルギーがなるべく等しくなるように区分する基準」で、N個の範囲{Bnn=1 N={B1,…,Bn,…,BN}に区分する。この「各範囲のエネルギーがなるべく等しくなるように区分する基準」で区分する区分処理の詳細は後述する。この区分処理で得られるN個の範囲への区分に関する情報(以下、区分情報という)は区分部150から出力されゲイン補正量符号化部140に提供される。
<ゲイン補正量符号化部140>
 ゲイン補正量符号化部140には、入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]と、量子化グローバルゲインg^と、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]と区分情報が入力される。ゲイン補正量符号化部140は、図示しない記憶部に記憶されているゲイン補正量コードブックを用いて、量子化グローバルゲインをゲイン補正量で区分された範囲ごとに補正して得られる補正ゲインと量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の各サンプルの値とを乗算して得られる信号系列と入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]との相関が最大または誤差が最小となる、区分された範囲毎のゲイン補正量を特定するための符号であるゲイン補正量符号を出力する(ステップS4e)。
 さらに、必要に応じて、合成部160が、正規化信号符号と、ゲイン補正量符号と、グローバルゲイン符号をまとめたビットストリームを出力する。ビットストリームは復号装置2へ伝送される。
<区分部150が行なう区分処理の詳細>
 「各範囲のエネルギーがなるべく等しくなるように区分する基準」での区分処理は、例えば、量子化正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、
(a)量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように、
または、
(b)量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和と、量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のnと、が最も近付くように、
または、
(c)量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように、
または、
(d)量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以上となる最小のサンプル数になるように、
または、
(e)量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように、
または、
(f)量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以下となる最大のサンプル数になるように、
求め、
量子化正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、量子化正規化済み信号系列の第Nの範囲とすることで、量子化正規化済み信号系列をN個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を、第1の範囲から順に逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を実現できる。
[区分処理の第1例]
 区分処理の第1例を図4と図5と図6を用いて説明する。第1例の区分処理は上記の(a)に対応する。第1例の区分処理は、量子化正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように求め、量子化正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、量子化正規化済み信号系列の第Nの範囲とすることで、量子化正規化済み信号系列をN個の範囲に区分する処理である。
[[区分処理の第1例の具体例1:2つの範囲に区分する例]]
 図4は、2つの範囲に区分する例、すなわち、N=2の場合の例である。区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]をX^Q(ω) [ω∈{Lmin,…,Lmid-1}]とX^Q(ω) [ω∈{L mid,…,Lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるLmidを決定する場合の例である。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
Figure JPOXMLDOC01-appb-M000002
 次に、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の2分の1と、量子化正規化済み信号系列の第1の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(Lmid-1)の値の二乗和との差が最小となるように、第2の範囲の最も低域側にあるサンプル番号であるLmidを求める。すなわち、Lmidは式(3)によって求まる。これにより第1の範囲がX^Q [ω∈{Lmin,…,Lmid-1}]と決定する。
Figure JPOXMLDOC01-appb-M000003
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{Lmid,…,Lmax}]を第2の範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、Lmidであってもよいし、Lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数Lmid-Lminであってもよいし、第2の範囲のサンプル数Lmax-Lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
[[区分処理の第1例の具体例2:4個の範囲に区分する例]]
 図5は、区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を4個の範囲に区分する例、具体的には、第1の範囲と第2の範囲との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるL(1)を決定し、第2の範囲と第3の範囲との境界を表す情報として第3の範囲の最も低域側にあるサンプル番号であるL(2)を決定し、第3の範囲と第4の範囲との境界を表す情報として第4の範囲の最も低域側にあるサンプル番号であるL(3)を決定する例である。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の1と、量子化正規化済み信号系列の第1の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(1)-1)の値の二乗和との差が最小となるように求めたL(1)を第2の範囲の最も低域側にあるサンプル番号とする。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲として定まる。
 また、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の2(すなわち、2分の1)と、量子化正規化済み信号系列の第1の範囲から第2の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(2)-1)の値の二乗和との差が最小となるように求めたL(2)を第3の範囲の最も低域側にあるサンプル番号とする。これにより、X^Q [ω∈{L(1),…,L(2)-1}]が第2の範囲として定まる。
 また、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の3と、量子化正規化済み信号系列の第1の範囲から第3の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(3)-1)の値の二乗和との差が最小となるように求めたL(3)を第4の範囲の最も低域側にあるサンプル番号とする。これにより、X^Q [ω∈{L(2),…,L(3)-1}]が第3の範囲として定まる。
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲から第3の範囲以外の範囲、すなわち、X^Q [ω∈{L(3),…,Lmax}]を第4の範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]は4個の範囲に区分される。
 区分部150が出力する区分情報は、L(1)とL(2)とL(3)であってもよいし、L(1)とL(2)とL(3)のそれぞれに予め定めた値を演算した値であってもよいし、各範囲のサンプル数であってもよいし、要は、4個の範囲の全てを特定できる情報であれば何でもよい。
[[区分処理の第1例の一般化:N個の範囲に区分する例]]
 図6は、区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]をN個の範囲に区分する例、具体的には、第nの範囲と第n+1の範囲との境界を表す情報として第n+1の範囲の最も低域側にあるサンプル番号であるL(n)を決定する例である。以下では、LminをL(0)として説明する。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、n=1からN-1のそれぞれのnについて、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和のN分のnと、量子化正規化済み信号系列の第1の範囲から第nの範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(n)-1)の値の二乗和との差が最小となるように求めたL(n)を第n+1の範囲の最も低域側にあるサンプル番号とする。これにより、X^Q [ω∈{L(n-1),…,L(n)-1}]が第nの範囲として定まる。
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲から第N-1の範囲以外の範囲、すなわち、X^Q [ω∈{L(N-1),…,Lmax}]を第Nの範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]はN個の範囲に区分される。
 区分部150が出力する区分情報は、L(n)(nは1からN-1までの各整数)であってもよいし、L(n)(nは1からN-1までの各整数)に予め定めた値を演算した値であってもよいし、各範囲のサンプル数であってもよいし、要は、N個の範囲の全てを特定できる情報であれば何でもよい。
[区分処理の第2例]
 区分処理の第2例は上記の(b)に対応する。第2例の区分処理は、第1例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第1例の区分処理と同じ方法である。第2例の区分処理によれば、第1例の区分処理で行なう二乗計算を省略できる分、第1例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
[区分処理の第3例]
 区分処理の第3例を図7と図8と図9を用いて説明する。第3例の区分処理は上記の(c)に対応する。第3例の区分処理は、量子化正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように求め、量子化正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、量子化正規化済み信号系列の第Nの範囲とすることで、量子化正規化済み信号系列をN個の範囲に区分する処理である。
[[区分処理の第3例の具体例1:2つの範囲に区分する例]]
 図7は、2つの範囲に区分する例、すなわち、N=2の場合の例である。区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]をX^Q(ω) [ω∈{Lmin,…,Lmid-1}]とX^Q(ω) [ω∈{Lmid,…,Lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるLmidを決定する場合の例である。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、離散周波数のインデックスωの番号をLminから順に増やしながら量子化正規化済み信号系列X^Q(ω)のLminから当該インデクスまでの二乗和plowがplow≧pow/2を満たすか否かを判定し、初めてplow≧pow/2を満たす場合の離散周波数のインデックスωまでを第1の範囲とし、当該インデックスωに1を加算したものを第2の範囲の最も低域側にあるサンプル番号であるインデックスLmidとして出力する。これにより第1の範囲がX^Q [ω∈{Lmin,…,Lmid-1}]と決定する。
 図7は、上記の処理を実現するためのフローチャートである。離散周波数のインデックスωの初期値をLmin、低域のエネルギーplowの初期値を|X^Q(Lmin)|2に設定する。そして、plow≧pow/2を満たすか否かを判定する。plow≧pow/2を満たさない場合には、離散周波数のインデックスωに1を加えたものを新たなωとし、plowにX^Q(ω)のエネルギー|X^Q(ω)|2を加算したものを新たなplowとする。plow≧pow/2を満たす場合には、その時点での離散周波数のインデックスωに1を加えたものをインデックスLmidとして出力する。
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{Lmid,…,Lmax}]を第2の範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、Lmidであってもよいし、Lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数Lmid-Lminであってもよいし、第2の範囲のサンプル数Lmax-Lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
[[区分処理の第3例の具体例2:4個の範囲に区分する例]]
 図8は、区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を4個の範囲に区分する例、具体的には、第1の範囲と第2の範囲との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるL(1)を決定し、第2の範囲と第3の範囲との境界を表す情報として第3の範囲の最も低域側にあるサンプル番号であるL(2)を決定し、第3の範囲と第4の範囲との境界を表す情報として第4の範囲の最も低域側にあるサンプル番号であるL(3)を決定する例である。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、量子化正規化済み信号系列の第1の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(1)-1)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の1以上であり、かつ、量子化正規化済み信号系列の第1の範囲に含まれる全てのサンプルから第1の範囲の最も高域側にある1つのサンプルを除いた信号系列X^Q(Lmin),…,X^Q(L(1)-2)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の1より小さい、L(1)を第2の範囲の最も低域側にあるサンプル番号として求める。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲として定まる。
 また、量子化正規化済み信号系列の第1の範囲から第2の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(2)-1)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の2(すなわち、2分の1)以上であり、かつ、量子化正規化済み信号系列の第1の範囲から第2の範囲に含まれる全てのサンプルから第2の範囲の最も高域側にある1つのサンプルを除いた信号系列X^Q(Lmin),…,X^Q(L(2)-2)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の2(すなわち、2分の1)より小さい、L(2)を第3の範囲の最も低域側にあるサンプル番号として求める。これにより、X^Q [ω∈{L(1),…,L(2)-1}]が第2の範囲として定まる。
 また、量子化正規化済み信号系列の第1の範囲から第3の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(3)-1)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の3以上であり、かつ、量子化正規化済み信号系列の第1の範囲から第3の範囲に含まれる全てのサンプルから第3の範囲の最も高域側にある1つのサンプルを除いた信号系列X^Q(Lmin),…,X^Q(L(3)-2)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の3より小さい、L(3)を第4の範囲の最も低域側にあるサンプル番号として求める。これにより、X^Q [ω∈{L(2),…,L(3)-1}]が第3の範囲として定まる。
 これら処理は、具体的には例えば、以下により実現できる。
 まず、式(2)によってエネルギーpowを求める。
 次に、iをLminから順に1ずつ増やしながら式(4)の条件を満たすか否かを判断していき、式(4)の条件を満たすiに1を加算したものをL(1)として求める。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲として定まる。
Figure JPOXMLDOC01-appb-M000004
 さらに、iをL(1)から順に1ずつ増やしながら式(5)の条件を満たすか否かを判断していき、式(5)の条件を満たすiに1を加算したものをL(2)として求める。これにより、X^Q [ω∈{L(1),…,L(2)-1}]が第2の範囲として定まる。
Figure JPOXMLDOC01-appb-M000005
 さらに、iをL(2)から順に1ずつ増やしながら式(6)の条件を満たすか否かを判断していき、式(6)の条件を満たすiに1を加算したものをL(3)として求める。これにより、X^Q [ω∈{L(2),…,L(3)-1}]が第3の範囲として定まる。
Figure JPOXMLDOC01-appb-M000006
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲から第3の範囲以外の範囲、すなわち、X^Q [ω∈{L(3),…,Lmax}]を第4の範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]は4個の範囲に区分される。
 区分部150が出力する区分情報は、L(1)とL(2)とL(3)であってもよいし、L(1)とL(2)とL(3)のそれぞれに予め定めた値を演算した値であってもよいし、各範囲のサンプル数であってもよいし、要は、4個の範囲の全てを特定できる情報であれば何でもよい。
[[区分処理の第3例の一般化:N個の範囲に区分する例]]
 図9は、区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]をN個の範囲に区分する例、具体的には、第nの範囲と第n+1の範囲との境界を表す情報として第n+1の範囲の最も低域側にあるサンプル番号であるL(n)を決定する例である。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、n=1からN-1のそれぞれのnについて、量子化正規化済み信号系列の第1の範囲から第nの範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(n)-1)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和のN分のn以上であり、かつ、量子化正規化済み信号系列の第1の範囲から第nの範囲に含まれる全てのサンプルから第nの範囲の最も高域側にある1つのサンプルを除いた信号系列X^Q(Lmin),…,X^Q(L(n)-2)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和のN分のnより小さい、L(n)を第n+1の範囲の最も低域側にあるサンプル番号として求める。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲、n=2からN-1のそれぞれのnについて、X^Q [ω∈{L(n-1),…,L(n)-1}]が第nの範囲、として定まる。
 この処理は、具体的には例えば、以下により実現できる。まず、式(2)によってエネルギーpowを求める。次に、n=1について、iをLminから順に1ずつ増やしながら式(7)の条件を満たすか否かを判断していき、式(7)の条件を満たすiに1を加算したものをL(1)として求める。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲として定まる。
Figure JPOXMLDOC01-appb-M000007
 さらに、n=2からN-1のそれぞれのnについて、iをL(n-1)から順に1ずつ増やしながら式(7)の条件を満たすか否かを判断していき、式(7)の条件を満たすiに1を加算したものをL(n)として求める処理をnが小さい順に繰り返す。以上の処理により、n=2からN-1のそれぞれのnについて、X^Q [ω∈{L(n-1),…,L(n)-1}]が第nの範囲として定まる。
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲から第N-1の範囲以外の範囲、すなわち、X^Q [ω∈{L(N-1),…,Lmax}]を第Nの範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]はN個の範囲に区分される。
 区分部150が出力する区分情報は、L(n)(nは1からN-1までの各整数)であってもよいし、L(n)(nは1からN-1までの各整数)に予め定めた値を演算した値であってもよいし、各範囲のサンプル数であってもよいし、要は、N個の範囲の全てを特定できる情報であれば何でもよい。
[区分処理の第4例]
 区分処理の第4例は上記の(d)に対応する。第4例の区分処理は、第3例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第3例の区分処理と同じ方法である。第4例の区分処理によれば、第3例の区分処理で行なう二乗計算を省略できる分、第3例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
[区分処理の第5例]
 区分処理の第5例を図10と図11と図12を用いて説明する。第5例の区分処理は上記の(e)に対応する。第5例の区分処理は、量子化正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように求め、量子化正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、量子化正規化済み信号系列の第Nの範囲とすることで、量子化正規化済み信号系列をN個の範囲に区分する処理である。
[[区分処理の第5例の具体例1:2つの範囲に区分する例]]
 図10は、2つの範囲に区分する例、すなわち、N=2の場合の例である。区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]をX^Q(ω) [ω∈{Lmin,…,Lmid-1}]とX^Q(ω) [ω∈{Lmid,…,Lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるLmidを決定する場合の例である。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、離散周波数のインデックスωの番号をLminから順に増やしながら量子化正規化済み信号系列X^Q(ω)のLminから当該インデクスまでの二乗和plowがplow≦pow/2を満たすか否かを判定し、初めてplow≦pow/2を満たさなくなる場合の離散周波数のインデックスωから1を減算した離散周波数までを第1の範囲とし、当該インデックスωを第2の範囲の最も低域側にあるサンプル番号であるインデックスLmidとして出力する。これにより第1の範囲がX^Q [ω∈{Lmin,…,Lmid-1}]と決定する。
 図10は、上記の処理を実現するためのフローチャートである。離散周波数のインデックスωの初期値をLmin、低域のエネルギーplowの初期値を|X^Q(Lmin)|2に設定する。そして、plow≦pow/2を満たすか否かを判定する。plow≦pow/2を満たす場合には、離散周波数のインデックスωに1を加えたものを新たなωとし、plowにX^Q(ω)のエネルギー|X^Q(ω)|2を加算したものを新たなplowとする。plow≦pow/2を満たさない場合には、その時点での離散周波数のインデックスωをインデックスLmidとして出力する。
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{Lmid,…,Lmax}]を第2の範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、Lmidであってもよいし、Lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数Lmid-Lminであってもよいし、第2の範囲のサンプル数Lmax-Lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
[[区分処理の第5例の具体例2:4個の範囲に区分する例]]
 図11は、区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を4個の範囲に区分する例、具体的には、第1の範囲と第2の範囲との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるL(1)を決定し、第2の範囲と第3の範囲との境界を表す情報として第3の範囲の最も低域側にあるサンプル番号であるL(2)を決定し、第3の範囲と第4の範囲との境界を表す情報として第4の範囲の最も低域側にあるサンプル番号であるL(3)を決定する例である。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、量子化正規化済み信号系列の第1の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(1)-1)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の1以下であり、かつ、量子化正規化済み信号系列の第1の範囲に含まれる全てのサンプルに第2の範囲の最も低域側にある1つのサンプルを加えた信号系列X^Q(Lmin),…,X^Q(L(1))の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の1より大きい、L(1)を第2の範囲の最も低域側にあるサンプル番号として求める。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲として定まる。
 また、量子化正規化済み信号系列の第1の範囲から第2の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(2)-1)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の2(すなわち、2分の1)以下であり、かつ、量子化正規化済み信号系列の第1の範囲から第2の範囲に含まれる全てのサンプルに第3の範囲の最も低域側にある1つのサンプルを加えた信号系列X^Q(Lmin),…,X^Q(L(2))の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の2(すなわち、2分の1)より大きい、L(2)を第3の範囲の最も低域側にあるサンプル番号として求める。これにより、X^Q [ω∈{L(1),…,L(2)-1}]が第2の範囲として定まる。
 また、量子化正規化済み信号系列の第1の範囲から第3の範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(3)-1)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の3以下であり、かつ、量子化正規化済み信号系列の第1の範囲から第3の範囲に含まれる全てのサンプルに第4の範囲の最も低域側にある1つのサンプルを加えた信号系列X^Q(Lmin),…,X^Q(L(3))の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和の4分の3より大きい、L(3)を第4の範囲の最も低域側にあるサンプル番号として求める。これにより、X^Q [ω∈{L(2),…,L(3)-1}]が第3の範囲として定まる。
 この処理は、具体的には例えば、以下により実現できる。
 まず、式(2)によってエネルギーpowを求める。
 次に、iをLminから順に1ずつ増やしながら式(8)の条件を満たすか否かを判断していき、式(8)下の条件を満たすiに1を加算したものをL(1)として求める。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲として定まる。
Figure JPOXMLDOC01-appb-M000008
 さらに、iをL(1)から順に1ずつ増やしながら式(9)の条件を満たすか否かを判断していき、式(9)下の条件を満たすiに1を加算したものをL(2)として求める。これにより、X^Q [ω∈{L(1),…,L(2)-1}]が第2の範囲として定まる。
Figure JPOXMLDOC01-appb-M000009
 さらに、iをL(2)から順に1ずつ増やしながら式(10)の条件を満たすか否かを判断していき、式(10)の条件を満たすiに1を加算したものをL(3)として求める。これにより、X^Q [ω∈{L(2),…,L(3)-1}]が第3の範囲として定まる。
Figure JPOXMLDOC01-appb-M000010
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲から第3の範囲以外の範囲、すなわち、X^Q [ω∈{L(3),…,Lmax}]を第4の範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]は4個の範囲に区分される。
 区分部150が出力する区分情報は、L(1)とL(2)とL(3)であってもよいし、L(1)とL(2)とL(3)のそれぞれに予め定めた値を演算した値であってもよいし、各範囲のサンプル数であってもよいし、要は、4個の範囲の全てを特定できる情報であれば何でもよい。
[[区分処理の第5例の一般化:N個の範囲に区分する例]]
 図12は、区分対象の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]をN個の範囲に区分する例、具体的には、第nの範囲と第n+1の範囲との境界を表す情報として第n+1の範囲の最も低域側にあるサンプル番号であるL(n)を決定する例である。
 まず、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、n=1からN-1のそれぞれのnについて、量子化正規化済み信号系列の第1の範囲から第nの範囲に含まれる全てのサンプルX^Q(Lmin),…,X^Q(L(n)-1)の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和のN分のn以下であり、かつ、量子化正規化済み信号系列の第1の範囲から第nの範囲に含まれる全てのサンプルに第n+1の範囲の最も低域側にある1つのサンプルを加えた信号系列X^Q(Lmin),…,X^Q(L(n))の値の二乗和が、式(2)により求めた量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の全サンプルX^Q(Lmin),…,X^Q(Lmax)の二乗和のN分のnより大きい、L(n)を第n+1の範囲の最も低域側にあるサンプル番号として求める。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲、n=2からN-1のそれぞれのnについて、X^Q [ω∈{L(n-1),…,L(n)-1}]が第nの範囲、として定まる。
 この処理は、具体的には例えば、以下により実現できる。まず、式(2)によってエネルギーpowを求める。次に、n=1について、iをLminから順に1ずつ増やしながら式(11)の条件を満たすか否かを判断していき、式(11)の条件を満たすiに1を加算したものをL(1)として求める。これにより、X^Q [ω∈{Lmin,…,L(1)-1}]が第1の範囲として定まる。
Figure JPOXMLDOC01-appb-M000011
 さらに、n=2からN-1のそれぞれのnについて、iをL(n-1)から順に1ずつ増やしながら式(11)の条件を満たすか否かを判断していき、式(11)の条件を満たすiに1を加算したものをL (n)として求める処理をnが小さい順に繰り返す。以上の処理により、n=2からN-1のそれぞれのnについて、X^Q [ω∈{L(n-1),…,L(n)-1}]が第nの範囲として定まる。
 そして、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]の第1の範囲から第N-1の範囲以外の範囲、すなわち、X^Q [ω∈{L(N-1),…,Lmax}]を第Nの範囲とする。
 以上により、量子化正規化済み信号系列X^Q [ω∈{Lmin,…,Lmax}]はN個の範囲に区分される。
 区分部150が出力する区分情報は、L(n)(nは1からN-1までの各整数)であってもよいし、L(n)(nは1からN-1までの各整数)に予め定めた値を演算した値であってもよいし、各範囲のサンプル数であってもよいし、要は、N個の範囲の全てを特定できる情報であれば何でもよい。
[区分処理の第6例]
 区分処理の第6例は上記の(f)に対応する。第6例の区分処理は、第5例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第5例の区分処理と同じ方法である。第6例の区分処理によれば、第5例の区分処理で行なう二乗計算を省略できる分、第5例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
<ゲイン補正量符号化部140が行なう処理の詳細>
 ゲイン補正量符号化部140は、図示しない記憶部に記憶されているゲイン補正量コードブックを用いて、区分された範囲ごとに量子化グローバルゲインg^をゲイン補正量で補正して得られる補正ゲインと量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の各サンプルの値とを乗算して得られる信号系列と入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]との相関が最大または誤差が最小となる、区分された範囲毎のゲイン補正量を特定する符号であるゲイン補正量符号を出力する。
[ゲイン補正量符号化処理の第1例]
 ゲイン補正量符号化処理の第1例は、量子化グローバルゲインg^とゲイン補正量とを加算したものを補正ゲインとする例である。
[[ゲイン補正量符号化処理の第1例の具体例1:2つの範囲に区分されている場合の例]]
 量子化正規化済み信号系列が2つの範囲に区分されている場合について説明する。
 図示しない記憶部には、第1の範囲のゲイン補正量の候補Δlow(m)と第2の範囲のゲイン補正量の候補Δhigh(m)とこれらのゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δlow(1)とΔhigh(1)とidx(1)との組、Δlow(2)とΔhigh(2)とidx(2)との組、・・・、Δlow(M)とΔhigh(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。
 ゲイン補正量符号化部140は、まず、1からMのそれぞれのmについて、量子化グローバルゲインg^と第1の範囲のゲイン補正量の候補Δlow(m)とを加算して得られる値と第1の範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmid-1}]の各サンプルの値とを乗算して得られる信号系列と第1の範囲の入力信号系列X(ω) [ω∈{Lmin,…,Lmid-1}]との対応するサンプル同士の値の差の二乗和と、量子化グローバルゲインg^と第2の範囲のゲイン補正量の候補Δhigh(m)とを加算して得られる値と第2の範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmid,…,Lmax}]の各サンプルの値とを乗算して得られる信号系列と第2の範囲の入力信号系列X(ω) [ω∈{Lmid,…,Lmax}]との対応するサンプル同士の値の差の二乗和と、の加算値を求める。加算値は下記の式(12)で求まる。
Figure JPOXMLDOC01-appb-M000012
 次に、この加算値が最小となるmに対応する符号idx(m)をゲイン補正量符号idxとして出力する。すなわち、ゲイン補正量符号idxは式(13)により求まる。
Figure JPOXMLDOC01-appb-M000013
 なお、式(13)は誤差が最小となる基準でのベクトル量子化に対応するものであるが、相関が最大となる基準でのベクトル量子化、誤差が最小または相関が最大となる基準でのスカラ量子化などの手法を適用してもよいのは当然のことである。
[[ゲイン補正量符号化処理の第1例の具体例2:4個の範囲に区分されている場合の例]]
 量子化正規化済み信号系列が4個の範囲に区分されている場合について説明する。
 図示しない記憶部には、第1の範囲のゲイン補正量の候補Δ1(m)と第2の範囲のゲイン補正量の候補Δ2(m)と第3の範囲のゲイン補正量の候補Δ3(m)と第4の範囲のゲイン補正量の候補Δ4(m)とこれらのゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δ1(1)とΔ2(1)とΔ3(1)とΔ4(1)とidx(1)との組、Δ1(2)とΔ2(2)とΔ3(2)とΔ4(2)とidx(2)との組、・・・、Δ1(M)とΔ2(M)とΔ3(M)とΔ4(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。
 ゲイン補正量符号化部は、まず、1からMのそれぞれのmについて、量子化グローバルゲインg^と第1の範囲のゲイン補正量の候補Δ1(m)とを加算して得られる値と第1の範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,L(1)-1}]の各サンプルの値とを乗算して得られる信号系列と第1の範囲の入力信号系列X(ω) [ω∈{Lmin,…,L(1)-1}]との対応するサンプル同士の値の差の二乗和と、量子化グローバルゲインg^と第2の範囲のゲイン補正量の候補Δ2(m)とを加算して得られる値と第2の範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{L(1),…,L(2)-1}]の各サンプルの値とを乗算して得られる信号系列と第2の範囲の入力信号系列X(ω) [ω∈{L(1),…,L(2)-1}]との対応するサンプル同士の値の差の二乗和と、量子化グローバルゲインg^と第3の範囲のゲイン補正量の候補Δ3(m)とを加算して得られる値と第3の範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{L(2),…,L(3)-1}]の各サンプルの値とを乗算して得られる信号系列と第3の範囲の入力信号系列X(ω) [ω∈{L(2),…,L(3)-1}]との対応するサンプル同士の値の差の二乗和と、量子化グローバルゲインg^と第4の範囲のゲイン補正量の候補Δ4(m)とを加算して得られる値と第4の範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{L(3),…,Lmax}]の各サンプルの値とを乗算して得られる信号系列と第4の範囲の入力信号系列X(ω) [ω∈{L(3),…,Lmax}]との対応するサンプル同士の値の差の二乗和と、の加算値を求める。加算値は式(14)で求まる。
Figure JPOXMLDOC01-appb-M000014
 次に、この加算値が最小となるmに対応する符号idx(m)をゲイン補正量符号idxとして出力する。すなわち、ゲイン補正量符号idxは式(15)により求まる。
Figure JPOXMLDOC01-appb-M000015
 なお、式(15)は誤差が最小となる基準でのベクトル量子化に対応するものであるが、相関が最大となる基準でのベクトル量子化、誤差が最小または相関が最大となる基準でのスカラ量子化などの手法を適用してもよいのは当然のことである。
[[ゲイン補正量符号化処理の第1例の一般化:N個の範囲に区分されている場合の例]]
 量子化正規化済み信号系列がN個の範囲に区分されている場合について説明する。以下では、LminをL(0)、LmaxをL(N)-1、として説明する。
 図示しない記憶部には、第1の範囲から第Nの範囲それぞれのゲイン補正量の候補Δ1(m),…,ΔN(m)とこれらのゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δ1(1),…,ΔN(1)とidx(1)との組、Δ1(2),…,ΔN(2)とidx(2)との組、・・・、Δ1(M),…,ΔN(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。
 ゲイン補正量符号化部は、まず、1からMのそれぞれのmについて、第1の範囲から第Nの範囲のそれぞれについての量子化グローバルゲインg^と第nの範囲のゲイン補正量の候補Δn(m)とを加算して得られる値と第nの範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値とを乗算して得られる信号系列と第1の範囲の入力信号系列X(ω) [ω∈{L(n-1),…,L(n)-1}]との対応するサンプル同士の値の差の二乗和、の第1の範囲から第Nの範囲の全てについての加算値を求める。加算値は式(16)で求まる。
Figure JPOXMLDOC01-appb-M000016
 次に、この加算値が最小となるmに対応する符号idx(m)をゲイン補正量符号idxとして出力する。すなわち、ゲイン補正量符号idxは式(17)により求まる。
Figure JPOXMLDOC01-appb-M000017
 なお、式(17)は誤差が最小となる基準でのベクトル量子化に対応するものであるが、相関が最大となる基準でのベクトル量子化、誤差が最小または相関が最大となる基準でのスカラ量子化などの手法を適用してもよいのは当然のことである。
[ゲイン補正量符号化処理の第2例:パワー比の乗算]
 ゲイン補正量符号化処理の第2例は、量子化グローバルゲインg^と、量子化正規化済み信号系列のフレーム内の全てのサンプルの値の二乗和を量子化正規化済み信号系列の区分された範囲内の全てのサンプルの値の二乗和で除算した値をゲイン補正量に乗算した値と、を加算したものを補正ゲインとする例である。
 量子化正規化済み信号系列がN個の範囲に区分されている場合について説明する。以下では、LminをL(0)、LmaxをL(N)-1、として説明する。
 図示しない記憶部には、第1例と同様に、第1の範囲から第Nの範囲それぞれのゲイン補正量の候補Δ1(m),…,ΔN(m)とこれらのゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δ1(1),…,ΔN(1)とidx(1)との組、Δ1(2),…,ΔN(2)とidx(2)との組、・・・、Δ1(M),…,ΔN(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。
 第1の範囲から第Nの範囲それぞれについて、量子化正規化済み信号系列のフレーム内の全てのサンプルX^Q(ω) [ω∈{L(0),…,L(N)-1}]の値の二乗和を量子化正規化済み信号系列の区分された範囲内の全てのサンプルX^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の値の二乗和で除算した値をs(n)としたとき、ゲイン補正量符号化部は、まず、1からMのそれぞれのmについて、第1の範囲から第Nの範囲のそれぞれについての、量子化グローバルゲインg^と、第nの範囲のゲイン補正量の候補Δn(m)とs(n)との乗算値と、を加算して得られる値と第nの範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値とを乗算して得られる信号系列と第1の範囲の入力信号系列X(ω) [ω∈{L(n-1),…,L(n)-1}]との対応するサンプル同士の値の差の二乗和、の第1の範囲から第Nの範囲の全てについての加算値を求める。s(n)は式(18)で求まる。また、加算値は式(19)で求まる。
Figure JPOXMLDOC01-appb-M000018
 次に、この加算値が最小となるmに対応する符号idx(m)をゲイン補正量符号idxとして出力する。すなわち、ゲイン補正量符号idxは式(20)により求まる。
Figure JPOXMLDOC01-appb-M000019
 なお、式(20)は誤差が最小となる基準でのベクトル量子化に対応するものであるが、相関が最大となる基準でのベクトル量子化、誤差が最小または相関が最大となる基準でのスカラ量子化などの手法を適用してもよいのは当然のことである。
[ゲイン補正量符号化処理の第3例:サンプル数の比の乗算]
 ゲイン補正量符号化処理の第3例は、量子化グローバルゲインg^と、量子化正規化済み信号系列のフレーム内のサンプルのエネルギーが所定値より大きいサンプルの個数を上記量子化正規化済み信号系列の区分された範囲内のサンプルのエネルギーが所定値より大きいサンプルの個数で除算した値をゲイン補正量に乗算した値と、を加算したものを補正ゲインとする例である。
 量子化正規化済み信号系列がN個の範囲に区分されている場合について説明する。以下では、LminをL(0)、LmaxをL(N)-1、として説明する。
 図示しない記憶部には、第1例と同様に、第1の範囲から第Nの範囲それぞれのゲイン補正量の候補Δ1(m),…,ΔN(m)とこれらのゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δ1(1),…,ΔN(1)とidx(1)との組、Δ1(2),…,ΔN(2)とidx(2)との組、・・・、Δ1(M),…,ΔN(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。
 第1の範囲から第Nの範囲のそれぞれについて、量子化正規化済み信号系列の区分された範囲内の全てのサンプルX^Q(ω) [ω∈{L(n-1),…,L(n)-1}]のうちの、エネルギーが所定値より大きいサンプルの個数c(n)を求める。また、c(1)からc(N)の総和を求める。この総和は、量子化正規化済み信号系列の全てのサンプルX^Q(ω) [ω∈{L(0),…,L(N)-1}]のうちの、エネルギーが所定値より大きいサンプルの個数である。所定値は、0であっても、0以上の値であってもよく、また、量子化グローバルゲインg^と所定の値αとを乗算したものであってもよい。
 第1の範囲から第Nの範囲のそれぞれについて、c(1)からc(N)の総和をc(n)で除算した値をs(n)として求める。s(n)は式(21)で求まる。
Figure JPOXMLDOC01-appb-M000020
 ゲイン補正量符号化部140は、まず、1からMのそれぞれのmについて、第1の範囲から第Nの範囲のそれぞれについての、量子化グローバルゲインg^と、第nの範囲のゲイン補正量の候補Δn(m)とs(n)との乗算値と、を加算して得られる値と第nの範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値とを乗算して得られる信号系列と第1の範囲の入力信号系列X(ω) [ω∈{L(n-1),…,L(n)-1}]との対応するサンプル同士の値の差の二乗和、の第1の範囲から第Nの範囲の全てについての加算値を求める。加算値は式(22)で求まる。
Figure JPOXMLDOC01-appb-M000021
 次に、この加算値が最小となるmに対応する符号idx(m)をゲイン補正量符号idxとして出力する。すなわち、ゲイン補正量符号idxは式(23)により求まる。
Figure JPOXMLDOC01-appb-M000022
 なお、式(23)は誤差が最小となる基準でのベクトル量子化に対応するものであるが、相関が最大となる基準でのベクトル量子化、誤差が最小または相関が最大となる基準でのスカラ量子化などの手法を適用してもよいのは当然のことである。
[ゲイン補正量符号化処理の第4例:量子化ステップ幅の関係]
 ゲイン補正量符号化処理の第4例は、量子化グローバルゲインg^に対応する量子化ステップ幅に依存したゲイン補正量を求め、量子化グローバルゲインg^とゲイン補正量とを加算したものを補正ゲインとする例である。
 量子化正規化済み信号系列がN個の範囲に区分されている場合について説明する。以下では、LminをL(0)、LmaxをL(N)-1、として説明する。
 図示しない記憶部には、第1の範囲から第Nの範囲それぞれの量子化幅乗算前ゲイン補正量の候補Δ1(m),…,ΔN(m)とこれらの量子化幅乗算前ゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δ1(1),…,ΔN(1)とidx(1)との組、Δ1(2),…,ΔN(2)とidx(2)との組、・・・、Δ1(M),…,ΔN(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。
 ゲイン補正量符号化処理の第4例では、例えば、図示しない記憶部に格納しておくゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量の候補Δn(m)の全ての値の絶対値を1未満としておく。すなわち、ゲイン補正量コードブックには、量子化幅乗算前ゲイン補正量の候補をΔn(m)として格納しておく。量子化グローバルゲインg^に対応する量子化ステップ幅stepを用いて、ゲイン補正量符号化部140は、まず、1からMのそれぞれのmについて、第1の範囲から第Nの範囲のそれぞれについての、量子化グローバルゲインg^と、第nの範囲の量子化幅乗算前ゲイン補正量の候補Δn(m)と量子化ステップ幅stepとの乗算値と、を加算して得られる値と第nの範囲の量子化正規化済み信号系列X^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値とを乗算して得られる信号系列と第nの範囲の入力信号系列X(ω) [ω∈{L(n-1),…,L(n)-1}]との対応するサンプル同士の値の差の二乗和、の第1の範囲から第Nの範囲の全てについての加算値を求める。加算値は式(24)で求まる。
Figure JPOXMLDOC01-appb-M000023
 次に、この加算値が最小となるmに対応する符号idx(m)をゲイン補正量符号idxとして出力する。すなわち、ゲイン補正量符号idxは式(25)により求まる。
Figure JPOXMLDOC01-appb-M000024
 なお、式(25)は誤差が最小となる基準でのベクトル量子化に対応するものであるが、相関が最大となる基準でのベクトル量子化、誤差が最小または相関が最大となる基準でのスカラ量子化などの手法を適用してもよいのは当然のことである。
 ゲイン補正量符号化処理の第4例では、量子化グローバルゲインg^に対応する量子化ステップ幅stepとは、グローバルゲイン符号化部105における量子化グローバルゲインの隣接する候補間の差分値である。例えば、この量子化ステップ幅stepと絶対値が1未満である量子化幅乗算前ゲイン補正量の候補Δn(m)との積を量子化グローバルゲインg^に加算したものとなるように量子化グローバルゲインを補正することで、量子化グローバルゲインg^をゲイン補正量で補正して得られる補正ゲインが、量子化グローバルゲインg^とこれに隣接する量子化グローバルゲインの候補との間となるようにできる。
 なお、例えば、図示しない記憶部に格納しておくゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量の候補Δn(m) は、学習により生成されることもある。この場合は、量子化幅乗算前ゲイン補正量の候補Δn(m)に1未満でないものが含まれる可能性もある。ただし、たとえ量子化幅乗算前ゲイン補正量の候補Δn(m)に1未満でないものが含まれていたとしても、量子化ステップ幅stepと量子化幅乗算前ゲイン補正量の候補Δn(m)との積を量子化グローバルゲインg^に加算したものとなるように量子化グローバルゲインを補正することで、量子化グローバルゲインg^とこれに隣接する量子化グローバルゲインの候補との距離、すなわち、量子化ステップ幅に依存した補正を量子化グローバルゲインに対して行うことが可能となる。
[ゲイン補正量符号化処理の第4例の変形例]
 第4例の変形例は、量子化グローバルゲインg^に対応する量子化ステップ幅に依存したゲイン補正量を求め、量子化グローバルゲインg^と、量子化正規化済み信号系列のフレーム内の全てのサンプルの値の二乗和を量子化正規化済み信号系列の区分された範囲内の全てのサンプルの値の二乗和で除算した値をゲイン補正量に乗算した値と、を加算したものを補正ゲインとするか、または、量子化グローバルゲインg^と、量子化正規化済み信号系列のフレーム内のサンプルのエネルギーが所定値より大きいサンプルの個数を上記量子化正規化済み信号系列の区分された範囲内のサンプルのエネルギーが所定値より大きいサンプルの個数で除算した値をゲイン補正量に乗算した値と、を加算したものを補正ゲインとする例である。
 具体的には、例えば、図示しない記憶部に格納しておくゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量の候補Δn(m)の全ての値の絶対値を1/N未満としておく。すなわち、ゲイン補正量コードブックには、量子化幅乗算前ゲイン補正量の候補をΔn(m)として格納しておく。そして、第4例の式(24)に代えて第2例または第3例のs(n)を用いた式(26)により加算値を求め、第4例の式(25)に代えて式(27)によりゲイン補正量符号idxを求める。
Figure JPOXMLDOC01-appb-M000025
 なお、式(27)は誤差が最小となる基準でのベクトル量子化に対応するものであるが、相関が最大となる基準でのベクトル量子化、誤差が最小または相関が最大となる基準でのスカラ量子化などの手法を適用してもよいのは当然のことである。
 第2例または第3例のs(n)の平均値はNである。そこで、例えば、量子化ステップ幅stepと絶対値が1/N未満である量子化幅乗算前ゲイン補正量の候補Δn(m)と平均値がNであるs(n)との積を量子化グローバルゲインg^に加算したものとなるように量子化グローバルゲインを補正することで、量子化グローバルゲインg^をゲイン補正量で補正して得られるゲインが、量子化グローバルゲインg^とこれに隣接する量子化グローバルゲインの候補との間となるようにできる。
 なお、例えば、図示しない記憶部に格納しておくゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量の候補Δn(m) は、学習により生成されることもある。この場合は、量子化幅乗算前ゲイン補正量の候補Δn(m)に1/N未満でないものが含まれる可能性がある。ただし、たとえ量子化幅乗算前ゲイン補正量の候補Δn(m)に1/N未満でないものが含まれていたとしても、量子化ステップ幅stepと量子化幅乗算前ゲイン補正量の候補Δn(m)とs(n)との積を量子化グローバルゲインg^に加算したものとなるように量子化グローバルゲインを補正することで、量子化グローバルゲインg^とこれに隣接する量子化グローバルゲインの候補との距離、すなわち、量子化ステップ幅に依存した補正を量子化グローバルゲインに対して行うことが可能となる。
 なお、符号化装置1から復号装置2へビットストリームを伝送する実施構成に限定されず、例えば、合成部160によって得られた情報を記録媒体に記録し、当該記録媒体から読み出された当該情報が復号装置2に入力される実施構成も許容される。
 第1実施形態の復号装置2(図13参照)は、正規化信号復号部107、グローバルゲイン復号部106、ゲイン補正量復号部230、復号信号系列生成部250、区分部260を含む。復号装置2は必要に応じて分離部210、時間領域変換部270を含んでもよい。
 以下、復号装置2(decoder)での処理を説明する(図14参照)。
 符号化装置1から送信されたビットストリームは復号装置2に入力される。分離部210が、ビットストリームから、正規化信号符号と、グローバルゲイン符号と、ゲイン補正量符号を取り出す。
<正規化信号復号部107>
 正規化信号復号部107には、正規化信号符号が入力される。正規化信号復号部107が、符号化装置1の正規化信号符号化部120が行う符号化方法と対応する復号方法を適用して、正規化信号符号を復号して復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を得る(ステップS1d)。この例では、符号化装置1に対応して説明を行なうため、ωは離散周波数のインデックスを表すものとし、L点の離散周波数の各成分をω=LminからLmaxのそれぞれで表すものとする。正規化信号復号部107は、[背景技術]欄で説明した図1の正規化信号復号部107と同じ動作をする。
<区分部260>
 区分部260が、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を、「各範囲のエネルギーがなるべく等しくなるように区分する基準」で、N個の範囲(ただし、Nは2以上の予め定められた整数である)に区分する(ステップS2d)。既述の説明と整合させると、復号正規化済み信号系列X^Q(ω)の離散周波数インデックスの集合を{Lmin,…,Lmax}として、復号正規化済み信号系列X^Q(ω)[ω∈{Lmin,…,Lmax}]が系列全体Bに相当し、区分部260は、復号正規化済み信号系列X^Q(ω)[ω∈{Lmin,…,Lmax}]をN個の範囲{Bnn=1 N={B1,…,Bn,…,BN}に区分する。この区分処理の詳細は後述する。この区分処理で得られるN個の範囲の全てを特定できる情報である区分情報は復号信号系列生成部250に提供される。
 区分数Nは、符号化装置1の区分部150における区分数Nと共通の値となるように、例えば符号化装置1の区分部150と復号装置2の区分部260とに予め設定されている。
 区分部260が復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]に対して行なう区分処理は、符号化装置1の区分部150が量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]に対して行なう区分処理と同一の処理が行われるように、符号化装置1の区分部150と復号装置2の区分部260との間で予め設定されている。
<区分部260が行なう区分処理の詳細>
 区分部260が復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]に対して行なう区分処理は、符号化装置1の区分部150が量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]に対して行なう区分処理と同一である。すなわち、「各範囲のエネルギーがなるべく等しくなるように区分する基準」での区分処理は、例えば、復号正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、
(a)復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように、
または、
(b)復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和と、復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のnと、が最も近付くように、
または、
(c)復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように、
または、
(d)復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以上となる最小のサンプル数になるように、
または、
(e)復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように、
または、
(f)復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以下となる最大のサンプル数になるように、
求め、
復号正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、復号正規化済み信号系列の第Nの範囲とすることで、復号正規化済み信号系列をN個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を、第1の範囲から順に逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を実現できる。
 区分部260が行なう区分処理の具体例は、符号化装置1の区分部150が行う区分処理の具体例である「区分処理の第1例」から「区分処理の第6例」のそれぞれの具体例中の、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]に置き換えたものである。
<ゲイン補正量復号部230>
 ゲイン補正量復号部230には、ゲイン補正量符号が入力される。ゲイン補正量復号部230は、ゲイン補正量符号を復号して、区分された各範囲に対応するゲイン補正量を得る(ステップS3d)。
 復号正規化済み信号系列がN個の範囲に区分されている場合について説明する。図示しない記憶部には、第1の範囲から第Nの範囲それぞれのゲイン補正量の候補Δ1(m),…,ΔN(m)とこれらのゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δ1(1),…,ΔN(1)とidx(1)との組、Δ1(2),…,ΔN(2)とidx(2)との組、・・・、Δ1(M),…,ΔN(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。記憶部に格納されているゲイン補正量コードブックは、符号化装置1の記憶部に格納されているゲイン補正量コードブックと同一とする。
 ゲイン補正量復号部230は、ゲイン補正量コードブックを参照して、ゲイン補正量コードブック内でゲイン補正量符号idxと同じ符号であるidx(I)と対応付けられている第1の範囲から第Nの範囲の各範囲に対応するゲイン補正量Δ1(I),…,ΔN(I)を得る。
 上記の例はベクトル量子化の復号処理を行なう例であるが、ゲイン補正量復号部230が行う復号処理は、要はゲイン補正量符号化部140が行う符号化処理に対応する処理であれば、ベクトル量子化の復号処理であってもスカラ量子化の復号処理であってもよい。
<グローバルゲイン復号部106>
 グローバルゲイン復号部106には、グローバルゲイン符号が入力される。グローバルゲイン復号部160は、当該グローバルゲイン符号を復号し、復号グローバルゲインg^を出力する(ステップS4d)。グローバルゲイン復号部106が行う復号処理は、グローバルゲイン復号部106が行う復号処理は、グローバルゲイン符号化部105が行う符号化処理に対応する処理であり、[背景技術]欄のグローバルゲイン復号部106でも説明した通りの周知技術である。
<復号信号系列生成部250>
 復号信号系列生成部250には、復号正規化済み信号系列X^Q(ω)と、ゲイン補正量Δn(I)と、復号グローバルゲインg^が入力される。復号信号系列生成部250は、区分部260における<ステップS2d>の処理で得られた範囲ごとに、復号グローバルゲインg^をゲイン補正量Δn(I)で補正して得られる補正ゲインと復号正規化済み信号系列X^Q(ω)の各サンプルの値とを乗算して得られる信号系列を出力信号系列X^(ω)として出力する(ステップS5d)。この出力信号系列X^(ω)は、符号化装置1の入力信号系列X(ω)と対応するものであるので、復号信号系列とも言える。
[復号信号系列生成部の第1例]
 復号信号系列生成処理の第1例は、復号グローバルゲインg^とゲイン補正量とを加算したものを補正ゲインとする例である。
 復号正規化済み信号系列がN個の範囲に区分されている場合について説明する。復号信号系列生成部250には、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]と、ゲイン補正量Δn(I) [n∈{1,…,N}]と、復号グローバルゲインg^と、区分情報が入力される。以下では、区分情報により特定される第nの範囲の最も低域側にあるサンプル番号をL(n-1)、LminをL(0)、LmaxをL(N)-1、として説明する。
 区分部260で得られた第1の範囲から第Nの範囲のそれぞれを第nの範囲とすると、第nの範囲の出力信号系列X^(ω) [ω∈{L(n-1),…,L(n)-1}]は、復号グローバルゲインg^をゲイン補正量Δn(I)で補正して得られる補正ゲインと復号正規化済み信号系列X^Q(ω)の各サンプルの値とを乗算して得られる。すなわち、第nの範囲の出力信号系列X^(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値は、式(28)により得られる。
X^(ω)=(g^+Δn(I))X^Q(ω)     …(28)
 第1の範囲から第Nの範囲の各範囲について式(28)により出力信号系列X^(ω) [ω∈{L(0),…,L(1)-1}]、X^(ω) [ω∈{L(1),…,L(2)-1}]、・・・、X^(ω) [ω∈{L(N-1),…,L(N)-1}]の各サンプルの値を得ることにより、出力信号系列X^(ω) [ω∈{L(0),…,L(N)-1}]、すなわち、X^(ω) [ω∈{Lmin,…,Lmax}]が得られる。
[復号信号系列生成処理の第2例:パワー比の乗算]
 復号信号系列生成処理の第2例は、復号グローバルゲインg^と、復号正規化済み信号系列のフレーム内の全てのサンプルの値の二乗和を復号正規化済み信号系列の区分された範囲内の全てのサンプルの値の二乗和で除算した値をゲイン補正量に乗算した値と、を加算したものを補正ゲインとする例である。
 復号正規化済み信号系列がN個の範囲に区分されている場合について説明する。復号信号系列生成部250には、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]と、ゲイン補正量Δn(I) [n∈{1,…,N}]と、復号グローバルゲインg^と、区分情報が入力される。以下では、区分情報により特定される第nの範囲の最も低域側にあるサンプル番号をL(n-1)、LminをL(0)、LmaxをL(N)-1、区分部260で得られた第1の範囲から第Nの範囲のそれぞれを第nの範囲として説明する。
 まず、第1の範囲から第Nの範囲のそれぞれについて、復号正規化済み信号系列のフレーム内の全てのサンプルX^Q(ω) [ω∈{L(0),…,L(N)-1}]の値の二乗和を復号正規化済み信号系列の区分された範囲内の全てのサンプルX^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の値の二乗和で除算した値をs(n)として求める。s(n)は式(29)で求まる。
Figure JPOXMLDOC01-appb-M000026
 さらに、第1の範囲から第Nの範囲のそれぞれについて、復号グローバルゲインg^と、第nの範囲のゲイン補正量Δn(I)とs(n)との乗算値と、を加算して得られる値と第nの範囲の復号正規化済み信号系列X^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値とを乗算して得られる信号系列を第nの範囲の出力信号系列X^(ω) [ω∈{L(n-1),…,L(n)-1}]とする。すなわち、第nの範囲の出力信号系列X^(ω) [ω∈{L (n-1),…,L(n)-1}]の各サンプルの値は、式(30)により得られる。
X^(ω)=(g^+s(n)Δn(I))X^Q(ω)     …(30)
 第1の範囲から第Nの範囲の各範囲について式(30)により出力信号系列X^(ω) [ω∈{L(0),…,L(1)-1}]、X^(ω) [ω∈{L(1),…,L(2)-1}]、・・・、X^(ω) [ω∈{L(N-1),…,L(N)-1}]の各サンプルの値を得ることにより、出力信号系列X^(ω) [ω∈{L(0),…,L(N)-1}]、すなわち、X^(ω) [ω∈{Lmin,…,Lmax}]が得られる。
[復号信号系列生成処理の第3例:サンプル数の比の乗算]
 復号信号系列生成処理の第3例は、復号グローバルゲインg^と、復号正規化済み信号系列のフレーム内のサンプルのエネルギーが所定値より大きいサンプルの個数を上記復号正規化済み信号系列の区分された範囲内のサンプルのエネルギーが所定値より大きいサンプルの個数で除算した値をゲイン補正量に乗算した値と、を加算したものを補正ゲインとする例である。
 復号正規化済み信号系列がN個の範囲に区分されている場合について説明する。復号信号系列生成部250には、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]と、ゲイン補正量Δn(I) [n∈{1,…,N}]と、復号グローバルゲインg^と、区分情報が入力される。以下では、区分情報により特定される第nの範囲の最も低域側にあるサンプル番号をL(n-1)、LminをL(0)、LmaxをL(N)-1、区分部260で得られた第1の範囲から第Nの範囲のそれぞれを第nの範囲として説明する。
 まず、第1の範囲から第Nの範囲のそれぞれについて、復号正規化済み信号系列の区分された範囲内の全てのサンプルX^Q(ω) [ω∈{L(n-1),…,L(n)-1}]のうちの、エネルギーが所定値より大きいサンプルの個数c(n)を求める。また、c(1)からc(N)の総和を求める。この総和は、復号正規化済み信号系列の全てのサンプルX^Q(ω) [ω∈{L(0),…,L(N)-1}]のうちの、エネルギーが所定値より大きいサンプルの個数である。所定値は、0であっても、0以上の値であってもよく、また、復号グローバルゲインg^と所定の値αとを乗算したものであってもよい。
 次に、第1の範囲から第Nの範囲のそれぞれについて、c(1)からc(N)の総和をc(n)で除算した値をs(n)として求める。s(n)は式(31)で求まる。
Figure JPOXMLDOC01-appb-M000027
 さらに、第1の範囲から第Nの範囲のそれぞれについて、復号グローバルゲインg^と、第nの範囲のゲイン補正量Δn(I)とs(n)との乗算値と、を加算して得られる値と第nの範囲の復号正規化済み信号系列X^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値とを乗算して得られる信号系列を第nの範囲の出力信号系列X^(ω) [ω∈{L(n-1),…,L(n)-1}]とする。すなわち、第nの範囲の出力信号系列X^(ω) [ω∈{L (n-1),…,L(n)-1}]の各サンプルの値は、式(32)により得られる。
X^(ω)=(g^+s(n)Δn(I))X^Q(ω)     (32)
 第1の範囲から第Nの範囲の各範囲について式(32)により出力信号系列X^(ω) [ω∈{L(0),…,L(1)-1}]、X^(ω) [ω∈{L(1),…,L(2)-1}]、・・・、X^(ω) [ω∈{L(N-1),…,L(N)-1}]の各サンプルの値を得ることにより、出力信号系列X^(ω) [ω∈{L(0),…,L(N)-1}]、すなわち、X^(ω) [ω∈{Lmin,…,Lmax}]が得られる。
[復号信号系列生成処理の第4例:量子化ステップ幅の関係]
 復号信号系列生成処理の第4例は、復号グローバルゲインg^に対応する量子化ステップ幅に依存したゲイン補正量を求め、復号グローバルゲインg^とゲイン補正量とを加算したものを補正ゲインとする例である。
 復号正規化済み信号系列がN個の範囲に区分されている場合について説明する。以下では、区分情報により特定される第nの範囲の最も低域側にあるサンプル番号をL(n-1)、LminをL(0)、LmaxをL(N)-1、として説明する。
 図示しない記憶部には、第1の範囲から第Nの範囲それぞれの量子化幅乗算前ゲイン補正量の候補Δ1(m),…,ΔN(m)とこれらの量子化幅乗算前ゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δ1(1),…,ΔN(1)とidx(1)との組、Δ1(2),…,ΔN(2)とidx(2)との組、・・・、Δ1(M),…,ΔN(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。
 復号信号系列生成部250が第4例の復号信号系列生成処理を行う場合は、例えば、図示しない記憶部に格納しておくゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量の候補Δn(m)の全ての値の絶対値を1未満としておく。もちろん、記憶部に格納されているゲイン補正量コードブックは、符号化装置1の記憶部に格納されているゲイン補正量コードブックと同一とする。そして、復号信号系列生成部250が第4例の復号信号系列生成処理を行う場合は、ゲイン補正量復号部230は、ゲイン補正量コードブックを参照して、ゲイン補正量コードブック内でゲイン補正量符号idxと同じ符号であるidx(I)と対応付けられている第1の範囲から第Nの範囲の各範囲に対応する量子化幅乗算前ゲイン補正量Δ1(I),…,ΔN(I)を得る。
 復号信号系列生成部250は、グローバルゲイン復号部106における復号グローバルゲインg^の量子化ステップ幅stepを用いて、第1の範囲から第Nの範囲のそれぞれについて、復号グローバルゲインg^と、第nの範囲の量子化幅乗算前ゲイン補正量Δn(I)と量子化ステップ幅stepとの乗算値と、を加算して得られる値と第nの範囲の復号正規化済み信号系列X^Q(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値とを乗算して得られる信号系列を第nの範囲の出力信号系列X^(ω) [ω∈{L(n-1),…,L(n)-1}]とする。すなわち、第nの範囲の出力信号系列X^(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値は、式(33)により得られる。
X^(ω)=(g^+stepΔn(I))X^Q(ω)     …(33)
 第1の範囲から第Nの範囲の各範囲について式(33)により出力信号系列X^(ω) [ω∈{L(0),…,L(1)-1}]、X^(ω) [ω∈{L (1),…,L(2)-1}]、・・・、X^(ω) [ω∈{L(N-1),…,L(N)-1}]の各サンプルの値を得ることにより、出力信号系列X^(ω) [ω∈{L(0),…,L(N)-1}]、すなわち、X^(ω) [ω∈{Lmin,…,Lmax}]が得られる。
 復号信号系列生成処理の第4例では、復号グローバルゲインg^に対応する量子化ステップ幅stepとは、グローバルゲイン復号部106における復号グローバルゲインと隣接する候補間の差分値である。例えば、この量子化ステップ幅stepと絶対値が1未満であるΔn(I)との積を復号グローバルゲインg^に加算したものとなるように復号グローバルゲインを補正することで、復号グローバルゲインg^をゲイン補正量で補正して得られるゲインが、復号グローバルゲインg^とこれに隣接する復号グローバルゲインの候補との間となるようにできる。
 なお、例えば、図示しない記憶部に格納しておく量子化幅乗算前ゲイン補正量の候補Δn(m) は、学習により生成されることもある。この場合は、量子化幅乗算前ゲイン補正量の候補Δn(m)に1未満でないものが含まれる可能性もある。ただし、たとえ量子化幅乗算前ゲイン補正量の候補Δn(m)に1未満でないものが含まれていたとしても、量子化ステップ幅stepと量子化幅乗算前ゲイン補正量の候補Δn(m)との積を復号グローバルゲインg^に加算したものとなるように復号グローバルゲインを補正することで、復号グローバルゲインg^とこれに隣接する復号グローバルゲインの候補との距離、すなわち、量子化ステップ幅に依存した補正を復号グローバルゲインに対して行うことが可能となる。
[復号信号系列生成処理の第4例の変形例]
 第4例の変形例は、復号グローバルゲインg^に対応する量子化ステップ幅に依存したゲイン補正量を求め、復号グローバルゲインg^と、復号正規化済み信号系列のフレーム内の全てのサンプルの値の二乗和を復号正規化済み信号系列の区分された範囲内の全てのサンプルの値の二乗和で除算した値をゲイン補正量に乗算した値と、を加算したものを補正ゲインとするか、または、復号正規化済み信号系列のフレーム内のサンプルのエネルギーが所定値より大きいサンプルの個数を上記復号正規化済み信号系列の区分された範囲内のサンプルのエネルギーが所定値より大きいサンプルの個数で除算した値をゲイン補正量に乗算した値と、を加算したものを補正ゲインとする例である。
 図示しない記憶部には、第1の範囲から第Nの範囲それぞれの量子化幅乗算前ゲイン補正量の候補Δ1(m),…,ΔN(m)とこれらの量子化幅乗算前ゲイン補正量の候補を特定する符号idx(m)との組がM個(Mは2以上の予め定められた整数)格納されている。具体的には、Δ1(1),…,ΔN(1)とidx(1)との組、Δ1(2),…,ΔN(2)とidx(2)との組、・・・、Δ1(M),…,ΔN(M)とidx(M)との組、がゲイン補正量コードブックとして記憶部に格納されている。
 具体的には、例えば、図示しない記憶部に格納しておくゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量の候補Δn(m)の全ての値の絶対値を1/N未満としておく。もちろん、記憶部に格納されているゲイン補正量コードブックは、符号化装置1の記憶部に格納されているゲイン補正量コードブックと同一とする。そして、復号信号系列生成部250が第4例の変形例の復号信号系列生成処理を行う場合は、ゲイン補正量復号部230は、ゲイン補正量コードブックを参照して、ゲイン補正量コードブック内でゲイン補正量符号idxと同じ符号であるidx(I)と対応付けられている第1の範囲から第Nの範囲の各範囲に対応する量子化幅乗算前ゲイン補正量Δ1(I),…,ΔN(I)を得る。
 そして、第4例の式(33)に代えて第2例または第3例のs(n)を用いた式(34)により第nの範囲の出力信号系列X^(ω) [ω∈{L(n-1),…,L(n)-1}]の各サンプルの値を得る。
X^(ω)=(g^+step s(n) Δn(I))X^Q(ω)     …(34)
 第1の範囲から第Nの範囲の各範囲について式(34)により出力信号系列X^(ω) [ω∈{L(0),…,L(1)-1}]、X^(ω) [ω∈{L (1),…,L(2)-1}]、・・・、X^(ω) [ω∈{L(N-1),…,L(N)-1}]の各サンプルの値を得ることにより、出力信号系列X^(ω) [ω∈{L(0),…,L(N)-1}]、すなわち、X^(ω) [ω∈{Lmin,…,Lmax}]が得られる。
 第2例または第3例のs(n)の平均値はNである。そこで、例えば、量子化ステップ幅stepと絶対値が1/N未満である量子化幅乗算前ゲイン補正量の候補Δn(m)と平均値がNであるs(n)との積を復号グローバルゲインg^に加算したものとなるように復号グローバルゲインを補正することで、復号グローバルゲインg^をゲイン補正量で補正して得られるゲインが、復号グローバルゲインg^とこれに隣接する復号グローバルゲインの候補との間となるようにできる。
 なお、例えば、図示しない記憶部に格納しておくゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量の候補Δn(m) は、学習により生成されることもある。この場合は、量子化幅乗算前ゲイン補正量の候補Δn(m)に1/N未満でないものが含まれる可能性がある。ただし、たとえ量子化幅乗算前ゲイン補正量の候補Δn(m)に1/N未満でないものが含まれていたとしても、量子化ステップ幅stepと量子化幅乗算前ゲイン補正量の候補Δn(m)とs(n)との積を復号グローバルゲインg^に加算したものとなるように復号グローバルゲインを補正することで、復号グローバルゲインg^とこれに隣接する復号グローバルゲインの候補との距離、すなわち、量子化ステップ幅に依存した補正を復号グローバルゲインに対して行うことが可能となる。
<時間領域変換部270>
 必要に応じて備える時間領域変換部270には、出力信号系列X^(ω)が入力される。時間領域変換部270は、出力信号系列X^(ω)に対して周波数-時間変換を適用して、フレーム単位の時間領域信号系列zF(t)を出力する。周波数-時間変換方法は、周波数領域変換部101で用いられた時間-周波数変換方法に対応する逆変換である。上述の例であれば、ここでの周波数-時間変換方法は、IMDCT(Inverse Modified Discrete Cosine Transform)またはIDCT(Inverse Discrete Cosine Transform)である。
《第2実施形態》
 第2実施形態は、ゲイン補正量符号に、正規化信号符号の余剰ビットを用いる形態である。
 正規化信号符号化部120が[背景技術]欄で説明した正規化部102と量子化部103とゲイン制御部104により構成される場合などでは、消費ビット数が規定ビット数より少なくなる場合がある。
 第2実施形態の符号化装置1では、正規化信号符号化部120が、規定ビット数から消費ビット数を減算して得られる余剰ビット数Uをゲイン補正量符号化部140に対して出力するようにする。また、ゲイン補正量符号化部140は、入力された余剰ビット数Uに基づいて、Uビットのゲイン補正量符号を出力するようにする。具体的には、ゲイン補正量符号化部140で用いるゲイン補正量の候補数Mを2Uとし、各ゲイン補正量の候補を特定する符号idx(m)をUビットとすればよい。
 第2実施形態の復号装置2では、正規化信号復号部107が、正規化信号符号のビット数の最大値として規定されている規定ビット数から実際の正規化信号符号のビット数である消費ビット数を減算して得られる余剰ビット数Uをゲイン補正量復号部230に対して出力するようにする。また、ゲイン補正量復号部230は入力されたUビットのゲイン補正量符号を復号できるようにする。具体的には、ゲイン補正量復号部230で用いるゲイン補正量コードブックに含まれるゲイン補正量の候補数Mを2Uとし、各ゲイン補正量の候補を特定する符号idx(m)をUビットとしておき、Uビットのゲイン補正量符号idxと同じ符号であるidx(I)を得られるようにすればよい。
 第2実施形態の符号化装置1及び復号装置2によれば、正規化信号符号のために用意されたものの実際には正規化信号符号には用いられなかったビットをゲイン補正量符号に用いることで、与えられたビットを有効に活用した符号化及び復号を行うことが可能となる。
《第3実施形態》
 第3実施形態は、区分された範囲の数Nに対応する情報を符号化装置1から復号装置2に伝える例である。
 符号化装置1の区分部150は、何らかの基準や区分部150の外から伝えられた情報により区分後の範囲数Nを決定し、区分後の範囲の数がNとなるように区分処理を行う。符号化装置1の区分部150は、区分後の範囲の数であるNを特定できる補助符号も出力する。復号装置2の区分部260には、補助符号が入力され、区分後の範囲の数が補助符号により特定される数Nとなるように、区分処理を行なう。
[実験結果]
 以下の2条件に関するSSNR(Segmental Signal to Noise Ratio)を求めた。
1.[背景技術]欄に記載した従来技術
2.第1実施形態(区分処理は第5例の具体例2、ゲイン補正量符号化処理は第4例の変形例)
[実験条件]
周波数帯域:50 Hzから6.4 kHz
ビットレート:0.8 bit/sample
N:2
M:4
ゲイン補正量の候補:[Δlow(1),Δlow(2),Δlow(3) ,Δlow(4)]=[0, 0.06, 0.14, -0.08],[Δhigh(1),Δhigh(2),Δhigh(3),Δhigh(4)]=[0, -0.06, -0.14, 0.08] 
入力信号系列:音声と楽音の2種類
 表1から、従来技術と比較して、第1実施形態+区分処理と補正処理(第7例)によるとSSNRが平均で約0.16 dB改善したことがわかる。
Figure JPOXMLDOC01-appb-T000028
 以上の各実施形態の他、本発明である符号化装置、符号化方法、復号装置、復号方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
 また、上記符号化装置/上記復号装置における処理機能をコンピュータによって実現する場合、符号化装置/復号装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記符号化装置/上記復号装置における処理機能がコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
 また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
 また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、符号化装置、復号装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (14)

  1.    複数の入力信号サンプルにより構成されるフレーム単位の入力信号系列を符号化する符号化方法において、
       上記入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、上記正規化信号符号に対応する量子化正規化済み信号系列と、を得る正規化信号符号化ステップと、
       上記入力信号系列に対応するゲインである量子化グローバルゲインと、上記量子化グローバルゲインに対応するグローバルゲイン符号と、を得るグローバルゲイン符号化ステップと、
       上記量子化正規化済み信号系列をN個の範囲(Nは2以上の整数)に区分する区分ステップと、
       区分された範囲ごとに上記量子化グローバルゲインをゲイン補正量で補正して得られる補正ゲインと上記量子化正規化済み信号系列の各サンプルの値とを乗算して得られる信号系列と上記入力信号系列との相関が最大又は誤差が最小となる、区分された範囲毎のゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化ステップと
    を有し、
       上記区分ステップは、
     上記量子化正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、
    (a)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、上記量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように、
    または、
    (b)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和と、上記量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のnと、が最も近付くように、
    または、
    (c)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が上記量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように、
    または、
    (d)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が上記量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以上となる最小のサンプル数になるように、
    または、
    (e)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が上記量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように、
    または、
    (f)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が上記量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以下となる最大のサンプル数になるように、
    求め、
     上記量子化正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、上記量子化正規化済み信号系列の第Nの範囲とする
    ことで、上記量子化正規化済み信号系列をN個の範囲に区分する
    ことにより行なわれる
    符号化方法。
  2.    請求項1に記載の符号化方法であって、
       上記補正ゲインは、上記量子化グローバルゲインと上記ゲイン補正量とを加算した値である
    ことを特徴とする符号化方法。
  3.    請求項1に記載の符号化方法であって、
       上記補正ゲインは、上記量子化グローバルゲインと、上記量子化正規化済み信号系列のフレーム内の全てのサンプルの値の二乗和を上記量子化正規化済み信号系列の区分された範囲内の全てのサンプルの値の二乗和で除算した値を上記ゲイン補正量に乗算した値と、を加算した値である
    ことを特徴とする符号化方法。
  4.    請求項1に記載の符号化方法であって、
       上記補正ゲインは、上記量子化グローバルゲインと、上記量子化正規化済み信号系列のフレーム内のサンプルのエネルギーが所定値より大きいサンプルの個数を上記量子化正規化済み信号系列の区分された範囲内のサンプルのエネルギーが上記所定値より大きいサンプルの個数で除算した値をゲイン補正量に乗算した値と、を加算した値である
    ことを特徴とする符号化方法。
  5.    請求項2から請求項4の何れかに記載の符号化方法であって、
       上記ゲイン補正量は、量子化幅乗算前ゲイン補正量の候補が予め格納されたゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量と、上記量子化済みグローバルゲインに対応する量子化ステップ幅と、を乗算して得られる値である
    ことを特徴とする符号化方法。
  6.    フレーム単位の符号を復号して出力信号系列を得る復号方法において、
       上記符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号ステップと、
       上記復号正規化済み信号系列をN個の範囲(Nは2以上の整数)に区分する区分ステップと、
       上記符号に含まれるゲイン補正量符号を復号して上記各範囲に対応するゲイン補正量を得るゲイン補正量復号ステップと、
       上記符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号ステップと、
       上記区分された範囲ごとに、上記復号グローバルゲインを上記ゲイン補正量で補正して得られる補正ゲインと上記復号正規化済み信号系列の各サンプルの値とを乗算して得られる信号系列を出力信号系列とする復号信号系列生成ステップと
    を有し、
       上記区分ステップは、
     上記復号正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、
    (a)上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、上記復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように、
    または、
    (b)上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和と、上記復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のnと、が最も近付くように、
    または、
    (c)上記復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が上記復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように、
    または、
    (d)上記復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が上記復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以上となる最小のサンプル数になるように、
    または、
    (e)上記復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が上記量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように、
    または、
    (f)上記復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が上記復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以下となる最大のサンプル数になるように、
    求め、
     上記復号正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、上記復号正規化済み信号系列の第Nの範囲とする
    ことで、上記復号正規化済み信号系列をN個の範囲に区分する
    ことにより行なわれる
    復号方法。
  7.    請求項6に記載の復号方法であって、
       上記補正ゲインは、上記復号グローバルゲインと上記ゲイン補正量とを加算した値である
    ことを特徴とする復号方法。
  8.    請求項6に記載の復号方法であって、
       上記補正ゲインは、上記復号グローバルゲインと、上記復号正規化済み信号系列のフレーム内の全てのサンプルの値の二乗和を上記復号正規化済み信号系列の区分された範囲内の全てのサンプルの値の二乗和で除算した値を上記ゲイン補正量に乗算した値と、を加算した値である
    ことを特徴とする復号方法。
  9.    請求項6に記載の復号方法であって、
       上記補正ゲインは、上記復号グローバルゲインと、上記復号正規化済み信号系列のフレーム内のサンプルのエネルギーが所定値より大きいサンプルの個数を上記復号正規化済み信号系列の区分された範囲内のサンプルのエネルギーが上記所定値より大きいサンプルの個数で除算した値を上記ゲイン補正量に乗算した値と、を加算した値である
    ことを特徴とする復号方法。
  10.    請求項7から請求項9の何れかに記載の復号方法であって、
       上記ゲイン補正量は、量子化幅乗算前ゲイン補正量の候補が予め格納されたゲイン補正量コードブックに含まれる量子化幅乗算前ゲイン補正量と、上記復号グローバルゲインに対応する量子化ステップ幅と、を乗算して得られる値である
    ことを特徴とする復号方法。
  11.    複数の入力信号サンプルにより構成されるフレーム単位の入力信号系列を符号化する符号化装置であって、
       上記入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、上記正規化信号符号に対応する量子化正規化済み信号系列と、を得る正規化信号符号化部と、
       上記入力信号系列に対応するゲインである量子化グローバルゲインと、上記量子化グローバルゲインに対応するグローバルゲイン符号と、を得るグローバルゲイン符号化部と、
       上記量子化正規化済み信号系列をN個の範囲(Nは2以上の整数)に区分する区分部と、
       区分された範囲ごとに上記量子化グローバルゲインをゲイン補正量で補正して得られる補正ゲインと上記量子化正規化済み信号系列の各サンプルの値とを乗算して得られる信号系列と上記入力信号系列との相関が最大又は誤差が最小となる、区分された範囲毎のゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化部と
    を有し、
       上記区分部は、
     上記量子化正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、
    (a)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、上記量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように、
    または、
    (b)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和と、上記量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のnと、が最も近付くように、
    または、
    (c)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が上記量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように、
    または、
    (d)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が上記量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以上となる最小のサンプル数になるように、
    または、
    (e)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が上記量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように、
    または、
    (f)上記量子化正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記量子化正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が上記量子化正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以下となる最大のサンプル数になるように、
    求め、
     上記量子化正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、上記量子化正規化済み信号系列の第Nの範囲とする
    ことで、上記量子化正規化済み信号系列をN個の範囲に区分するものである、
    符号化装置。
  12.    フレーム単位の符号を復号して出力信号系列を得る復号装置であって、
       上記符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号部と、
       上記復号正規化済み信号系列をN個の範囲(Nは2以上の整数)に区分する区分部と、
       上記符号に含まれるゲイン補正量符号を復号して上記各範囲に対応するゲイン補正量を得るゲイン補正量復号部と、
       上記符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号部と、
       上記区分された範囲ごとに、上記復号グローバルゲインを上記ゲイン補正量で補正して得られる補正ゲインと上記復号正規化済み信号系列の各サンプルの値とを乗算して得られる信号系列を出力信号系列とする復号信号系列生成部と
    を有し、
       上記区分部は、
     上記復号正規化済み信号系列の第nの範囲(nは1からN-1までの各整数)を、
    (a)上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和と、上記復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のnと、が最も近付くように、
    または、
    (b)上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和と、上記復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のnと、が最も近付くように、
    または、
    (c)上記復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が上記復号正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以上となる最小のサンプル数になるように、
    または、
    (d)上記復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が上記復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以上となる最小のサンプル数になるように、
    または、
    (e)上記復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の二乗和が上記量子化正規化済み信号系列の全てのサンプルの値の二乗和のN分のn以下となる最大のサンプル数になるように、
    または、
    (f)上記復号正規化済み信号系列の第1の範囲から第nの範囲までのサンプル数の合計が、上記復号正規化済み信号系列の第1の範囲から第nの範囲までに含まれる全てのサンプルの値の絶対値和が上記復号正規化済み信号系列の全てのサンプルの値の絶対値和のN分のn以下となる最大のサンプル数になるように、
    求め、
     上記復号正規化済み信号系列のうちの第1の範囲から第N-1の範囲以外の範囲を、上記復号正規化済み信号系列の第Nの範囲とする
    ことで、上記復号正規化済み信号系列をN個の範囲に区分するものである、
    復号装置。
  13.    請求項1から請求項5のいずれかに記載の符号化方法の各手順及び/又は請求項6から請求項10のいずれかに記載の復号方法の各手順をコンピュータに実行させるためのプログラム。
  14.    請求項1から請求項5のいずれかに記載の符号化方法の各手順及び/又は請求項6から請求項10のいずれかに記載の復号方法の各手順をコンピュータに実行させるためのプログラムを記録した記録媒体。
PCT/JP2013/052913 2012-02-07 2013-02-07 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 WO2013118834A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013557573A JP5800920B2 (ja) 2012-02-07 2013-02-07 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012024175 2012-02-07
JP2012-024175 2012-02-07

Publications (1)

Publication Number Publication Date
WO2013118834A1 true WO2013118834A1 (ja) 2013-08-15

Family

ID=48947589

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/052913 WO2013118834A1 (ja) 2012-02-07 2013-02-07 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JP5800920B2 (ja)
WO (1) WO2013118834A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
JP2006010817A (ja) * 2004-06-23 2006-01-12 Victor Co Of Japan Ltd 音響信号符号化装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
JP2006010817A (ja) * 2004-06-23 2006-01-12 Victor Co Of Japan Ltd 音響信号符号化装置

Also Published As

Publication number Publication date
JPWO2013118834A1 (ja) 2015-05-11
JP5800920B2 (ja) 2015-10-28

Similar Documents

Publication Publication Date Title
US8548801B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
EP2650878B1 (en) Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
US8665945B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
CN106463134B (zh) 用于对线性预测系数进行量化的方法和装置及用于反量化的方法和装置
JP2022009710A (ja) 高位周波数帯域における検出されたピークスペクトル領域を考慮してオーディオ信号を符号化するオーディオ符号器、オーディオ信号を符号化する方法、及びコンピュータプログラム
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体
WO2011045926A1 (ja) 符号化装置、復号装置およびこれらの方法
US11355131B2 (en) Time-domain stereo encoding and decoding method and related product
JP5800920B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5786044B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5734519B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP6224827B2 (ja) 分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法
JP5320508B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
KR102569784B1 (ko) 오디오 코덱의 장기 예측을 위한 시스템 및 방법
JP5840101B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5738480B2 (ja) 符号化方法、符号化装置、復号方法、復号装置及びプログラム
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
US20100235172A1 (en) Method and an apparatus for processing an audio signal
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体
WO2013129439A1 (ja) 符号化装置、この方法、プログラム及び記録媒体
Zhou et al. A unified framework for ACELP codebook search based on low-complexity multi-rate lattice vector quantization

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13746798

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2013557573

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13746798

Country of ref document: EP

Kind code of ref document: A1