WO2013146895A1 - 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 - Google Patents

符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 Download PDF

Info

Publication number
WO2013146895A1
WO2013146895A1 PCT/JP2013/059024 JP2013059024W WO2013146895A1 WO 2013146895 A1 WO2013146895 A1 WO 2013146895A1 JP 2013059024 W JP2013059024 W JP 2013059024W WO 2013146895 A1 WO2013146895 A1 WO 2013146895A1
Authority
WO
WIPO (PCT)
Prior art keywords
correction amount
signal sequence
gain correction
gain
samples
Prior art date
Application number
PCT/JP2013/059024
Other languages
English (en)
French (fr)
Inventor
勝宏 福井
祐介 日和▲崎▼
登 原田
守谷 健弘
優 鎌本
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2014507961A priority Critical patent/JP5635213B2/ja
Publication of WO2013146895A1 publication Critical patent/WO2013146895A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Definitions

  • the present invention relates to a technique for encoding a sound signal such as speech or music with a small amount of information, and more particularly, to an encoding technique for improving quantization accuracy.
  • Non-Patent Document 1 an outline of an encoding device and a decoding device disclosed in Non-Patent Document 1 is shown in FIG.
  • the quantized value of the global gain (gain that affects the quantization accuracy of the normalized input signal sequence) is calculated in the time domain.
  • the energy of the signal in the time domain is equal to the energy of the signal in the frequency domain, even if the quantized value of the global gain is obtained in the frequency domain, this result is not different from that in the time domain. Therefore, here, a case where the quantized value of the global gain and the decoded value thereof are calculated in the frequency domain is illustrated.
  • the frequency domain transform unit 101 receives an input time domain signal sequence x F (t) in frame units composed of a plurality of consecutive samples included in the time domain input signal x (t).
  • the frequency domain transform unit 101 converts the frequency component at the L point (L is a positive integer, for example, 256) corresponding to the input time domain signal sequence x F (t) of one frame to the input frequency domain signal sequence X ( ⁇ ).
  • L is a positive integer, for example, 256
  • t represents an index of discrete time
  • represents an index of discrete frequency.
  • MDCT Modified Discrete Cosine Transform
  • DCT Discrete Cosine Transform
  • the normalization unit 102 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and an input frequency domain signal sequence X ( ⁇ ) obtained by the gain control unit 104 described later.
  • a gain hereinafter referred to as a global gain
  • g that determines the quantization accuracy of each component of [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is input.
  • the normalization unit 102 divides each component of the input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by the global gain g, or the input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by multiplying each component of [ ⁇ ⁇ 0,..., L-1 ⁇ ] by the reciprocal of the global gain g, respectively.
  • ⁇ ] Is normalized, and a normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is output.
  • the quantizing unit 103 receives the normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ].
  • the quantization unit 103 quantizes the normalized signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] by a predetermined method, and the normalized signal sequence X Q ( ⁇ ) Quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1] which is a series of quantized values of each component of [ ⁇ ⁇ 0,.
  • a normalized signal code that is a code corresponding to the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], and the bits of the normalized signal code Number (hereinafter referred to as the number of consumed bits). Further, when receiving from the gain control unit 104 command information for outputting a quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a normalized signal code Then, the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and the normalized signal code are output.
  • the gain control unit 104 receives the number of consumed bits.
  • the gain control unit 104 adjusts the global gain g so that the number of consumed bits approaches a maximum value that is less than or equal to the number of bits allocated in advance to the normalized signal code (hereinafter referred to as the specified number of bits).
  • the global gain g is output as a new global gain g.
  • a process of increasing the global gain g when the number of consumed bits is larger than the specified number of bits and decreasing the global gain g otherwise can be exemplified.
  • the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0, ..., L-1 ⁇ ] and the normalized signal code are Command information to be output is output to the quantization unit 103.
  • the global gain encoding unit 105 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0. ,..., L-1 ⁇ ] is input.
  • the global gain encoding unit 105 includes an input frequency domain signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and a quantum among a plurality of preset global gain quantization values.
  • the normalized signal code and the global gain code which are output codes of the encoding device, are transmitted to the decoding device and input to the decoding device.
  • a global gain code is input to the global gain decoding unit 106.
  • the global gain decoding unit 106 applies a decoding process corresponding to the encoding process performed by the global gain encoding unit 105 to decode the global gain code, and outputs a decoded global gain g ⁇ .
  • ⁇ Normalized signal decoding unit 107 A normalized signal code is input to the normalized signal decoding unit 107.
  • the normalized signal decoding unit 107 applies a decoding method corresponding to the encoding method performed by the quantization unit 103 of the encoding device, decodes the normalized signal code, and generates a decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] is output.
  • the decoded frequency component calculation unit 108 receives the decoded global gain g ⁇ and the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ].
  • the decoded frequency component calculation unit 108 is obtained by multiplying each component of the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] and the decoded global gain g ⁇ .
  • the sequence is output as a decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ].
  • ⁇ Time domain conversion unit 109 Decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L ⁇ 1 ⁇ ] is input to time domain transform section 109.
  • the time domain transform unit 109 applies a frequency-time transform to the decoded frequency domain signal sequence X ⁇ ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], and outputs an output time domain signal sequence in units of frames.
  • the frequency-time conversion method is an inverse conversion corresponding to the time-frequency conversion method used in the frequency domain conversion unit 101.
  • the frequency-time conversion method here is IMDCT (Inverse Modified Discrete Cosine Transform) or IDCT (Inverse Discrete Cosine Transform).
  • the global gain is adjusted to appropriately control the coarseness of quantization of the normalized signal sequence, so that the number of bits consumed, which is the code amount of the normalized signal code, is the specified number of bits. Control is performed so that the following maximum value is obtained. For this reason, when the number of bits consumed is smaller than the specified number of bits, there is a problem in that the encoding process that makes full use of the number of bits allocated in advance for the normalized signal sequence cannot be performed.
  • an object of the present invention is to provide an encoding technique that improves the quantization accuracy of a normalized signal sequence with a small increase in code amount and a decoding technique thereof.
  • An encoding method is an encoding method for encoding an input signal sequence in units of frames, which includes a plurality of input signal samples, wherein each input signal sample included in the input signal sequence is normalized.
  • a normalized signal encoding step for obtaining a normalized signal code obtained by encoding a sequence based on the received signal and a quantized normalized signal sequence corresponding to the normalized signal code, and a gain corresponding to the input signal sequence
  • a global gain encoding step for obtaining a quantized global gain and a global gain code corresponding to the quantized global gain, and the input first signal sequence is divided into two ranges, and each input divided range Of the first gain corresponding to each of the samples of the first signal series and the second gain obtained by correcting with the gain correction amount corresponding to each divided range.
  • Gain correction amount code for obtaining a gain correction amount code for specifying a gain correction amount corresponding to each divided range in which the correlation between the signal sequence obtained by multiplying and the input signal sequence is maximum or the error is minimum
  • the first gain correction amount encoding step is performed with the quantized normalized signal sequence as the first signal sequence and the quantized global gain as the first gain.
  • a signal sequence corresponding to any one of 2 n ranges obtained by dividing in the 2 n -1th gain correction amount encoding step is defined as a first signal sequence, and the second n-1 in any one range of first 2 n -1 time from times th
  • the second gain obtained by correcting the first gain corresponding to any one range with the gain correction amount specified by the gain correction amount code obtained in the corresponding gain correction amount encoding step is used as the first gain.
  • the gain correction amount encoding step is a range of the number of times that the sum of the number of bits of the gain correction amount code obtained in the gain correction amount encoding step is less than or equal to the number of bits allocated for the gain correction amount code. Executed within.
  • first restoration step the decoded normalized signal sequence and the first signal sequence, which is performed to decode global gain as a first gain, the 2 n th (n is 1 or more Each of the integer) of the 2 n + 1 -1-th restoration step, among the decoded normalized signal sequence, obtained from the 2 n-1 th and divided at the 2 n -1 th restoration step
  • the signal sequence corresponding to any one of the 2 n ranges is the first signal sequence, and corresponds to any one of the 2 n-1 to 2 n -1 times.
  • the second gain corresponding to any one of the ranges obtained in the restoration step is performed as the first gain.
  • FIG. 3 is a block diagram showing an example functional configuration of a gain correction amount encoding unit 140.
  • FIG. The figure for demonstrating the modification 5 of the gain correction amount encoding part 140.
  • FIG. The block diagram which shows the function structural example of the decoding apparatus which concerns on 1st Embodiment.
  • the acoustic signal handled in each embodiment is a signal such as a sound or a sound such as music or a video.
  • the acoustic signal is a time domain signal.
  • the time domain signal may be converted into a frequency domain signal or a frequency domain signal may be converted into a time domain signal by a known technique as necessary. You can also. Therefore, the signal to be encoded may be a time-domain signal or a frequency-domain signal (in the following description, a frequency-domain signal is treated for the sake of concrete explanation).
  • the signal input as the target of the encoding process is a sequence (sample sequence) composed of a plurality of samples, and the encoding process is normally executed in units of frames. I will call it.
  • each component included in the input signal sequence X ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ], the quantized global gain g ⁇ , and the quantized normalized signal The relationship between the components included in the sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] can be expressed by Expression (1).
  • e g is the quantization error between the global gain g and the quantized global gain g ⁇
  • e XQ is the normalized input signal sequence X Q ( ⁇ ) [ ⁇ ⁇ 0, ..., L-1 ⁇ ].
  • Quantization normalized signal sequence X ⁇ Q ( ⁇ ) represents a quantization error between corresponding components (components having the same value of ⁇ ) included in [ ⁇ ⁇ 0, ..., L-1 ⁇ ] .
  • unused bits the remaining one or more bits (hereinafter, referred to as unused bits) is used to reduce the quantization error e g and e XQ. Furthermore, not only unused bits but also one or a plurality of bits prepared in advance for reducing the quantization error may be used.
  • some or all of one or more bits which are prepared in unused bits or pre describes the application of the reduction of the quantization error e g.
  • the one or more bits which are prepared in unused bits or pre can utilize the remaining bits not used to reduce the quantization error e XQ the reduction of the quantization error e g.
  • it may be prepared one or more bits used only for reducing the quantization error e g in advance.
  • available bits in reducing the quantization error e g a "gain correction bits".
  • U be the number of gain correction bits.
  • the entire sequence of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ 0,..., L-1 ⁇ ] is divided into a plurality of ranges.
  • An easily conceivable method for dividing the same signal sequence B into N ranges by the encoding device and the decoding device is to specify a range such as the boundary position of adjacent ranges and the number of components included in each range.
  • information is output from the encoding device.
  • a large number of bits are required to output information specifying the range.
  • the coding apparatus and the decoding apparatus perform classification according to the same standard without using the information specifying the range as the output of the coding apparatus, that is, without consuming bits.
  • the gain correction bits that is, the amount of information for correcting the quantized global gain, are given to each range as evenly as possible, the components of the quantized normalized signal sequence included in each range It is desirable that the amount of information be as uniform as possible.
  • the input signal sequence of the encoding device 1 is an input signal sequence X ( ⁇ that is a frequency component of L points (L is a positive integer, for example, 256) corresponding to the acoustic signal x (t) in units of frames. ) [ ⁇ ⁇ L min ,..., L max ⁇ ]
  • t is an index of discrete time
  • is an index of discrete frequency
  • L min is an index of minimum discrete frequency among frequency components at L point
  • L max is a maximum discrete frequency among frequency components at L point. Represents the index.
  • the frame-wise acoustic signal x (t) itself may be used as the input signal sequence of the encoding device 1, or a residual signal obtained by performing linear prediction analysis on the frame-wise acoustic signal x (t) is encoded. 1 may be used as the input signal sequence, or a frequency component at L point (L is a positive integer, for example, 256) corresponding to the residual signal may be used as the input signal sequence.
  • the encoding device 1 may include a frequency domain transform unit 101 as a preprocessing unit of the encoding device 1 or in the encoding device 1.
  • the frequency domain transform unit 101 generates frequency components at L points (L is a positive integer, for example, 256) corresponding to the time domain acoustic signal x (t) in units of frames, and the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ]
  • MDCT Modified Discrete Cosine Transform
  • DCT Discrete Cosine Transform
  • a residual signal obtained by linear prediction analysis of the time domain acoustic signals in units of frames may be set as x (t).
  • the normalized signal encoding unit 120 encodes a sequence based on a signal obtained by normalizing each component of the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] in units of frames.
  • the quantized signal code and the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] corresponding to the normalized signal code are output (step S1e).
  • the normalization signal encoding unit 120 is realized by, for example, the normalization unit 102, the quantization unit 103, and the gain control unit 104 in FIG. Each of the normalization unit 102, the quantization unit 103, and the gain control unit 104 operates as described in the [Background Art] column.
  • the global gain encoding unit 105 supports a quantized global gain g ⁇ that is a gain corresponding to the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and a quantized global gain g ⁇ .
  • the global gain code to be obtained is obtained (step S2e).
  • the global gain encoding unit 105 also obtains a quantization step width corresponding to the quantized global gain g ⁇ as necessary.
  • the global gain encoding unit 105 operates, for example, as described in the “Background art” column.
  • the global gain coding unit 105 multiplies each component of the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and the gain and obtains a signal.
  • Quantized global gain g ⁇ obtained on the basis of the maximum correlation or minimum error between the sequence and the input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] and this quantization
  • a global gain code corresponding to the global gain may be obtained and output.
  • the quantization step width corresponding to the quantized global gain ⁇ is also the gain correction amount code. Is output to the conversion unit 140.
  • the gain correction amount encoding unit 140 includes, for example, a sorting unit 150, a storage unit 141, an encoding unit 143, and a control unit 170. Further, the gain correction amount encoding unit 140 may include a multiplication unit 144 indicated by a broken line in FIG. An example of the processing flow of the gain correction amount encoding unit 140 is shown in FIG.
  • the gain correction amount encoding unit 140 includes at least a first signal sequence, a first gain, the number U of gain correction bits, and an input signal sequence X ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ]. Entered.
  • the processing of the gain correction amount encoding unit 140 is repeatedly executed according to the number U of gain correction bits, as will be described later (step S4e).
  • the process of the gain correction amount encoding unit 140 that is repeatedly executed specifically means an iterative process by the sorting unit 150 and the encoding unit 143.
  • the first processing of the gain correction amount encoding unit 140 uses the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] as the first signal sequence,
  • the generalized global gain ⁇ circumflex over (g) ⁇ is set as the first gain ⁇ , and the number of gain correction bits U is set as the number of surplus bits u.
  • the gain correction amount encoding unit 140 from the 2 nth time to the 2 n + 1 -1th time is processed by a quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min, ..., L max ⁇ ] among the among the 2 n pieces of range obtained by dividing from the 2 n-1 th in the processing of the 2 n -1-th gain correction amount encoding section 140
  • the signal sequence corresponding to any one of the ranges is set as the first signal sequence
  • the second gain obtained by correcting the first gain corresponding to any one of the ranges with the gain correction amount specified in (1) is executed as the first gain.
  • the control unit 170 determines whether the surplus bit number u is greater than 0 (step S4e1).
  • step S4e1 If it is determined in step S4e1 that the surplus bit number u is not greater than 0, the process of step S4e is terminated.
  • step S4e1 When it is determined in step S4e1 that the surplus bit number u is greater than 0, the control unit 170 determines a range to be subjected to the current process by the gain correction amount encoding unit 140 (step S4e2). .
  • a previous gain correction amount processing of the encoding unit 140 is the 2 n th from the 2 n + 1 -2 th process, from the 2 n-1 th and divided at the 2 n -1 time processing
  • the control unit 170 selects any one of the remaining ranges by the gain correction amount encoding unit 140 as the current range.
  • the range to be processed is [l min , l max ].
  • the previous processing of the gain correction amount encoding unit 140 is the 2 n + 1 ⁇ 1th processing, and is divided into the 2 n ⁇ 1 to 2 n ⁇ 1th processing. If the range is not encoded among the 2 n ranges obtained by does not remain, the controller 170, were obtained from the 2 n th are classified at the 2 n + 1 -1-th process Any one of the 2 n + 1 ranges is set as a range [l min , l max ] that is a target of the current processing by the gain correction amount encoding unit 140.
  • the control unit 170 determines one of the two ranges obtained by the first process as a gain.
  • a range [l min , l max ] that is a target of the current processing by the correction amount encoding unit 140 is set.
  • the range [l min , l max ] is set as the first signal sequence in the current process by the gain correction amount encoding unit 140 and input to the sorting unit 150 and the encoding unit 143.
  • the dividing unit 150 of the gain correction amount encoding unit 140 divides the input first signal sequence into two ranges (step S4e3).
  • the range of the input first signal sequence is expressed as [l min , l max ], and among the divided ranges, the range on the low frequency side is [l min , l mid -1] and the range on the high frequency side Is denoted as [l mid , l max ]. Details of the processing of the sorting unit 150 will be described later.
  • Information about the two divided ranges is transmitted to the encoding unit 143.
  • the encoding unit 143 of the gain correction amount encoding unit 140 corrects the input first gain corresponding to each divided range with the gain correction amount corresponding to each divided range.
  • Gain correction amount for specifying a gain correction amount corresponding to each divided range in which an error between the signal sequence obtained by multiplying the value of each sample of the first signal sequence and the input signal sequence is minimized A code idx is obtained (step S4e4).
  • the error is defined by, for example, the formula (C1).
  • the encoding unit 143 obtains a gain correction amount code idx that satisfies the equation (C2).
  • E is a predetermined integer equal to or greater than 1, and is the maximum number of bits used in one process of the gain correction amount encoding unit 140. That is, E is the maximum number of bits of the gain correction amount code idx obtained by one process of the gain correction amount encoding unit 140.
  • E 2.
  • min (a, b) is a function that outputs a smaller integer among the integers a and b.
  • is the first gain
  • ⁇ + ⁇ low (i) is a second gain obtained by correcting the first gain ⁇ with a gain correction amount ⁇ low (i) corresponding to the low frequency range.
  • ⁇ + ⁇ high (i) is a second gain obtained by correcting the first gain ⁇ with a gain correction amount ⁇ high (i) corresponding to the range on the high frequency side.
  • Each range is associated with a plurality of gain correction amount candidates.
  • These gain correction amount candidates may be stored in the storage unit 141 as a gain correction amount codebook together with a code idx (i) for specifying the gain correction amount candidates ⁇ low (i) and ⁇ high (i). However, it may be obtained by calculation as will be described later.
  • the encoding unit 143 determines the gain correction amount candidates ⁇ low (1), ⁇ low (2),..., ⁇ low (2 E ) corresponding to the low frequency range and the high frequency range.
  • the gain correction amount that minimizes the error defined by the equation (C1) is classified from the gain correction amount candidates ⁇ high (1), ⁇ high (2), ..., ⁇ high (2 E ) corresponding to The gain correction amount code idx for selecting for each range is obtained.
  • the gain correction amount candidate vector ( ⁇ low (i), ⁇ high (i)) is composed of two gain correction amount candidates ⁇ low (i), ⁇ high (i).
  • One example of the processing of 140 is 2 E gain correction amount candidate vectors ( ⁇ low (1), ⁇ high (1)), ( ⁇ low (2), ⁇ high (2)), ..., ( ⁇ low ( 2 E ), ⁇ high (2 E )) is a vector quantization that selects a gain correction amount candidate vector that minimizes the error defined by the equation (C1).
  • a code idx (i) for specifying a gain correction amount code idx that minimizes the error is obtained and output as a gain correction amount code idx.
  • the encoding unit 143 uses 2 Me of codes idx (i) that specify the gain correction amount code idx that minimizes the error defined by the equation (C1). The portion of the Me bits that can distinguish the code idx (i) is output as the gain correction amount code idx.
  • the gain ⁇ + ⁇ low (i) obtained by correcting the first gain ⁇ with the gain correction amount ⁇ low (i) specified by the gain correction amount code idx is the second corresponding to the range [l min , l mid ⁇ 1].
  • the gain ⁇ + ⁇ high (i) obtained by correcting the first gain ⁇ with the gain correction amount ⁇ high (i) specified by the gain correction amount code idx is the second corresponding to the range [l mid , l max ].
  • the controller 170 decrements the number of surplus bits u by the number of consumed bits Me as u ⁇ u-Me (step S4e5). That is, a value obtained by subtracting Me from u is set as a new value of u. Thereafter, the process returns to step S4e1.
  • step S4e1 to step S4e5 is repeated as long as the number of surplus bits u is greater than zero.
  • the processing of the gain correction amount encoding unit 140 is such that the total number of bits of the gain correction amount code idx obtained by the gain correction amount encoding unit 140 is equal to or less than the number of bits allocated for gain correction amount code. It is executed within the range of the number of times.
  • the processing of the gain correction amount encoding unit 140 from the 2 nth time to the 2 n + 1 ⁇ 1 time is performed by the gain correction amount encoding unit 140 from the 2 n ⁇ 1 time to the 2 n ⁇ 1th time.
  • the processing may be performed in order from the lowest frequency range.
  • the absolute value of the gain correction amount candidate in the processing of the gain correction amount encoding unit 140 from the 2 nth time to the 2 n + 1 -1 time is the second value from the 2 n -1 time to the 2 n -1 time.
  • the absolute value of the gain correction amount candidate in the processing of the gain correction amount encoding unit 140 may be smaller.
  • 2 E gain correction amount candidates ⁇ low (corresponding to the low frequency range used in the processing of the gain correction amount encoding unit 140 from the 2 nth time to the 2 n + 1 -1 time time) 1), ⁇ low (2),..., ⁇ E low (2 E ) absolute value and 2 E gain correction amount candidates corresponding to the high frequency range ⁇ high (1), ⁇ high (2), ..., ⁇ high (2 E ) has an absolute value of 2 E corresponding to the low frequency range used in the processing of the gain correction amount encoding unit 140 from the 2 n-1 th to the 2 n -1 th time.
  • Gain correction amount candidates ⁇ low (1), ⁇ low (2), ..., ⁇ low (2 E ) absolute value and 2 E gain correction amount candidates ⁇ high ( 1), ⁇ high (2),..., ⁇ high (2 E ) may be smaller than the absolute value.
  • the gain correction amount candidate vector ( ⁇ low (i), ⁇ high (i)) is assumed to be composed of two gain correction amount candidates ⁇ low (i), ⁇ high (i). It is assumed that the two ranges divided by the sorting unit 150 are associated with two gain correction amount candidates ⁇ low (i) and ⁇ high (i), respectively, constituting the gain correction amount candidate vector. In the above example, ⁇ low (i) is associated with the low frequency range, and ⁇ high (i) is correlated with the high frequency range.
  • an example of the processing of the gain correction amount encoding unit 140 is vector quantization for the input first signal sequence.
  • the gain correction amount candidate vector used in this vector quantization can be generated as follows, for example.
  • the storage unit 141 stores, for example, 2 E normalized gain correction amount candidate vectors, that is, ( ⁇ 1 (1), ⁇ 2 (1)),... ( ⁇ 1 (2 E ), ⁇ 2 (2 E )) Is stored.
  • a vector obtained by multiplying the normalized gain correction amount candidate vector by a predetermined coefficient corresponding to the number of processings of the gain correction amount encoding unit 140 is used in the processing of the gain correction amount encoding unit 140 for the number of times.
  • each of the two values ⁇ 1 (i) and ⁇ 2 (i) constituting the normalized gain correction amount candidate vector ( ⁇ 1 (i), ⁇ 2 (i)) has a gain correction amount code.
  • Vector (step ⁇ 1 (i), step ⁇ 2 ) composed of two values step ⁇ 1 (i) and step ⁇ 2 (i) obtained by multiplying a predetermined coefficient step corresponding to the number of processings of the conversion unit 140.
  • the gain correction amount candidate used in each processing by the gain correction amount encoding unit 140 is stored in the storage unit 141 as a single gain correction amount code book together with a code for specifying the gain correction amount candidate. It may be left.
  • n is an integer greater than or equal to 0
  • ⁇ 2, n (i)) is stored in the storage unit 141 together with a code idx (i) for specifying the gain correction amount candidate vector ( ⁇ 1, n (i), ⁇ 2, n (i)).
  • Gain correction amount candidate vectors ( ⁇ 1,2 (i), ⁇ 2,2 (i)) [i 1,..., 2 E ],..., 2nd nmax to 2 nmax + 1 ⁇ 1
  • the gain correction amount candidates corresponding to the lower frequency range are ⁇ 1, n (i), and the candidate gain correction amount corresponding to the high frequency range is ⁇ 2, n (i).
  • the encoding unit 143 may obtain the gain correction amount code idx that satisfies the equation (C5).
  • s low and s high are defined as the following equations.
  • the sum of the squares of all the sample values of the input first signal sequence [l min , l max ] is the square of the values of all the samples in the low frequency range [l min , l mid ⁇ 1].
  • the value obtained by multiplying the value s low divided by the sum and the gain correction amount ⁇ low (i) corresponding to the low frequency range is used to correct the first gain ⁇ to obtain the second gain ⁇ + s low ⁇ low ( i).
  • the sum of squares of all sample values of the input first signal sequence [l min , l max ] is divided by the sum of squares of values of all samples in the high frequency range [l mid , l max ].
  • c low is the number of samples in which the energy of the samples in the range [l min , l mid ⁇ 1] on the low frequency side is larger than the first predetermined value.
  • c high is the number of samples in which the energy of the samples in the range [l mid , l max ] on the high frequency side is larger than the second predetermined value.
  • c low + c high is the number of samples in which the energy of the input first signal sequence [l min , l max ] is larger than a third predetermined value.
  • the number of samples c low + c high in which the energy of the input first signal sequence [l min , l max ] is larger than the third predetermined value is used, and the low frequency range [l min , l
  • the value s low obtained by dividing the energy of the sample of [ mid -1] by the number c low of the samples larger than the first predetermined value is multiplied by the gain correction amount ⁇ low (i) corresponding to the low frequency range.
  • the first gain ⁇ may be corrected by the value to obtain the second gain ⁇ + s low ⁇ low (i).
  • the number of samples c low + c high in which the energy of the input first signal sequence [l min , l max ] is larger than the third predetermined value is the range [l mid , l max ] on the high frequency side.
  • the first gain ⁇ may be corrected to be the second gain ⁇ + s high ⁇ high (i).
  • the first predetermined value, the second predetermined value, and the third predetermined value may be different from each other, but are preferably the same value.
  • the first predetermined value, the second predetermined value, and the third predetermined value correspond to ⁇ in equation (B2) described later.
  • the first processing of the gain correction amount encoding unit 140 uses the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] as the first signal sequence,
  • the generalized global gain ⁇ is executed as the first gain ⁇ .
  • the division unit 150 divides the first signal sequence into a low frequency range [L min , L mid ⁇ 1] and a high frequency range [L mid , L max ].
  • the low-frequency gain correction amount specified by the gain correction amount code idx is ⁇ low and the high-frequency gain correction amount is ⁇ high
  • the second gain for is ⁇ circumflex over (g) ⁇ + ⁇ low
  • the second gain for the high frequency range [L mid , L max ] is ⁇ circumflex over (g) ⁇ + ⁇ high .
  • the processing of the second gain correction amount encoding unit 140 is performed by processing the low-frequency range [ Q ⁇ ⁇ L min ,..., L max ⁇ ] in the quantized normalized signal sequence X ⁇ Q ( ⁇ ) [ L min , L mid ⁇ 1] is the first signal sequence, and g ⁇ + ⁇ low is the first gain ⁇ .
  • the dividing unit 150 divides the first signal sequence into a low-frequency range [L min , L ′ mid ⁇ 1] and a high-frequency range [L ′ mid , L mid ⁇ 1].
  • the synthesis unit 160 After the processing of the gain correction amount encoding unit 140 is completed, the synthesis unit 160 performs gain correction obtained by the normalized signal code and the gain correction amount encoding unit 140 for each number of times as necessary. A bit stream in which the quantity code idx and the global gain code are collected is output. The bit stream is transmitted to the decoding device 2.
  • the “criteria for classifying so that the energy of each range is as equal as possible” is abbreviated as the first standard
  • the “criteria for classifying so that the number of significant samples included in each range is as equal as possible” is abbreviated as the second standard.
  • the minimum number of samples is at least half the sum of squares of sample values.
  • the sum of the number of samples in the first range of the first signal sequence is the sum of the absolute values of all the samples included in the first range of the first signal sequence. So that the minimum number of samples is 1/2 or more of the absolute value sum of the values of
  • (e) The sum of the number of samples in the first range of the first signal sequence is the sum of squares of the values of all the samples included in the first range of the first signal sequence. So that the maximum number of samples is less than half the sum of squares of the sample value.
  • (f) The sum of the number of samples in the first range of the first signal sequence is the sum of the absolute values of all the samples included in the first range of the first signal sequence. So that the maximum number of samples is less than one half of the absolute value sum of the values of Seeking
  • the first signal sequence is divided into two ranges by setting a range other than the first range in the first signal sequence as the second range of the first signal sequence.
  • the classification process exemplified above is realized by a method of sequentially determining the classification based on the “criteria for classifying so that the energy of each range is as equal as possible” sequentially from the first range. According to the classification process exemplified above, it is possible to realize the classification based on the “standard for classifying the energy in each range so as to be as equal as possible” with a small amount of calculation processing.
  • the first signal sequence was determined by equation (2) X ⁇ Q [ ⁇ ⁇ l min, ..., l max ⁇ ] All samples X ⁇ Q (l min) of, ..., X ⁇ Q (l max ) And the square of the values of all samples X ⁇ Q ( lmin ), ..., X ⁇ Q ( lmid- 1) included in the first range of the first signal sequence In order to minimize the difference from the sum, lmid which is the sample number on the lowest side of the second range is obtained. That is, lmid is obtained by equation (3). Accordingly, the first range is determined as X ⁇ Q [ ⁇ ⁇ l min ,..., L mid ⁇ 1 ⁇ ].
  • the first signal sequence X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information identifying circuit 150 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, number of samples l mid -l min of the first range Alternatively, the number of samples in the second range may be l max ⁇ l mid +1, or anything insofar as it is information that can identify the first range and the second range.
  • the second example of the sorting process based on the first standard corresponds to the above (b).
  • the sorting process of the second example is the same method as the sorting process of the first example, except that “sum of squares” in the sorting process of the first example is replaced with “sum of absolute values”. According to the sorting process of the second example, it is possible to perform the sorting process with a smaller amount of calculation processing than the sorting process of the first example because the square calculation performed in the sorting process of the first example can be omitted.
  • the first range is up to the discrete frequency index ⁇ when p low ⁇ pow / 2 is satisfied for the first time, and the value obtained by adding 1 to the index ⁇ is the lowest range in the second range.
  • FIG. 5 is a flowchart for realizing the above processing.
  • the initial value of the discrete frequency index ⁇ is set to l min
  • the initial value of the low frequency energy p low is set to
  • the value obtained by adding is a new p low .
  • p low ⁇ pow / 2 is satisfied, a value obtained by adding 1 to the index ⁇ of the discrete frequency at that time is output as the index l mid .
  • the first signal sequence X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information identifying circuit 150 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, number of samples l mid -l min of the first range Alternatively, the number of samples in the second range may be l max ⁇ l mid +1, or anything insofar as it is information that can identify the first range and the second range.
  • the fourth example of the sorting process based on the first standard corresponds to the above (d).
  • the sorting process of the fourth example is the same method as the sorting process of the third example, except that “sum of squares” in the sorting process of the third example is replaced with “sum of absolute values”. According to the classification process of the fourth example, it is possible to perform the classification process with a smaller calculation processing amount than the classification process of the third example because the square calculation performed in the classification process of the third example can be omitted.
  • the first range is a discrete frequency obtained by subtracting 1 from the discrete frequency index ⁇ when p low ⁇ pow / 2 is not satisfied for the first time, and the index ⁇ is the lowest in the second range.
  • index l mid which is the sample number on the band side. Accordingly, the first range is determined as X ⁇ Q [ ⁇ ⁇ l min ,..., L mid ⁇ 1 ⁇ ].
  • FIG. 6 is a flowchart for realizing the above processing.
  • the initial value of the discrete frequency index ⁇ is set to l min
  • the initial value of the low frequency energy p low is set to
  • p low ⁇ pow / 2 is the one plus the index of discrete frequency omega as a new omega, energy to p low X ⁇ Q ( ⁇ )
  • the first signal sequence X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • the sixth example of the sorting process based on the first standard corresponds to the above (f).
  • the sorting process of the sixth example is the same method as the sorting process of the fifth example, except that “sum of squares” in the sorting process of the fifth example is replaced with “sum of absolute values”. According to the sorting process of the sixth example, it is possible to perform the sorting process with a smaller calculation processing amount than the sorting process of the fifth example, because the square calculation performed in the sorting process of the fifth example can be omitted.
  • the classification process in “a criterion for classifying so that the number of significant samples included in each range is as equal as possible” includes, for example, the first range of the first signal sequence, (a) Of all samples included in the first range of the first signal sequence, the number of samples whose sample energy is greater than or equal to a predetermined value and all included in the first signal sequence So that the half of the number of samples in which the energy of the sample is greater than or equal to or greater than or equal to the predetermined value is the closest, Or (b) Among all samples included in the first range of the first signal sequence, the number of samples whose absolute value is greater than or equal to a predetermined value and included in the first signal sequence So that the absolute value of all the samples is greater than or equal to a half of the number of samples that are greater than or equal to the predetermined value.
  • All the numbers of samples whose sample energy is greater than or equal to a predetermined value among all samples included in the first range of the first signal sequence are included in the first signal sequence The maximum number of samples in which the energy of the samples is less than one half of the number of samples whose sample energy is greater than or equal to or greater than a predetermined value.
  • the number of samples whose absolute value is greater than or equal to a predetermined value is included in the first signal sequence. Among all samples, the absolute value of the sample is greater than the predetermined value or the maximum number of samples that is less than or equal to one half of the number of samples that is greater than or equal to the predetermined value. Seeking The first signal sequence is divided into two ranges by setting a range other than the first range in the first signal sequence as the second range of the first signal sequence.
  • the classification process exemplified above realizes the classification based on the “criteria for classifying so that the number of significant samples included in each range is as equal as possible” by a method of sequentially determining each range. . According to the classification process exemplified above, it is possible to realize classification according to “a criterion for classifying so that the number of significant samples included in each range is as equal as possible” with a small amount of calculation processing.
  • first signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l max ⁇ ] Segment target X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min, ..., l mid - 1 ⁇ ] and X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l mid ,..., L max ⁇ ]
  • the first range is the low range and the second range This is an example of determining lmid which is a sample number on the lowest side of the second range as information representing the boundary with the high range.
  • f count ( ⁇ ) is determined for each index ⁇ by the equation (B2).
  • the f count ( ⁇ ) for each index ⁇ includes the energy of the sample corresponding to the index ⁇ of the first signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min ,..., L max ⁇ ]
  • 1 is set as information indicating that “the sample energy
  • “ 0 is set as information indicating that the sample energy
  • the predetermined value is arbitrarily set to a minute amount ⁇ ( ⁇ is a value of 0 or more).
  • the first signal sequence X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • Sorting information identifying circuit 150 outputs may be a l mid, may be a value obtained by calculating the predetermined value in l mid, sample number of the first range l mid -1-l It may be min +1, the number of samples in the second range l max -l mid +1, or anything that can identify the first range and the second range. Good.
  • a second example of the sorting process based on the second standard corresponds to the above (b).
  • 2 ” in the classification process of the first example is replaced with “absolute value of sample
  • This is the same method as the sorting process in the first example.
  • it is possible to perform the sorting process with a smaller amount of calculation processing than the sorting process of the first example because the square calculation performed in the sorting process of the first example can be omitted.
  • f count ( ⁇ ) is determined for each index ⁇ by the equation (B2).
  • the first range is determined as X ⁇ Q [ ⁇ ⁇ l min ,..., L mid ⁇ 1 ⁇ ].
  • the first signal sequence X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • the fourth example of the sorting process based on the second standard corresponds to the above (d).
  • 2 ” in the classification process of the third example is replaced with “absolute value of sample
  • the first signal sequence X ⁇ Q [ ⁇ ⁇ l min ,..., L max ⁇ ] is divided into two ranges.
  • combination part 160 is recorded on a recording medium, and the said information read from the said recording medium Is also allowed to be input to the decoding device 2.
  • the decoding device 2 (see FIG. 13) of the first embodiment includes a normalized signal decoding unit 107, a global gain decoding unit 106, a restoration unit 250, and an integration unit 290.
  • the decoding device 2 may include a separation unit 210 and a time domain conversion unit 270 as necessary.
  • ⁇ Normalized signal decoding unit 107 A normalized signal code is input to the normalized signal decoding unit 107.
  • the normalized signal decoding unit 107 applies a decoding method corresponding to the encoding method performed by the normalized signal encoding unit 120 of the encoding device 1 to decode the normalized signal code and decode the normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] is obtained (step S1d).
  • represents an index of discrete frequency
  • the normalized signal decoding unit 107 performs the same operation as the normalized signal decoding unit 107 of FIG. 1 described in the “Background Art” column.
  • the processing of the first restoration unit 250 uses the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] as the first signal sequence, and sets the decoded global gain g ⁇ . This is executed as the first gain ⁇ .
  • Each processing of the reconstruction unit 250 from the 2n- th time to the 2n + 1 -th time is represented by a decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] corresponds to any one of the 2 n ranges obtained by the division in the processing of the 2 n-1 th to 2 n -1 th restoration unit 250.
  • the second gain corresponding to one range is performed as the first gain.
  • the second gain obtained by correcting the first gain with the gain correction amount corresponding to the low frequency range [l min , l mid -1] corresponds to the first gain corresponding to the range [l min , l mid -1]. 2 gain.
  • the second gain obtained by correcting the first gain with the gain correction amount corresponding to the high frequency range [l mid , l max ] becomes the second gain corresponding to the range [l mid , l max ]. .
  • Each range is associated with a plurality of gain correction amount candidates.
  • These gain correction amount candidates are specified as gain correction amount candidate vectors ( ⁇ low (i), ⁇ high (i)), and the gain correction amount candidate vectors ( ⁇ low (i), ⁇ high (i)) are specified. Is stored in the storage unit 251 as a gain correction amount code book.
  • the gain correction amount candidate vector ( ⁇ low (i), ⁇ high (i)) may be obtained by calculation as described later.
  • the gain correction amount candidate vector can be generated as follows, for example.
  • the storage unit 141 stores, for example, 2 E normalized gain correction amount candidate vectors, that is, ( ⁇ 1 (1), ⁇ 2 (1)),... ( ⁇ 1 (2 E ), ⁇ 2 (2 E )) Is stored.
  • the gain correction amount from the 2 n th used in the processing of the 2 n + 1 -1-th recovery unit 250 candidate vectors ( ⁇ 1, n (i) , ⁇ 2, n (i)) and
  • the absolute values of the constituent gain correction amount candidates ⁇ 1, n (i), ⁇ 2, n (i) are used in the processing of the restoration unit 250 from the 2 n -1 th to the 2 n -1 th time.
  • the gain correction amount candidate vectors ( ⁇ 1, n (i), ⁇ 2, n (i)) used in the processing of the restoration unit 250 from the 2 n th to the 2 n +1 -1 times are: Gain correction amount candidate vectors ( ⁇ 1, n (i), ⁇ 2, n (i)) for two ranges divided in the processing of the restoration unit 250 from the 2 n th time to the 2 n +1 -1 time. That's it.
  • the gain correction amount candidate corresponding to the low frequency range is ⁇ 1, n (i)
  • the gain correction amount candidate corresponding to the high frequency range is ⁇ 2, n (i).
  • the sum of squares of all sample values of the input first signal sequence [l min , l max ] is divided by the sum of squares of values of all samples in the high frequency range [l mid , l max ].
  • the value obtained by multiplying the obtained value s high by the gain correction amount ⁇ high (i) corresponding to the high frequency range specified by the gain correction amount code idx is used to correct the first gain ⁇ and to obtain the second gain ⁇ . It may be + s high ⁇ high (i).
  • the number of samples c low + c high in which the energy of the input first signal sequence [l min , l max ] is larger than the third predetermined value is the range [l min , l mid ⁇ 1]
  • the first gain ⁇ may be corrected to be the second gain ⁇ + s low ⁇ low (i).
  • the number of samples c low + c high in which the energy of the input first signal sequence [l min , l max ] is larger than the third predetermined value is the range [l mid , l max ] on the high frequency side.
  • the first gain ⁇ may be corrected to be the second gain ⁇ + s high ⁇ high (i).
  • c low is the number of samples in which the energy of the samples in the range [l min , l mid ⁇ 1] on the low frequency side is larger than the first predetermined value.
  • c high is the number of samples in which the energy of the samples in the range [l mid , l max ] on the high frequency side is larger than the second predetermined value.
  • c low + c high is the number of samples in which the energy of the input first signal sequence [l min , l max ] is larger than a third predetermined value.
  • the first predetermined value, the second predetermined value, and the third predetermined value may be different from each other, but are preferably the same value.
  • the first predetermined value, the second predetermined value, and the third predetermined value correspond to ⁇ in equation (B2).
  • the number of bits U allocated for the gain correction amount code is 4, and each of the gain correction amount code idx and the range [L min , L] corresponding to the range [L min , L max ] represented by 2 bits. Assume that a gain correction amount code idx corresponding to L mid ⁇ 1] is input.
  • the processing of the first reconstruction unit 250 uses the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ] as the first signal sequence, and the quantized global gain g ⁇ . Is executed as the first gain.
  • the division unit 260 of the restoration unit 250 divides the first signal sequence into a low frequency range [L min , L mid ⁇ 1] and a high frequency range [L mid , L max ].
  • the restoration unit 250 decodes the gain correction amount code idx corresponding to the range [L min , L max ], and performs a low-frequency gain correction amount ⁇ low (R1234) and a high-frequency gain correction amount ⁇ high (R1234 ) And get.
  • Recovery unit 250 a first gain g ⁇ corrected with the lower-frequency side of the gain correction amount ⁇ low (R1234), lower frequency range [L min, L mid -1] second gain corresponding to g ⁇ + delta obtain low (R1234).
  • the restoration unit 250 corrects the first gain with the high-frequency gain correction amount ⁇ high (R1234), and the second gain g ⁇ + ⁇ high corresponding to the high-frequency range [L mid , L max ]. (R1234) is obtained.
  • R1234 ranges [L min, L max]
  • R12 is the range [L min, L mid -1] described below
  • R34 is assumed to be the range [L mid, L max] which will be described later.
  • the processing of the second restoration unit 250 is performed by the low-frequency range [L min , L mid of the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ].
  • ⁇ 1] is the first signal sequence
  • g ⁇ + ⁇ low (R1234) is the first gain.
  • the dividing unit 260 of the restoration unit 250 divides the first signal sequence into a low frequency range [L min , L ′ mid ⁇ 1] and a high frequency range [L ′ mid , L mid ⁇ 1]. .
  • the restoration unit 250 decodes the gain correction amount code idx corresponding to the range [L min , L mid ⁇ 1] to obtain the low-frequency gain correction amount ⁇ low (R12) and the high-frequency gain correction amount ⁇ high. (R12) is obtained.
  • the restoration unit 250 corrects the first gain g ⁇ + ⁇ low (R1234) with the low-frequency gain correction amount ⁇ low (R12) to obtain the low-frequency range [L min , L ′ mid ⁇ 1]. to give the corresponding second gain g ⁇ + ⁇ low (R1234) + ⁇ low (R12).
  • the restoration unit 250 corrects the first gain g ⁇ + ⁇ low (R1234) with the high-frequency gain correction amount ⁇ high (R12), and the high-frequency range [L ′ mid , L mid ⁇ 1 ], The second gain g ⁇ + ⁇ high (R1234) + ⁇ high (R12) is obtained.
  • the second gain obtained by the last processing of the restoration unit 250 for the range [L ′ mid , L mid ⁇ 1] is g ⁇ + ⁇ low (R1234) + ⁇ high (R12). Therefore, the integration unit 290 determines each sample value for the range [L ′ mid , L mid ⁇ 1] in the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,..., L max ⁇ ]. those obtained by multiplying the first of Toko second gain g ⁇ + ⁇ low (R1234) + ⁇ high (R12), the range [L 'mid, L mid -1 ] and the output signal sequence of about.
  • the second gain obtained by the last processing of the restoration unit 250 for the range [L mid , L max ] is g ⁇ + ⁇ high (R1234). Therefore, integrating unit 290, decodes the normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min, ..., L max ⁇ ] range of [L mid, L max] and each sample value of the first
  • the product of 2 gains g ⁇ + ⁇ high (R1234) is used as the output signal sequence for the range [L mid , L max ].
  • the sorting process performed on the first signal sequence to which the sorting unit 260 is input is the same as the sorting process performed on the first signal sequence to which the sorting unit 150 of the encoding device 1 is input.
  • the classification process based on the “criteria for classifying the energy of each range to be as equal as possible” includes, for example, the first range of the first signal sequence, (a) The sum of squares of the values of all samples included in the first range of the first signal series and the half of the sum of squares of the values of all samples of the first signal series are closest. like, Or (b) The absolute value sum of the values of all the samples included in the first range of the first signal sequence and one half of the absolute value sum of the values of all the samples of the first signal sequence are: As you get closer, Or (c) The number of samples in the first range of the first signal sequence is equal to the sum of squares of the values of all samples included in the first range of the first signal sequence.
  • the minimum number of samples is at least half of the sum of squares of values.
  • the number of samples in the first range of the first signal sequence is the sum of the absolute values of the values of all the samples included in the first range of the first signal sequence. So that the minimum number of samples is at least half the absolute sum of the values of
  • (e) The number of samples in the first range of the first signal sequence is equal to the sum of squares of the values of all samples included in the first range of the first signal sequence. So that the maximum number of samples is less than half of the sum of squares of values.
  • the number of samples from the first range to the n-th range of the first signal sequence is the first sum of absolute values of the values of all samples included in the first range of the first signal sequence.
  • the first signal sequence is divided into two ranges by setting a range other than the first range in the first signal sequence as the second range of the first signal sequence.
  • the classification process exemplified above is realized by a method of sequentially determining the classification based on the “criteria for classifying so that the energy of each range is as equal as possible” sequentially from the first range. According to the classification process exemplified above, it is possible to realize the classification based on the “standard for classifying the energy in each range so as to be as equal as possible” with a small amount of calculation processing.
  • the classification process in “a criterion for classifying so that the number of significant samples included in each range is as equal as possible” includes, for example, the first range of the first signal sequence, (a) Of all the samples included in the first range of the first signal sequence, the number of samples whose sample energy is greater than or equal to a predetermined value and all included in the first signal sequence So that the half of the number of samples in which the energy of the sample is greater than or equal to or greater than or equal to the predetermined value is the closest, Or (b) Among all samples included in the first range of the first signal sequence, the number of samples whose absolute value is greater than or equal to a predetermined value and included in the first signal sequence So that the absolute value of all the samples is greater than or equal to a half of the number of samples that are greater than or equal to the predetermined value.
  • the number of samples whose sample energy is greater than or equal to a predetermined value among all samples included in the first range of the first signal sequence is included in the first signal sequence.
  • (f) The number of samples whose absolute value of samples is greater than or equal to a predetermined value among all samples included in the first range of the first signal sequence is included in the first signal sequence Among all samples, the absolute value of the sample is greater than the predetermined value or the maximum number of samples that is less than or equal to one half of the number of samples that is greater than or equal to the predetermined value. Seeking This is performed by dividing the first signal sequence into one range by setting a range other than the first range of the first signal sequence as the second range of the first signal sequence.
  • the classification process exemplified above realizes the classification based on the “criteria for classifying so that the number of significant samples included in each range is as equal as possible” by a method of sequentially determining each range. . According to the classification process exemplified above, it is possible to realize classification according to “a criterion for classifying so that the number of significant samples included in each range is as equal as possible” with a small amount of calculation processing.
  • a specific example of the sorting process performed by the sorting unit 260 is a specific example of the sorting process performed by the sorting unit 150 of the encoding device 1 to “a first example of a sorting process based on the first criterion” to “a sorting based on the first criterion”.
  • Quantization normalized signal sequence X in each of the specific examples of “sixth example of processing”, “first example of segmentation processing based on second criterion” to “sixth example of segmentation processing based on second criterion” ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min , ..., l max ⁇ ] is replaced with the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ l min , ..., l max ⁇ ] .
  • ⁇ Integration unit 290 obtains the second gain obtained by the processing of the decoding unit 250 performed for each range in the frame and the decoded normalized signal sequence X ⁇ Q ( ⁇ ) [ ⁇ ⁇ L min ,. , L max ⁇ ] is multiplied by each sample value to obtain an output signal sequence (step S6d).
  • the output signal sequence X ⁇ ( ⁇ ) is transmitted to the time domain conversion unit 270 as necessary.
  • the output signal sequence X ⁇ ( ⁇ ) is input to the time domain conversion unit 270 provided as necessary.
  • the time domain transform unit 270 applies a frequency-time transform to the output signal sequence X ⁇ ( ⁇ ) and outputs a time domain signal sequence z F (t) in units of frames.
  • the frequency-time conversion method is an inverse conversion corresponding to the time-frequency conversion method used in the frequency domain conversion unit 101.
  • the frequency-time conversion method here is IMDCT (Inverse Modified Discrete Cosine Transform) or IDCT (Inverse Discrete Cosine Transform).
  • Second Embodiment >> In the second embodiment, the remaining bits of the normalized signal code are used for the gain correction amount code idx.
  • the number of consumed bits may be smaller than the specified number of bits. is there.
  • the normalized signal encoding unit 120 uses the gain correction amount encoding unit 140 to calculate the number of gain correction bits U obtained by subtracting the number of consumed bits from the specified number of bits. Output. Further, the gain correction amount encoding unit 140 outputs a U-bit gain correction amount code idx based on the input number U of gain correction bits.
  • the normalized signal decoding unit 107 uses the consumption bits that are the number of bits of the actual normalized signal code from the specified number of bits defined as the maximum value of the number of bits of the normalized signal code.
  • the number U of gain correction bits obtained by subtracting the number is output to the gain correction amount decoding unit 230.
  • the gain correction amount decoding unit 230 can decode the input U-bit gain correction amount code idx.
  • bits that are prepared for the normalized signal code but are not actually used for the normalized signal code are used as the gain correction amount code idx. As a result, it is possible to perform encoding and decoding using the given bits effectively.
  • the encoding device, the encoding method, the decoding device, and the decoding method according to the present invention are not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention. Is possible.
  • the processing described in the above embodiment may be executed not only in time series according to the order of description but also in parallel or individually as required by the processing capability of the apparatus that executes the processing. .
  • the processing functions in the encoding device / decoding device are realized by a computer
  • the processing contents of the functions that the encoding device / decoding device should have are described by a program.
  • the processing functions of the encoding device / decoding device are realized on the computer.
  • the program describing the processing contents can be recorded on a computer-readable recording medium.
  • a computer-readable recording medium for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
  • the encoding device and the decoding device are configured by executing a predetermined program on the computer.
  • at least a part of the processing contents may be realized by hardware. Good.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 符号化方法は、入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、正規化信号符号に対応する量子化正規化済み信号系列とを得る正規化信号符号化処理と、入力信号系列に対応する量子化グローバルゲインと、量子化グローバルゲインに対応するグローバルゲイン符号とを得るグローバルゲイン符号化処理と、入力された第1の信号系列を2つの範囲に区分し、入力された各区分された範囲に対応する第1ゲインを各区分された範囲に対応するゲイン補正量で補正して得られる第2ゲインと第1の信号系列の各サンプルの値とを乗算して得られる信号系列と入力信号系列との相関が最大又は誤差が最小となる各区分された範囲に対応するゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化処理とを有する。余剰ビットの数uが0になるまで、ゲイン補正量の符号化処理を繰り返す。

Description

符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
 本発明は、音声や音楽などの音響信号を少ない情報量で符号化するための技術に関し、より詳しくは、量子化精度を向上させる符号化技術に関する。
 現在、音声や音楽などの音響信号を離散化したディジタルの入力信号を高能率に符号化する技術として、例えば、入力信号に含まれる5から200ms程度の一定間隔の各区間(フレーム)の入力信号系列を処理対象として、1フレームの入力信号系列に時間-周波数変換を適用して得られた周波数領域信号を符号化することが知られている。このような従来技術のうち、非特許文献1に開示されている符号化装置と復号装置の概要を図1に示す。
 なお、非特許文献1によるとグローバルゲイン(正規化された入力信号系列の量子化精度に影響を及ぼすゲイン)の量子化値は時間領域で計算されている。しかし、時間領域における信号のエネルギーと周波数領域における信号のエネルギーは等しいため、グローバルゲインの量子化値を周波数領域で求めてもこの結果は時間領域におけるそれと異ならない。したがって、ここでは、グローバルゲインの量子化値およびその復号値を周波数領域で計算する場合を例示する。
 以下、符号化装置での処理を説明する。
 <周波数領域変換部101>
 周波数領域変換部101には、時間領域の入力信号x(t)に含まれる連続する複数サンプルからなるフレーム単位の入力時間領域信号系列xF(t)が入力される。周波数領域変換部101は、1フレームの入力時間領域信号系列xF(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分を入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]として出力する。ここで、tは離散時間のインデックス、ωは離散周波数のインデックスを表す。時間-周波数変換方法として、例えばMDCT(Modified Discrete Cosine Transform)またはDCT(Discrete Cosine Transform)を用いることができる。
 <正規化部102>
 正規化部102には、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と、後述するゲイン制御部104で求められた入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分の量子化精度を決定するゲイン(以下、グローバルゲインという)gが入力される。正規化部102は、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分をグローバルゲインgでそれぞれ除することによって、もしくは入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の各成分にグローバルゲインgの逆数をそれぞれ乗ずることによって、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]の正規化を行い、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]を出力する。
 <量子化部103>
 量子化部103には、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]が入力される。量子化部103は、事前に定められた方法で正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]の量子化を行い、正規化済み信号系列XQ(ω) [ω∈{0,…,L-1}]の各成分の量子化値による系列である量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]、および量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に対応する符号である正規化信号符号を生成し、正規化信号符号のビット数(以下、消費ビット数という)を出力する。また、ゲイン制御部104から、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する指令情報を受けた場合には、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する。
 <ゲイン制御部104>
 ゲイン制御部104には、消費ビット数が入力される。ゲイン制御部104は、消費ビット数が正規化信号符号に対して事前に割り当てられたビット数(以下、規定ビット数という)以下の最大値に近づくようにグローバルゲインgを調整し、調整後のグローバルゲインgを新たなグローバルゲインgとして出力する。グローバルゲインgの調整の一例として、消費ビット数が規定ビット数より大きい場合にはグローバルゲインgを大きくし、そうでなければグローバルゲインgを小さくする処理を例示できる。消費ビット数が規定ビット数以下の最大値となった場合には、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]と正規化信号符号を出力する指令情報を量子化部103に対して出力する。
 <グローバルゲイン符号化部105>
 グローバルゲイン符号化部105には、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]が入力される。グローバルゲイン符号化部105は、予め設定されたグローバルゲインの量子化値の複数の候補のうち、入力周波数領域信号系列X(ω) [ω∈{0,…,L-1}]と、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の各成分とグローバルゲインの量子化値の候補との乗算値による系列と、の間の相関が最大または誤差が最小となるグローバルゲインの量子化値の候補g^に対応する符号をグローバルゲイン符号として出力する。
 符号化装置の出力符号である正規化信号符号とグローバルゲイン符号は、復号装置に向けて送信され、復号装置に入力される。
 以下、復号装置での処理を説明する。
 <グローバルゲイン復号部106>
 グローバルゲイン復号部106には、グローバルゲイン符号が入力される。グローバルゲイン復号部106は、グローバルゲイン符号化部105が行う符号化処理に対応する復号処理を適用して当該グローバルゲイン符号を復号し、復号グローバルゲインg^を出力する。
 <正規化信号復号部107>
 正規化信号復号部107には、正規化信号符号が入力される。正規化信号復号部107は、符号化装置の量子化部103で行われる符号化方法と対応する復号方法を適用して当該正規化信号符号を復号し、復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]を出力する。
 <復号周波数成分計算部108>
 復号周波数成分計算部108には、復号グローバルゲインg^と復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]が入力される。復号周波数成分計算部108は、復号正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の各成分と復号グローバルゲインg^とをそれぞれ乗算して得られる系列を復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]として出力する。
 <時間領域変換部109>
 時間領域変換部109には、復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]が入力される。時間領域変換部109は、復号周波数領域信号系列X^(ω) [ω∈{0,…,L-1}]に対して周波数-時間変換を適用して、フレーム単位の出力時間領域信号系列zF(t)を出力する。周波数-時間変換方法は、周波数領域変換部101で用いられた時間-周波数変換方法に対応する逆変換である。上述の例であれば、ここでの周波数-時間変換方法は、IMDCT(Inverse Modified Discrete Cosine Transform)またはIDCT(Inverse Discrete Cosine Transform)である。
Guillaume Fuchs, Markus Multrus, Max Neuendorf and Ralf Geiger, "MDCT-BASED CODER FOR HIGHLY ADAPTIVE SPEECH AND AUDIO CODING," 17th European Signal Processing Conference (EUSIPCO 2009), Glasgow, Scotland, August 24-28, 2009.
 上述のような符号化方法では、グローバルゲインを調整して正規化済み信号系列の量子化の粗さを適宜制御し、このことによって正規化信号符号の符号量である消費ビット数が規定ビット数以下の最大値となるように制御を行っている。このため、規定ビット数より消費ビット数が小さい場合は、正規化済み信号系列のために事前に割り当てられたビット数を十分に生かした符号化処理を行えていないという問題がある。
 このような状況に鑑みて、本発明は、正規化済み信号系列の量子化精度を少ない符号量の増加で改善する符号化技術とその復号技術を提供することを目的とする。
 本発明の一態様による符号化方法は、複数の入力信号サンプルにより構成される、フレーム単位の入力信号系列を符号化する符号化方法において、入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、正規化信号符号に対応する量子化正規化済み信号系列とを得る正規化信号符号化ステップと、入力信号系列に対応するゲインである量子化グローバルゲインと、量子化グローバルゲインに対応するグローバルゲイン符号とを得るグローバルゲイン符号化ステップと、入力された第1の信号系列を2つの範囲に区分し、入力された各区分された範囲に対応する第1ゲインを各区分された範囲に対応するゲイン補正量で補正して得られる第2ゲインと第1の信号系列の各サンプルの値とを乗算して得られる信号系列と入力信号系列との相関が最大又は誤差が最小となる各区分された範囲に対応するゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化ステップと、を有し、第1回目のゲイン補正量符号化ステップは、量子化正規化済み信号系列を第1の信号系列とし、量子化グローバルゲインを第1ゲインとして行われるものであり、第2n回目(nは1以上の整数)から第2n+1-1回目のゲイン補正量符号化ステップのそれぞれは、量子化正規化済み信号系列のうち、第2n-1回目から第2n-1回目のゲイン補正量符号化ステップで区分して得られた2個の範囲のうちの何れか1つの範囲に対応する信号系列を第1の信号系列とし、第2n-1回目から第2n-1回目のうちの何れか1つの範囲に対応するゲイン補正量符号化ステップで得られたゲイン補正量符号で特定されるゲイン補正量で何れか1つの範囲に対応する第1ゲインを補正して得られる第2ゲインを第1ゲインとして行われるものであり、ゲイン補正量符号化ステップは、ゲイン補正量符号化ステップで得られたゲイン補正量符号のビット数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行される。
 本発明の一態様による復号方法は、フレーム単位の符号を復号して出力信号系列を得る復号方法において、符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号ステップと、符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号ステップと、入力された第1の信号系列を2つの範囲に区分し、符号に含まれるゲイン補正量符号を復号して各区分された範囲に対応するゲイン補正量を得て、入力された第1ゲインを各ゲイン補正量で補正して得られる第2ゲインを求める復元ステップと、を有し、第1回目の復元ステップは、復号正規化済み信号系列を第1の信号系列とし、復号グローバルゲインを第1ゲインとして行われるものであり、第2n回目(nは1以上の整数)から第2n+1-1回目の復元ステップのそれぞれは、復号正規化済み信号系列のうち、第2n-1回目から第2n-1回目の復元ステップで区分して得られた2n個の範囲のうちの何れか1つの範囲に対応する信号系列を第1の信号系列とし、第2n-1回目から第2n-1回目のうちの何れか1つの範囲に対応する復元ステップで得られた何れか1つの範囲に対応する第2ゲインを第1ゲインとして行われるものであり、復元ステップは、復号したゲイン補正量符号のビット数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、フレーム内の各範囲についての最後に行なわれた復元ステップで得られた第2ゲインと復号正規化済み信号系列の各サンプル値とを乗算したものを出力信号系列として得る統合ステップを更に有する、復号方法。
 符号を要することなく符号化側と復号側で同一の方法でフレームを複数の範囲に区分し、複数の範囲のそれぞれにおいて、フレームの帯域全体に適用される量子化グローバルゲインを補正することによって、少ない符号量の増加でゲインの量子化精度が向上し、ミュージカルノイズや量子化ノイズなどに起因する音質劣化を軽減できる。
従来技術に関わる符号化装置と復号装置の機能構成例を示すブロック図。 第1実施形態に係る符号化装置の機能構成例を示すブロック図。 第1実施形態に係る符号化処理の処理フローを示す図。 第1基準による区分処理の第1例の具体例1の処理フローを示す図。 第1基準による区分処理の第3例の具体例1の処理フローを示す図。 第1基準による区分処理の第5例の具体例1の処理フローを示す図。 第2基準による区分処理の第1例の具体例1の処理フローを示す図。 第2基準による区分処理の第3例の具体例1の処理フローを示す図。 第2基準による区分処理の第5例の具体例1の処理フローを示す図。 ゲイン補正量符号化部140の機能構成例を示すブロック図。 ゲイン補正量符号化部140の処理フローの例を示す図。 ゲイン補正量符号化部140の変形例5を説明するための図。 第1実施形態に係る復号装置の機能構成例を示すブロック図。 第1実施形態に係る復号処理の処理フローを示す図。
 本発明の実施形態を、図面を参照して説明する。同一構成要素ないし同一処理には同一符号を割り当てて重複説明を省略する場合がある。なお、各実施形態で扱う音響信号は音声や楽音などの音響、映像などの信号である。ここでは音響信号が時間領域信号であることを想定しているが、必要に応じて周知技術によって時間領域信号を周波数領域信号に変換することも、或いは周波数領域信号を時間領域信号に変換することもできる。したがって、符号化処理の対象となる信号は、時間領域信号でも周波数領域信号でもよい(以下の説明では、説明を具体的にするため、周波数領域信号を扱う)。符号化処理の対象として入力される信号は複数のサンプルで構成される系列(サンプル系列)であり、符号化処理は通常、フレーム単位で実行されることから、処理対象の信号を入力信号系列と呼称することにする。
 例えば図1に示す技術を参考にすると、入力信号系列X(ω) [ω∈{0,…,L-1}]に含まれる各成分、量子化グローバルゲインg^および量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に含まれる各成分の間の関係は式(1)で表すことができる。ここで、egはグローバルゲインgと量子化グローバルゲインg^との量子化誤差を、eXQは正規化入力信号系列XQ(ω) [ω∈{0,…,L-1}]と量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に含まれる対応する成分同士(同じωの値の成分同士)の量子化誤差を表している。
Figure JPOXMLDOC01-appb-M000001
 通常の量子化では、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]に対応する符号である正規化信号符号に消費される消費ビット数は入力信号系列に依存し、正規化信号符号用に予め定められた規定ビット数の一部が未使用のビットとして残る場合が多い。そこで、この残った一つまたは複数のビット(以下、未使用ビットという)を量子化誤差egとeXQの低減に利用する。さらに言えば、未使用ビットに限らず、量子化誤差の低減のために事前に用意された一つまたは複数のビットを利用してもよい。以下で説明する実施形態では、未使用ビットまたは事前に用意された一つまたは複数のビットのうち一部または全部を量子化誤差egの低減に利用することを説明する。例えば、未使用ビットまたは事前に用意された一つまたは複数のビットのうち、量子化誤差eXQの低減に使われなかった残りのビットを量子化誤差egの低減に利用することができる。もちろん、量子化誤差egの低減のためだけに利用される一つまたは複数のビットを事前に用意しておいてもよい。以下、量子化誤差egの低減に利用可能なビットを「ゲイン修正ビット」と呼称する。ゲイン修正ビットのビット数をUとする。
 「量子化誤差egを低減する」ことは、換言すると、「量子化グローバルゲインを補正する」ことに他ならない。量子化グローバルゲインの補正に関して、一つのフレームに関する離散周波数のインデックスω∈{0,1,2,…,L-1}の全体、つまり系列全体、に共通の量子化グローバルゲインを補正する方法が考えられる。しかし、音響信号の特性を考慮すると、系列全体に共通の量子化グローバルゲインを補正するよりも、系列全体BをN個(ただし、Nは2以上の予め定められた整数である)の範囲{Bnn=1 N={B1,…,Bn,…,BN}に区分した後、各範囲に対応するゲインを、量子化グローバルゲインを補正することによって求める方が、音声品質の向上を期待できる。このような観点から、実施形態における適応量子化では、量子化正規化済み信号系列X^Q(ω) [ω∈{0,…,L-1}]の系列全体が複数の範囲に区分される。
 符号化装置と復号装置とで同じ信号系列BをN個の範囲に区分するために容易に考えられる方法は、隣接する範囲の境界位置や各範囲に含まれる成分数のような範囲を特定する情報を符号化装置の出力とする方法である。しかし、範囲を特定する情報を出力するためには大量のビット数が必要となる。範囲を特定する情報を符号化装置の出力とすることなく、すなわち、ビットを消費することなく、符号化装置と復号装置とで同じ基準で区分を行なう。また、各範囲に対してなるべく均等にゲイン修正ビット、すなわち、量子化グローバルゲインを修正するための情報量、を与えることを想定し、各範囲に含まれる量子化正規化済み信号系列の成分の情報量がなるべく均等となることが望ましい。そこで、系列区分の基準として「各範囲のエネルギーがなるべく等しくなるように区分する基準」又は「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」を採用する。これらの基準による具体的な区分方法については、後に詳述する。
 実施形態の詳細を以下に説明する。
 《第1実施形態》
 第1実施形態の符号化装置1(図2参照)は、正規化信号符号化部120、グローバルゲイン符号化部105、ゲイン補正量符号化部140及び制御部170を含む。符号化装置1は、必要に応じて、周波数領域変換部101と合成部160を含んでもよい。
 まず、符号化装置1(encoder)が行う符号化処理を説明する(図3参照)。
 ここでは、符号化装置1の入力信号系列は、フレーム単位の音響信号x(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分である入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]であるとして説明する。ここで、tは離散時間のインデックス、ωは離散周波数のインデックス、LminはL点の周波数成分のうちの最小の離散周波数のインデックス、LmaxはL点の周波数成分のうちの最大の離散周波数のインデックス、を表す。ただし、フレーム単位の音響信号x(t)そのものを符号化装置1の入力信号系列としてもよいし、フレーム単位の音響信号x(t)に対して線形予測分析をした残差信号を符号化装置1の入力信号系列としてもよいし、その残差信号に対応するL点(Lは、正整数で例えば256である)の周波数成分を入力信号系列としてもよい。
 <周波数領域変換部101>
 符号化装置1は、符号化装置1の前処理部として、または符号化装置1内に、周波数領域変換部101を備えてもよい。この場合は、周波数領域変換部101がフレーム単位の時間領域の音響信号x(t)に対応するL点(Lは、正整数で例えば256である)の周波数成分を生成して入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]として出力する。時間-周波数変換方法として、例えばMDCT(Modified Discrete Cosine Transform)やDCT(Discrete Cosine Transform)を用いることができる。この場合も、フレーム単位の時間領域の音響信号に代えて、フレーム単位の時間領域の音響信号を線形予測分析して得られる残差信号をx(t)としてもよい。
 <正規化信号符号化部120>
 正規化信号符号化部120は、フレーム単位の入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]の各成分が正規化された信号による系列を符号化して得られる正規化信号符号と、この正規化信号符号に対応する量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を出力する(ステップS1e)。
 正規化信号符号化部120は、例えば、図1の正規化部102、量子化部103、ゲイン制御部104により実現される。正規化部102、量子化部103、ゲイン制御部104のそれぞれは、[背景技術]欄で説明した通りに動作する。
 <グローバルゲイン符号化部105>
 グローバルゲイン符号化部105が、入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]に対応するゲインである量子化グローバルゲインg^と、量子化グローバルゲインg^に対応するグローバルゲイン符号とを得る(ステップS2e)。また、グローバルゲイン符号化部105は、必要に応じて量子化グローバルゲインg^に対応する量子化ステップ幅も得る。
 グローバルゲイン符号化部105は、例えば、[背景技術]欄で説明した通りに動作する。
 また、例えば、グローバルゲイン符号化部105は、量子化グローバルゲインの候補とその候補に対応するグローバルゲイン符号の組を複数組格納したテーブルを備え、正規化信号符号化部120で得られたグローバルゲインgと最も近い量子化グローバルゲインの候補を量子化グローバルゲインg^とし、その候補に対応するグローバルゲイン符号を出力してもよい。
 要は、グローバルゲイン符号化部105は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の各成分とゲインとを乗算して得られる信号系列と入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]との相関が最大または誤差が最小となるような基準で求められた量子化グローバルゲインg^とこの量子化グローバルゲインに対応するグローバルゲイン符号を求めて出力すればよい。
 なお、ゲイン補正量符号化部140が量子化グローバルゲインg^に対応する量子化ステップ幅を用いた処理を行う場合は、量子化グローバルゲインg^に対応する量子化ステップ幅もゲイン補正量符号化部140に対して出力される。
 <ゲイン補正量符号化部140>
 ゲイン補正量符号化部140は、図10に示すように、区分部150、記憶部141、符号化部143及び制御部170を例えば備えている。また、ゲイン補正量符号化部140は、図10に破線で示す乗算部144を備えていてもよい。ゲイン補正量符号化部140の処理フローの例を図11に示す。
 ゲイン補正量符号化部140には、第1の信号系列、第1ゲイン、ゲイン修正ビットのビット数U及び入力信号系列X(ω) [ω∈{Lmin,…,Lmax}]が少なくとも入力される。ゲイン補正量符号化部140の処理は、後述するように、ゲイン修正ビットのビット数Uに応じて繰り返し実行される(ステップS4e)。繰り返し実行されるゲイン補正量符号化部140の処理とは、具体的には、区分部150及び符号化部143による繰り返しの処理を意味する。
 第1回目のゲイン補正量符号化部140の処理は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を第1の信号系列とし、量子化グローバルゲインg^を第1ゲインδとし、ゲイン修正ビットのビット数Uを余剰ビット数uとして実行される。
 nを1以上の整数として、第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のうち、第2n-1回目から第2n-1回目のゲイン補正量符号化部140の処理で区分して得られた2個の範囲のうちの何れか1つの範囲に対応する信号系列を第1の信号系列とし、第2n-1回目から第2n-1回目のゲイン補正量符号化部140の処理で得られたゲイン補正量符号idxで特定されるゲイン補正量でその何れか1つの範囲に対応する第1ゲインを補正して得られる第2ゲインを第1ゲインとして実行される。
 以下、図11を参照しながら、ゲイン補正量符号化部140の処理の一例について説明する。
 制御部170は、余剰ビット数uが0より大であるか判定する(ステップS4e1)。
 ステップS4e1において、余剰ビット数uが0より大でないと判定された場合には、ステップS4eの処理を終了する。
 ステップS4e1において、余剰ビット数uが0より大であると判定された場合には、制御部170は、ゲイン補正量符号化部140による今回の処理の対象となる範囲を決定する(ステップS4e2)。
 前回のゲイン補正量符号化部140の処理が第2n回目から第2n+1-2回目の処理であり、第2n-1回目から第2n-1回目の処理で区分して得られた2個の範囲のうち符号化していない範囲が残っている場合には、制御部170は、この残っている範囲の何れか1つの範囲を、ゲイン補正量符号化部140による今回の処理の対象となる範囲[lmin,lmax]とする。
 nを1以上の整数として、前回のゲイン補正量符号化部140の処理が第2n+1-1回目の処理であり、第2n-1回目から第2n-1回目の処理で区分して得られた2個の範囲のうち符号化していない範囲が残っていない場合、制御部170は、第2n回目から第2n+1-1回目の処理で区分して得られた2n+1個の範囲のうち何れか1つの範囲を、ゲイン補正量符号化部140による今回の処理の対象となる範囲[lmin,lmax]とする。
 前回のゲイン補正量符号化部140の処理が1回目の処理である場合、制御部170は、1回目の処理で区分して得られた2個の範囲のうち何れか1つの範囲を、ゲイン補正量符号化部140による今回の処理の対象となる範囲[lmin,lmax]とする。
 量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のうち、このゲイン補正量符号化部140による今回の処理の対象となる範囲[lmin,lmax]に対応する信号系列が、ゲイン補正量符号化部140による今回の処理における第1の信号系列とされ、区分部150及び符号化部143に入力される。
 ゲイン補正量符号化部140の区分部150は、入力された第1の信号系列を2つの範囲に区分する(ステップS4e3)。入力された第1の信号系列の範囲を[lmin,lmax]と表記し、区分された範囲のうち、低域側の範囲を[lmin,lmid-1]、高域側の範囲を[lmid,lmax]と表記する。区分部150の処理の詳細については、後述する。区分された2つの範囲についての情報は、符号化部143に送信される。
 ゲイン補正量符号化部140の符号化部143は、入力された各区分された範囲に対応する第1ゲインをその各区分された範囲に対応するゲイン補正量で補正して得られる第2ゲインと第1の信号系列の各サンプルの値とを乗算して得られる信号系列と入力信号系列との誤差が最小となる各区分された範囲に対応するゲイン補正量を特定するためのゲイン補正量符号idxを得る(ステップS4e4)。
 誤差は、例えば式(C1)により定義される。
Figure JPOXMLDOC01-appb-M000002
 この場合、符号化部143は、式(C2)を満たすゲイン補正量符号idxを得る。
Figure JPOXMLDOC01-appb-M000003
 Eは、予め定められた1以上の整数であり、ゲイン補正量符号化部140の1回の処理で使用する最大ビット数である。すなわち、Eは、ゲイン補正量符号化部140の1回の処理で得られるゲイン補正量符号idxの最大ビット数である。例えば、E=2である。min(a,b)は整数a,bのうち小さい整数を出力する関数である。min(u,E)は、今回のゲイン補正量符号化部140の処理で使用する消費ビット数である。消費ビット数Me=min(u,E)とする。
 δは、第1ゲインである。
 Δlow(i)は区分された2つの範囲のうち低域側の範囲に対応するゲイン補正量であり、Δhigh(i)は区分された2つの範囲のうち高域側の範囲に対応するゲイン補正量である。
 δ+Δlow(i)は、第1ゲインδを低域側の範囲に対応するゲイン補正量Δlow(i)で補正して得られる第2ゲインである。δ+Δhigh(i)は、第1ゲインδを高域側の範囲に対応するゲイン補正量Δhigh(i)で補正して得られる第2ゲインである。
 各範囲には、複数のゲイン補正量の候補が対応付けられている。例えば、i=1,2,…,2Eとして、低域側の範囲には2E個のゲイン補正量の候補Δlow(1),Δlow(2),…,Δlow(2E)が対応付けられており、高域側の範囲にも2E個のゲイン補正量の候補Δhigh(1),Δhigh(2),…,Δhigh(2E)が対応付けられている。これらのゲイン補正量の候補は、ゲイン補正量の候補Δlow(i),Δhigh(i)を特定する符号idx(i)と共にゲイン補正量コードブックとして記憶部141に記憶されていてもよいし、後述するように計算により求めてもよい。
 この場合、符号化部143は、低域側の範囲に対応するゲイン補正量の候補Δlow(1),Δlow(2),…,Δlow(2E)、及び、高域側の範囲に対応するゲイン補正量の候補Δhigh(1),Δhigh(2),…,Δhigh(2E)から、式(C1)で定義される誤差を最小にするゲイン補正量を各区分された範囲ごとに選択するためのゲイン補正量符号idxを得るのである。
 ゲイン補正量候補ベクトル(Δlow(i),Δhigh(i))は、2個のゲイン補正量の候補Δlow(i),Δhigh(i)で構成されているとすると、符号化部140の処理の一例は、2E個のゲイン補正量候補ベクトル(Δlow(1),Δhigh(1)),(Δlow(2),Δhigh(2)),…,(Δlow(2E),Δhigh(2E))から、式(C1)で定義される誤差を最小にするゲイン補正量候補ベクトルを選択するベクトル量子化である。
 消費ビット数Me=Eである場合には、符号化部143は、i=1,2,…,2Eの2E個の符号idx(i)の中から、式(C1)で定義される誤差を最小にするゲイン補正量符号idxを特定する符号idx(i)を得て、ゲイン補正量符号idxとして出力する。
 消費ビット数Me<Eである場合には、符号化部143は、式(C1)で定義される誤差を最小にするゲイン補正量符号idxを特定する符号idx(i)のうち、2Me個の符号idx(i)を区別することができるMeビットの部分をゲイン補正量符号idxとして出力する。例えば、Me=1,E=2であり、idx(1)={0,0},idx(2)={0,1},idx(3)={1,0},idx(4)={1,1}である場合には、符号化部143は、idx(1)={0,0}の2ビットのうちの1ビット目である{0}、又は、idx(3)={1,0}の2ビットのうちの1ビット目である{1}をゲイン補正量符号idxとして出力する。
 第1ゲインδをゲイン補正量符号idxで特定されるゲイン補正量Δlow(i)で補正したゲインδ+Δlow(i)は、範囲[lmin,lmid-1]に対応する第2ゲインとされる。また、第1ゲインδをゲイン補正量符号idxで特定されるゲイン補正量Δhigh(i)で補正したゲインδ+Δhigh(i)は、範囲[lmid,lmax]に対応する第2ゲインとされる。
 制御部170は、u←u-Meとして、余剰ビットの数uを消費ビット数Meだけデクリメントする(ステップS4e5)。すなわち、uからMeを減じた値を新たなuの値とする。その後、ステップS4e1に戻る。
 このようにして、ステップS4e1からステップS4e5の処理は、余剰ビットの数uが0より大きい限りは繰り返される。換言すれば、ゲイン補正量符号化部140の処理は、ゲイン補正量符号化部140で得られたゲイン補正量符号idxのビット数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行される。
 [ゲイン補正量符号化部140の変形例1]
 第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理は、第2n-1回目から第2n-1回目のゲイン補正量符号化部140の処理による区分により得られた2n個の範囲のうち、聴覚的な重要度が高い範囲から順に行なわれてもよい。
 [ゲイン補正量符号化部140の変形例2]
 また、一般的には、周波数が低い帯域の方が、周波数が高い帯域よりも、聴覚的な重要度が高いことが多い。このため、第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理は、第2n-1回目から第2n-1回目のゲイン補正量符号化部140の処理による区分により得られた2n個の範囲のうち、周波数が低い範囲から順に行なわれてもよい。
 [ゲイン補正量符号化部140の変形例3]
 第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理におけるゲイン補正量の候補の絶対値の方が、第2n-1回目から第2n-1回目のゲイン補正量符号化部140の処理におけるゲイン補正量の候補の絶対値よりも小さくてもよい。
 すなわち、例えば、第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理で用いられる低域側の範囲に対応する2E個のゲイン補正量の候補Δlow(1),Δlow(2),…,Δlow(2E)の絶対値及び高域側の範囲に対応する2E個のゲイン補正量の候補Δhigh(1),Δhigh(2),…,Δhigh(2E)の絶対値が、第2n-1回目から第2n-1回目のゲイン補正量符号化部140の処理で用いられる低域側の範囲に対応する2E個のゲイン補正量の候補Δlow(1),Δlow(2),…,Δlow(2E)の絶対値及び高域側の範囲に対応する2E個のゲイン補正量の候補Δhigh(1),Δhigh(2),…,Δhigh(2E)の絶対値よりも小さくてもよい。
 [ゲイン補正量符号化部140の変形例4]
 ゲイン補正量候補ベクトル(Δlow(i),Δhigh(i))は、2個のゲイン補正量の候補Δlow(i),Δhigh(i)で構成されているとする。区分部150で区分された2つの範囲は、それぞれゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補Δlow(i),Δhigh(i)に対応付けされているとする。上記の例だと、低域側の範囲にΔlow(i)が対応付けされており、高域側の範囲にΔhigh(i)が対応付けされている。このように考えると、ゲイン補正量符号化部140の処理の一例は、入力された第1の信号系列に対するベクトル量子化である。このベクトル量子化で用いるゲイン補正量候補ベクトルは、例えば次のようにして生成することができる。
 記憶部141には、2個の値で構成される正規化ゲイン補正量候補ベクトルがその正規化ゲイン補正量候補ベクトルを特定する符号と共に複数格納されているとする。正規化ゲイン補正量候補ベクトルを構成する2個の値をΔ1(i),…,Δ2(i)と表記すると、正規化ゲイン補正量候補ベクトルは(Δ1(i),Δ2(i))と表記することができる。記憶部141には、例えば、2E個の正規化ゲイン補正量候補ベクトル、すなわち(Δ1(1),Δ2(1)),…,(Δ1(2E),Δ2(2E))が格納されている。
 なお、Δの右肩の数字及び文字はΔについての単なる添え字でありべき乗を意味しない。一方、例えば2E等のΔ以外の文字の右肩の数字及び文字はべき乗を意味する点に注意すること。
 ゲイン補正量符号化部140の処理の回数に応じて所定の係数が対応付けされているものとする。例えば、第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理に対応する所定の係数の絶対値の方が、第2n-1回目から第2n-1回目のゲイン補正量符号化部140の処理に対応する所定の係数の絶対値よりも小さいように対応付けがされている。
 このとき、正規化ゲイン補正量候補ベクトルに、ゲイン補正量符号化部140の処理の回数に対応する所定の係数を乗算したベクトルを、その回数目のゲイン補正量符号化部140の処理で用いるゲイン補正量候補ベクトルとする。言いかえれば、正規化ゲイン補正量候補ベクトル(Δ1(i),Δ2(i))を構成する2個の値Δ1(i),Δ2(i)のそれぞれに、ゲイン補正量符号化部140の処理の回数に対応する所定の係数stepを乗算することにより得られた2個の値stepΔ1(i),stepΔ2(i)により構成されるベクトル(stepΔ1(i),stepΔ2(i))を、その回数目のゲイン補正量符号化部140の処理で用いるゲイン補正量候補ベクトル(Δlow(i),Δhigh(i))とする。この乗算は、ゲイン補正量符号化部140の乗算部144により行われる。正規化ゲイン補正量候補ベクトル(Δ1(i),Δ2(i))が2E個ある場合には、i=1,…,2Eのそれぞれについてこの乗算を行うことにより、2E個のゲイン補正量候補ベクトル(stepΔ1(i),stepΔ2(i))が得られる。
 [ゲイン補正量符号化部140の変形例5]
 なお、ゲイン補正量符号化部140による各回数目の処理で用いるゲイン補正量の候補をそのゲイン補正量の候補を特定する符号と共に、ひとつのゲイン補正量コードブックとして記憶部141に格納しておいてもよい。例えば、nを0以上の各整数として、第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理で用いられるゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))が、そのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を特定する符号idx(i)と共に記憶部141に格納されているとする。
 すなわち、図12に例示するように、nの最大値をnmaxとして、1回目(n=0)のゲイン補正量符号化部140の処理で用いられるゲイン補正量候補ベクトル(Δ1,0(i),Δ2,0(i))[i=1,…,2E]、2回目(n=1)から3回目のゲイン補正量符号化部140の処理で用いられるゲイン補正量候補ベクトル(Δ1,1(i),Δ2,1(i))[i=1,…,2E]、4回目(n=2)から7回目のゲイン補正量符号化部140の処理で用いられるゲイン補正量候補ベクトル(Δ1,2(i),Δ2,2(i))[i=1,…,2E]、…、第2nmax回目から第2nmax+1-1回目のゲイン補正量符号化部140の処理で用いられるゲイン補正量候補ベクトル(Δ1,nmax(i),Δ2,nmax(i))[i=1,…,2E]が、そのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を特定する符号idx(i)と共に記憶部141に格納されているとする。
 このとき、例えば、第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理で用いられるゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を構成するゲイン補正量の候補Δ1,n(i),Δ2,n(i)の絶対値の方が、第2n-1回目から第2n-1回目のゲイン補正量符号化部140の処理で用いられるゲイン補正量候補ベクトル(Δ1,n-1(i),Δ2,n-1(i))を構成するゲイン補正量の候補Δ1,n-1(i),Δ2,n-1(i)の絶対値よりも小さいとする。
 なお、第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理で用いられるゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))とは、その第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理において区分される2つの範囲についてのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))のことである。第2n回目から第2n+1-1回目のゲイン補正量符号化部140の処理において区分される2つの範囲のうち、低域側の範囲に対応するゲイン補正量の候補がΔ1,n(i)であり、高域側の範囲に対応するゲイン補正量の候補がΔ2,n(i)である。
 [ゲイン補正量符号化部140の変形例6]
 ゲイン補正量符号化部140の符号化部143は、式(C1)ではなく式(C4)で定義される誤差を最小にするゲイン補正量を特定してもよい。
Figure JPOXMLDOC01-appb-M000004
 すなわち、符号化部143は、式(C5)を満たすゲイン補正量符号idxを得てもよい。
Figure JPOXMLDOC01-appb-M000005
 slow及びshighは、例えば、以下の式のように定義される。
Figure JPOXMLDOC01-appb-M000006
 このように、入力された第1の信号系列[lmin,lmax]の全てのサンプル値の二乗和を低域側の範囲[lmin,lmid-1]の全てのサンプルの値の二乗和で除算した値slowと、低域側の範囲に対応するゲイン補正量Δlow(i)とを乗算した値で、第1ゲインδを補正して第2ゲインδ+slowΔlow(i)としてもよい。
 同様に、入力された第1の信号系列[lmin,lmax]の全てのサンプル値の二乗和を高域側の範囲[lmid,lmax]の全てのサンプルの値の二乗和で除算した値shighと、高域側の範囲に対応するゲイン補正量Δhigh(i)とを乗算した値で、第1ゲインδを補正して第2ゲインδ+shighΔhigh(i)としてもよい。
 また、slow及びshighを、例えば以下の式のように定義してもよい。
Figure JPOXMLDOC01-appb-M000007
 clowは、低域側の範囲[lmin,lmid-1]のサンプルのエネルギーが第一の所定値よりも大きいサンプルの個数である。chighは、高域側の範囲[lmid,lmax]のサンプルのエネルギーが第二の所定値よりも大きいサンプルの個数である。clow+chighは、入力された第1の信号系列[lmin,lmax]のエネルギーが第三の所定値よりも大きいサンプルの個数である。
 このように、入力された第1の信号系列[lmin,lmax]のエネルギーが第三の所定値よりも大きいサンプルの個数clow+chighで、低域側の範囲[lmin,lmid-1]のサンプルのエネルギーが第一の所定値よりも大きいサンプルの個数clowで除算した値slowと、低域側の範囲に対応するゲイン補正量Δlow(i)とを乗算した値で、第1ゲインδを補正して第2ゲインδ+slowΔlow(i)としてもよい。
 同様に、入力された第1信号系列[lmin,lmax]のエネルギーが第三の所定値よりも大きいサンプルの個数clow+chighで、高域側の範囲[lmid,lmax]のサンプルのエネルギーが第二の所定値よりも大きいサンプルの個数chighで除算した値shighと、高域側の範囲に対応するゲイン補正量Δhigh(i)とを乗算した値で、第1ゲインδを補正して第2ゲインδ+shighΔhigh(i)としてもよい。
 第一の所定値、第二の所定値及び第三の所定値は、互いに異なる値であってもよいが、同じ値であることが好ましい。第一の所定値、第二の所定値及び第三の所定値は、後述する式(B2)におけるεに対応する。
 [ゲイン補正量符号化部140の処理の具体例]
 以下、U=4,E=2の場合の、ゲイン補正量符号化部140の処理の具体例を説明する。
 (1)1回目の処理
 u=U=4>0であるから、第1回目のゲイン補正量符号化部140の処理が行われる。
 第1回目のゲイン補正量符号化部140の処理は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を第1の信号系列とし、量子化グローバルゲインg^を第1ゲインδとして実行される。
 区分部150は、第1の信号系列を、低域側の範囲[Lmin,Lmid-1]及び高域側の範囲[Lmid,Lmax]に区分する。
 符号化部143は、lmin=Lmin,lmid=Lmid,lmax=Lmaxとして、式(C2)を満たすゲイン補正量符号idxを得る。そのゲイン補正量符号idxにより特定される、低域側のゲイン補正量をΔlowとし、高域側のゲイン補正量をΔhighとすると、低域側の範囲[Lmin,Lmid-1]についての第2ゲインはg^+Δlowとなり、高域側の範囲[Lmid,Lmax]についての第2ゲインはg^+Δhighとなる。
 制御部170は、u=4のuから2をデクリメントして、u=2とする。
 (2)2回目の処理
 u=2>0であるから、第2回目のゲイン補正量符号化部140の処理が行われる。
 第2回目のゲイン補正量符号化部140の処理は、量子化正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のうち、低域側の範囲[Lmin,Lmid-1]の信号系列を第1の信号系列とし、g^+Δlowを第1ゲインδとして実行される。
 区分部150は、第1の信号系列を、低域側の範囲[Lmin,L’mid-1]及び高域側の範囲[L’mid,Lmid-1]に区分する。
 符号化部143は、lmin=Lmin,lmid=L’mid,lmax=Lmid-1として、式(C2)を満たすゲイン補正量符号idxを得る。
 制御部170は、u=2のuから2をデクリメントして、u=0とする。
 u=0であるため、3回目以降の処理は行われない。
 1回目の処理で得られたゲイン補正量符号idx及び2回目の処理で得られたゲイン補正量符号idxは、復号装置2に送信される。
 ゲイン補正量符号化部140の処理が終わった後は、必要に応じて、合成部160が、正規化信号符号と、ゲイン補正量符号化部140の各回数目の処理で得られたゲイン補正量符号idxと、グローバルゲイン符号をまとめたビットストリームを出力する。ビットストリームは復号装置2へ伝送される。
 <区分部150が行なう区分処理の詳細>
 区分部150は、「各範囲のエネルギーがなるべく等しくなるように区分する基準」又は「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」に基づいて、入力された第1の信号系列を2つの範囲に区分する。
 まず「各範囲のエネルギーがなるべく等しくなるように区分する基準」での区分処理について説明し、次に「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」での区分処理について説明する。
 以下、「各範囲のエネルギーがなるべく等しくなるように区分する基準」を第1基準、「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」を第2基準と略記することがある。
 「各範囲のエネルギーがなるべく等しくなるように区分する基準」での区分処理は、例えば、第1の信号系列の第1の範囲を、
(a)第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和と、第1の信号系列の全てのサンプルの値の二乗和の2分の1と、が最も近付くように、
または、
(b)第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和と、第1の信号系列の全てのサンプルの値の絶対値和の2分の1と、が最も近付くように、
または、
(c)第1の信号系列の第1の範囲のサンプル数の合計が、第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和が第1の信号系列の全てのサンプルの値の二乗和の2分の1以上となる最小のサンプル数になるように、
または、
(d)第1の信号系列の第1の範囲のサンプル数の合計が、第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和が第1の信号系列の全てのサンプルの値の絶対値和の2分の1以上となる最小のサンプル数になるように、
または、
(e)第1の信号系列の第1の範囲のサンプル数の合計が、第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和が第1の信号系列の全てのサンプルの値の二乗和の2分の1以下となる最大のサンプル数になるように、
または、
(f)第1の信号系列の第1の範囲のサンプル数の合計が、第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和が第1の信号系列の全てのサンプルの値の絶対値和の2分の1以下となる最大のサンプル数になるように、
求め、
第1の信号系列のうちの第1の範囲以外の範囲を、第1の信号系列の第2の範囲とすることで、第1の信号系列を2個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を、第1の範囲から順に逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を実現できる。
 [第1基準による区分処理の第1例]
 第1基準による区分処理の第1例を図4を用いて説明する。第1例の区分処理は上記の(a)に対応する。
 図4は、区分対象の第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{l mid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]の全サンプルX^Q(lmin),…,X^Q(lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
Figure JPOXMLDOC01-appb-M000008
 次に、式(2)により求めた第1の信号系列X^Q [ω∈{lmin,…,lmax}]の全サンプルX^Q(lmin),…,X^Q(lmax)の二乗和の2分の1と、第1の信号系列の第1の範囲に含まれる全てのサンプルX^Q(lmin),…,X^Q(lmid-1)の値の二乗和との差が最小となるように、第2の範囲の最も低域側にあるサンプル番号であるlmidを求める。すなわち、lmidは式(3)によって求まる。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
Figure JPOXMLDOC01-appb-M000009
 そして、第1の信号系列X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、第1の信号系列X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第1基準による区分処理の第2例]
 第1基準による区分処理の第2例は上記の(b)に対応する。第2例の区分処理は、第1例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第1例の区分処理と同じ方法である。第2例の区分処理によれば、第1例の区分処理で行なう二乗計算を省略できる分、第1例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 [第1基準による区分処理の第3例]
 第1基準による区分処理の第3例を図5を用いて説明する。第3例の区分処理は上記の(c)に対応する。
 図5は、区分対象の第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]の全サンプルX^Q(lmin),…,X^Q(lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、離散周波数のインデックスωの番号をlminから順に増やしながら第1の信号系列X^Q(ω)のlminから当該インデックスまでの二乗和plowがplow≧pow/2を満たすか否かを判定し、初めてplow≧pow/2を満たす場合の離散周波数のインデックスωまでを第1の範囲とし、当該インデックスωに1を加算したものを第2の範囲の最も低域側にあるサンプル番号であるインデックスlmidとして出力する。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
 図5は、上記の処理を実現するためのフローチャートである。離散周波数のインデックスωの初期値をlmin、低域のエネルギーplowの初期値を|X^Q(lmin)|2に設定する。そして、plow≧pow/2を満たすか否かを判定する。plow≧pow/2を満たさない場合には、離散周波数のインデックスωに1を加えたものを新たなωとし、plowにX^Q(ω)のエネルギー|X^Q(ω)|2を加算したものを新たなplowとする。plow≧pow/2を満たす場合には、その時点での離散周波数のインデックスωに1を加えたものをインデックスlmidとして出力する。
 そして、第1の信号系列X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、第1の信号系列X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第1基準による区分処理の第4例]
 第1基準による区分処理の第4例は上記の(d)に対応する。第4例の区分処理は、第3例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第3例の区分処理と同じ方法である。第4例の区分処理によれば、第3例の区分処理で行なう二乗計算を省略できる分、第3例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 [第1基準による区分処理の第5例]
 第1基準による区分処理の第5例を図6を用いて説明する。第5例の区分処理は上記の(e)に対応する。
 図6は、区分対象の第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]の全サンプルX^Q(lmin),…,X^Q(lmax)の二乗和powを求める。二乗和powは、式(2)によって求まる。
 次に、離散周波数のインデックスωの番号をlminから順に増やしながら第1の信号系列X^Q(ω)のlminから当該インデックスまでの二乗和plowがplow≦pow/2を満たすか否かを判定し、初めてplow≦pow/2を満たさなくなる場合の離散周波数のインデックスωから1を減算した離散周波数までを第1の範囲とし、当該インデックスωをを第2の範囲の最も低域側にあるサンプル番号であるインデックスlmidとして出力する。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
 図6は、上記の処理を実現するためのフローチャートである。離散周波数のインデックスωの初期値をlmin、低域のエネルギーplowの初期値を|X^Q(lmin)|2に設定する。そして、plow≦pow/2を満たすか否かを判定する。plow≦pow/2を満たす場合には、離散周波数のインデックスωに1を加えたものを新たなωとし、plowにX^Q(ω)のエネルギー|X^Q(ω)|2を加算したものを新たなplowとする。plow≦pow/2を満たさない場合には、その時点での離散周波数のインデックスωをインデックスlmidとして出力する。
 そして、第1の信号系列X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、第1の信号系列X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第1基準による区分処理の第6例]
 第1基準による区分処理の第6例は上記の(f)に対応する。第6例の区分処理は、第5例の区分処理における「二乗和」を「絶対値和」に置き換えた以外は、第5例の区分処理と同じ方法である。第6例の区分処理によれば、第5例の区分処理で行なう二乗計算を省略できる分、第5例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 次に、第2基準である「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」での区分処理について説明する。
 「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」での区分処理は、例えば、第1の信号系列の第1の範囲を、
(a)第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数と、第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1と、が最も近付くように、
または、
(b)第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数と、第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1と、が最も近付くように、
または、
(c)第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数が、第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以上となる最小のサンプル数となるように、
または、
(d)第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数が、第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以上となる最小のサンプル数となるように、
または、
(e)第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数が、第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以下となる最大のサンプル数となるように、
または、
(f)第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数が、第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以下となる最大のサンプル数となるように、
求め、
第1の信号系列のうちの第1の範囲以外の範囲を、第1の信号系列の第2の範囲とすることで、第1の信号系列を2個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」による区分を、各範囲を逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」による区分を実現できる。
 [第2基準による区分処理の第1例]
 第2基準による区分処理の第1例を図7を用いて説明する。第1例の区分処理は上記の(a)に対応する。
 図7は、区分対象の第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるl midを決定する場合の例である。
 まず、各インデックスωについてfcount(ω)を式(B2)によって定める。各インデックスωについてのfcount(ω)には、第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]のインデックスωに対応するサンプルのエネルギー|X^Q(ω)|2が所定値より大きいサンプルに対して「サンプルのエネルギー|X^Q(ω)|が所定値より大きい」ことを表す情報として1を設定し、それ以外のサンプルに対して「サンプルのエネルギー|X^Q(ω)|が所定値より大きくない」ことを表す情報として0を設定する。この例では所定値を任意に予め定めた微小量ε(εは0以上の値)とする。
Figure JPOXMLDOC01-appb-M000010
 次に、第1の信号系列に含まれる全てのサンプルX^Q(ω) [ω∈{lmin,…,lmax}]のうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(lmax)の2分の1と、第1の信号系列の第1の範囲に含まれる全てのサンプルX^Q(ω) [ω∈{lmin,…,lmid-1}]のうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(lmid-1)との差分値(差の絶対値)が最小となるように、第2の範囲の最も低域側にあるサンプル番号であるlmidを求める。すなわち、lmidは式(B3)によって求まる。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
Figure JPOXMLDOC01-appb-M000011
 そして、第1の信号系列X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、第1の信号系列X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-1-lmin+1であってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第2基準による区分処理の第2例]
 第2基準による区分処理の第2例は上記の(b)に対応する。第2例の区分処理は、第1例の区分処理における「サンプルのエネルギー|X^Q(ω)|2」を「サンプルの絶対値|X^Q(ω)|」に置き換えた以外は、第1例の区分処理と同じ方法である。第2例の区分処理によれば、第1例の区分処理で行なう二乗計算を省略できる分、第1例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 [第2基準による区分処理の第3例]
 第2基準による区分処理の第3例を図8を用いて説明する。第3例の区分処理は上記の(c)に対応する。
 図8は、区分対象の第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、各インデックスωについてfcount(ω)を式(B2)によって定める。
 次に、第1の信号系列に含まれる全てのサンプルX^Q(ω) [ω∈{lmin,…,lmax}]のうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(lmax)を求める。
 次に、離散周波数のインデックスωの番号kをlminから順に増やしながらlminから当該インデックスkまでの第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(k)が(fcount(lmin)+…+fcount(lmax))/2以上であるか否かを判定し、初めてfcount(lmin)+…+fcount(k)が (fcount(lmin)+…+fcount(lmax))/2以上となる離散周波数のインデックスkまでを第1の範囲とし、当該インデックスkに1を加算したものを第2の範囲の最も低域側にあるサンプル番号であるインデックスl midとして出力する。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
 そして、第1の信号系列X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、第1の信号系列X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、l midであってもよいし、l midに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第2基準による区分処理の第4例]
 第2基準による区分処理の第4例は上記の(d)に対応する。第4例の区分処理は、第3例の区分処理における「サンプルのエネルギー|X^Q(ω)|2」を「サンプルの絶対値|X^Q(ω)|」に置き換えた以外は、第3例の区分処理と同じ方法である。第4例の区分処理によれば、第3例の区分処理で行なう二乗計算を省略できる分、第3例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 [第2基準による区分処理の第5例]
 第2基準による区分処理の第5例を図9を用いて説明する。第5例の区分処理は上記の(e)に対応する。
 図9は、区分対象の第1の信号系列X^Q(ω) [ω∈{lmin,…,lmax}]をX^Q(ω) [ω∈{lmin,…,lmid-1}]とX^Q(ω) [ω∈{lmid,…,lmax}]の2つの範囲に区分する例、具体的には、第1の範囲である低域と第2の範囲である高域との境界を表す情報として第2の範囲の最も低域側にあるサンプル番号であるlmidを決定する場合の例である。
 まず、各インデックスωについてfcount(ω)を式(B2)によって定める。
 次に、第1の信号系列に含まれる全てのサンプルX^Q(ω) [ω∈{lmin,…,lmax}]のうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(lmax)を求める。
 次に、離散周波数のインデックスωの番号kをlminから順に増やしながらlminから当該インデックスkまでの第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数fcount(lmin)+…+fcount(k)が(fcount(lmin)+…+fcount(lmax))/2より大であるか否かを判定し、初めてfcount(lmin)+…+fcount(k)が (fcount(lmin)+…+fcount(lmax))/2より大となる離散周波数のインデックスkより1小さいk-1までを第1の範囲とし、当該インデックスkを第2の範囲の最も低域側にあるサンプル番号であるインデックスl midとして出力する。これにより第1の範囲がX^Q [ω∈{lmin,…,lmid-1}]と決定する。
 そして、第1の信号系列X^Q [ω∈{lmin,…,lmax}]の第1の範囲以外の範囲、すなわち、X^Q [ω∈{lmid,…,lmax}]を第2の範囲とする。
 以上により、第1の信号系列X^Q [ω∈{lmin,…,lmax}]は2つの範囲に区分される。
 区分部150が出力する区分情報は、lmidであってもよいし、lmidに予め定めた値を演算した値であってもよいし、第1の範囲のサンプル数lmid-lminであってもよいし、第2の範囲のサンプル数lmax-lmid+1であってもよいし、要は、第1の範囲と第2の範囲とを特定できる情報であれば何でもよい。
 [第2基準による区分処理の第6例]
 第2基準による区分処理の第6例は上記の(f)に対応する。第6例の区分処理は、第5例の区分処理における「サンプルのエネルギー|X^Q(ω)|2」を「サンプルの絶対値|X^Q(ω)|」に置き換えた以外は、第5例の区分処理と同じ方法である。第6例の区分処理によれば、第5例の区分処理で行なう二乗計算を省略できる分、第5例の区分処理よりも少ない演算処理量で区分処理を行なうことが可能となる。
 なお、符号化装置1から復号装置2へビットストリームを伝送する実施構成に限定されず、例えば、合成部160によって得られた情報を記録媒体に記録し、当該記録媒体から読み出された当該情報が復号装置2に入力される実施構成も許容される。
 第1実施形態の復号装置2(図13参照)は、正規化信号復号部107、グローバルゲイン復号部106及び復元部250及び統合部290を含む。復号装置2は必要に応じて分離部210、時間領域変換部270を含んでもよい。
 以下、復号装置2(decoder)での処理を説明する(図13参照)。
 符号化装置1から送信されたビットストリームは復号装置2に入力される。分離部210が、ビットストリームから、正規化信号符号と、グローバルゲイン符号と、ゲイン補正量符号idxを取り出す。
 <正規化信号復号部107>
 正規化信号復号部107には、正規化信号符号が入力される。正規化信号復号部107が、符号化装置1の正規化信号符号化部120が行う符号化方法と対応する復号方法を適用して、正規化信号符号を復号して復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を得る(ステップS1d)。この例では、符号化装置1に対応して説明を行なうため、ωは離散周波数のインデックスを表すものとし、L点の離散周波数の各成分をω=LminからLmaxのそれぞれで表すものとする。正規化信号復号部107は、[背景技術]欄で説明した図1の正規化信号復号部107と同じ動作をする。
 <グローバルゲイン復号部106>
 グローバルゲイン復号部106には、グローバルゲイン符号が入力される。グローバルゲイン復号部106は、当該グローバルゲイン符号を復号し、復号グローバルゲインg^を出力する(ステップS4d)。グローバルゲイン復号部106が行う復号処理は、グローバルゲイン符号化部105が行う符号化処理に対応する処理であり、[背景技術]欄のグローバルゲイン復号部106でも説明した通りの周知技術である。
 <復元部250>
 復元部250は、図13に示すように、記憶部251、区分部260及び制御部280を例えば備えている。復元部250の処理フローの例を図14に示す。
 復元部250には、第1の信号系列、第1ゲイン、ゲイン補正量符号idx、ゲイン補正量符号用に割り当てられたビット数U、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]及び復号グローバルゲインg^が少なくとも入力される。
 復元部250は、入力された第1の信号系列を2つの範囲に区分し、ゲイン補正量符号idxを復号して各区分された範囲に対応するゲイン補正量を得て、入力された第1ゲインを各ゲイン補正量で補正して得られる第2ゲインを求める(ステップS5d)。
 復元部250の処理は、復号したゲイン補正量符号idxの合計がゲイン補正量符号用に割り当てられたビット数U以下となる回数の範囲内で実行される。ゲイン補正量符号用に割り当てられたビット数Uとは、符号化装置1におけるゲイン修正ビットのビット数Uに等しい。ゲイン補正量符号用に割り当てられたビット数Uは、例えば、復号装置2においてゲイン補正量符号idxのビット数の合計を加算することにより求まる。換言すれば、復元部250の処理は、分離部210で分離された全てのゲイン補正量符号idxについて行われる。
 第1回目の復元部250の処理は、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を第1の信号系列とし、復号グローバルゲインg^を第1ゲインδとして実行される。
 nを1以上の各整数として、第2n回目から第2n+1-1回目の復元部250の処理のそれぞれは、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のうち、第2n-1回目から第2n-1回目の復元部250の処理における区分で得られた2n個の範囲のうちの何れか1つの範囲に対応する信号系列を第1の信号系列とし、第2n-1回目から第2n-1回目の復元部250の処理のうちの何れか1つの範囲に対応する処理で得られたその何れか1つの範囲に対応する第2ゲインを第1ゲインとして行われる。
 入力された第1の信号系列の2つの範囲への区分は、復元部250の区分部260により行われる。区分部260により、入力された第1の信号系列の範囲[lmin,lmax]は、低域側の範囲[lmin,lmid-1]と、高域側の範囲[lmid,lmax]とに区分される。この区分についての情報である区分情報が、復元部250に提供される。区分部260の処理の詳細については、後述する。
 低域側の範囲[lmin,lmid-1]に対応するゲイン補正量による第1ゲインの補正の一例は、低域側の範囲[lmin,lmid-1]に対応するゲイン補正量と第1ゲインとの加算である。同様に、高域側の範囲[lmid,lmax]に対応するゲイン補正量による第1ゲインの補正の一例は、高域側の範囲[lmid,lmax]に対応するゲイン補正量と第1ゲインとの加算である。
 第1ゲインを低域側の範囲[lmin,lmid-1]に対応するゲイン補正量で補正して得られる第2ゲインが、その範囲[lmin,lmid-1]に対応する第2ゲインとなる。第1ゲインを高域側の範囲[lmid,lmax]に対応するゲイン補正量で補正して得られる第2ゲインが、その範囲[lmid,lmax]に対応する第2ゲインとなる。
 各範囲には、複数のゲイン補正量の候補が対応付けられている。例えば、i=1,2,…,2Eとして、低域側の範囲には2E個のゲイン補正量の候補Δlow(1),Δlow(2),…,Δlow(2E)が対応付けられており、高域側の範囲にも2E個のゲイン補正量の候補Δhigh(1),Δhigh(2),…,Δhigh(2E)が対応付けられている。これらのゲイン補正量の候補は、ゲイン補正量候補ベクトル(Δlow(i),Δhigh(i))として、このゲイン補正量候補ベクトル(Δlow(i),Δhigh(i))を特定する符号idx(i)と共にゲイン補正量コードブックとして記憶部251に記憶されていている。なお、ゲイン補正量候補ベクトル(Δlow(i),Δhigh(i))を後述するように計算により求めてもよい。
 この場合、復元部250は、入力されたゲイン補正量符号idxに対応するゲイン補正量候補ベクトル(Δlow(i),Δhigh(i))を記憶部251から読み込み、各区分された範囲に対応するゲイン補正量Δlow(i),Δhigh(i)を得る。
 フレーム内の各範囲についての最後に行なわれた復号部250の処理で得られた第2ゲインは、統合部290に送信される。
 [復元部250の変形例1]
 第2n回目から第2n+1-1回目の復元部250の処理は、第2n-1回目から第2n-1回目の復元部250の処理による区分により得られた2n個の範囲のうち、聴覚的な重要度が高い範囲から順に行なわれてもよい。
 [復元部250の変形例2]
 また、一般的には、周波数が低い帯域の方が、周波数が高い帯域よりも、聴覚的な重要度が高いことが多い。このため、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]が周波数領域の信号系列である場合には、第2n回目から第2n+1-1回目の復元部250の処理は、第2n-1回目から第2n-1回目の復元部250の処理による区分により得られた2n個の範囲のうち、周波数が低い範囲から順に行なわれてもよい。
 [復元部250の変形例3]
 第2n回目から第2n+1-1回目の復元部250の処理におけるゲイン補正量の絶対値の方が、第2n-1回目から第2n-1回目の復元部250の処理におけるゲイン補正量の絶対値よりも小さくてもよい。
 すなわち、例えば、第2n回目から第2n+1-1回目の復元部250の処理で用いられる低域側の範囲に対応する2E個のゲイン補正量の候補Δlow(1),Δlow(2),…,Δlow(2E)の絶対値及び高域側の範囲に対応する2E個のゲイン補正量の候補Δhigh(1),Δhigh(2),…,Δhigh(2E)の絶対値が、第2n-1回目から第2n-1回目の復元部250の処理で用いられる低域側の範囲に対応する2E個のゲイン補正量の候補Δlow(1),Δlow(2),…,Δlow(2E)の絶対値及び高域側の範囲に対応する2E個のゲイン補正量の候補Δhigh(1),Δhigh(2),…,Δhigh(2E)の絶対値よりも小さくてもよい。
 [復元部250の変形例4]
 ゲイン補正量候補ベクトルは、例えば次のようにして生成することができる。
 記憶部251には、2個の値で構成される正規化ゲイン補正量候補ベクトルがその正規化ゲイン補正量候補ベクトルを特定する符号と共に複数格納されているとする。正規化ゲイン補正量候補ベクトルを構成する2個の値をΔ1(i),…,Δ2(i)と表記すると、正規化ゲイン補正量候補ベクトルは(Δ1(i),Δ2(i))と表記することができる。記憶部141には、例えば、2E個の正規化ゲイン補正量候補ベクトル、すなわち(Δ1(1),Δ2(1)),…,(Δ1(2E),Δ2(2E))が格納されている。
 復元部250の処理の回数に応じて所定の係数が対応付けされているものとする。例えば、第2n回目から第2n+1-1回目の復元部250の処理に対応する所定の係数の絶対値の方が、第2n-1回目から第2n-1回目の復元部250の処理に対応する所定の係数の絶対値よりも小さいように対応付けがされている。
 このとき、正規化ゲイン補正量候補ベクトルに、復元部250の処理の回数に対応する所定の係数を乗算したベクトルを、その回数目の復元部250の処理で用いるゲイン補正量候補ベクトルとする。言いかえれば、正規化ゲイン補正量候補ベクトル(Δ1(i),Δ2(i))を構成する2個の値Δ1(i),Δ2(i)のそれぞれに、復元部250の処理の回数に対応する所定の係数stepを乗算することにより得られた2個の値stepΔ1(i),stepΔ2(i)により構成されるベクトル(stepΔ1(i),stepΔ2(i))を、その回数目の復元部250の処理で用いるゲイン補正量候補ベクトルを(Δlow(i),Δhigh(i))とする。この乗算は、復元部250により行われる。正規化ゲイン補正量候補ベクトル(Δ1(i),Δ2(i))が2E個ある場合には、i=1,…,2Eのそれぞれについてこの乗算を行うことにより、2E個のゲイン補正量候補ベクトル(stepΔ1(i),stepΔ2(i))が得られる。
 [復元部250の変形例5]
 なお、復元部250による各回数目の処理で用いるゲイン補正量の候補をそのゲイン補正量の候補を特定する符号と共に、ひとつのゲイン補正量コードブックとして記憶部251に格納しておいてもよい。例えば、nを0以上の各整数として、第2n回目から第2n+1-1回目の復元部250の処理で用いられるゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))が、そのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を特定する符号idx(i)と共に記憶部251に格納されているとする。
 すなわち、図12に例示するように、nの最大値をnmaxとして、1回目(n=0)の復元部250の処理で用いられるゲイン補正量候補ベクトル(Δ1,0(i),Δ2,0(i))[i=1,…,2E]、2回目(n=1)から3回目の復元部250の処理で用いられるゲイン補正量候補ベクトル(Δ1,1(i),Δ2,1(i))[i=1,…,2E]、4回目(n=2)から7回目の復元部250の処理で用いられるゲイン補正量候補ベクトル(Δ1,2(i),Δ2,2(i))[i=1,…,2E]、…、第2nmax回目から第2nmax+1-1回目の復元部250の処理で用いられるゲイン補正量候補ベクトル(Δ1,nmax(i),Δ2,nmax(i))[i=1,…,2E]が、そのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を特定する符号idx(i)と共に記憶部251に格納されているとする。
 このとき、例えば、第2n回目から第2n+1-1回目の復元部250の処理で用いられるゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))を構成するゲイン補正量の候補Δ1,n(i),Δ2,n(i)の絶対値の方が、第2n-1回目から第2n-1回目の復元部250の処理で用いられるゲイン補正量候補ベクトル(Δ1,n-1(i),Δ2,n-1(i))を構成するゲイン補正量の候補Δ1,n-1(i),Δ2,n-1(i)の絶対値よりも小さいとする。
 なお、第2n回目から第2n+1-1回目の復元部250の処理で用いられるゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))とは、その第2n回目から第2n+1-1回目の復元部250の処理において区分される2つの範囲についてのゲイン補正量候補ベクトル(Δ1,n(i),Δ2,n(i))のことである。第2n回目から第2n+1-1回目の復元部250の処理において区分される2つの範囲のうち、低域側の範囲に対応するゲイン補正量の候補がΔ1,n(i)であり、高域側の範囲に対応するゲイン補正量の候補がΔ2,n(i)である。
 [復元部250の変形例6]
 入力された第1の信号系列[lmin,lmax]の全てのサンプル値の二乗和を低域側の範囲[lmin,lmid-1]の全てのサンプルの値の二乗和で除算した値slowと、ゲイン補正量符号idxで特定される低域側の範囲に対応するゲイン補正量Δlow(i)とを乗算した値で、第1ゲインδを補正して第2ゲインδ+slowΔlow(i)としてもよい。
 同様に、入力された第1の信号系列[lmin,lmax]の全てのサンプル値の二乗和を高域側の範囲[lmid,lmax]の全てのサンプルの値の二乗和で除算した値shighと、ゲイン補正量符号idxで特定される高域側の範囲に対応するゲイン補正量Δhigh(i)とを乗算した値で、第1ゲインδを補正して第2ゲインδ+shighΔhigh(i)としてもよい。
 slow及びshighは、例えば、以下の式のように定義される。
Figure JPOXMLDOC01-appb-M000012
 また、入力された第1の信号系列[lmin,lmax]のエネルギーが第三の所定値よりも大きいサンプルの個数clow+chighで、低域側の範囲[lmin,lmid-1]のサンプルのエネルギーが第一の所定値よりも大きいサンプルの個数clowで除算した値slowと、低域側の範囲に対応するゲイン補正量Δlow(i)とを乗算した値で、第1ゲインδを補正して第2ゲインδ+slowΔlow(i)としてもよい。
 同様に、入力された第1信号系列[lmin,lmax]のエネルギーが第三の所定値よりも大きいサンプルの個数clow+chighで、高域側の範囲[lmid,lmax]のサンプルのエネルギーが第二の所定値よりも大きいサンプルの個数chighで除算した値shighと、高域側の範囲に対応するゲイン補正量Δhigh(i)とを乗算した値で、第1ゲインδを補正して第2ゲインδ+shighΔhigh(i)としてもよい。
 この場合、slow及びshighを、例えば以下の式のように定義される。
Figure JPOXMLDOC01-appb-M000013
 clowは、低域側の範囲[lmin,lmid-1]のサンプルのエネルギーが第一の所定値よりも大きいサンプルの個数である。chighは、高域側の範囲[lmid,lmax]のサンプルのエネルギーが第二の所定値よりも大きいサンプルの個数である。clow+chighは、入力された第1の信号系列[lmin,lmax]のエネルギーが第三の所定値よりも大きいサンプルの個数である。
 第一の所定値、第二の所定値及び第三の所定値は、互いに異なる値であってもよいが、同じ値であることが好ましい。第一の所定値、第二の所定値及び第三の所定値は、式(B2)におけるεに対応する。
 [復元部250及び統合部290の処理の具体例]
 以下、復元部250及び統合部290の処理の具体例を説明する。この例では、ゲイン補正量符号用に割り当てられたビット数Uは4であり、それぞれ2ビットで表現される範囲[Lmin,Lmax]に対応するゲイン補正量符号idx及び範囲[Lmin,Lmid-1]に対応するゲイン補正量符号idxが入力されるとする。
 (1)1回目の復元部250の処理
 U=4>0であるため、第1回目の復元部250の処理が行われる。
 第1回目の復元部250の処理は、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]を第1の信号系列とし、量子化グローバルゲインg^を第1ゲインとして実行される。
 復元部250の区分部260は、第1の信号系列を、低域側の範囲[Lmin,Lmid-1]及び高域側の範囲[Lmid,Lmax]に区分する。
 復元部250は、範囲[Lmin,Lmax]に対応するゲイン補正量符号idxを復号して、低域側のゲイン補正量Δlow(R1234)と高域側のゲイン補正量Δhigh(R1234)とを得る。復元部250は、第1ゲインg^を低域側のゲイン補正量Δlow(R1234)で補正して、低域側の範囲[Lmin,Lmid-1]に対応する第2ゲインg^+Δlow(R1234)を得る。また、復元部250は、第1ゲインを高域側のゲイン補正量Δhigh(R1234)で補正して、高域側の範囲[Lmid,Lmax]に対応する第2ゲインg^+Δhigh(R1234)を得る。
 ここでは、Δlow及びΔhighの後の括弧の中の記号は、符号のインデックスではなく、対応する範囲を表すことに注意する。なお、R1234は範囲[Lmin,Lmax]であり、R12は後述する範囲[Lmin,Lmid-1]であり、R34は後述する範囲[Lmid,Lmax]であるとする。
 Uは、範囲[Lmin,Lmax]に対応するゲイン補正量符号idxのビット数2だけデクリメントされ、U=2となる。
 (2)2回目の復元部250の処理
 U=2>0であるから、第2回目の復元部250の処理が行われる。
 第2回目の復元部250の処理は、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のうち、低域側の範囲[Lmin,Lmid-1]の信号系列を第1の信号系列とし、g^+Δlow(R1234)を第1ゲインとして実行される。
 復元部250の区分部260は、第1の信号系列を、低域側の範囲[Lmin,L’mid-1]及び高域側の範囲[L’mid,Lmid-1]に区分する。
 復元部250は、範囲[Lmin,Lmid-1]に対応するゲイン補正量符号idxを復号して、低域側のゲイン補正量Δlow(R12)と高域側のゲイン補正量Δhigh(R12)とを得る。復元部250は、第1ゲインg^+Δlow(R1234)を低域側のゲイン補正量Δlow(R12)で補正して、低域側の範囲[Lmin,L’mid-1]に対応する第2ゲインg^+Δlow(R1234)+Δlow(R12)を得る。また、復元部250は、第1ゲインg^+Δlow(R1234)を高域側のゲイン補正量Δhigh(R12)で補正して、高域側の範囲[L’mid,Lmid-1]に対応する第2ゲインg^+Δhigh(R1234)+Δhigh(R12)を得る。
 Uは、範囲[Lmin,Lmid-1]に対応するゲイン補正量符号idxのビット数2だけデクリメントされ、U=0となる。
 しかし、U=0であるため、3回目以降の処理は行われない。
 (3)統合部290の処理
 範囲[Lmin,L’mid-1]についての最後に行われた復元部250の処理で得られた第2ゲインはg^+Δlow(R1234)+Δlow(R12)である。したがって、統合部290は、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のうち範囲[Lmin,L’mid-1]についての各サンプル値とこの第2ゲインg^+Δlow(R1234)+Δlow(R12)とを乗算したものを、範囲[Lmin,L’mid-1]についての出力信号系列とする。
 範囲[L’mid,Lmid-1]についての最後に行われた復元部250の処理で得られた第2ゲインはg^+Δlow(R1234)+Δhigh(R12)である。したがって、統合部290は、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のうち範囲[L’mid,Lmid-1]についての各サンプル値とこの第2ゲインg^+Δlow(R1234)+Δhigh(R12)とを乗算したものを、範囲[L’mid,Lmid-1]についての出力信号系列とする。
 範囲[Lmid,Lmax]についての最後に行われた復元部250の処理で得られた第2ゲインはg^+Δhigh(R1234)である。したがって、統合部290は、復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]のうち範囲[Lmid,Lmax]についての各サンプル値とこの第2ゲインg^+Δhigh(R1234)とを乗算したものを、範囲[Lmid,Lmax]についての出力信号系列とする。
 <区分部260が行なう区分処理の詳細>
 区分部260が入力された第1の信号系列に対して行なう区分処理は、符号化装置1の区分部150が入力された第1の信号系列に対して行なう区分処理と同一である。
 「各範囲のエネルギーがなるべく等しくなるように区分する基準」での区分処理は、例えば、第1の信号系列の第1の範囲を、
(a) 第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和と、第1の信号系列の全てのサンプルの値の二乗和の2分の1と、が最も近付くように、
または、
(b) 第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和と、第1の信号系列の全てのサンプルの値の絶対値和の2分の1と、が最も近付くように、
または、
(c) 第1の信号系列の第1の範囲のサンプル数が、第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和が第1の信号系列の全てのサンプルの値の二乗和の2分の1以上となる最小のサンプル数になるように、
または、
(d) 第1の信号系列の第1の範囲のサンプル数が、第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和が第1の信号系列の全てのサンプルの値の絶対値和の2分の1以上となる最小のサンプル数になるように、
または、
(e) 第1の信号系列の第1の範囲のサンプル数が、第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和が第1の信号系列の全てのサンプルの値の二乗和の2分の1以下となる最大のサンプル数になるように、
または、
(f) 第1の信号系列の第1の範囲から第nの範囲までのサンプル数が、第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和が第1の信号系列の全てのサンプルの値の絶対値和の2分の1以下となる最大のサンプル数になるように、
求め、
第1の信号系列のうちの第1の範囲以外の範囲を、第1の信号系列の第2の範囲とすることで、第1の信号系列を2個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を、第1の範囲から順に逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲のエネルギーがなるべく等しくなるように区分する基準」による区分を実現できる。
 「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」での区分処理は、例えば、第1の信号系列の第1の範囲を、
(a) 第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数と、第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1と、が最も近付くように、
または、
(b) 第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数と、第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1と、が最も近付くように、
または、
(c) 第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数が、第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以上となる最小のサンプル数となるように、
または、
(d) 第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数が、第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以上となる最小のサンプル数となるように、
または、
(e) 第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数が、第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以下となる最大のサンプル数となるように、
または、
(f) 第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数が、第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいかまたは所定値以上であるサンプルの個数の2分の1以下となる最大のサンプル数となるように、
求め、
第1の信号系列のうちの第1の範囲以外の範囲を、第1の信号系列の第2の範囲とすることで、第1の信号系列を1個の範囲に区分することにより行なわれる。
 上記に例示した区分処理は、「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」による区分を、各範囲を逐次的に決定していく方法によって実現するものである。上記に例示した区分処理によれば、少ない演算処理量で「各範囲に含まれる有意のサンプルの個数がなるべく等しくなるように区分する基準」による区分を実現できる。
 区分部260が行なう区分処理の具体例は、符号化装置1の区分部150が行う区分処理の具体例である「第1の基準による区分処理の第1例」から「第1の基準による区分処理の第6例」、「第2の基準による区分処理の第1例」から「第2の基準による区分処理の第6例」のそれぞれの具体例中の、量子化正規化済み信号系列X^Q(ω) [ω∈{lmin,…,lmax}]を復号正規化済み信号系列X^Q(ω) [ω∈{lmin,…,lmax}]に置き換えたものである。
 <統合部290>
 統合部290は、フレーム内の各範囲についての最後に行なわれた復号部250の処理で得られた第2ゲインと復号正規化済み信号系列X^Q(ω) [ω∈{Lmin,…,Lmax}]の各サンプル値とを乗算したものを出力信号系列として得る(ステップS6d)。出力信号系列X^(ω)は、必要に応じて時間領域変換部270に送信される。
 <時間領域変換部270>
 必要に応じて備える時間領域変換部270には、出力信号系列X^(ω)が入力される。時間領域変換部270は、出力信号系列X^(ω)に対して周波数-時間変換を適用して、フレーム単位の時間領域信号系列zF(t)を出力する。周波数-時間変換方法は、周波数領域変換部101で用いられた時間-周波数変換方法に対応する逆変換である。上述の例であれば、ここでの周波数-時間変換方法は、IMDCT(Inverse Modified Discrete Cosine Transform)またはIDCT(Inverse Discrete Cosine Transform)である。
 《第2実施形態》
 第2実施形態は、ゲイン補正量符号idxに、正規化信号符号の余ったビットを用いる形態である。
 正規化信号符号化部120が[背景技術]欄で説明した正規化部102と量子化部103とゲイン制御部104により構成される場合などでは、消費ビット数が規定ビット数より少なくなる場合がある。
 第2実施形態の符号化装置1では、正規化信号符号化部120が、規定ビット数から消費ビット数を減算して得られるゲイン修正ビットのビット数Uをゲイン補正量符号化部140に対して出力するようにする。また、ゲイン補正量符号化部140は、入力されたゲイン修正ビットのビット数Uに基づいて、Uビットのゲイン補正量符号idxを出力するようにする。
 第2実施形態の復号装置2では、正規化信号復号部107が、正規化信号符号のビット数の最大値として規定されている規定ビット数から実際の正規化信号符号のビット数である消費ビット数を減算して得られるゲイン修正ビットのビット数Uをゲイン補正量復号部230に対して出力するようにする。また、ゲイン補正量復号部230は入力されたUビットのゲイン補正量符号idxを復号できるようにする。
 第2実施形態の符号化装置1及び復号装置2によれば、正規化信号符号のために用意されたものの実際には正規化信号符号には用いられなかったビットをゲイン補正量符号idxに用いることで、与えられたビットを有効に活用した符号化及び復号を行うことが可能となる。
 以上の各実施形態の他、本発明である符号化装置、符号化方法、復号装置、復号方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
 また、上記符号化装置/上記復号装置における処理機能をコンピュータによって実現する場合、符号化装置/復号装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記符号化装置/上記復号装置における処理機能がコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
 また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、符号化装置、復号装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (24)

  1.  複数の入力信号サンプルにより構成される、フレーム単位の入力信号系列を符号化する符号化方法において、
     上記入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、上記正規化信号符号に対応する量子化正規化済み信号系列とを得る正規化信号符号化ステップと、
     上記入力信号系列に対応するゲインである量子化グローバルゲインと、上記量子化グローバルゲインに対応するグローバルゲイン符号とを得るグローバルゲイン符号化ステップと、
     入力された第1の信号系列を2つの範囲に区分し、入力された各区分された範囲に対応する第1ゲインを上記各区分された範囲に対応するゲイン補正量で補正して得られる第2ゲインと上記第1の信号系列の各サンプルの値とを乗算して得られる信号系列と上記入力信号系列との相関が最大又は誤差が最小となる各区分された範囲に対応するゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化ステップと、を有し、
     第1回目の上記ゲイン補正量符号化ステップは、上記量子化正規化済み信号系列を上記第1の信号系列とし、上記量子化グローバルゲインを上記第1ゲインとして行われるものであり、
     第2n回目(nは1以上の整数)から第2n+1-1回目の上記ゲイン補正量符号化ステップのそれぞれは、上記量子化正規化済み信号系列のうち、第2n-1回目から第2n-1回目のゲイン補正量符号化ステップで区分して得られた2個の範囲のうちの何れか1つの範囲に対応する信号系列を上記第1の信号系列とし、上記第2n-1回目から第2n-1回目のうちの上記何れか1つの範囲に対応するゲイン補正量符号化ステップで得られたゲイン補正量符号で特定されるゲイン補正量で上記何れか1つの範囲に対応する第1ゲインを補正して得られる第2ゲインを上記第1ゲインとして行われるものであり、
     上記ゲイン補正量符号化ステップは、ゲイン補正量符号化ステップで得られたゲイン補正量符号のビット数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行される、
     符号化方法。
  2.  請求項1に記載の符号化方法であって、
     上記ゲイン補正量符号化ステップにおける2つの範囲への区分は、
     上記第1の信号系列の第1の範囲を、
    (a)上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和と、上記第1の信号系列の全てのサンプルの値の二乗和の2分の1と、が最も近付くように、
    または、
    (b)上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和と、上記第1の信号系列の全てのサンプルの値の絶対値和の2分の1と、が最も近付くように、
    または、
    (c)上記第1の信号系列の第1の範囲のサンプル数が、上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和が上記第1の信号系列の全てのサンプルの値の二乗和の2分の1以上となる最小のサンプル数になるように、
    または、
    (d)上記第1の信号系列の第1の範囲のサンプル数が、上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和が上記第1の信号系列の全てのサンプルの値の絶対値和の2分の1以上となる最小のサンプル数になるように、
    または、
    (e)上記第1の信号系列の第1の範囲のサンプル数が、上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和が上記第1の信号系列の全てのサンプルの値の二乗和の2分の1以下となる最大のサンプル数になるように、
    または、
    (f)上記第1の信号系列の第1の範囲のサンプル数が、上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和が上記第1の信号系列の全てのサンプルの値の絶対値和の2分の1以下となる最大のサンプル数になるように、
    求め、
     上記第1の信号系列のうちの第1の範囲以外の範囲を、上記第1の信号系列の第2の範囲とすることで、上記第1の信号系列を2つの範囲に区分することにより行なわれる、
     符号化方法。
  3.  請求項1に記載の符号化方法であって、
     上記ゲイン補正量符号化ステップにおける2つの範囲への区分は、
     上記第1の信号系列の第1の範囲を、
    (a)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数と、上記第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1と、が最も近付くように、
    または、
    (b)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数と、上記第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数の2分の1と、が最も近付くように、
    または、
    (c)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数が、上記第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1以上となる最小のサンプル数となるように、
    または、
    (d)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数が、上記第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が上記所定値より大きいサンプルの個数の2分の1以上となる最小のサンプル数となるように、
    または、
    (e)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数が、上記第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1以下となる最大のサンプル数となるように、
    または、
    (f)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数が、上記第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が上記所定値より大きいサンプルの個数の2分の1以下となる最大のサンプル数となるように、
    求め、
     上記第1の信号系列のうちの第1の範囲以外の範囲を、上記第1の信号系列の第2の範囲とすることで、上記第1の信号系列を2つの範囲に区分することにより行なわれる、
     符号化方法。
  4.  請求項1から請求項3の何れかに記載の符号化方法であって、
     第2n回目から第2n+1-1回目のゲイン補正量符号化ステップの処理は、第2n-1回目から第2n-1回目のゲイン補正量符号化ステップの区分により得られた2n個の範囲のうち、聴覚的な重要度が高い範囲から順に行なわれる、
     符号化方法。
  5.  請求項1から請求項3の何れかに記載の符号化方法であって、
     上記入力信号系列は周波数領域の信号系列であり、
     第2n回目から第2n+1-1回目のゲイン補正量符号化ステップの処理は、第2n-1回目から第2n-1回目のゲイン補正量符号化ステップの区分により得られた2n個の範囲のうち、周波数が低い範囲から順に行なわれる、
     符号化方法。
  6.  請求項1から請求項5の何れかに記載の符号化方法であって、
     上記ゲイン補正量符号化ステップは、複数個のゲイン補正量の候補の中から上記相関が最大又は誤差が最小となるゲイン補正量を特定するステップであり、
     第2n回目から第2n+1-1回目のゲイン補正量符号化ステップにおけるゲイン補正量の候補の絶対値の方が、第2n-1回目から第2n-1回目のゲイン補正量符号化ステップにおけるゲイン補正量の候補の絶対値よりも小さい、
     符号化方法。
  7.  請求項1から請求項5の何れかに記載の符号化方法であって、
     ゲイン補正量候補ベクトルは、2個のゲイン補正量の候補で構成されており、
     上記2つの区分された範囲は、それぞれゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補に対応付けされており、
     上記ゲイン補正量符号化ステップは、複数のゲイン補正量候補ベクトルの中から上記誤差を最小にするゲイン補正量候補ベクトルを特定するためのゲイン補正量符号を得るステップであり、
     符号帳には、2個の値で構成される正規化ゲイン補正量候補ベクトルが複数格納されており、
     上記複数のゲイン補正量候補ベクトルは、上記符号帳に格納された正規化ゲイン補正量候補ベクトルを構成する2個の値のそれぞれにゲイン補正量符号化ステップの処理が行われる回数に対応する所定の係数を乗算することにより得られた2個の値により構成されるベクトルであり、
     第2n回目から第2n+1-1回目のゲイン補正量符号化ステップに対応する所定の係数の絶対値の方が、第2n-1回目から第2n-1回目のゲイン補正量符号化ステップに対応する所定の係数の絶対値よりも小さい、
     符号化方法。
  8.  請求項1から請求項5の何れかに記載の符号化方法であって、
     ゲイン補正量候補ベクトルは、2個のゲイン補正量の候補で構成されており、
     ゲイン補正量コードブックには、第2b回目(bは0以上の各整数)から第2b+1-1回目のゲイン補正量符号化ステップで区分される2つの範囲についてのゲイン補正量候補ベクトルが複数個格納されており、
     上記区分される2つの範囲は、上記区分される2つの範囲についてのゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補に対応付けされており、
     上記ゲイン補正量符号化ステップは、上記ゲイン補正量コードブックに格納された複数のゲイン補正量候補ベクトルの中から上記誤差を最小にするゲイン補正量候補ベクトルを特定するゲイン補正量符号を得るステップであり、
     第2n回目から第2n+1-1回目のゲイン補正量符号化ステップで区分される2つの範囲についてのゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補の絶対値の方が、第2n-1回目から第2-1回目のゲイン補正量符号化ステップで区分される2つの範囲についてのゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補の絶対値よりも小さい、
     ことを特徴とする符号化方法。
  9.  請求項1から請求項6の何れかに記載の符号化方法であって、
     上記第2ゲインは、上記入力された第1の信号系列内の全てのサンプル値の二乗和を上記各区分された範囲内の全てのサンプルの値の二乗和で除算した値と上記各区分された範囲に対応するゲイン補正量とを乗算した値で上記入力された第1ゲインを補正して得られる値である、
     符号化方法。
  10.  請求項1から請求項6のいずれかに記載の符号化方法であって、
     上記第2ゲインは、上記入力された第1の信号系列内のサンプルのエネルギーが所定値よりも大きいサンプルの個数を上記各区分された範囲内のサンプルのエネルギーが上記所定値よりも大きいサンプルの個数で除算した値と上記各区分された範囲に対応するゲイン補正量とを乗算した値で上記入力された第1ゲインを補正して得られる値である、
     符号化方法。
  11.  フレーム単位の符号を復号して出力信号系列を得る復号方法において、
     上記符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号ステップと、
     上記符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号ステップと、
     入力された第1の信号系列を2つの範囲に区分し、上記符号に含まれるゲイン補正量符号を復号して各区分された範囲に対応するゲイン補正量を得て、入力された第1ゲインを各上記ゲイン補正量で補正して得られる第2ゲインを求める復元ステップと、を有し、
     第1回目の上記復元ステップは、上記復号正規化済み信号系列を上記第1の信号系列とし、上記復号グローバルゲインを上記第1ゲインとして行われるものであり、
     第2n回目(nは1以上の整数)から第2n+1-1回目の上記復元ステップのそれぞれは、上記復号正規化済み信号系列のうち、第2n-1回目から第2n-1回目の復元ステップで区分して得られた2n個の範囲のうちの何れか1つの範囲に対応する信号系列を上記第1の信号系列とし、上記第2n-1回目から第2n-1回目のうちの上記何れか1つの範囲に対応する復元ステップで得られた上記何れか1つの範囲に対応する第2ゲインを上記第1ゲインとして行われるものであり、
     上記復元ステップは、復号したゲイン補正量符号のビット数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、
     フレーム内の各範囲についての最後に行なわれた復元ステップで得られた第2ゲインと上記復号正規化済み信号系列の各サンプル値とを乗算したものを出力信号系列として得る統合ステップを更に有する、
     復号方法。
  12.  請求項11に記載の復号方法であって、
     上記復元ステップにおける2つの範囲への区分は、
     上記第1の信号系列の第1の範囲を、
    (a)上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和と、上記第1の信号系列の全てのサンプルの値の二乗和の2分の1と、が最も近付くように、
    または、
    (b)上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和と、上記第1の信号系列の全てのサンプルの値の絶対値和の2分の1と、が最も近付くように、
    または、
    (c)上記第1の信号系列の第1の範囲のサンプル数が、上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和が上記第1の信号系列の全てのサンプルの値の二乗和の2分の1以上となる最小のサンプル数になるように、
    または、
    (d)上記第1の信号系列の第1の範囲のサンプル数が、上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和が上記第1の信号系列の全てのサンプルの値の絶対値和の2分の1以上となる最小のサンプル数になるように、
    または、
    (e)上記第1の信号系列の第1の範囲のサンプル数が、上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の二乗和が上記第1の信号系列の全てのサンプルの値の二乗和の2分の1以下となる最大のサンプル数になるように、
    または、
    (f)上記第1の信号系列の第1の範囲のサンプル数が、上記第1の信号系列の第1の範囲に含まれる全てのサンプルの値の絶対値和が上記第1の信号系列の全てのサンプルの値の絶対値和の2分の1以下となる最大のサンプル数になるように、
    求め、
     上記第1の信号系列のうちの第1の範囲以外の範囲を、上記第1の信号系列の第2の範囲とすることで、上記第1の信号系列を2つの範囲に区分することにより行なわれる、
     復号方法。
  13.  請求項11に記載の復号方法であって、
     上記復元ステップにおける2つの範囲への区分は、
     上記第1の信号系列の第1の範囲を、
    (a)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数と、上記第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1と、が最も近付くように、
    または、
    (b)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数と、上記第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数の2分の1と、が最も近付くように、
    または、
    (c)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数が、上記第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1以上となる最小のサンプル数となるように、
    または、
    (d)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数が、上記第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が上記所定値より大きいサンプルの個数の2分の1以上となる最小のサンプル数となるように、
    または、
    (e)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルのエネルギーが所定値より大きいサンプルの個数が、上記第1の信号系列に含まれる全てのサンプルのうちサンプルのエネルギーが上記所定値より大きいサンプルの個数の2分の1以下となる最大のサンプル数となるように、
    または、
    (f)上記第1の信号系列の第1の範囲に含まれる全てのサンプルのうちサンプルの絶対値が所定値より大きいサンプルの個数が、上記第1の信号系列に含まれる全てのサンプルのうちサンプルの絶対値が上記所定値より大きいサンプルの個数の2分の1以下となる最大のサンプル数となるように、
    求め、
     上記第1の信号系列のうちの第1の範囲以外の範囲を、上記第1の信号系列の第2の範囲とすることで、上記第1の信号系列を2つの範囲に区分することにより行なわれる、
     復号方法。
  14.  請求項11から請求項13の何れかに記載の復号方法であって、
     第2n回目から第2n+1-1回目の復元ステップの処理は、第2n-1回目から第2n-1回目の復元ステップの区分により得られた2n個の範囲のうち、聴覚的な重要度が高い範囲から順に行なわれる、
     復号方法。
  15.  請求項11から請求項13の何れかに記載の復号方法であって、
     上記復号正規化済み信号系列は周波数領域の信号系列であり、
     第2n回目から第2n+1-1回目の復元ステップの処理は、第2n-1回目から第2n-1回目の復元ステップの区分により得られた2n個の範囲のうち、周波数が低い範囲から順に行なわれる、
     復号方法。
  16.  請求項11から請求項15の何れかに記載の復号方法であって、
     第2n回目から第2n+1-1回目の復元ステップにおけるゲイン補正量の絶対値の方が、第2n-1回目から第2n-1回目の復元ステップにおけるゲイン補正量の絶対値よりも小さい、
     復号方法。
  17.  請求項11から請求項15の何れかに記載の復号方法であって、
     ゲイン補正量候補ベクトルは、2個のゲイン補正量の候補で構成されており、
     上記2つの区分された範囲は、それぞれゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補に対応付けされており、
     上記復元ステップは、複数のゲイン補正量候補ベクトルの中から上記符号に含まれるゲイン補正量符号により特定されるゲイン補正量候補ベクトルを選択し、その選択されたゲイン補正量候補ベクトルを構成するゲイン補正量を用いて上記第1ゲインの補正を行うステップであり、
     符号帳には、2個の値で構成される正規化ゲイン補正量候補ベクトルが複数格納されており、
     上記複数のゲイン補正量候補ベクトルは、上記符号帳に格納された正規化ゲイン補正量候補ベクトルを構成する2個の値のそれぞれに復元ステップの処理が行われる回数に対応する所定の係数を乗算することにより得られた2個の値により構成されるベクトルであり、
     第2n回目から第2n+1-1回目の復元ステップに対応する所定の係数の絶対値の方が、第2n-1回目から第2n-1回目の復元ステップに対応する所定の係数の絶対値よりも小さい、
     復号方法。
  18.  請求項11から請求項15の何れかに記載の復号方法であって、
     ゲイン補正量候補ベクトルは、2個のゲイン補正量の候補で構成されており、
     ゲイン補正量コードブックには、第2b回目(bは0以上の各整数)から第2b+1-1回目のゲイン補正量符号化ステップで区分される2つの範囲についてのゲイン補正量候補ベクトルが複数個格納されており、
     上記区分される2つの範囲は、上記区分される2つの範囲についてのゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補に対応付けされており、
     上記復元ステップは、複数のゲイン補正量候補ベクトルの中から上記符号に含まれるゲイン補正量符号により特定されるゲイン補正量候補ベクトルを選択し、その選択されたゲイン補正量候補ベクトルを構成するゲイン補正量を用いて上記第1ゲインの補正を行うステップであり、
     第2n回目から第2n+1-1回目のゲイン補正量符号化ステップで区分される2つの範囲についてのゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補の絶対値の方が、第2n-1回目から第2-1回目のゲイン補正量符号化ステップで区分される2つの範囲についてのゲイン補正量候補ベクトルを構成する2個のゲイン補正量の候補の絶対値よりも小さい、
     復号方法。
  19.  請求項11から請求項16の何れかに記載の復号方法であって、
     上記第2ゲインは、上記入力された第1の信号系列内の全てのサンプル値の二乗和を上記各区分された範囲内の全てのサンプルの値の二乗和で除算した値と上記各区分された範囲に対応するゲイン補正量とを乗算した値で上記入力された第1ゲインを補正して得られる値である、
     復号方法。
  20.  請求項11から請求項16の何れかに記載の復号方法であって、
     上記第2ゲインは、上記入力された第1の信号系列内のサンプルのエネルギーが所定値よりも大きいサンプルの個数を上記各区分された範囲内のサンプルのエネルギーが上記所定値よりも大きいサンプルの個数で除算した値と上記各区分された範囲に対応するゲイン補正量とを乗算した値で上記入力された第1ゲインを補正して得られる値である、
     復号方法。
  21.  複数の入力信号サンプルにより構成される、フレーム単位の入力信号系列を符号化する符号化装置において、
     上記入力信号系列に含まれる各入力信号サンプルが正規化された信号による系列を符号化して得られる正規化信号符号と、上記正規化信号符号に対応する量子化正規化済み信号系列とを得る正規化信号符号化部と、
     上記入力信号系列に対応するゲインである量子化グローバルゲインと、上記量子化グローバルゲインに対応するグローバルゲイン符号とを得るグローバルゲイン符号化部と、
     入力された第1の信号系列を2つの範囲に区分し、入力された各区分された範囲に対応する第1ゲインを上記各区分された範囲に対応するゲイン補正量で補正して得られる第2ゲインと上記第1の信号系列の各サンプルの値とを乗算して得られる信号系列と上記入力信号系列との相関が最大又は誤差が最小となる各区分された範囲に対応するゲイン補正量を特定するためのゲイン補正量符号を得るゲイン補正量符号化部と、を備え、
     第1回目の上記ゲイン補正量符号化部の処理は、上記量子化正規化済み信号系列を上記第1の信号系列とし、上記量子化グローバルゲインを上記第1ゲインとして行われるものであり、
     第2n回目(nは1以上の整数)から第2n+1-1回目の上記ゲイン補正量符号化部の処理のそれぞれは、上記量子化正規化済み信号系列のうち、第2n-1回目から第2n-1回目のゲイン補正量符号化部の処理で区分して得られた2個の範囲のうちの何れか1つの範囲に対応する信号系列を上記第1の信号系列とし、上記第2n-1回目から第2n-1回目のうちの上記何れか1つの範囲に対応するゲイン補正量符号化部の処理で得られたゲイン補正量符号で特定されるゲイン補正量で上記何れか1つの範囲に対応する第1ゲインを補正して得られる第2ゲインを上記第1ゲインとして行われるものであり、
     上記ゲイン補正量符号化部は、ゲイン補正量符号化部の処理で得られたゲイン補正量符号のビット数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行される、
     符号化装置。
  22.  フレーム単位の符号を復号して出力信号系列を得る復号装置において、
     上記符号に含まれる正規化信号符号を復号して復号正規化済み信号系列を得る正規化信号復号部と、
     上記符号に含まれるグローバルゲイン符号を復号して復号グローバルゲインを得るグローバルゲイン復号部と、
     入力された第1の信号系列を2つの範囲に区分し、上記符号に含まれるゲイン補正量符号を復号して各区分された範囲に対応するゲイン補正量を得て、入力された第1ゲインを各上記ゲイン補正量で補正して得られる第2ゲインを求める復元部と、を備え、
     第1回目の上記復元部の処理は、上記復号正規化済み信号系列を上記第1の信号系列とし、上記復号グローバルゲインを上記第1ゲインとして行われるものであり、
     第2n回目(nは1以上の整数)から第2n+1-1回目の上記復元部の処理のそれぞれは、上記復号正規化済み信号系列のうち、第2n-1回目から第2n-1回目の復元部の処理で区分して得られた2n個の範囲のうちの何れか1つの範囲に対応する信号系列を上記第1の信号系列とし、上記第2n-1回目から第2n-1回目のうちの上記何れか1つの範囲に対応する復元部の処理で得られた上記何れか1つの範囲に対応する第2ゲインを上記第1ゲインとして行われるものであり、
     上記復元部は、復号したゲイン補正量符号のビット数の合計がゲイン補正量符号用に割り当てられたビット数以下となる回数の範囲内で実行され、
     フレーム内の各範囲についての最後に行なわれた復元部の処理で得られた第2ゲインと上記復号正規化済み信号系列の各サンプル値とを乗算したものを出力信号系列として得る統合部を更に備える、
     復号装置。
  23.  請求項1から請求項10の何れかに記載の符号化方法の各ステップ及び/又は請求項11から請求項20の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラム。
  24.  請求項1から請求項10の何れかに記載の符号化方法の各ステップ及び/又は請求項11から請求項20の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラムを記録した記録媒体。
PCT/JP2013/059024 2012-03-28 2013-03-27 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 WO2013146895A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014507961A JP5635213B2 (ja) 2012-03-28 2013-03-27 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012-073156 2012-03-28
JP2012073156 2012-03-28

Publications (1)

Publication Number Publication Date
WO2013146895A1 true WO2013146895A1 (ja) 2013-10-03

Family

ID=49260144

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/059024 WO2013146895A1 (ja) 2012-03-28 2013-03-27 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JP5635213B2 (ja)
WO (1) WO2013146895A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008065162A (ja) * 2006-09-08 2008-03-21 Toshiba Corp オーディオ符号化装置
JP2008203739A (ja) * 2007-02-22 2008-09-04 Kddi Corp オーディオビットレート変換方法および装置
JP2008261978A (ja) * 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4639073B2 (ja) * 2004-11-18 2011-02-23 キヤノン株式会社 オーディオ信号符号化装置および方法
ATE532175T1 (de) * 2008-12-01 2011-11-15 Research In Motion Ltd Optimierung von mp3-kodierung mit vollständiger dekodiererkompatibilität

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008065162A (ja) * 2006-09-08 2008-03-21 Toshiba Corp オーディオ符号化装置
JP2008203739A (ja) * 2007-02-22 2008-09-04 Kddi Corp オーディオビットレート変換方法および装置
JP2008261978A (ja) * 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
JP2010281965A (ja) * 2009-06-03 2010-12-16 Sony Corp 量子化装置、再生装置、量子化方法およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GUILLAUME FUCHS ET AL.: "MDCT-BASED CODER FOR HIGHLY ADAPTIVE SPEECH AND AUDIO CODING", 17TH EUROPEAN SIGNAL PROCESSING CONFERENCE (EUSIPCO 2009), August 2009 (2009-08-01), pages 1264 - 1268 *

Also Published As

Publication number Publication date
JP5635213B2 (ja) 2014-12-03
JPWO2013146895A1 (ja) 2015-12-14

Similar Documents

Publication Publication Date Title
TWI590233B (zh) 解碼器及其解碼方法、編碼器及其編碼方法、電腦程式
JP5085543B2 (ja) 適応コーディングおよびデコーディングでの複数のエントロピモデルの選択的使用
KR102493482B1 (ko) 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품
JP6457552B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
WO2015146224A1 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
KR20170127533A (ko) 선형 예측 부호화 장치, 선형 예측 복호 장치, 이들의 방법, 프로그램 및 기록 매체
WO2011045926A1 (ja) 符号化装置、復号装置およびこれらの方法
CA2803276A1 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
JP5734519B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
CN110291583B (zh) 用于音频编解码器中的长期预测的系统和方法
RU2662921C2 (ru) Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения
JP5320508B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
CN103503065A (zh) 用于衰减低精确度重构的信号区域的方法和解码器
JP5840101B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5738480B2 (ja) 符号化方法、符号化装置、復号方法、復号装置及びプログラム
CN111788628A (zh) 编码装置、编码方法、程序以及记录介质
JP5786044B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5800920B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
RU2773421C9 (ru) Способ и соответствующий продукт для определения режима кодирования/декодирования аудио
RU2773421C2 (ru) Способ и соответствующий продукт для определения режима кодирования/декодирования аудио
WO2013129528A1 (ja) 符号化装置、この方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13767296

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014507961

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13767296

Country of ref document: EP

Kind code of ref document: A1